A continuación presentamos una descripción de los algoritmos y sistemas de integración más importantes: PROMPT, FCA-Merge, y Chimaera.
En (Fridman-Noy and Musen, 1999) se presenta un enfoque para integrar ontologías. En este enfoque se introducen dos procesos diferentes:
Fusión: Es el proceso por el cual dos ontologías se unen para formar una sola, cubriendo ambas ontologías dominios similares o solapados.
Alineamiento: enlazar conceptos entre las dos ontologías fuente.
El algoritmo SMART (Fridman-Noy and Musen, 1999; Musen and Fridman-Noy, 1999) fusiona conceptos cuyos nombres son lingüísticamente iguales o similares (por ejemplo, Unidad Militar y Unidad Militar Moderna).
Estos autores presentan un nuevo algoritmo llamado PROMPT en (Fridman-Noy and Musen, 2000), que es una evolución de SMART y tiene en cuenta no sólo similaridades lingüísticas, sino también la estructura de la ontología para detectar conceptos a fusionar. En los sistemas basados en PROMPT, el usuario siempre decide qué conceptos son integrados puesto que fue diseñado para apoyar el proceso de integración, no para realizarlo por sí mismo.
PROMPT tiene en cuenta diferentes características de las ontologías como pueden ser: nombres de clases y ranuras, jerarquía de clases, asignación de ranuras a clases y facetas y sus valores
Además PROMPT identifica conflictos, algunos de los cuales son: conflicto de nombres, referencias obsoletas, redundancia en la jerarquía de clases y restricciones ranura-valor que violen la herencia
En términos de ayuda al usuario, PROMPT tiene las siguientes características:
Establecer ontología preferida. Suele suceder que las ontologías fuente no tienen la misma importancia o estabilidad, y que el usuario desee resolver todos los conflictos en beneficio de una ontología fuente. El usuario puede escoger una de las ontologías como la preferida. Entonces, cuando ocurre un conflicto de valores el sistema resolverá el conflicto automáticamente.
Mantener la posición de usuario. Supongamos que un usuario une dos ontologías grandes y actualmente está trabajando sobre un área en particular. PROMPT mantiene la posición del usuario usando una lista de sugerencias y se presentan primero los ítems que incluyan frames relacionados con las últimas operaciones realizadas.
Informar al usuario. Para cada sugerencia, PROMPT presenta una serie de explicaciones, empezando por la obtenida en primer lugar. Si PROMPT cambia la posición de una sugerencia en dicha lista, entonces también explicará el motivo de este cambio.
FCA-Merge (Stumme and Maedche, 2001) es un enfoque bottom-up para integrar ontologías que ofrece una descripción estructural global del proceso de fusión. Para las ontologías fuente se extraen instancias de un conjunto dado de textos específicos del dominio por medio de la aplicación de técnicas de procesamiento de lenguaje natural. Se aplican técnicas basadas en matemáticas tomadas del Análisis Formal de Conceptos (FCA) (Wille, 1982; Ganter and Wille, 1999) para obtener un enrejado de conceptos como estructura final del proceso de FCA-Merge. Este resultado obtenido lo explora y transforma el ingeniero de conocimiento en la ontología integrada.
Esta metodología impone unas condiciones a los datos de entrada:
Los documentos tienen que ser relevantes para cada una de las ontologías fuente. Un documento del que no se extraigan instancias para cada ontología fuente no es útil.
Los documentos tienen que cubrir todos los conceptos de las ontologías fuente. Conceptos no cubiertos han de ser tratados manualmente tras el proceso de integración.
Los documentos deben separar suficientemente los conceptos. Si dos conceptos considerados como diferentes aparecen siempre en los mismos documentos, FCAMerge los mapeará al mismo concepto en la ontología final (a no ser que el ingeniero de conocimiento establezca otra cosa). Si esta situación se da con frecuencia, el ingeniero de conocimiento podría añadir más documentos para obtener una mejor diferenciación.
Esta metodología toma como datos de entrada las dos ontologías y un conjunto D de documentos en lenguaje natural. Los documentos pueden ser tomados de la aplicación objeto que requiere la ontología final. A partir de los documentos en D se extraen instancias. Este paso de adquisición automática de conocimiento devuelve, para cada ontología, un contexto formal que indica qué conceptos ontológicos aparecen en qué documentos. La extracción de instancias a partir de documentos es necesaria porque no existen generalmente instancias ya clasificadas por ambas ontologías. Sin embargo, si se da esta situación, se puede obviar el primer paso y usar dicha clasificación de instancias.
El segundo paso de este enfoque contiene el algoritmo FCA-Merge, que unifica dos contextos y calcula un enrejado de conceptos a partir del contexto unificado usando técnicas de FCA. Más precisamente, calcula un enrejado de conceptos que tiene el mismo grado de detalle que las dos ontologías fuente. La extracción de instancias y el algoritmo FCA-Merge son procesos completamente automáticos. El paso final para derivar la ontología fusionada a partir del enrejado de conceptos requiere de la interacción humana. El ingeniero ontológico crea los conceptos y relaciones de la ontología final a partir del enrejado de conceptos y del conjunto de relaciones.
El diseño de Chimaera (McGuiness et al, 2000) se basa en la experiencia obtenida al desarrollar otras interfaces para aplicaciones de conocimiento del mismo grupo. Se construyó sobre una plataforma que maneja cualquier sistema de representación basado en OKBC(Chaudhri, et. al, 1998). De esta forma, Chimaera acepta más de quince formatos de entrada,tales como ANSI KIF, Ontolingua, Protégé, CLASSIC, o XOL.
Chimaera sugerirá candidatos potenciales basados en un número de propiedades. Genera una lista de resolución de nombres que pueden ser usados como guía a través de la tarea de mezcla. Cuando se propone una sugerencia, se le muestra al usuario los lugares donde los dos términos aparecen en la jerarquía. El usuario puede explorar la jerarquía en más detalle mediante operaciones como expandir subclases. El usuario también puede ver las definiciones de los términos y obtener los resultados de comparaciones de similaridad y diferencia estructural de las definiciones. El usuario puede entonces elegir la integración de términos mediante una opción del menú.
Tiene un modo que apoya a la resolución taxonómica. Busca relaciones sintácticas tipo <X-Y> e <Y>. Cuando encuentra alguna, entonces busca relaciones de semánticas de subsunción. Chimaera posee una capacidad analítica que permite a los usuarios ejecutar un conjunto de tests diagnósticos (incompletitud, chequeos sintácticos, análisis taxonómico, chequeo semánticos, etc) sobre las ontologías. La salida de muestra en forma de log interactivo que permite ver y explorar los resultados de estos tests.
Información extraída de https://163.117.147.74/ie/doku.php?id=fusion_y_mapeados
Página creada por José María Rubio
Última Actualización: 09-05-2007
Wiki Grupo 1 - Recuperación y Organización de la información - Ontologias de metadatos: fusion y mapeado