El documento discute diferentes técnicas y herramientas para alinear ontologías, incluyendo Falcon-AO, que integra técnicas lingüísticas y basadas en grafos, AgreementMaker que usa un enfoque multicapa con métodos automáticos y semiautomáticos, y RiMON que selecciona estrategias lingüísticas o basadas en estructura dependiendo de la similitud léxica entre ontologías. También se mencionan técnicas como similarity flooding y OLA que usan representaciones de grafos para medir similit
2. ONTOLOGÍA Thomas Gruber (Gruber, 1993) define a las ontologías, como “una especificación explicita de una conceptualización”. Una conceptualización es una abstracción, una vista simplificada del mundo que deseamos representar para un cierto propósito Borst (W.N. Borst, 1997) establece que las ontologías son definidas como “una especificación formal de una conceptualización compartida”.
3. ONTOLOGÍA ontologías ligeras: que incluyen conceptos, taxonomía de conceptos, relaciones entre conceptos y propiedades. ontologías pesadas: agregan axiomas y restricciones a las ontologías ligeras
4. DIFICULTADES EN CORRESPONDENCIA DE ONTOLOGÍAS Heterogeneidad sintáctica: Diferencias en el lenguaje usado para la representación de modelos. Heterogeneidad estructural: Diferencias en los tipos, y estructura de los elementos. Heterogeneidad semántica: Donde las mismas entidades del mundo real son representadas usando diferentes términos o viceversa. Heterogeneidad en modelos: diferencias en los modelos subyacentes (bases de datos, ontologías) o su representación (modelo relacional, orientado a objetos, lenguajes de ontologías RDF, OWL).
5. ALINEACIÓN DE ONTOLOGÍAS La interoperabilidad semántica puede ser tratada con una reconciliación ontológica, encontrando relaciones entre entidades que pertenecen a diferentes ontologías, a este proceso se le conoce como alineación de ontologías
6. ALINEACIÓN DE ONTOLOGÍAS Diversas estrategias de alineación han sido propuestas, estas técnicas se clasifican por medio de las características de las ontologías (etiquetas, estructuras, instancias, semántica), y usan diversas disciplinas como la estadística, aprendizaje automático o análisis de datos. También se pueden clasificar a nivel de elemento y a nivel de estructura
7. ALINEACIÓN DE ONTOLOGÍAS Nivel de elemento: técnicas basadas en cadenas, lenguaje, consideraciones lingüísticas, restricciones o re-usó de alineaciones. Estas consideran las etiquetas de los conceptos, sus definiciones, el lenguaje en el que las ontologías son expresadas, y cualquier posibilidad para reutilizar previos mapeos para derivar nuevos. Nivel de estructura: técnicas basadas en grafos, taxonomías, u otros modelos. Estas consideran la ubicación del concepto en la estructura de la ontología, y cómo las correspondencias entre los conceptos pueden contribuir a establecer otras correspondencias.
8. FALCON-AO (Jian, et al., 2005) Falcon-AO es una herramienta para alineación de ontologías que consiste en la integración de dos matchers LMO: basado en similitud lingüística (linguisticmatching), GMO: matcher basado en similitud de grafos (graphmatching)
11. LMO (LinguisticMatchingOntology) Para obtener la similitud lingüística, LMO combina el enfoque basado en comparación léxica y un enfoque basado en análisis estadístico. Para la similitud lingüística nombrada SS, se utilizó la Distancia de Levenshtein entre nombres de entidades y una función para capturar la similitud entre cadenas largas. Para el análisis estadístico se usó el modelo espacio vectorial (Vector SpaceModel). Este método se usa para ponderar cada entidad (clases, propiedades, e instancias) de una ontología respecto al resto de los elementos de sí misma, para después realizar la comparación con otra ontología.
12. LMO (LinguisticMatchingOntology) Una vez ponderada cada entidad, se construye una colección de documentos y sus vectores por cada ontología, finalmente se calcula la similitud (nombrada DS) entre documentos por medio del producto escalar entre vectores. Cabe destacar, que previo a la extracción de las entidades de los vectores, se ejecuta un proceso de preparación, que consiste en: separación de palabras, stemming(reducir una palabra a su raíz) y eliminación de “stop words” (preposiciones). Finalmente los dos métodos para medir similitud lingüística son combinados linealmente, donde los coeficientes son experimentales y se le ha otorgado mayor peso a los resultados a la similitud DS: Similitud_linguistica = 0.8 DS + 0.2 SS
13. GMO (GraphMatchingOntology) La idea principal es medir la similitud entre dos entidades (de dos ontologías), considerando la acumulación de similitudes de sentencias involucradas (tripletas) GMO también toma en cuenta la acumulación de las similitudes de entidades vecinas respecto a las dos entidades que están siendo comparadas. GMO, acepta un conjunto de pares de entidades relacionadas, que son encontradas previamente por otros algoritmos de similitud (matching). A la salida GMOproporciona parejas de entidades adicionales al comparar la similitud estructural.
14. GMO (GraphMatchingOntology) Un enfoque para evaluar los resultados proporcionados por GMO es la comparabilidad lingüística y estructural. El enfoque de evaluación está basado en dos medidas: comparabilidad lingüística (LC): mide por medio del número de elementos de pares de entidades que hayan rebasado un umbral de similitud y del total de entidades en cada ontología comparabilidad estructural (SC): es determinada a través de las ocurrencias de las propiedades incorporadas usadas en las dos ontologías a ser alineadas. Finalmente un modelo vectorial define esta comparabilidad con la frecuencia de propiedades usadas en ambas ontologías, y el número de ocurrencias
15. FALCON-AO Falcon-AO se desempeña bien cuando las estructuras de las ontologías son muy similares entre sí o existe mucha similitud léxica entre las mismas. También este sistema proporciona buenos resultados cuando las dos ontologías tienen poca similitud léxica pero alta similitud estructural. Si existe poco vocabulario comun y poca similitud estructural, Falcon dificilmente da buenos resultado. Hace uso de diccionarios lexicos para la alineacion. No tiene en cuenta axiomas o reglas logicas.
16. AgreementMaker(Sunna, et al., 2007) Esta arquitectura propone métodos automáticos que transforman en una estructura de grafos la jerarquía de conceptos de una ontología. maneja un enfoque multicapa, que consiste de 4 capas: dos usan métodos automáticos, una usa un método semiautomático, y la otra es un método manual
17.
18. AgreementMaker Primera capa: proceso de mapeo automático, compara el significado de cada concepto en la primera ontología con cada concepto de la segunda ontología segunda capa:es un proceso manual de mapeo conducido por un experto de dominio. Tercera capa: se ejecuta un proceso de mapeo semiautomático por contexto, en el cual los mapeos son deducidos al considerar mapeos establecidos previamente, trabajando desde las hojas del árbol ontológico cuarta capa: proceso automático de consolidación de mapeos, en el cual son resueltos los posibles conflictos semánticos de las capas anteriores, en esta capa el experto del dominio determina la importancia de las capas al asignar un nivel de prioridad a cada una.
19. AgreementMaker El enfoque semiautomático que se propone en AgreementMaker, involucra la intervención del usuario experto durante el proceso de alineación, lo cual contribuye en precisión al detectar las correspondencias semánticas.
20.
21. RiMON(Li, et al., 2008) Aquí las estrategias usadas consisten en técnicas basadas en lingüística: Distancia de Levenshtein y statisticallearning También técnicas basadas en estructuras: propagación de similitud, propagación de propiedad a propiedad y propagación de concepto a propiedad
22. RiMON Inicialmente se examina la estructura de las ontologías y la similitud léxica entre conceptos, para determinar qué estrategias se utilizan en el proceso de alineación. Si existe una alta similitud léxica entre los nombres, el sistema usará técnicas basadas en lingüística para encontrar las correspondencias entre conceptos Luego se aplican las estrategias de alineación seleccionadas por un experto
23. Similarityflooding (Melnik, et al., 2001) Técnica basada en modelos estructurales, este algoritmo es usado para establecer correspondencias en varios modelos o estructuras de datos recibe dos modelos de datos que después serán convertidos a grafos. “si dos grafos son similares entonces, también sus conceptos adyacentes en cierto grado también son similares”.
24. OLA alineación de ontologías (Euzenat, et al., 2004b) OLA transforma las ontologías OWL en estructuras basadas en grafos encontrando todas las relaciones entre entidades (e.g., clase, propiedad) y considera todas las características de las entidades (e.g., superclases, propiedades). Estos grafos establecen las restricciones para calcular la similitud entre entidades de ontologías usando diversas medidas de similitud ponderadas, las cuales son combinadas de forma lineal. Se consideran conjuntos de relaciones entre parejas de entidades, que dependen de correspondencias locales (entidad-relación-entidad).