SlideShare una empresa de Scribd logo
1 de 36
Descargar para leer sin conexión
Utilidad de los datos enlazados
para la terminología
Jorge Gracia
Ontology Engineering Group
Dpto. de Inteligencia Artificial
Universidad Politécnica de Madrid
jgracia@fi.upm.es
Jornada sobre “TERMINESP y la terminología del español”
Representación de la Comisión Europea en España, Madrid
28 de octubre de 2016
Recursos lingüísticos
en la Web
2
2
Recursos lingüísticos en la Web
Recursos Lingüísticos Electrónicos
• corpus
• lexicones
• diccionarios
• “wordnets”
• terminologías
• etc.
3
Recursos lingüísticos en la Web
Actualmente…
• En formatos heterogéneos
• Diferentes esquemas de representación
• APIs no estándar
• Aislados entre sí (“data silos”)
• Diferentes niveles de acceso (desde “mándame un email” a servicios
web)
• Múltiples catálogos de recursos lingüísticos con diferentes metadatos y
esquemas de representación
Por tanto... el descubrimiento y reutilización de RLs resulta costoso en
tiempo y esfuerzo
4
*Picture attribution: http://commons.wikimedia.org/wiki/User:Gugerell
“Red”
Etimología: Del latin “rete”
Género: “f”
Definición: “Conjunto de
ordenadores o de equipos
informáticos conectados entre
sí….”
“Red”
Traducciones: “xarxa”(ca), “rede”(ga), …
“Red”
Norma: UNE 21302-131
Inglés: network
Alemán: Netzwerk
“Red”
Pronunciation: [red]
Grammar category: sustantivo femenino
Singular: “red”
Plural: “redes”
“Red_de_computadores”
Category: redes informáticas
Image
Recursos lingüísticos en la Web
“Red” (de
ordenadores)
5
*Picture attribution: http://commons.wikimedia.org/wiki/User:Gugerell
“Red”
Etimología: Del latin “rete”
Género: “f”
Definición: “Conjunto de
ordenadores o de equipos
informáticos conectados entre
sí….”
“Red”
Traducciones: “xarxa”(ca), “rede”(ga), …
“Red”
Norma: UNE 21302-131
Inglés: network
Alemán: Netzwerk
“Red”
Pronunciation: [red]
Grammar category: sustantivo femenino
Singular: “red”
Plural: “redes”
“Red_de_computadores”
Category: redes informáticas
Image
Recursos lingüísticos en la Web
Información
complementaria
pero no conectada
6
Datos enlazados para los
recursos lingüísticos
7
Datos enlazados
Prinicipos de los Datos Enlazados
(linked data principles)
1. Usar URIs (Uniform Resource Identifiers) para identificar
“cosas” en la Web
2. Usar HTTP URIs para que la gente pueda acceder a
esos identificadores y obtener algo
3. Cuando alguien accede a una URI, debe proporcionarse
información útil sobre el recurso que identifica (en RDF)
4. Incluir enlaces a otras URIs, para que se puedan
descubrir más cosas.
8
8
Datos enlazados
9
9
Datos enlazados
Red
Phonetic form
Form
number
singular
[RED]
Form
plural
[REDES]
Phonetic form
number
Red
Sense
written form
“red”@es
Sense
written form
“xarxa”@ca
translation
Red
image
Red
Sense Sense
translation written form
“red” “network”
written form
Red
written form
Form
gender
femenine
“red”
10
Datos enlazados
Red
Phonetic form
Form
number
singular
[RED]
Form
plural
[REDES]
Phonetic form
number
Red
Sense
written form
“red”@es
Sense
written form
“xarxa”@ca
translation
Red
image
Red
Sense Sense
translation written form
“red” “network”
written form
Red
written form
Form
gender
femenine
“red”
11
Datos enlazados
Algunos BENEFICIOS de los recursos lingüísticos
como datos enlazados
• Agregación e integración de recursos lingüísticos
• Los datos se exponen de manera estandarizada (SPARQL)
• Se facilita el descubrimiento de los datos
• Uso de vocabularios acordados para representar contenido
lingüístico
NIF
NLP Interchange Format
12
12
Datos enlazados
Linguistic Linked Data Cloud
Aparición de la “nube de datos lingüísticos enlazados”
Linguistic Linked Open Data (LLOD) cloud
13
http://linguistic-lod.org/llod-cloud
13
El modelo lemon-ontolex
14
lemon-ontolex
15
El núcleo del modelo
https://www.w3.org/2016/05/ontolex/
lemon-ontolex
16
El módulo vartrans
Datos enlazados en
terminologías:
Terminoteca RDF
17
Terminesp TERMCAT IATE
Otras
terminologías
Terminoteca RDF
18
Terminoteca RDF
TERMINOTECA RDF como demostrador del potencial de los datos
enlazados en terminologías
• Basado en Terminesp y Termcat
• Multilingüe: inglés, catalán, francés, italiano, sueco, alemán, latín
http://linguistic.linkeddata.es/terminoteca/
19
Terminesp
TERMINESP es la base de datos terminológica creada por AETER
(Asociación Española de Terminología) en base a la terminología
contenida en las normas UNE (AENOR)
>30,000 términos técnicos con definiciones (en español)
Variedad de dominios: aeronáutica, agricultura, ingeniería eléctrica, …
Traducciones al Inglés, francés, alemán, italiano, sueco
Denominación científica (latín)
20
http://www.wikilengua.org/index.php/Wikilengua:Terminesp
Terminesp
4
http://www.wikilengua.org/index.php/Wikilengua:Terminesp
21
Termcat
http://www.termcat.cat/en/Terminologia_Oberta/
TERMCAT es el centro de terminología de la lengua catalana,
responsable de la Terminologia Oberta:
Gran variedad de dominios. [En nuestro prototipo: Internet y sociedad
de la información, Telecomunicaciones, Industria electrónica]
Traducciones al español, inglés y francés
Siglas, abreviaturas, sinónimos,…
22
Termcat
http://www.termcat.cat/en/Terminologia_Oberta/
23
Terminoteca RDF
Conversión de TERMINESP y TERMCAT a datos enlazados:
De acuerdo al modelo lemon-ontolex
Cada elemento lingüístico (lexical entry, lexical form, lexical sense,
translation, …) identificado con una URI
Creación de conceptos en skos para dar cuenta de la información
semántica
En TERMINESP:
>30000 conceptos creados
Añadida información de categorías gramaticales (part-of-speech)
Añadido el tipo de sintagma (nominal, adjetival, preposicional, …)
En TERMCAT:
> 7000 conceptos creados (tres dominios)
24
Terminoteca RDF
25
DE ES
SV
IT
FR
EN
ES
FR
EN
CA
Terminoteca RDF
26
DE ES
SV
IT
FR
EN
CA
Terminoteca-RDF
Terminoteca RDF
27
Terminoteca RDF
28
Terminoteca RDF
29
Terminoteca RDF
Interfaz web para obtener traducciones directas
http://linguistic.linkeddata.es/terminoteca/search/
30
Terminoteca RDF
31
Motor SPARQL para búsquedas semánticas más complejas
http://linguistic.linkeddata.es/terminoteca/sparql-editor/
Terminoteca RDF
Ejemplo: “Dame traducciones al catalán [Termcat] y al alemán [Terminesp]
del término en español ‘amplificador’, indicando el origen de los datos y el
dominio de aplicación.”
32
wr_target provenance subject
"amplificador"@ca
http://www.termcat.cat/Thor/files/terminologiaOberta/20101126104034_TO%20Internet%20i%20s
ocietat%20de%20la%20informacio.xml
"Electrònica"@ca
"amplificador"@ca
http://www.termcat.cat/Thor/files/terminologiaOberta/20101126103843_TO%20Industria%20electr
onica%20i%20dels%20materials%20electrics.xml
"Electrònica"@ca
"amplificador"@ca
http://www.termcat.cat/Thor/files/terminologiaOberta/20101126104034_TO%20Internet%20i%20s
ocietat%20de%20la%20informacio.xml
"Societat de la informació"@ca
"amplificador"@ca
http://www.termcat.cat/Thor/files/terminologiaOberta/20101126103843_TO%20Industria%20electr
onica%20i%20dels%20materials%20electrics.xml
"Societat de la informació"@ca
"amplificador"@ca
http://www.termcat.cat/Thor/files/terminologiaOberta/20101126104034_TO%20Internet%20i%20s
ocietat%20de%20la%20informacio.xml
"Telecomunicacions"@ca
"amplificador"@ca
http://www.termcat.cat/Thor/files/terminologiaOberta/20101126103843_TO%20Industria%20electr
onica%20i%20dels%20materials%20electrics.xml
"Telecomunicacions"@ca
"Verstärker"@de http://www.wikilengua.org
"Verstärket"@de http://www.wikilengua.org
Terminoteca RDF
33
Ejemplo: “Dame las siglas [de Termcat] asociadas a las entradas en inglés
que vengan de Terminesp [y que no tenían siglas asociadas, inicialmente].”
label initialism
"code division multiple access"@en "CDMA"@en
"time division multiple access"@en "TDMA"@en
"light-emitting diode"@en "LED"@en
"unipolar transistor"@en "FET"@en
"N-channel field-effect transistor"@en "N-FET"@en
"database management system"@en "DBMS"@en
"frequency division multiple access"@en "FDMA"@en
"low-noise amplifier"@en "LNA"@en
"automatic gain control"@en "AGC"@en
"programmable logic controller"@en "PLC"@en
"alternating current"@en "AC"@en
"direct current"@en "DC"@en
"programmable logic device"@en "PLD"@en
Conclusiones
Conclusiones
• Los datos enlazados pueden ser de utilidad para los recursos
lingüísticos en general y las terminologías en particular
• Iniciativa Terminoteca RDF: crear un grafo unificado de
terminologías en España basado en técnicas de datos enlazados
• Validación y enriquecimiento de los datos, y enlazado a otras
fuentes
• Futuros pasos:
• Enlace con otras terminologías y fuentes de datos (ej.: IATE, DBpedia,
Apertium)
• Evolución más allá de estado de “prototipo” de investigación
• Interacción más directa con los propios procesos de
creación/validación/publicación de datos de Terminesp y Termcat
35
¡Gracias!
36Ontology Engineering Group

Más contenido relacionado

Destacado

Methodology for Linguistic Linked Open Data generation. The Apertium RDF case
Methodology for Linguistic Linked Open Data generation. The Apertium RDF caseMethodology for Linguistic Linked Open Data generation. The Apertium RDF case
Methodology for Linguistic Linked Open Data generation. The Apertium RDF caseJorge Gracia
 
2017 UpdatedCV Julie Paton Facilities
2017 UpdatedCV Julie Paton Facilities2017 UpdatedCV Julie Paton Facilities
2017 UpdatedCV Julie Paton FacilitiesJulie Paton
 
Contaduria publica power
Contaduria publica powerContaduria publica power
Contaduria publica powersara gomez
 
Proyecto integral de semestre
Proyecto integral de semestreProyecto integral de semestre
Proyecto integral de semestrepablovelascof
 
Cuestionario previo clases sexualidad pp.doc.docx
Cuestionario previo clases sexualidad pp.doc.docxCuestionario previo clases sexualidad pp.doc.docx
Cuestionario previo clases sexualidad pp.doc.docxBorjafa
 
Herramientas digitales
Herramientas digitalesHerramientas digitales
Herramientas digitalesBenito Espinal
 
Practico de rodriguez claudia de google
Practico de rodriguez claudia de googlePractico de rodriguez claudia de google
Practico de rodriguez claudia de googlenahiarati
 
Model to scan workflow
Model to scan workflowModel to scan workflow
Model to scan workflowSal D'Ambrosia
 
English Premier League Player Awards 2010/ 11
English Premier League Player Awards 2010/ 11 English Premier League Player Awards 2010/ 11
English Premier League Player Awards 2010/ 11 Shekhar Ibhrampurkar
 

Destacado (20)

Methodology for Linguistic Linked Open Data generation. The Apertium RDF case
Methodology for Linguistic Linked Open Data generation. The Apertium RDF caseMethodology for Linguistic Linked Open Data generation. The Apertium RDF case
Methodology for Linguistic Linked Open Data generation. The Apertium RDF case
 
2017 UpdatedCV Julie Paton Facilities
2017 UpdatedCV Julie Paton Facilities2017 UpdatedCV Julie Paton Facilities
2017 UpdatedCV Julie Paton Facilities
 
00008830
0000883000008830
00008830
 
Teatreeoil
TeatreeoilTeatreeoil
Teatreeoil
 
Ley lleras
Ley llerasLey lleras
Ley lleras
 
Can You Understand Me
Can You Understand MeCan You Understand Me
Can You Understand Me
 
Contaduria publica power
Contaduria publica powerContaduria publica power
Contaduria publica power
 
Proyecto integral de semestre
Proyecto integral de semestreProyecto integral de semestre
Proyecto integral de semestre
 
Cuestionario previo clases sexualidad pp.doc.docx
Cuestionario previo clases sexualidad pp.doc.docxCuestionario previo clases sexualidad pp.doc.docx
Cuestionario previo clases sexualidad pp.doc.docx
 
Herramientas digitales
Herramientas digitalesHerramientas digitales
Herramientas digitales
 
Lição 3 aluno
Lição 3 alunoLição 3 aluno
Lição 3 aluno
 
Cindys profile new 2017-rev1
Cindys profile new 2017-rev1Cindys profile new 2017-rev1
Cindys profile new 2017-rev1
 
Impresionismo
ImpresionismoImpresionismo
Impresionismo
 
Argentina mi país
Argentina mi paísArgentina mi país
Argentina mi país
 
Practico de rodriguez claudia de google
Practico de rodriguez claudia de googlePractico de rodriguez claudia de google
Practico de rodriguez claudia de google
 
Whassath
WhassathWhassath
Whassath
 
Model to scan workflow
Model to scan workflowModel to scan workflow
Model to scan workflow
 
Herramientas digitales
Herramientas digitalesHerramientas digitales
Herramientas digitales
 
Hsa portfolio 2017
Hsa portfolio 2017Hsa portfolio 2017
Hsa portfolio 2017
 
English Premier League Player Awards 2010/ 11
English Premier League Player Awards 2010/ 11 English Premier League Player Awards 2010/ 11
English Premier League Player Awards 2010/ 11
 

Similar a Utilidad de los datos enlazados para la terminología

Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03GloriaTinoco
 
Web semanticasidar 03
Web semanticasidar 03Web semanticasidar 03
Web semanticasidar 03jenorevi
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03GloriaTinoco
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03GloriaTinoco
 
Web Semantica Y las Bases de Datos
Web Semantica Y las Bases de DatosWeb Semantica Y las Bases de Datos
Web Semantica Y las Bases de DatosUCAB
 
ROH: Proceso de Ingeniería Ontológica & Uso y Extensión de Vocabularios Estándar
ROH: Proceso de Ingeniería Ontológica & Uso y Extensión de Vocabularios EstándarROH: Proceso de Ingeniería Ontológica & Uso y Extensión de Vocabularios Estándar
ROH: Proceso de Ingeniería Ontológica & Uso y Extensión de Vocabularios EstándarDiego López-de-Ipiña González-de-Artaza
 
Web semántica y sus principales características
Web semántica y sus principales característicasWeb semántica y sus principales características
Web semántica y sus principales característicasPollis Morales
 
Web 3.0 y herramientas tecnologicas
Web 3.0 y herramientas tecnologicasWeb 3.0 y herramientas tecnologicas
Web 3.0 y herramientas tecnologicasCarlos Arroyo
 
Agrovoc cswb training_1
Agrovoc cswb training_1Agrovoc cswb training_1
Agrovoc cswb training_1catecara
 

Similar a Utilidad de los datos enlazados para la terminología (20)

Ontologias
OntologiasOntologias
Ontologias
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
 
Web semanticasidar 03
Web semanticasidar 03Web semanticasidar 03
Web semanticasidar 03
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
 
Web 3.0
Web 3.0Web 3.0
Web 3.0
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
 
Web Semantica Y las Bases de Datos
Web Semantica Y las Bases de DatosWeb Semantica Y las Bases de Datos
Web Semantica Y las Bases de Datos
 
ROH: Proceso de Ingeniería Ontológica & Uso y Extensión de Vocabularios Estándar
ROH: Proceso de Ingeniería Ontológica & Uso y Extensión de Vocabularios EstándarROH: Proceso de Ingeniería Ontológica & Uso y Extensión de Vocabularios Estándar
ROH: Proceso de Ingeniería Ontológica & Uso y Extensión de Vocabularios Estándar
 
Web semántica y sus principales características
Web semántica y sus principales característicasWeb semántica y sus principales características
Web semántica y sus principales características
 
Web 3.0 y herramientas tecnologicas
Web 3.0 y herramientas tecnologicasWeb 3.0 y herramientas tecnologicas
Web 3.0 y herramientas tecnologicas
 
Web semántica
Web semánticaWeb semántica
Web semántica
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
 
Dbpedia
DbpediaDbpedia
Dbpedia
 
Agrovoc cswb training_1
Agrovoc cswb training_1Agrovoc cswb training_1
Agrovoc cswb training_1
 

Último

Presentación informe 'Fondos Next Generation European Union destinados a actu...
Presentación informe 'Fondos Next Generation European Union destinados a actu...Presentación informe 'Fondos Next Generation European Union destinados a actu...
Presentación informe 'Fondos Next Generation European Union destinados a actu...Ivie
 
Croquis de riesgo de trabajo gasolinera.pdf
Croquis de riesgo de trabajo gasolinera.pdfCroquis de riesgo de trabajo gasolinera.pdf
Croquis de riesgo de trabajo gasolinera.pdfhernestosoto82
 
FORMATO INVENTARIO MOBILIARIO PASO A PASO
FORMATO INVENTARIO MOBILIARIO PASO A PASOFORMATO INVENTARIO MOBILIARIO PASO A PASO
FORMATO INVENTARIO MOBILIARIO PASO A PASOsecundariatecnica891
 
PREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRIL
PREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRILPREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRIL
PREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRILeluniversocom
 
INTRODUCCION A LA ESTADISTICA RECOLECCION DE DATOS.pdf
INTRODUCCION A LA ESTADISTICA RECOLECCION DE DATOS.pdfINTRODUCCION A LA ESTADISTICA RECOLECCION DE DATOS.pdf
INTRODUCCION A LA ESTADISTICA RECOLECCION DE DATOS.pdfmaryisabelpantojavar
 
Países por velocidad de sus misiles hipersónicos (2024).pdf
Países por velocidad de sus misiles hipersónicos  (2024).pdfPaíses por velocidad de sus misiles hipersónicos  (2024).pdf
Países por velocidad de sus misiles hipersónicos (2024).pdfJC Díaz Herrera
 
AREA TECNOLOGIA E INFORMATICA.pdf Santiago
AREA TECNOLOGIA E INFORMATICA.pdf SantiagoAREA TECNOLOGIA E INFORMATICA.pdf Santiago
AREA TECNOLOGIA E INFORMATICA.pdf SantiagoSantiagoRodriguezLoz
 
MAPA DE RIESGOS DE UN ZOOLOGICO ..pdf
MAPA DE RIESGOS DE UN ZOOLOGICO    ..pdfMAPA DE RIESGOS DE UN ZOOLOGICO    ..pdf
MAPA DE RIESGOS DE UN ZOOLOGICO ..pdfCamilaArzate2
 
Las familias más ricas dentro del sionismo (2024).pdf
Las familias más ricas dentro del sionismo (2024).pdfLas familias más ricas dentro del sionismo (2024).pdf
Las familias más ricas dentro del sionismo (2024).pdfJC Díaz Herrera
 
PREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdf
PREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdfPREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdf
PREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdfeluniversocom
 
Módulo mapa de riesgos de tienda de abarrotes
Módulo mapa de riesgos de tienda de abarrotesMódulo mapa de riesgos de tienda de abarrotes
Módulo mapa de riesgos de tienda de abarrotessald071205mmcnrna9
 
Análisis de un mapa de riesgos de una tortillería
Análisis de un mapa de riesgos de una tortillería Análisis de un mapa de riesgos de una tortillería
Análisis de un mapa de riesgos de una tortillería yocelynsanchezerasmo
 
que son los planes de ordenamiento predial POP.pptx
que son los planes de ordenamiento predial  POP.pptxque son los planes de ordenamiento predial  POP.pptx
que son los planes de ordenamiento predial POP.pptxSergiothaine2
 
Niveles de organización biologica clase de biologia
Niveles de organización biologica clase de biologiaNiveles de organización biologica clase de biologia
Niveles de organización biologica clase de biologiatongailustraconcienc
 
HABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdfHABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdfGEINER22
 
PREGUNTA H DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA H DE CONSULTA POPULAR 21 DE ABRILPREGUNTA H DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA H DE CONSULTA POPULAR 21 DE ABRILeluniversocom
 
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRILPREGUNTA G DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRILeluniversocom
 
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
17 PRACTICAS - MODALIDAAD FAMILIAAR.docxmarthaarroyo16
 
PREGUNTA E REFÉRENDUM 21 DE ABRIL ECUADOR
PREGUNTA E REFÉRENDUM 21 DE ABRIL ECUADORPREGUNTA E REFÉRENDUM 21 DE ABRIL ECUADOR
PREGUNTA E REFÉRENDUM 21 DE ABRIL ECUADOReluniversocom
 
PREGUNTA J DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA J DE CONSULTA POPULAR 21 DE ABRILPREGUNTA J DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA J DE CONSULTA POPULAR 21 DE ABRILeluniversocom
 

Último (20)

Presentación informe 'Fondos Next Generation European Union destinados a actu...
Presentación informe 'Fondos Next Generation European Union destinados a actu...Presentación informe 'Fondos Next Generation European Union destinados a actu...
Presentación informe 'Fondos Next Generation European Union destinados a actu...
 
Croquis de riesgo de trabajo gasolinera.pdf
Croquis de riesgo de trabajo gasolinera.pdfCroquis de riesgo de trabajo gasolinera.pdf
Croquis de riesgo de trabajo gasolinera.pdf
 
FORMATO INVENTARIO MOBILIARIO PASO A PASO
FORMATO INVENTARIO MOBILIARIO PASO A PASOFORMATO INVENTARIO MOBILIARIO PASO A PASO
FORMATO INVENTARIO MOBILIARIO PASO A PASO
 
PREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRIL
PREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRILPREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRIL
PREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRIL
 
INTRODUCCION A LA ESTADISTICA RECOLECCION DE DATOS.pdf
INTRODUCCION A LA ESTADISTICA RECOLECCION DE DATOS.pdfINTRODUCCION A LA ESTADISTICA RECOLECCION DE DATOS.pdf
INTRODUCCION A LA ESTADISTICA RECOLECCION DE DATOS.pdf
 
Países por velocidad de sus misiles hipersónicos (2024).pdf
Países por velocidad de sus misiles hipersónicos  (2024).pdfPaíses por velocidad de sus misiles hipersónicos  (2024).pdf
Países por velocidad de sus misiles hipersónicos (2024).pdf
 
AREA TECNOLOGIA E INFORMATICA.pdf Santiago
AREA TECNOLOGIA E INFORMATICA.pdf SantiagoAREA TECNOLOGIA E INFORMATICA.pdf Santiago
AREA TECNOLOGIA E INFORMATICA.pdf Santiago
 
MAPA DE RIESGOS DE UN ZOOLOGICO ..pdf
MAPA DE RIESGOS DE UN ZOOLOGICO    ..pdfMAPA DE RIESGOS DE UN ZOOLOGICO    ..pdf
MAPA DE RIESGOS DE UN ZOOLOGICO ..pdf
 
Las familias más ricas dentro del sionismo (2024).pdf
Las familias más ricas dentro del sionismo (2024).pdfLas familias más ricas dentro del sionismo (2024).pdf
Las familias más ricas dentro del sionismo (2024).pdf
 
PREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdf
PREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdfPREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdf
PREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdf
 
Módulo mapa de riesgos de tienda de abarrotes
Módulo mapa de riesgos de tienda de abarrotesMódulo mapa de riesgos de tienda de abarrotes
Módulo mapa de riesgos de tienda de abarrotes
 
Análisis de un mapa de riesgos de una tortillería
Análisis de un mapa de riesgos de una tortillería Análisis de un mapa de riesgos de una tortillería
Análisis de un mapa de riesgos de una tortillería
 
que son los planes de ordenamiento predial POP.pptx
que son los planes de ordenamiento predial  POP.pptxque son los planes de ordenamiento predial  POP.pptx
que son los planes de ordenamiento predial POP.pptx
 
Niveles de organización biologica clase de biologia
Niveles de organización biologica clase de biologiaNiveles de organización biologica clase de biologia
Niveles de organización biologica clase de biologia
 
HABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdfHABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdf
 
PREGUNTA H DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA H DE CONSULTA POPULAR 21 DE ABRILPREGUNTA H DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA H DE CONSULTA POPULAR 21 DE ABRIL
 
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRILPREGUNTA G DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRIL
 
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
 
PREGUNTA E REFÉRENDUM 21 DE ABRIL ECUADOR
PREGUNTA E REFÉRENDUM 21 DE ABRIL ECUADORPREGUNTA E REFÉRENDUM 21 DE ABRIL ECUADOR
PREGUNTA E REFÉRENDUM 21 DE ABRIL ECUADOR
 
PREGUNTA J DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA J DE CONSULTA POPULAR 21 DE ABRILPREGUNTA J DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA J DE CONSULTA POPULAR 21 DE ABRIL
 

Utilidad de los datos enlazados para la terminología

  • 1. Utilidad de los datos enlazados para la terminología Jorge Gracia Ontology Engineering Group Dpto. de Inteligencia Artificial Universidad Politécnica de Madrid jgracia@fi.upm.es Jornada sobre “TERMINESP y la terminología del español” Representación de la Comisión Europea en España, Madrid 28 de octubre de 2016
  • 3. Recursos lingüísticos en la Web Recursos Lingüísticos Electrónicos • corpus • lexicones • diccionarios • “wordnets” • terminologías • etc. 3
  • 4. Recursos lingüísticos en la Web Actualmente… • En formatos heterogéneos • Diferentes esquemas de representación • APIs no estándar • Aislados entre sí (“data silos”) • Diferentes niveles de acceso (desde “mándame un email” a servicios web) • Múltiples catálogos de recursos lingüísticos con diferentes metadatos y esquemas de representación Por tanto... el descubrimiento y reutilización de RLs resulta costoso en tiempo y esfuerzo 4
  • 5. *Picture attribution: http://commons.wikimedia.org/wiki/User:Gugerell “Red” Etimología: Del latin “rete” Género: “f” Definición: “Conjunto de ordenadores o de equipos informáticos conectados entre sí….” “Red” Traducciones: “xarxa”(ca), “rede”(ga), … “Red” Norma: UNE 21302-131 Inglés: network Alemán: Netzwerk “Red” Pronunciation: [red] Grammar category: sustantivo femenino Singular: “red” Plural: “redes” “Red_de_computadores” Category: redes informáticas Image Recursos lingüísticos en la Web “Red” (de ordenadores) 5
  • 6. *Picture attribution: http://commons.wikimedia.org/wiki/User:Gugerell “Red” Etimología: Del latin “rete” Género: “f” Definición: “Conjunto de ordenadores o de equipos informáticos conectados entre sí….” “Red” Traducciones: “xarxa”(ca), “rede”(ga), … “Red” Norma: UNE 21302-131 Inglés: network Alemán: Netzwerk “Red” Pronunciation: [red] Grammar category: sustantivo femenino Singular: “red” Plural: “redes” “Red_de_computadores” Category: redes informáticas Image Recursos lingüísticos en la Web Información complementaria pero no conectada 6
  • 7. Datos enlazados para los recursos lingüísticos 7
  • 8. Datos enlazados Prinicipos de los Datos Enlazados (linked data principles) 1. Usar URIs (Uniform Resource Identifiers) para identificar “cosas” en la Web 2. Usar HTTP URIs para que la gente pueda acceder a esos identificadores y obtener algo 3. Cuando alguien accede a una URI, debe proporcionarse información útil sobre el recurso que identifica (en RDF) 4. Incluir enlaces a otras URIs, para que se puedan descubrir más cosas. 8 8
  • 10. Datos enlazados Red Phonetic form Form number singular [RED] Form plural [REDES] Phonetic form number Red Sense written form “red”@es Sense written form “xarxa”@ca translation Red image Red Sense Sense translation written form “red” “network” written form Red written form Form gender femenine “red” 10
  • 11. Datos enlazados Red Phonetic form Form number singular [RED] Form plural [REDES] Phonetic form number Red Sense written form “red”@es Sense written form “xarxa”@ca translation Red image Red Sense Sense translation written form “red” “network” written form Red written form Form gender femenine “red” 11
  • 12. Datos enlazados Algunos BENEFICIOS de los recursos lingüísticos como datos enlazados • Agregación e integración de recursos lingüísticos • Los datos se exponen de manera estandarizada (SPARQL) • Se facilita el descubrimiento de los datos • Uso de vocabularios acordados para representar contenido lingüístico NIF NLP Interchange Format 12 12
  • 13. Datos enlazados Linguistic Linked Data Cloud Aparición de la “nube de datos lingüísticos enlazados” Linguistic Linked Open Data (LLOD) cloud 13 http://linguistic-lod.org/llod-cloud 13
  • 15. lemon-ontolex 15 El núcleo del modelo https://www.w3.org/2016/05/ontolex/
  • 19. Terminoteca RDF TERMINOTECA RDF como demostrador del potencial de los datos enlazados en terminologías • Basado en Terminesp y Termcat • Multilingüe: inglés, catalán, francés, italiano, sueco, alemán, latín http://linguistic.linkeddata.es/terminoteca/ 19
  • 20. Terminesp TERMINESP es la base de datos terminológica creada por AETER (Asociación Española de Terminología) en base a la terminología contenida en las normas UNE (AENOR) >30,000 términos técnicos con definiciones (en español) Variedad de dominios: aeronáutica, agricultura, ingeniería eléctrica, … Traducciones al Inglés, francés, alemán, italiano, sueco Denominación científica (latín) 20 http://www.wikilengua.org/index.php/Wikilengua:Terminesp
  • 22. Termcat http://www.termcat.cat/en/Terminologia_Oberta/ TERMCAT es el centro de terminología de la lengua catalana, responsable de la Terminologia Oberta: Gran variedad de dominios. [En nuestro prototipo: Internet y sociedad de la información, Telecomunicaciones, Industria electrónica] Traducciones al español, inglés y francés Siglas, abreviaturas, sinónimos,… 22
  • 24. Terminoteca RDF Conversión de TERMINESP y TERMCAT a datos enlazados: De acuerdo al modelo lemon-ontolex Cada elemento lingüístico (lexical entry, lexical form, lexical sense, translation, …) identificado con una URI Creación de conceptos en skos para dar cuenta de la información semántica En TERMINESP: >30000 conceptos creados Añadida información de categorías gramaticales (part-of-speech) Añadido el tipo de sintagma (nominal, adjetival, preposicional, …) En TERMCAT: > 7000 conceptos creados (tres dominios) 24
  • 30. Terminoteca RDF Interfaz web para obtener traducciones directas http://linguistic.linkeddata.es/terminoteca/search/ 30
  • 31. Terminoteca RDF 31 Motor SPARQL para búsquedas semánticas más complejas http://linguistic.linkeddata.es/terminoteca/sparql-editor/
  • 32. Terminoteca RDF Ejemplo: “Dame traducciones al catalán [Termcat] y al alemán [Terminesp] del término en español ‘amplificador’, indicando el origen de los datos y el dominio de aplicación.” 32 wr_target provenance subject "amplificador"@ca http://www.termcat.cat/Thor/files/terminologiaOberta/20101126104034_TO%20Internet%20i%20s ocietat%20de%20la%20informacio.xml "Electrònica"@ca "amplificador"@ca http://www.termcat.cat/Thor/files/terminologiaOberta/20101126103843_TO%20Industria%20electr onica%20i%20dels%20materials%20electrics.xml "Electrònica"@ca "amplificador"@ca http://www.termcat.cat/Thor/files/terminologiaOberta/20101126104034_TO%20Internet%20i%20s ocietat%20de%20la%20informacio.xml "Societat de la informació"@ca "amplificador"@ca http://www.termcat.cat/Thor/files/terminologiaOberta/20101126103843_TO%20Industria%20electr onica%20i%20dels%20materials%20electrics.xml "Societat de la informació"@ca "amplificador"@ca http://www.termcat.cat/Thor/files/terminologiaOberta/20101126104034_TO%20Internet%20i%20s ocietat%20de%20la%20informacio.xml "Telecomunicacions"@ca "amplificador"@ca http://www.termcat.cat/Thor/files/terminologiaOberta/20101126103843_TO%20Industria%20electr onica%20i%20dels%20materials%20electrics.xml "Telecomunicacions"@ca "Verstärker"@de http://www.wikilengua.org "Verstärket"@de http://www.wikilengua.org
  • 33. Terminoteca RDF 33 Ejemplo: “Dame las siglas [de Termcat] asociadas a las entradas en inglés que vengan de Terminesp [y que no tenían siglas asociadas, inicialmente].” label initialism "code division multiple access"@en "CDMA"@en "time division multiple access"@en "TDMA"@en "light-emitting diode"@en "LED"@en "unipolar transistor"@en "FET"@en "N-channel field-effect transistor"@en "N-FET"@en "database management system"@en "DBMS"@en "frequency division multiple access"@en "FDMA"@en "low-noise amplifier"@en "LNA"@en "automatic gain control"@en "AGC"@en "programmable logic controller"@en "PLC"@en "alternating current"@en "AC"@en "direct current"@en "DC"@en "programmable logic device"@en "PLD"@en
  • 35. Conclusiones • Los datos enlazados pueden ser de utilidad para los recursos lingüísticos en general y las terminologías en particular • Iniciativa Terminoteca RDF: crear un grafo unificado de terminologías en España basado en técnicas de datos enlazados • Validación y enriquecimiento de los datos, y enlazado a otras fuentes • Futuros pasos: • Enlace con otras terminologías y fuentes de datos (ej.: IATE, DBpedia, Apertium) • Evolución más allá de estado de “prototipo” de investigación • Interacción más directa con los propios procesos de creación/validación/publicación de datos de Terminesp y Termcat 35