Ce diaporama a bien été signalé.
Nous utilisons votre profil LinkedIn et vos données d’activité pour vous proposer des publicités personnalisées et pertinentes. Vous pouvez changer vos préférences de publicités à tout moment.

Introducción a la Web Semántica

173 vues

Publié le

Introducción a la Web Semántica

Publié dans : Formation
  • Soyez le premier à commenter

Introducción a la Web Semántica

  1. 1. Introducción a la Web Semántica Departamento de Informática Universidad de Oviedo Jose Emilio Labra Gayo
  2. 2. Jose Emilio Labra Gayo – Universidad de Oviedo Web Semántica Editorial NetBiblo, Colección Pcket Innova, 2012 http://www.netbiblo.com 1' de publicidad Validating RDF Data Ed. Morgan & Claypool, 2018 http://book.validatingrdf.com Online HTML version
  3. 3. Jose Emilio Labra Gayo – Universidad de Oviedo Introducción a la Web Semántica Justificación Definición Principales tecnologías
  4. 4. Jose Emilio Labra Gayo – Universidad de Oviedo Justificación: Avalancha de datos Más y más datos publicados en la Web Crecimiento casi exponencial Número total de sitios Web (Fuente: http://www.internetlivestats.com)
  5. 5. Jose Emilio Labra Gayo – Universidad de Oviedo Justificación: Avalancha de datos Datos generados por humanos Cada vez hay más usuarios conectados Usuarios de internet: case 4 mil millones en 2018 Tráfico en internet: 56mil GB de tráfico en 1 segundo Redes sociales Twitter: 500 millones de tweets al día Facebook: 850 millones usuarios activos al día Y lo que está por venir... Datos generados automáticamente Sensores, robots, etc. Internet de las cosas (*) Fuente: http://www.internetlivestats.com
  6. 6. Jose Emilio Labra Gayo – Universidad de Oviedo
  7. 7. Jose Emilio Labra Gayo – Universidad de Oviedo Avalancha de datos Tendencias Open Producir datos es tecnológicamente fácil Movimientos: Open Software Open Content Open Data Open Science Open Government Viejos modelos afectados Música, Cine, finanzas,... ¿Educación? ¿Gobierno? ...
  8. 8. Jose Emilio Labra Gayo – Universidad de Oviedo Problemas de la Web actual No es suficiente publicar información Hay que encontrarla Si no se encuentra, como si no existiese Hay que poder utilizarla Utilizar la información en otros contextos Si no es usable, no sirve
  9. 9. Jose Emilio Labra Gayo – Universidad de Oviedo Web sintáctica Web actual = Web sintáctica Web de documentos Normalmente representados en HTML Enlaces entre documentos mediante <a href="…">…</a> Enlaces sin significado El usuario no quiere documentos, quiere datos Ejemplo: Teléfono de Juan vs Página web de Juan
  10. 10. Jose Emilio Labra Gayo – Universidad de Oviedo Web sintáctica Recursos enlazados entre sí (Grafo dirigido) recurso recurso recurso recurso recurso recursorecurso recurso recurso href href href href hrefhre f href href href Ordenadores realizan la presentación visual (tarea fácil) Personas navegan e interpretan el contenido (tarea difícil)
  11. 11. Jose Emilio Labra Gayo – Universidad de Oviedo Hacia la Web Semántica Web Semántica = visión de la Web de datos Tim Berners Lee Fuente: Wikipedia Proyecto a largo plazo Cambios graduales No se trata de deshacer lo que ya hay Mejorar las técnicas de publicación Dar mayor valor a la información Objetivo: marco que permite compartir y reutilizar datos entre aplicaciones, empresas y comunidades.
  12. 12. Jose Emilio Labra Gayo – Universidad de Oviedo Web semántica Visión donde los datos se publican y se enlazan con otros datos Objetivos: Automatizar Reutilizar Integrar
  13. 13. Jose Emilio Labra Gayo – Universidad de Oviedo Beneficios Datos accesibles Evitar pérdidas semánticas al publicar Facilitar automatización de tareas Datos enlazados Reutilización de datos Integración de aplicaciones La mejor manera de explotar tus datos se le ocurrirá a otro Jo Walsh, Rufus Pollock, http://www.okfn.org/files/talks/xtech_2007/
  14. 14. Jose Emilio Labra Gayo – Universidad de Oviedo Características de la web No centralizada Difícil garantizar integridad de la información Información Dinámica La información existente cambia Mucha información Un sistema no puede pretender acaparar toda la información Es abierta Open World Assumption En inglés: Principio AAA: Anyone can say Anything about Any topic Fuente: Semantic Web for the Working Ontologist, D. Allemang, J. Hendler
  15. 15. Jose Emilio Labra Gayo – Universidad de Oviedo Tarta de la Web URIUnicode XML + Namespaces + XML Schema Demostración RDF + RDF Schema Ontologías Lógica Confianza Versión propuesta por Tim Berners Lee, año 2000 http://www.w3.org/2000/Talks/1206-xml2k-tbl/slide10-0.html
  16. 16. Jose Emilio Labra Gayo – Universidad de Oviedo Cambios en la tarta... URIUnicode XML RDF Query: SPARQL RDF Schema Ontologies OWL Trust Unifying Logic Rules RIF Proof Validation ShEx/SHACL
  17. 17. Jose Emilio Labra Gayo – Universidad de Oviedo El mayor reto = Integración En general, el problema no es informatizar algo El problema es integrar los sistemas Interoperabilidad No basta con publicar datos…
  18. 18. Jose Emilio Labra Gayo – Universidad de Oviedo Publicar = hacer accesible Niveles de accesibilidad Discapacidad física Técnica: utilizar otros entornos Intelectual y cultural Analfabetismo Barreras de conocimiento Otros idiomas… Accesible para las máquinas 胡安花園照片
  19. 19. Jose Emilio Labra Gayo – Universidad de Oviedo ¿Accesible para las máquinas? Sí, es necesario Accedemos a la web mediante máquinas Procesan el contenido que vemos Nos "ayudan" a filtrar, visualizar, etc. Pero...son entes diferentes Algunas cosas, fáciles para humanos, difíciles para máquinas Difícil entender contexto
  20. 20. Jose Emilio Labra Gayo – Universidad de Oviedo Ejemplo "¿Dónde está Oviedo?" Puede ser una ciudad en España ...o una ciudad en Florida, USA ...o un jugador de fútbol ...o....¿Cómo sabemos a qué se refiere? URIs como identificadores únicos http://www.oviedo.es/ http://www.cityofoviedo.net/ https://twitter.com/Bryan_Oviedo
  21. 21. Jose Emilio Labra Gayo – Universidad de Oviedo Modelo de Estrellas* ★ Publicar los datos (en cualquier formato) ★★ Utilizar formato estructurado (Excel en lugar de imágenes escaneadas) ★★★ Usar formatos no propietarios (CSV en lugar de Excel) ★★★★ Usar URIs para identificar datos (otros sistemas puedan enlazar nuestros datos) ★★★★★ Enlazar con otros datos externos (proporcionar contexto) * Enunciado por Tim Berners-Lee en Gov 2.0 Expo 2010 http://www.youtube.com/watch?v=ga1aSJXCFe0
  22. 22. Jose Emilio Labra Gayo – Universidad de Oviedo Formatos no estructurados Formatos “caja negra”: Imágenes, vídeos, música, etc. Formatos binarios: PDF, PS, etc. Requieren técnicas de tratamiento de la señal, reconocimiento de patrones, etc. ★
  23. 23. Jose Emilio Labra Gayo – Universidad de Oviedo Problema de la pérdida semántica Pérdida de semántica en el proceso de publicación La persona que va a publicar tiene más información Esa información se pierde en el proceso publicador consumidor (persona) consumidor (agente) próximo sábado Semántica
  24. 24. Jose Emilio Labra Gayo – Universidad de Oviedo Formatos estructurados Los datos tienen una estructura Ejemplo: Hojas de cálculo Problema con formatos propietarios Requieren herramientas que no son públicas No resuelven el problema de la pérdida semántica ¿Qué significa cada celda? ★ ★
  25. 25. Jose Emilio Labra Gayo – Universidad de Oviedo Formatos no propietarios Utilizar formatos abiertos estructurados Ejemplos: CSV, HTML, JSON, XML… Permiten procesamiento automático Pero no resuelven el problema de la pérdida semántica ★ ★ ★
  26. 26. Jose Emilio Labra Gayo – Universidad de Oviedo El problema de HTML HTML tiene como objetivo publicar hipertexto Etiquetas HTML legibles por los navegadores Información dentro de marcas = lenguaje natural Las máquinas no entienden el lenguaje natural <p>Evento: <ul> <li>Nombre: Concierto</li> <li>Fecha: Próximo sábado</li> </ul> </p> <p>իրադարձություն: <ul> <li>տիպ: համերգ</li> <li>ամսաթիվ: հաջորդ շաբաթ/li> </ul> </p> ★ ★ ★
  27. 27. Jose Emilio Labra Gayo – Universidad de Oviedo <event> <name>համերգ</name> <date>հաջորդ շաբաթ</date> </event> El problema de XML XML da un paso más hacia la solución Se pueden definir vocabularios específicos Pueden crearse aplicaciones que los procesan Sin embargo, los documentos XML no se integran fácilmente si son de otros vocabularios <event> <name>Concierto</name> <date>Próximo sábado</date> </event> <իրադարձություն> <տիպ>համերգ </տիպ> <ամսաթիվ>հաջորդ շաբաթ</ամսաթիվ > </իրադարձություն> ★ ★ ★
  28. 28. Jose Emilio Labra Gayo – Universidad de Oviedo ¿Y JSON? Más o menos…lo mismo que XML JSON tiene un modelo jerárquico similar a XML Aunque existe JSON Schema, la validación es menos habitual Los nombres de los campos son cadenas de texto { "event": { "name": "Concierto" , "date": "Próximo sábado" } } { "event": { "name": "համերգ" , "date": "հաջորդ շաբաթ" } } { "իրադարձություն": { "տիպ": "համերգ" , "ամսաթիվ": "հաջորդ շաբաթ" } } ★ ★ ★
  29. 29. Jose Emilio Labra Gayo – Universidad de Oviedo URIs para identificar datos Utilizar URIs para identificar datos Negociación de contenido Devolver diferentes representaciones Ejemplo: HTML para personas con navegadores RDF para sistemas automáticos ★ ★ ★ ★
  30. 30. Jose Emilio Labra Gayo – Universidad de Oviedo Ejemplo: RDF ★ ★ ★ ★ <http://www.sepe.es/datos/desempleo/Asturias/Allande/2013/10> HTML? @prefix sepe: <http://www.sepe.es/datos/> sepe:obs1 sepe:municipio "Allande" ; sepe:desempleados 18 . RDF?
  31. 31. Jose Emilio Labra Gayo – Universidad de Oviedo ¿Varias representaciones de lo mismo? La arquitectura de la web separa recurso de representación Ejemplo: Bolsa de patatas fritas
  32. 32. Jose Emilio Labra Gayo – Universidad de Oviedo Enlazar con otros datos Las representaciones devueltas incluyen enlaces con otros datos Permite: Reutilizar y descubrir datos Aplicaciones "no previstas" ★ ★ ★ ★ ★
  33. 33. Jose Emilio Labra Gayo – Universidad de Oviedo Ejemplo: RDF bien enlazado ★ ★ ★ ★ ★ <http://www.sepe.es/datos/desempleo/Asturias/Allende/2013/10> HTML? @prefix sepe: <http://www.sepe.es/datos/> sepe:obs1 sepe:municipio <http://dbpedia.org/resource/Allande>; sepe:desempleados 23 . RDF? dbo:allande dbo:areaTotal 342.24 ; rdf:type <http:/.../municipalitiesInAsturias> ; dbo:country <http:/.../Spain> ; dbo:populationTotal 2106 ; . . .
  34. 34. Jose Emilio Labra Gayo – Universidad de Oviedo Principios Linked Open Data 1. Utilizar URIs para denotar cosas 2. Permitir que las URIs sean dereferenciables 3. Proporcionar información útil Para personas y máquinas (HTML, RDF) 4. Incluir enlaces a otras cosas relacionadas ★ ★ ★ ★ ★
  35. 35. Jose Emilio Labra Gayo – Universidad de Oviedo Linking Open Data (2007) ★ ★ ★ ★ ★
  36. 36. Jose Emilio Labra Gayo – Universidad de Oviedo Linking Open Data (2008) ★ ★ ★ ★ ★
  37. 37. Jose Emilio Labra Gayo – Universidad de Oviedo Linking Open Data (2009) ★ ★ ★ ★ ★
  38. 38. Jose Emilio Labra Gayo – Universidad de Oviedo Linking Open Data (2010) ★ ★ ★ ★ ★
  39. 39. Jose Emilio Labra Gayo – Universidad de Oviedo Linking Open Data (2011) ★ ★ ★ ★ ★
  40. 40. Jose Emilio Labra Gayo – Universidad de Oviedo Linking Open Data (2014) ★ ★ ★ ★ ★
  41. 41. Jose Emilio Labra Gayo – Universidad de Oviedo LOD (2017) ★ ★ ★ ★ ★
  42. 42. Jose Emilio Labra Gayo – Universidad de Oviedo Datos abiertos enlazados Ejemplos de iniciativas data.gov.uk data.worldbank.org data.gov datos.gob.es datos.gijon.es ... datos.bcn.cl data.webfoundation.org
  43. 43. Jose Emilio Labra Gayo – Universidad de Oviedo La Web Semántica Web semántica  Web de Datos Visión donde los datos se publican y se enlazan Objetivos: Reutilizar Automatizar Integrar Tim Berners Lee, inventor de la WWW
  44. 44. Jose Emilio Labra Gayo – Universidad de Oviedo Algunas tecnologías RDF Descripción datos SPARQL Consultas OWL - RDFS Inferencias SHEX - SHACL Validación
  45. 45. Jose Emilio Labra Gayo – Universidad de Oviedo RDF Resource Description Framework (1998) Descripción de recursos Recurso = se identifica con URI Se basa en tripletas Sujeto  Predicado  Objeto
  46. 46. Jose Emilio Labra Gayo – Universidad de Oviedo Tripletas RDF http://purl.org/dc/elements/1.1/creator Sujeto URI que Identifica Facultad Biología Predicado URI que identifica propiedad de creación Objeto URI que identifica Juan @prefix dc: <http://purl.org/dc/elements/1.1/>. @prefix uni: <http://uniovi.es/> . uni:biologia dc:creator uni:juan . http://uniovi.es/biology http://uniovi.es/juan RDF en notación Turtle
  47. 47. Jose Emilio Labra Gayo – Universidad de Oviedo Grafo RDF @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> . @prefix uni: <http://uniovi.es/> . @prefix dc: <http://purl.org/dc/elements/1.1/> . uni:biologia dc:creator uni:juan . uni:biologia dc:creator uni:ana . uni:juan rdf:type uni:Profesor . uni:ana rdf:type uni:Profesor . uni:biologia uni:juandc:creator uni:anadc:creator uni:Profesor rdf:type rdf:type
  48. 48. Jose Emilio Labra Gayo – Universidad de Oviedo RDF es composicional uni:quimica uni:ana dc:creator uni:luisdc:creator uni:Becario rdf:type uni:biologia uni:juan dc:creator dc:creator uni:Profesor rdf:type rdf:type uni:derecho dc:creator uni:Profesor uni:ana rdf:type uni:luis uni:Becario rdf:type Grafo 1 Grafo 2 Grafo 3
  49. 49. Jose Emilio Labra Gayo – Universidad de Oviedo RDF es composicional uni:quimica uni:ana dc:creator uni:luisdc:creator uni:Becario rdf:type uni:biologia uni:juan dc:creator dc:creator uni:Profesor rdf:type rdf:type uni:derecho dc:creator uni:Profesor uni:ana rdf:type uni:luis uni:Becario rdf:type Grafo 1 Grafo 2 Grafo 3
  50. 50. Jose Emilio Labra Gayo – Universidad de Oviedo RDF es composicional uni:quimica uni:ana dc:creator uni:luis dc:creator uni:Becario rdf:type uni:biologia uni:juan dc:creator dc:creator uni:Profesor rdf:type rdf:type uni:derecho dc:creator Grafo 1 + Grafo 2 + Grafo 3
  51. 51. Jose Emilio Labra Gayo – Universidad de Oviedo Formatos RDF Numerosos formatos y sintaxis: N3 RDF/XML N-Triples Turtle json-ld RDFa etc.
  52. 52. Jose Emilio Labra Gayo – Universidad de Oviedo SPARQL Simple Protocol and RDF Query Language Lenguaje de consultas para la web semántica Encaje de grafos Extrae información de modelos RDF Un protocolo Define un mecanismo para invocar un servicio También define un vocabulario para resultados
  53. 53. Jose Emilio Labra Gayo – Universidad de Oviedo SPARQL Ejemplo: Buscar páginas cuyo autor sea un profesor @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> . @prefix uni: <http://uniovi.es/> . @prefix dc: <http://purl.org/dc/elements/1.1/> . SELECT ?p ?c WHERE { ?p dc:creator ?c . ?c rdf:type uni:Profesor. }
  54. 54. Jose Emilio Labra Gayo – Universidad de Oviedo Encaje de grafos SELECT ?p ?c WHERE { ?p dc:creator ?c . ?c rdf:type uni:Profesor . } uni:quimica uni:ana dc:creator uni:luis dc:creator uni:Becario rdf:type uni:biologia uni:juan dc:creator dc:creator uni:Profesor rdf:type rdf:type uni:derecho dc:creator ?p dc:creator ?c uni:Profesor rdf:type ?p ?c Resultados ?p ?c uni:biologia uni:juan uni:quimica uni:ana uni:biologia uni:ana ?p ?c ?p ?c
  55. 55. Jose Emilio Labra Gayo – Universidad de Oviedo RDF Schema Añade un vocabulario de esquema a RDF Class, Property, Resource,… type, subClassOf, subPropertyOf,… range, domain,… RDF Schema permite inferencias
  56. 56. Jose Emilio Labra Gayo – Universidad de Oviedo RDF Schema rdf:type uni:Profesor rdfs:subClassOf uni:Persona Ejemplo uni:juan rdf:type
  57. 57. Jose Emilio Labra Gayo – Universidad de Oviedo SPARQL + Inferencia Combinar SPARQL e inferencia Ejemplo: Páginas cuyo autor sea una persona @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> . @prefix uni: <http://uniovi.es/> . @prefix dc: <http://purl.org/dc/elements/1.1/> . SELECT ?p ?c WHERE { ?p dc:creator ?c . ?p rdf:type uni:Persona. }
  58. 58. Jose Emilio Labra Gayo – Universidad de Oviedo uni:quimica uni:ana dc:creator uni:luis dc:creator uni:Becario rdf:type uni:biologia uni:juan dc:creator dc:creator uni:Profesor rdf:type rdf:type uni:derecho dc:creator uni:Persona rdfs:subClassOf rdfs:subClassOf SPARQL con inferencia SELECT ?p ?c WHERE { ?p dc:creator ?c . ?c rdf:type uni:Persona . } ?p dc:creator ?c uni:Persona rdf:type ?p ?c Resultados ?p ?c uni:biologia uni:juan uni:quimica uni:ana uni:biologia uni:ana ?p ?c ?p ?c rdf:type rdf:type ?p ?c uni:derecho uni:luis
  59. 59. Jose Emilio Labra Gayo – Universidad de Oviedo Ontologías RDF Schema permite hacer inferencias sencillas Poca expresividad OWL (Web Ontology Language) Añade más expresividad Formalizar dominios concretos: ontologías Expresividad vs Complejidad
  60. 60. Jose Emilio Labra Gayo – Universidad de Oviedo Mitos de la Web Semántica Navegador inteligente Una nueva Web El cerebro global La gran verdad: Una única ontología Una etiqueta para cada cosa Nadie querrá compartir datos Demasiada apertura Moda pasajera No hay Killer application
  61. 61. Jose Emilio Labra Gayo – Universidad de Oviedo El navegador inteligente Mito: El objetivo es conseguir sistemas que naveguen por internet de forma inteligente Realidad: Objetivo = desarrollar tecnologías que faciliten el procesamiento automático de la información de la Web y su integración No es Inteligencia Artificial pero sí se utilizan técnicas de esa disciplina
  62. 62. Jose Emilio Labra Gayo – Universidad de Oviedo Una nueva Web Mito: La Web Semántica ( Web 3.0) es una nueva versión de la web que obligará a cambiar todo lo que ya hay Realidad: Se propone transición gradual. Las tecnologías ofrecerán valor añadido.
  63. 63. Jose Emilio Labra Gayo – Universidad de Oviedo El cerebro global Mito: El proyecto de la Web semántica generará un cerebro global Realidad: La web semántica facilitará un mejor uso de los datos de la web. Sí es un camino hacia la inteligencia colectiva
  64. 64. Jose Emilio Labra Gayo – Universidad de Oviedo La gran verdad Mito: Se propone la creación de una única ontología con todo el conocimiento de la humanidad Realidad: Múltiples ontologías para diferentes dominios Facilitar la integración Mejorar la descripción de dominios
  65. 65. Jose Emilio Labra Gayo – Universidad de Oviedo Una etiqueta para cada cosa Mito: El objetivo es asignar una etiqueta similar a RFID para cada cosa Realidad No es factible que cada cosa conlleve sus propios metadatos Descripciones de recursos externas a ellos
  66. 66. Jose Emilio Labra Gayo – Universidad de Oviedo Nadie querrá compartir datos Mito: Los proveedores de información no tendrán motivación para adoptar tecnologías nuevas Realidad: Lo harán cuando encuentren un retorno de inversión adecuado Posicionamiento semántico http://schema.org Principales buscadores indexan datos estructurados Google, Yandex, Yahoo, Bing
  67. 67. Jose Emilio Labra Gayo – Universidad de Oviedo Demasiada apertura Mito: Si abrimos datos de bases de datos, los perdemos Realidad: Hay tecnologías para limitar acceso Declarar de dónde provienen los datos Establecer propiedad legal de los datos
  68. 68. Jose Emilio Labra Gayo – Universidad de Oviedo Moda pasajera Mito: Mito1: La Web semántica es algo nuevo Mito 2: La Web semántica es algo viejo Realidad: Planteada ya en 1994, visión a largo plazo Exceso de entusiasmo vs escepticismo Casos de éxito: RSS, microformatos, XBRL,… "A little semantics goes a long way"
  69. 69. Jose Emilio Labra Gayo – Universidad de Oviedo No hay killer application Mito: No se ha desarrollado una killer application Realidad: ¿Es necesaria? ¿Linked Open Data?
  70. 70. Jose Emilio Labra Gayo – Universidad de Oviedo Retos Proyecto Web semántica: Primera fase = producción Segunda fase = consumo Calidad es cada vez más importante
  71. 71. Jose Emilio Labra Gayo – Universidad de Oviedo Fin de la Presentación

×