PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
Introducción a Linked Data [esp]
1. Linked Data
Jon Lázaro, Aitor Almeida
DeustoTech - Deusto Institute of Technology, University of Deusto
http://www.morelab.deusto.es
The degeneration of rationalism 1/6
2. Índice
¿Qué es Linked Data?
¿Por qué Linked Data?
Tecnología
Publicar Linked Data
Consumir Linked Data
Linked ¿Open? Data
Conclusiones
Preguntas
Linked Data Índice 2/42
3. ¿Qué es Linked Data?
Una serie de buenas prácticas para...
publicar
compartir
conectar
...datos e información en la Web.
Linked Data ¿Qué es Linked Data? 3/42
4. Principios Linked Data
Estas buenas prácticas las expuso públicamente Sir Tim
Berners-Lee en TED2009 en forma de
4 principios
Linked Data ¿Qué es Linked Data? 4/42
5. Principios Linked Data
1. Utilizar identificadores globales para nombrar las cosas:
URIs
2. Hacer accesible la información mediante el protocolo de
comunicación HTTP
3. Cuando se accede a una URI, proveer información relevante,
usando estándares (RDF, SPARQL)
4. Incluir links a otras URIs, para que descubrir nuevas cosas.
CO2 13717
http://.../mideResiduo http://.../numeroHabitantes
http://.../situadoEn
http://bizkaisense/.../station/BEASAIN http://geolinked/.../municipio/Beasain
BBDD de Sensores BBDD de Localizaciones
Bizkaisense GeoLinkedData
Linked Data ¿Qué es Linked Data? 5/42
6. Índice
¿Qué es Linked Data?
¿Por qué Linked Data?
Tecnología
Publicar Linked Data
Consumir Linked Data
Linked ¿Open? Data
Conclusiones
Preguntas
Linked Data Índice 6/42
7. ¿Por qué Linked Data?
Estado actual de la web: Web de Documentos
Mucha información pero...
Orientada a documentos, no a datos
Poco estructurada
No procesable de forma automática
Linked Data ¿Por qué Linked Data? 7/42
8. ¿Por qué Linked Data?
Objetivo de Linked Data: Web de Datos
Evolución de la web actual en la que...
Los datos están bien estructurados
La información es procesable tanto por humanos como
por máquinas
Linked Data ¿Por qué Linked Data? 8/42
9. ¿Por qué Linked Data?
Ejemplo simple del potencial de la Web de Datos
Al hacer una búsqueda compleja en buscadores como
Google...
1 resultado correcto pero
incompleto
N resultados
incorrectos o
irrelevantes
Linked Data ¿Por qué Linked Data? 9/42
10. ¿Por qué Linked Data?
Ejemplo simple del potencial de la Web de Datos
Busqueda compleja sobre la web de datos...
* Actualmente existen multitud
herramientas que realizan traducciones
de lenguaje natural a este tipo de
consultas complejas
Linked Data ¿Por qué Linked Data? 10/42
11. Índice
¿Qué es Linked Data?
¿Por qué Linked Data?
Tecnología
Publicar Linked Data
Consumir Linked Data
Linked ¿Open? Data
Conclusiones
Preguntas
Linked Data Índice 11/42
12. ¿Cómo se consigue esto?
Mediante varias tecnologías...
URI
RDF
OWL
RDF-S
SPARQL
...
Linked Data Tecnología 12/42
13. Tecnologías
URI – Uniform Resource Identifier
•
Identificadores únicos para recursos en la web
•
Son el punto de acceso a los datos
http://dbpedia.org/resource/Pablo_Picasso
Linked Data Tecnología 13/42
14. Tecnologías
RDF – Resource Description Framework
•
Modelo para representar metadatos en la web
•
Describen recursos de forma semántica
•
Formato tripleta: Sujeto – Predicado - Objeto
1881-10-25
dbpedia-owl:birthDate
http://dbpedia.org/resource/Pablo_Picasso foaf:name Pablo Picasso
dbpedia-owl:birthPlace
http://dbpedia.org/resource/Málaga
Linked Data Tecnología 14/42
15. Tecnologías
Serializaciones RDF: RDF/XML, Turtle, N3...
•
Formatos para expresar RDF
•
Sirven para compartir los datos
<rdf:Description rdf:about=” http://dbpedia.org/resource/Pablo_Picasso”>
<dbpedia-owl:birthDate>1881-10-25</dbpedia-owl:birthDate>
<dbpedia-owl:birthPlace rdf:resource=”http://dbpedia.org/resource/Málaga” />
<foaf:name>Pablo Picasso</foaf:name>
</rdf:Description>
Linked Data Tecnología 15/42
16. Tecnologías
RDF-Schema y OWL
•
Lenguajes para definir ontologías y vocabularios para
describir los recursos
SPARQL
•
Lenguaje de consultas para acceder a datos RDF
SELECT ?artista WHERE {
?artista <dbpedia-owl:birthPlace><http://dbpedia.org/resource/Málaga> .
}
Linked Data Tecnología 16/42
17. Índice
¿Qué es Linked Data?
¿Por qué Linked Data?
Tecnología
Publicar Linked Data
Consumir Linked Data
Linked ¿Open? Data
Conclusiones
Preguntas
Linked Data Índice 17/42
18. Publicar Linked Data
Algunos enfoques:
•
Publicación de datos usando directamente
serializaciones RDF y siguiendo los principios Linked
Data.
•
Publicando mediante CMSs como Drupal, que incorporan
RDF para mostrar datos.
•
Adaptando datos estructurados existentes
Linked Data Publicar Linked Data 18/42
19. Publicar Linked Data
Herramientas para adaptar datos estructurados
•
D2RQ, Triplify... (Bases de datos relacionales).
•
TripFS (Sistema de ficheros completo).
•
TripCel (Hojas de cálculo XLS)
•
Google Refine + Extensión RDF (Cualquier dato
bidimensional: HTML, CSV, Excel...)
•
...
Linked Data Publicar Linked Data 19/42
20. Publicar Linked Data
Otras herramientas de publicación:
Librerías para manejar RDF
•
Java: Jena / Sesame.
•
Python: RDFlib.
•
Ruby: RDF.rb.
•
C/C++: Redland.
•
...
Linked Data Publicar Linked Data 20/42
21. Publicar Linked Data
Otras herramientas de publicación:
Almacenamiento de tripletas RDF
•
OpenLink Virtuoso
•
4Store
•
SDB
•
AllegroGraph
•
...
Linked Data Publicar Linked Data 21/42
22. Publicar Linked Data
Otras herramientas de publicación:
SiLK
•
Framework de enlazado de conjuntos de datos.
•
Genera links en base a ciertas condiciones especificadas
mediante su lenguaje de especificación.
Linked Data Publicar Linked Data 22/42
23. Índice
¿Qué es Linked Data?
¿Por qué Linked Data?
Tecnología
Publicar Linked Data
Consumir Linked Data
Linked ¿Open? Data
Conclusiones
Preguntas
Linked Data Índice 23/42
24. Consumir Linked Data
•
Consultas SPARQL
•
Navegadores Linked Data
•
Permiten explorar Linked Data y navegar entre
conceptos.
•
Ej.: Tabulator, Disco...
•
Buscadores Linked Data
•
Buscan datos entre datasets Linked Data.
•
Ej.: Falcons, Sindice, Watson...
Linked Data Consumir Linked Data 24/42
25. Índice
¿Qué es Linked Data?
¿Por qué Linked Data?
Tecnología
Publicar Linked Data
Consumir Linked Data
Linked ¿Open? Data
Conclusiones
Preguntas
Linked Data Índice 25/42
26. Linked ¿Open? Data
La web está formada por “silos” de información:
Bases de datos cerradas
Datos solo procesables si el editor provee métodos:
SOAP, REST, FTP...
Información poco/nada estructurada
Publicación bajo formatos cerrados
Linked Data Linked ¿Open? Data 26/42
27. Linked Open Data
En respuesta a ello: Linked Open Data
Datos abiertos
Fácilmente accesibles
Semánticamente estructurados
Publicados bajo formatos abiertos
Enlazados
Linked Data Linked ¿Open? Data 27/42
29. Evaluación Linked Open Data
★ Abrir los datos a la web, en cualquier
PDF
formato, pero bajo licencias libres.
★★ Hacer los datos accesibles como datos
Excel
estructurados.
★★★ Estructurar los datos bajo formatos CSV
no-propietarios.
★★★★
Usar URIs para identificar lo publicado. RDF
★★★★★ Enlazar los datos publicados con otros
Linked Open Data
datos.
Linked Data Linked ¿Open? Data 29/42
30. LOD Cloud
Linking Open Data (LOD)
Community Project del W3C para la publicación de
conjuntos de datos siguiendo las directrices Linked Open
Data.
LOD Cloud
Nube de conjuntos de datos abiertos bajo Linked Data
(5★) relacionados entre sí.
Linked Data Linked ¿Open? Data 30/42
31. LOD Cloud
Evolución (2007)
Hechos relevantes
•
DBpedia: Wikipedia
Semántica
•
Datasets multimedia
•
Grandes datasets:
Censo EEUU, FOAF...
Tamaño
•
+1.000.000.000
tripletas
•
+250.000 links
Linked Data Linked ¿Open? Data 31/42
34. LOD Cloud
Evolución (2010)
Hechos relevantes
•
+100 datasets nuevos en
menos de un año.
Tamaño
•
+20.000.000.000 tripletas
•
+250.000.000 links
Linked Data Linked ¿Open? Data 34/42
35. LOD Cloud
Evolución (Actualidad)
Tamaño
•
+31.000.000.000
tripletas
•
+500.000.000 links
Más datasets en
TheDataHub
(diagrama no
actualizado desde
09/2011)
Linked Data Linked ¿Open? Data 35/42
36. Linked Open Data
Beneficios de Linked Open Data
•
Otras personas y aplicaciones puede acceder a los datos
mediante estándares Web.
•
Se puede obtener mayor información contextual
siguiendo los enlaces.
•
Mayor visibilidad e indexabilidad de los datos.
Linked Data Linked ¿Open? Data 36/42
37. Linked ¿Closed? Data
Es posible mediante:
Control de accesso a las URIs.
Manejo de usuarios y privilegios en SPARQL.
Beneficios
Todos los beneficios en términos de procesamiento, razonamiento y
contextualización que provee Linked Data.
Ejemplo de aplicación
Unión de datos (inter-intra)empresariales para su posterior
procesamiento.
Linked Data Linked ¿Open? Data 37/42
38. Índice
¿Qué es Linked Data?
¿Por qué Linked Data?
Tecnología
Publicar Linked Data
Consumir Linked Data
Linked ¿Open? Data
Conclusiones
Preguntas
Linked Data Índice 38/42
39. Conclusiones
Linked Data es...
•
Recomendaciones acerca de cómo publicar datos...
...usando nuevas tecnologías...
...para evolucionar a la Web de Datos.
Usado por...
•
Instituciones como BBC, The New York Times...
•
Gobiernos (Open-Government): Estados Unidos, Gran Bretaña...
•
Empresas tecnológicas: Google, Yahoo...
•
...
Y que ofrece...
•
Interoperabilidad, contextualización, semántica, procesamiento...
•
Es resumen, la posibilidad de crear valor añadido mediante el enlazado de datos
semánticos.
Linked Data Conclusiones 39/42
40. Índice
¿Qué es Linked Data?
¿Por qué Linked Data?
Tecnología
Publicar Linked Data
Consumir Linked Data
Linked ¿Open? Data
Conclusiones
Preguntas
Linked Data Índice 40/42
41. Preguntas
¿?
También en jlazaro [at] deusto.es
Linked Data Preguntas 41/42
42. Reconocimiento
Transparencias basadas en:
•
Bernhard Haslhofer. “Linked Data Tutorial.” Education,
March 9, 2009.
http://www.slideshare.net/bhaslhofer/linked-data-tutor
ial
•
Oscar Corcho. “Introduction to Linked Data.”
September 14, 2010.
http://www.slideshare.net/ocorcho/introduction-to-lin
ked-data
Linked Data Agradecimientos 42/42