Web de Dados: da Web de Documentos para a Web de Dados
1. LINKED DATA:
da Web de Documentos para
a Web de Dados
Danusa Ribeiro
Bernadette Lóscio
Damires Souza
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí.
2. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 2
como tudo Começou?
3. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 3
Os dados viviam isolados em ilhas de informação
<....>
<....>
<....>
<....>
<....>
<....>
<....> <....>
<....>
<....>
<....>
<....> <....>
<....>
<....>
<....>
<....> <....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....> <....>
<....>
<....>
<....> <....>
<....>
<....>
<....>
<....>
<....> <....>
<....>
<....>
<....>
<....>
<....> <....>
<....>
<....>
<....> <....>
<....>
Os dados eram guardados em arquivos e tinham
muitos problemas de redundância entre si.
4. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 4
Para solucionar esses problemas, os dados começaram
a se organizar em banco de dados.
projeto eng.
livro editora
dept
autor
prod venda
item
5. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 5
Com o passar do tempo, os bancos de dados foram se
organizando em grupos e daí surgiram os sistemas
de bancos de dados distribuídos e as federações
de bancos de dados.
6. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 6
... com o passar dos anos, eis que surgiu:
a World Wide Web
Criada por Tim Berners Lee.
7. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 7
“A ideia é que a máquina consiga
entender e interpretar os dados da Web de
forma a raciocinar sobre eles, inferindo
novos conhecimento e provendo
informações e serviços relevantes aos
usuários”
The World Wide Web: Past, Present and Future
Tim Berners-Lee
Agosto, 1996
8. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 8
A Web organiza as informações disponíveis na
Internet por meio de hipertexto e torna a
interação do usuário com a rede mundial
mais amigável.
9. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 9
a Web atual
Páginas direcionadas para pessoas e não para o
processamento
O principal foco é apresentação de
informações
O processo de interpretação é feito pelos usuários
10. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 10
... Daí, volume de dados digitais cresceu
imensamente e a Web tornou-se um espaço
global de informações.
<....>
Páginas
<....>
<....>
<....>
<....>
<....> HTML
<....> <....> <....>
<....>
<....> <....>
<....> <....>
<....>
<....> <....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....> <....>
<....> <....> <....>
<....> <....>
<....> <....>
<....>
<....> <....>
<....>
<....> <....>
<....> <....>
<....> <....>
<....>
<....> <....> <....>
<....><....>
<....> <....>
<....> <....>
<....><....>
<....> <....>
<....> <....> <....>
<....>
11. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 11
a Web atual
Porque os computadores não conseguem
interpretar as informações?
...faltam informações sobre as Páginas =(
12. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 12
a Web atual...
é apenas Sintática.
13. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 13
web Sintática
mecanismos de busca baseados em
palavras-chave
Grande número de páginas com pouca precisão
Informações distribuídas em várias páginas e
integração manual
15. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 15
... mas
nem todos os dados podem ser encontrados por meio
dos mecanismos de busca
não é possível especificar consultas complexas sobre
os dados
assim como no tempo dos arquivos, os dados na Web
ainda vivem isolados uns dos outros
16. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 16
O que fazer para transformar a Web em um
verdadeiro espaço global de dados?
aumentar a estrutura do conteúdo da Web ?
prover significado para os dados ?
estabelecer padrões para a publicação de dados e
criação de links entre eles ?
17. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 17
Então, Tim Berners Lee teve mais uma
brilhante ideia...
“The Semantic Web is the extension of the
World Wide Web that enables people to share
content beyond the boundaries of applications
and websites. It has been described in rather
different ways: as a utopic vision, as a web of
data, or merely as a natural paradigm shift in
our daily use of the Web.”
semanticweb.org
18. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 18
Web Semântica
Representar o conteúdo da Web para facilitar o seu
processamento
Categorizar as informações para facilitar o acesso
os dados estão mais ricos, são associados a
vocabulários e possuem um significado
19. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 19
Aaaaaagora sim...
os dados não precisam mais viver isolados e
podem ser compartilhados por diversas
aplicações
os dados, agora chamados de recursos, são
únicos e possuem a sua própria identificação
na Web!
20. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 20
Tááá legal, mas onde entra Linked Data
nessa história?
21. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 21
Conjunto de melhores práticas para a publicação de
dados estruturados na Web.
“Linked Data is about using the Web to connect
related data that wasn't previously linked, or using
the Web to lower the barriers to linking data currently
linked using other methods.”
linkeddata.org
"a term used to describe a recommended best practice
for exposing, sharing, and connecting pieces of data,
information, and knowledge on the Semantic Web
using URIs and RDF.”
wikipedia
22. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 22
Arquitetura da Web Clássica
Máquinas
Navegadores de Busca
<....> <....> <....> <....>
<....> <....>
<....> <....>
<....> <....> <....>
<....>
<....> <....>
<....>
<....> <....>
<....> <....> <....>
<....>
<....> <....>
<....>
<....> <....>
<....>
Hiperlinks
A B C
23. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 23
Web APIs e Mashups
1 APIs tem interface proprietárias
Mashups
2 Mashups são baseados em um
conjunto fixo de fontes de dados
3 Não se pode „linkar‟ item de dados de APIs
diferentes
<....> <....> <....>
<....> Web APIs <....>
Web APIs <....>
<....> <....> <....>
A B C
24. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 24
Reproduzido de www.economist.com (illustration by David Simonds)
25. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 25
Linked Data
RDF Link RDF
Link RDF RDF RDF
RDF
RDF
Link RDF RDF Link RDF
RDF RDF RDF
26. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 26
Contextualizando....
Web de Documentos Web de Dados
Navegadores HTML Navegadores RDF
(HyperText Markup (Resource Description
Language) Framework)
hiperlinks links RDF
URIs, HTTP, HTML URIs, HTTP, RDF,
SPARQL
27. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 27
Padrões Linked Data
• URIs – Uniform Resource Identifiers
URI é uma cadeia de caracteres compacta usada para
identificar ou denominar um recurso na Internet,
onde um recurso pode ser um documento html, uma
figura ou uma pessoa.
O principal propósito desta identificação é permitir a
interação com representações do recurso através
de uma rede, tipicamente a Web, usando protocolos
específicos.
28. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 28
Padrões Linked Data
• URIs – Uniform Resource Identifiers
URL URN
Identifica o Item Localiza o item
ISBN: 0-486-27557-4 file://home/Desktop/RomeoAndJuliet.pdf
Livro Romeu e Julieta
29. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 29
Padrões Linked Data
• URIs – Uniform Resource Identifiers
identificar objetos e conceitos
Por exemplo, a URI http://www.w3.org/People/Berners-
Lee/card#i
identifia o pesquisador Tim Bernes-Lee.
30. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 30
Padrões Linked Data
• HTTP – HyperText Transfer Protocol
responsável pelo tratamento de pedidos e respostas
entre cliente e servidor na Web
utilizado para a comunicação entre computadores
na Internet e a especificar como seriam realizadas as
transações entre clientes e servidores, através do uso de
regras básicas
31. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 31
Padrões Linked Data
• HTTP – HyperText Transfer Protocol
Servidor
PC rodando Mozila
PC rodando Chrome
32. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 32
Padrões Linked Data
HTTP – HyperText Transfer Protocol
[Redes de Computadores e a Internet - James F.
Kurose, Keith W. Ross]
33. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 33
Padrões Linked Data
• RDF – Resource Description Framework
“RDF is a standard model for data interchange on the
Web. RDF has features that facilitate data merging
even if the underlying schemas differ, and it
specifically supports the evolution of schemas over
time without requiring all the data consumers to be
changed.”
http://www.w3.org/RDF/
34. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 34
Padrões Linked Data
• RDF – Resource Description Framework
Como representar os dados dos bds ou das
páginas html para que os eles possam ser
compartilhados na Web?
35. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 35
id title professor year genre
01 FUP Berna Farias 2007 algoritmos
02 Programação Berna Farias 2009 algoritmos
03 BD I Berna Farias 2009 BD
04 SGBD Damires Souza 2010 BD
05 BDNC Berna Farias 2011 BD
Disciplinas computação
36. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 36
Os dados podem ser distribuídos em:
Linhas
Colunas
Células
37. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 37
03 BD I Berna Farias 2009 BD
02 Programação Berna Farias 2009 algoritmos
1
01 FUP Berna Farias 2007 algoritmos
2 04 SGBD Damires Souza 2010 BD
3 Berna Farias 2011 BD
05 BDNC
Distribuição por linha
38. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 38
Padrões Linked Data
eita... Cadê o esquema? Quem é o quê?
03 BD I Berna Farias 2009 BD
02 Programação Berna Farias 2009 algoritmos
1
01 FUP Berna Farias 2007 algoritmos
2 04 SGBD Damires Souza 2010 BD
3 Berna Farias 2011 BD
05 BDNC
Title
39. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 39
title 1 professor 2
FUP Berna Farias
Programação Berna Farias
BD I Berna Farias
SGBD 3 Damires Souza
Berna Farias
BDNC year genre
2007 algoritmos
2009 algoritmos
2009 BD
2010 BD
Distribuição por coluna 2011 BD
40. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 40
... e agora??? Quem é quem?
title 1 professor 2
Berna Farias
FUP Id
Programação Berna Farias
BD I Berna Farias
SGBD 3 Damires Souza
Berna Farias
BDNC year genre
2007 algoritmos
2009 algoritmos
2009 BD
2010 BD
2011 BD
41. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 41
title
2 professor
row 3 BD I
row 1 Berna Farias
genre
1
row 2 algoritmos
year genre
3 row 5 2011 row 1 algoritmo
Distribuição por célula
42. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 42
Iiiihhhhhhh... Agora complicou =(
Como eu vou saber “quem é o quê” e
“quem é quem” ?
43. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 43
Quer dizer então que eu preciso ter uma maneira
global para referenciar?
As linhas sujeito
As colunas predicado
E os valores objeto
44. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 44
Nós precisamos de triplas!
subject predicate object
Row 5 BD BDNC
Row 2 title Programação
Row 2 year 2009
Row 4 professor Damires Souza
Row 3 genre BD
45. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 45
Várias triplas podem fazer referência a uma
mesma entidade!
subject predicate object
Berna Farias leciona BDNC
Claudia é_irmã Berna Farias
Berna Farias mora_em Recife
Recife Is in Pernambuco
Pernambuco parte_de Brasil
Ceará Parte_de Brasil
Berna Farias leciona Programação
46. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 46
Triplas de diferentes fontes podem ser facilmente
combinadas para formar um único grafo
Além disso, é possível usar termos de diferentes
vocabulários para representar os dados.
O modelo RDF ainda permite a representação de
dados em diferentes níveis de estruturação, sendo
possível representar desde dados semiestruturados
a dados altamente estruturados.
47. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 47
Padrões Linked Data
• SPARQL
é a linguagem de consulta padrão recomendada pelo W3C para
recuperação de informações contidas em grafos RDF
48. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 48
Padrões Linked Data
• SPARQL
• Select: Especifica uma projeção sobre os dados como a ordem e
a quantidade de atributos e/ou instâncias que serão
retornados.
• From: Declara as fontes que serão consultadas. Esta cláusula
é opcional. Quando não especificada, assumimos que a busca
será feita em um documento RDF/RDFS particular.
• Where: Impões restrições na consulta. Os registros retornados
pela consulta deverão satisfazer as restrições impostas por esta
cláusula.
49. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 49
uma consulta
que retorna o
escritor que
escreveu o livro
King Lear e é
casado com
AnneHathaway
50. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 50
Princípios Linked Data
1 Usar URIs como nomes para recursos
Usar URIs HTTP para que as pessoas possam encontrar
2 esses nomes
Quando alguém procurar por uma URI, através dessa,
3 providenciar informações úteis, por meio de RDFs
4 Incluir sentenças RDF que ligam para outras URIs de
forma que eles possam descobrir mais recursos.
50
51. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 51
dados linkados
rdf: type
pd:cygr foaf:Person
foaf: name
Richard Cyganiak
foaf: based_near
dbpedia:Berlin
dbpedia:Berlin = http://dbpedia.org/resource/Berlin
52. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 52
dados linkados
rdf: type
pd:cygr
foaf:Person
foaf: name
Richard Cyganiak
foaf: based_near dp:population 3.405.259
dbpedia:Berlin
skos:subject
dp:Cities_in_Germany
53. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 53
rdf: type dados linkados
pd:cygr
foaf:Person
foaf: name
Richard Cyganiak
foaf: based_near dp:population 3.405.259
dbpedia:Berlin
dbpedia:Hamburg skos:subject
skos:subject
dp:Cities_in_Germany
dbpedia:Muenchen
skos:subject
54. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 54
poxa.... E isso já é realidade? Já existem dados na Web
de Dados?
Sim! Projeto Linking Open data
linkeddata.org
54
55. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 55
Fundado em janeiro de 2007 e apoiado pelo
W3C
“identificar conjuntos de dados disponíveis
sob licenças abertas e convertê-los para RDF
de acordo com os princípios Linked Data”
55
56. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 56
57. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 57
... e como eu posso publicar dados na Web de
Dados seguindo os princípios Linked Data?
58. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 58
Como publicar...Passo 1
Criação de URIs adequadas
59. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 59
Como publicar...Passo 1
• Usar URIs HTTP para tudo, tornando-as passíveis de serem
dereferenciadas.
• Evitar URIs com detalhes de implementação ou do
ambiente em que estão publicadas.
X
http://www.lia.ufc.br:8080/~danusarbc /index.php X
60. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 60
Como publicar...Passo 1
• Manter as URIs estáveis e persistentes
• usar algum tipo de chave primária dentro das URIs,
para se certificar de que cada uma delas é única.
Livros ISBN
Cool URIs for the Semantic Web
http://www.w3.org/TR/cooluris/
61. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 61
Como publicar...Passo 2
Usar URIs dereferenciáveis
62. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 62
Como publicar...Passo 2
É o processo de recuperar uma
representação de um recurso
identificado por uma URI, onde um
recurso pode ter várias representações
como documentos HTML, RDF, XML
entre outros.
63. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 63
Como publicar...Passo 2
A recuperação da representação mais
adequada para o usuário é feita por meio da
negociação de conteúdo.
Get, Head, Post, Put, Delete,
Trace, Options, Connection
Cliente
Servidor
64. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 64
Como publicar...Passo 2
Duas estratégias
303 URI e Hash URI
65. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 65
Como publicar...Passo 2
303 é um código de status de
redirecionamento no qual o servidor
pode dar a localização de um
documento que contém informações
sobre um recurso.
66. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 66
GET /resource/Berlin HTTP/1.1
Host: dbpedia.org 1
Accept: text/html;q=0.5, application/rdf+xml
HTTP/1.1 303 See Other
Location: http://dbpedia.org/data/Berlin
Vary: Accept 2
GET /data/Berlin HTTP/1.1
Host: dbpedia.org 3
Accept: text/html;q=0.5, application/rdf+xml
HTTP/1.1 200 OK
Como obter informações Content-Type: application/rdf+xml;charset=utf-
sobre a cidade de 8
Berlin 4
<?xml version="1.0"?>
fonte Dbpedia: http://dbpedia.org/ <rdf:RDF
xmlns:units="http://dbpedia.org/units/"
xmlns:foaf="http://xmlns.com/foaf/0.1/"
xmlns:geonames="http://www.geonames.org/ontology#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
...
67. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 67
Como publicar...Passo 2
Hash URI
a URI contém um fragmento, uma parte
especial que é separada do resto da URI
pelo símbolo #. Quando um cliente deseja
recuperar uma hash URI, ele remove tudo
que vem após o símbolo # e envia o
restante da URI para o servidor. Como
resposta, o cliente recebe um documento
completo com o conteúdo solicitado.
68. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 68
GET /vocab/sme HTTP/1.1
Host: bidlynx.co.uk
Accept: application/rdf+xml
1
HTTP/1.1 200 OK
Vocabulário Content−Type: application/ rdf+xml ; charset=utf −8
http://biglynx.co.uk/vocab/s
<? xml version ="1.0"?>
me <rdf:RDF
xmlns:rdf=" http: //www.w3.org /1999/02/22 −
2
rdf−syntax−ns#"
xmlns:rdfs=" http: //www.w3.org /2000/01/ rdf−schema#">
http://biglynx.co.uk/vocab/s
me#SmallMediumEnterprise <rdf:Description
rdf:about="http: // biglynx .co .uk/ vocab
/sme#SmallMediumEnterprise ">
http://biglynx.co.uk/vocab/s
<rdf:type rdf:resource=" http: //www.w3.org /2000/01/
me#Team rdf−schema#Class " />
</ rdf:Description>
...
69. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 69
Como publicar...Passo 3
Criação de links RDF
70. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 70
Como publicar...Passo 3
devem ser criados links para outras
fontes, seja de forma manual ou
automatizada.
71. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 71
Como publicar...Passo 3
devem ser criados links para outras
fontes, seja de forma manual ou
automatizada
links RDF internos e externos
72. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 72
Como publicar...Passo 3
links RDF internos
conecta recursos dentro de uma única
fonte de dados Linked Data
73. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 73
Como publicar...Passo 3
links RDF externos
conectam recursos os quais são
provenientes de diferentes fontes de dados
Linked Data
74. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 74
Como publicar...Passo 3
Sujeito: http://www.w3.org/People/Berners-Lee/card#i
Predicado: http://www.w3.org/2002/07/owl#sameAs
Objeto: http://www4.wiwiss.fu-berlin.de/dblp/resource/person/100007
Sujeito: http://dbpedia.org/resource/Tim_Berners-Lee
Predicado: http://www.w3.org/2002/07/owl#sameAs
Objeto: http://www4.wiwiss.fu-berlin.de/dblp/resource/person/100007
75. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 75
Como publicar...Passo 3
Ao se criar links RDF é preciso estabelecer
relações entre os termos dos vocabulários
entre as fontes que estão sendo
interligadas
76. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 76
Como publicar...Passo 3
• Friend-of-a-Friend (FOAF)
• Semantically-Interlinked Online
Communities (SIOC)
• Simple Knowledge Organization
System (SKOS)
• Description of a Project (DOAP)
• Creative Commons (CC)
• Dublin Core (DC).
77. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 77
Como publicar...Passo 4
Explicitar formas de acesso adicional
aos dados
78. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 78
Como publicar...Passo 4
Para acessar os dados das fontes
Linked Data é preciso realizar
consultas SPARQL sobre as fontes.
79. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 79
Como publicar...Passo 4
SPARQL endpoint é um serviço Web com
suporte ao protocolo SPARQL.
possui uma URI especifica para receber
requisições HTTP com consultas SPARQL e
retornar os resultados dessas consultas em
diferentes formatos como XML, JSON, texto,
RDF/XML, NTriples, Turtle ou N3 e HTML
80. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 80
É preciso seguir algum padrão para
publicar dados Linked Data?
81. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 81
Sim!!! Publicando os dados em RDF...
Converter planilhas, arquivos
CSV, arquivos XML, dados
relacionais e outros documentos
para o formato RDF
82. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 82
Publicando os dados em RDF.... Conversão!!!
Após a geração do arquivo em formato RDF, os
dados podem ser carregados em um banco de
dados que armazena as triplas RDF, chamado
de RDF Store.
83. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 83
Publicando os dados em RDF.... Conversão!!!
Vantagem? Desvantagem?
melhoria de desempenho o armazenamento das
que pode ser obtida ao triplas requer espaço
usar formas de extra em relação aos
dados originais. Além
armazenamento disso, a conversão
especificamente demanda um certo
otimizadas para realizar tempo para ser realizada
a persistência de triplas e os dados em RDF
RDF podem ficar
desatualizados em
relação aos dados
originais.
84. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 84
Publicando os dados em RDF.... Visão!!!
fornecer uma visão RDF
através de um RDF Wrapper
85. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 85
Publicando os dados em RDF.... Visão!!!
Vantagem? Desvantagem?
a visão RDF não um desempenho
requer espaço de inferior à conversão
armazenamento de dados para RDF
extra e não corre o devido às traduções
risco de apresentar dinâmicas entre os
dados modelos que deve ser
desatualizados realizada a cada uso
da visão RDF
86. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 86
Publicando os dados em RDF.... Visão!!!
• O RDB-to-RDF Wrappers é uma solução que cria
visões RDF a partir de mapeamentos entre as
estruturas relacionais e os grafos RDF
http://www.w3.org/TR/r2rml/
• A plataforma D2RQ é um exemplo de RDB-to-RDF
Wrappers, que fornece toda a infraestrutura
necessária para acessar bancos de dados relacionais
como grafos RDF virtuais
• http://www4.wiwiss.fu-berlin.de/bizer/d2rq/spec/
87. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 87
E como fazemos isso?
Vamos ver?
88. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 88
Publicando os dados em RDF.... Validação!!!
Após gerar os dados no modelo RDF, é necessário
verificar se o resultado está de acordo com os princípios
Linked Data. Essa verificação pode ser feita através de
ferramentas de validação como, por exemplo, Sindice
Web Data Inspector, Eyeball e W3C Validation
Service.
http://inspector.sindice.com/
http://jena.sourceforge.net/Eyeball/
http://www.w3.org/RDF/Validator/
89. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 89
Após os dados serem publicados seguindo os
princípios RDF como eles são consumidos?
90. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 90
Consumo de dados ligados
Browsers
Motores de buscas
Aplicações para domínios específicos
91. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 91
Piggy Bank
Dipper
Tabulator
Browsers
URI Burner LinkSailor
Graphite RDF Browser
92. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 92
Marbles
93. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 93
Falcons
Swoogle Watson
Motores
de
Buscas
Sig.ma
Sindice
94. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 94
95. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 95
96. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 96
Revyu
LinkedDataBr
BBC Programmes
Aplicações
para
domínios
específicos
Talis Aspire
DBpedia Mobile
97. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 97
BBC
Programmes
98. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 98
DBpedia Mobile
99. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 99
Tarefa para casa...
• http://www.foaf-project.org/
• Criar seu arquivo RDF
• Colocar em sua página pessoal
• Inserir no Sindice, Sig.ma
• E ver o que acontece =)
100. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 100
Conclusões ...
árdua a tarefa de prover meios eficientes que
permitam aproveitar todo conteúdo na Web, que pode
ser composto tanto por dados estruturados, como os
dados provenientes de bancos de dados relacionais,
quanto por dados não estruturados, como textos e
dados multimídia
101. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 101
Conclusões ...
espera-se que o uso dos princípios do Linked Data
possibilite a transformação de uma Web na qual os
recursos são documentos HTML para uma Web de
Dados, onde os dados estarão interligados através de
metadados
102. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 102
Grande Desafio ...
Adoção dos Princípios Linked Data e dos
padrões para publicações de dados RDF
103. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 103
Obrigada!!!
Danusa Ribeiro
danusa.cunha@lsbd.ufc.br
Bernadette Lóscio
bfl@cin.ufpe.br
Damires Souza
damires@ifpb.edu.br
104. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 104
Referências
• [Allemang & Hendler 2008] Allemang, D., Hendler, D. (2008) Semantic Web for
the Working Ontologist, 1st edition. Morgan Kaufmann publ., Amsterdam,
Netherlands.
• [Auer et al. 2009] Auer, S., Dietzold, S., Lehmann, J., Hellmann, S., and
Aumueller, D. (2009) Triplify: Light-weight linked data publication from
relational databases. In Quemada, J., León, G., Maarek, Y. S., and Nejdl, W.,
editors, Proceedings of the 18th International Conference on World Wide Web,
WWW 2009, Madrid, Spain, April 20-24, 2009, pages 621–630. ACM.
• [Becker & Bizer 2008] Becker, C., Bizer, C. (2008) DBpedia Mobile: A Location-
Enabled Linked Data Browser. In Linked Data on the Web (LDOW2008).
• [Bizer & Cyganiak 2006] Bizer, C., Cyganiak, R. (2006) D2R Server –
Publishing Relational Databases on the Semantic Web. In 5th International
Semantic Web Conference.
• [Bizer et al 2009] Bizer C., Heath T., Berners-Lee T. (2009) Linked data - the
story so far. Int. J. Semantic Web Inf. Syst., 5(3):1–22, 2009.
• [Campos 2010] Campos M. L. (2010) GT-LinkedDataBR – Exposição,
compartilhamento e conexão de recursos de dados abertos na Web (Linked Open
Data). Disponível em http://www.rnp.br/pd/gts2010-2011/gt_linkeddatabr.html
105. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 105
Referências
• [Cheg & Qu 2011] Cheng, G., Qu, Y. (2011) Searching Linked Objects with Falcons:
Approach, Implementation and Evaluation. International Journal on Semantic Web and
Information Systems, Special Issue on Linked Data.
• [Costa & Yamate 2009] Costa A., Yamate F. (2009) Semantic Lattes: uma ferramenta de
consulta baseada em ontologias. Trabalho de Grduação em Engenharia de Computação -
Escola Politécnica. IME/USP.
• [Erling & Mikhailov 2006] Erling, O., Mikhailov, I. (2006) Mapping Relational Data to
RDF in Virtuoso. http://virtuoso.openlinksw.com/dataspace/dav/wiki/ Main/VOSSQLRDF.
• [Filho & Lóscio 2009] Filho, F. W. B. H , Lóscio B. F. (2009) Web Semântica: Conceitos e
Tecnologias. In Anais do ERCEMAPI (Escola Regional de Computação Ceará – Maranhão –
Piauí).
• [Freitas 2003] Freitas, F. L. G. (2003) Ontologias e a Web Semântica. XXIII Congresso da
Sociedade Brasileira de Computação. JAI. Campinas, São Paulo, Junho de 2003.
• [Gruber 1995] Gruber T. (1995) Toward principles for the design of ontologies used for
knowledge sharing. 1995. International Journal Human-Computer Studies Vol. 43, Issues
5-6, November 1995, p.907-928.
• [Heath & Bizer 2011] Heath, T., Bizer, C. (2011) Linked Data: Evolving the Web into a
Global Data Space (1st edition). Synthesis Lectures on the Semantic Web: Theory and
Technology, 1:1, 1-136. Morgan & Claypool, 2011.
106. V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 106
Referências
• [Klyne et al 2004] Klyne, G., Carroll, JJ., McBride., B. (2004)
Resource description
framework (RDF): Concepts and abstract syntax. Disponível em:
http://www.w3.org/TR/rdf-concepts/
• [Lee et al 2006] Lee, B. T., Chen, Y., Chilton, L., Connolly, D., Dhanaraj, R., Hol-
lenbach, J., Lerer, A., and Sheets, D. (2006) Tabulator: Exploring and Analyzing
Linked Data on the Semantic Web. In In Procedings of the 3rd International Semantic
Web User Interaction Workshop (SWUI06, page 06.
• [Lee et al 2001] Lee, B. T., Hendler J., Lassilia O. (2001) The semantic web. Scientific
American, 284(5):34–44, Mai 2001.
http://dx.doi.org/10.1038/scientificamerican0501-34DOI:
10.1038/scientificamerican0501-34
• [Magalhães et al 2011] Magalhães, R. P., Macedo, J. A. F., Vidal, V. M. P. (2011)
Linked Data: Construindo um Espaço de Dados Global na Web. In Anais do XXIV
Simpósio Brasileiro de Banco de Dados. Outubro de 2011.
• [Oren et al 2008] Oren, E., Delbru, R., Catasta, M., Cyganiak, R., Stenzhorn, H., and
Tumma-rello, G. (2008) Sindice.com: a document-oriented lookup index for open
linked data. Int. J.Metadata Semant. Ontologies, 3:37–52.
• [Souza 2009] Souza D. (2009) Using Semantics to Enhance Query Reformulation in
Dynamic Distributed Environments. PhD Thesis, Federal University of Pernambuco
(UFPE), Recife, PE, Brazil.