SlideShare uma empresa Scribd logo
1 de 44
SameAs Networks and
Beyond: Analyzing
Deployment Status and
Implications of owl:sameAs
in Linked Data
Li Ding, Joshua Shinavier, Zhenning Shangguan,
and Deborah L. McGuinness
    Ícaro
globo       PUC-RIO
.com
CONTEXTO
Declarações owl:sameAs em
conjunto formam um enorme
grafo direcionado conectando
recursos RDF uns aos outros
REDES sameAs
Rede SameAs
Rede SameAs
Rede SameAs
hub
Rede SameAs
hub
Rede SameAs
hub

             autoridade
Efeito GLOBAL
de redes
SameAs
SEMÂNTICA
de owl:sameAs
Oficial: URIs se referem a mesma coisa. É uma
relação simétrica e transitiva

Relação simétrica? Em mashups não. Duas URIs só
são consideradas fortemente equivalentes se
existem declarações sameAs recíprocas

Na prática, sameAs é dependente do contexto,
portanto a transitividade raramente é garantida
A literatura tem apontado usos
errados de sameAs, divergentes
da semântica original em OWL
[4]
ANÁLISE EM
LARGA ESCALA DO
USO DE
owl:sameAs
Como as redes sameAs tem sido usadas na Web

of Data

Quais são os interesses em comum entre os

datasets da Linked Data? Como e por que eles

publicam mapeamentos usando owl:sameAs

Como as ontologias são afetadas pela inferência a

partir de owl:sameAs
DATASET
usado para testes

9 milhões de declarações owl:sameAs

Cobrindo ~7 milhões de recursos RDF

168 mil tipos (rdf:type) diferentes

967 datasets diferentes
PROPRIEDADES DE
REDES sameAs
GRAFO POUCO
conectado

Cada owl:sameAs cobre em média 2.4 URIs

A maioria dos componentes são pares simples de
nós com ligações owl:sameAs (geralmente
recíprocas)
A maioria das redes é na forma de estrela, onde
vários nós apontam para um (e.g. DBPedia)
POPULARIDADE:
grau dos nós
Quantidade de inbound links para os recursos


Distribuição Long Tail: A imensa maioria dos
recursos tem 1 inbound link e alguns recursos tem
mais de 4 mil inbound links
ANALISANDO
REDES ENTRE
DOMÍNIOS
dbpedia:Paul_Allen




                       nyt:Paul_Allen

free_base:Paul_Allen
dbpedia:Paul_Allen




                       nyt:Paul_Allen

free_base:Paul_Allen

                                 +
dbpedia:Paul_Allen




                       nyt:Paul_Allen

free_base:Paul_Allen

                                 +

  dbpedia:Albert_Einstein




                        nyt:Albert_Einstein

free_base:Albert_Einstein
dbpedia:Paul_Allen




                       nyt:Paul_Allen         dbpedia

free_base:Paul_Allen

                                 +
                                                          nyt
  dbpedia:Albert_Einstein
                                              free_base




                        nyt:Albert_Einstein

free_base:Albert_Einstein
Maior
cluster
encontrado
Como os
datasets são
conectados?
Como os
datasets são
conectados?
Comunidades
com interesses
comuns

Como os
datasets são
conectados?
Por que os datasets
são conectados?
Por que os datasets
são conectados?
 <dbtune.org,zitgist.com>
 tipos mais frequentes:
 mo:MusicArtist, mo:Record
Por que os datasets
são conectados?
 <dbtune.org,zitgist.com>
 tipos mais frequentes:
 mo:MusicArtist, mo:Record

   Conceitos de
   mesmo domínio
ANÁLISE DE
REDES sameAs
Para saber como a inferência por owl:sameAs afeta
as ontologias, foi feito um case de ontology
mapping

Duas classes são consideradas similares se
compartilham instâncias em comum (instance-
based mapping)

Com essa rede é possível encontrar clusters de
classes, mapeamentos de ontologias e possíveis
erros de sameAs
TRABALHO
RELACIONADO
Halpin et. al [4]: owl:sameAs é um tipo especial de
“link de entidade” e análise dessa entidade no
Linked Data de uma perspectiva filosófica e de
representação de conhecimento

Análise de grafos da Web Semântica e
propriedades como distribuição long tail, tamanho,
diâmetro, etc [13-17]
REFERÊNCIAS
BIBLIOGRÁFICAS
[4] H. Halpin and P. J. Hayes. When owl:sameAs isn’t the
same: An analysis of identity links on the semantic web. In
Proceedings of the International Workshop on Linked Data
on the Web, 2010.

[6] J. McCusker and D. L. McGuinness. owl:sameAs
considered harmful to provenance. In Proceedings of the
ISCB Conference on Semantics in Healthcare and Life
Sciences, 2010.

[13] W. Ge, J. Chen, W. Hu and Y. Qu. Object Link Structure
in the Semantic Web. In Proceedings of the 7th Extended
Semantic Web Conference (ESWC), 2010.

[15] Y. Theoharis, Y. Tzitzikas, D. Kotzinos, and V.
Christophides. On Graph Features of Semantic Web
Schemas. IEEE Transactions on Knowledge and Data
Engineering, Vol. 20, No. 5, May 2008.
FIM
  Ícaro
globo     PUC-RIO
.com

Mais conteúdo relacionado

Semelhante a Analysis of owl:sameAs Networks and Implications for Linked Data

Fólio: o futuro das bibliotecas é aberto: uma visão pessoal
Fólio: o futuro das bibliotecas é aberto: uma visão pessoalFólio: o futuro das bibliotecas é aberto: uma visão pessoal
Fólio: o futuro das bibliotecas é aberto: uma visão pessoalLeticia Strehl
 
Linked Data - Minicurso - SBBD 2011
Linked Data - Minicurso - SBBD 2011Linked Data - Minicurso - SBBD 2011
Linked Data - Minicurso - SBBD 2011Regis Magalhães
 
Utilizando dados abertos conectados para gerar inovação
Utilizando dados abertos conectados para gerar inovaçãoUtilizando dados abertos conectados para gerar inovação
Utilizando dados abertos conectados para gerar inovaçãoArmando Barbosa
 
SKOS: Interoperabilidade de linguagens documentais
SKOS: Interoperabilidade de linguagens documentaisSKOS: Interoperabilidade de linguagens documentais
SKOS: Interoperabilidade de linguagens documentaisFabrício Silva Assumpção
 
Linked Data Tutorial - Conferencia W3C Brasil 2011
Linked Data Tutorial - Conferencia W3C Brasil 2011Linked Data Tutorial - Conferencia W3C Brasil 2011
Linked Data Tutorial - Conferencia W3C Brasil 2011Regis Magalhães
 
Big, Open e Linked Data no caminho para a Web 3.0 (Web Semântica)
Big, Open e Linked Data no caminho para a Web 3.0 (Web Semântica)Big, Open e Linked Data no caminho para a Web 3.0 (Web Semântica)
Big, Open e Linked Data no caminho para a Web 3.0 (Web Semântica)Marcos Santos
 
Apresentação linked data
Apresentação linked dataApresentação linked data
Apresentação linked dataUmberto Diniz
 
Linked Data no domínio bibliográfico: vocabulários para a publicação de dado...
Linked Data no domínio bibliográfico: vocabulários para a publicação de dado...Linked Data no domínio bibliográfico: vocabulários para a publicação de dado...
Linked Data no domínio bibliográfico: vocabulários para a publicação de dado...Fabrício Silva Assumpção
 
Web Semântica e Ontologias
Web Semântica e OntologiasWeb Semântica e Ontologias
Web Semântica e OntologiasDaniela Brauner
 
Palestra Dia da Liberdade dos Documentos - 2011-03-30
Palestra Dia da Liberdade dos Documentos - 2011-03-30Palestra Dia da Liberdade dos Documentos - 2011-03-30
Palestra Dia da Liberdade dos Documentos - 2011-03-30UEPA
 
Análise de Redes Sociais: novas possibilidades de serviços e pesquisa para bi...
Análise de Redes Sociais: novas possibilidades de serviços e pesquisa para bi...Análise de Redes Sociais: novas possibilidades de serviços e pesquisa para bi...
Análise de Redes Sociais: novas possibilidades de serviços e pesquisa para bi...Dalton Martins
 
Seminário de Uso das Redes Sociais Para Publicação Cientifica na USP_Dalton M...
Seminário de Uso das Redes Sociais Para Publicação Cientifica na USP_Dalton M...Seminário de Uso das Redes Sociais Para Publicação Cientifica na USP_Dalton M...
Seminário de Uso das Redes Sociais Para Publicação Cientifica na USP_Dalton M...SIBiUSP
 
Descrição de recursos em wikis semânticos
Descrição de recursos em wikis semânticosDescrição de recursos em wikis semânticos
Descrição de recursos em wikis semânticosJaider Andrade Ferreira
 
OWL - Web Ontology Languages
OWL - Web Ontology LanguagesOWL - Web Ontology Languages
OWL - Web Ontology LanguagesNeilor Caldeira
 
Grupo 15 apres final 22 05-2010
Grupo 15   apres final 22 05-2010Grupo 15   apres final 22 05-2010
Grupo 15 apres final 22 05-2010Cesayres
 
Grupo 15 apres final 22 05-2010
Grupo 15   apres final 22 05-2010Grupo 15   apres final 22 05-2010
Grupo 15 apres final 22 05-2010Cesayres
 

Semelhante a Analysis of owl:sameAs Networks and Implications for Linked Data (20)

Fólio: o futuro das bibliotecas é aberto: uma visão pessoal
Fólio: o futuro das bibliotecas é aberto: uma visão pessoalFólio: o futuro das bibliotecas é aberto: uma visão pessoal
Fólio: o futuro das bibliotecas é aberto: uma visão pessoal
 
Linked Data - Minicurso - SBBD 2011
Linked Data - Minicurso - SBBD 2011Linked Data - Minicurso - SBBD 2011
Linked Data - Minicurso - SBBD 2011
 
Utilizando dados abertos conectados para gerar inovação
Utilizando dados abertos conectados para gerar inovaçãoUtilizando dados abertos conectados para gerar inovação
Utilizando dados abertos conectados para gerar inovação
 
SKOS: Interoperabilidade de linguagens documentais
SKOS: Interoperabilidade de linguagens documentaisSKOS: Interoperabilidade de linguagens documentais
SKOS: Interoperabilidade de linguagens documentais
 
Linked Data Tutorial - Conferencia W3C Brasil 2011
Linked Data Tutorial - Conferencia W3C Brasil 2011Linked Data Tutorial - Conferencia W3C Brasil 2011
Linked Data Tutorial - Conferencia W3C Brasil 2011
 
Linked Data
Linked DataLinked Data
Linked Data
 
Big, Open e Linked Data no caminho para a Web 3.0 (Web Semântica)
Big, Open e Linked Data no caminho para a Web 3.0 (Web Semântica)Big, Open e Linked Data no caminho para a Web 3.0 (Web Semântica)
Big, Open e Linked Data no caminho para a Web 3.0 (Web Semântica)
 
Apresentação linked data
Apresentação linked dataApresentação linked data
Apresentação linked data
 
Linked Data no domínio bibliográfico: vocabulários para a publicação de dado...
Linked Data no domínio bibliográfico: vocabulários para a publicação de dado...Linked Data no domínio bibliográfico: vocabulários para a publicação de dado...
Linked Data no domínio bibliográfico: vocabulários para a publicação de dado...
 
Web Semântica e Ontologias
Web Semântica e OntologiasWeb Semântica e Ontologias
Web Semântica e Ontologias
 
Palestra Dia da Liberdade dos Documentos - 2011-03-30
Palestra Dia da Liberdade dos Documentos - 2011-03-30Palestra Dia da Liberdade dos Documentos - 2011-03-30
Palestra Dia da Liberdade dos Documentos - 2011-03-30
 
Introdução BD
Introdução BDIntrodução BD
Introdução BD
 
Análise de Redes Sociais: novas possibilidades de serviços e pesquisa para bi...
Análise de Redes Sociais: novas possibilidades de serviços e pesquisa para bi...Análise de Redes Sociais: novas possibilidades de serviços e pesquisa para bi...
Análise de Redes Sociais: novas possibilidades de serviços e pesquisa para bi...
 
Seminário de Uso das Redes Sociais Para Publicação Cientifica na USP_Dalton M...
Seminário de Uso das Redes Sociais Para Publicação Cientifica na USP_Dalton M...Seminário de Uso das Redes Sociais Para Publicação Cientifica na USP_Dalton M...
Seminário de Uso das Redes Sociais Para Publicação Cientifica na USP_Dalton M...
 
Descrição de recursos em wikis semânticos
Descrição de recursos em wikis semânticosDescrição de recursos em wikis semânticos
Descrição de recursos em wikis semânticos
 
Palestra Introdução a Linked Data
Palestra Introdução a Linked DataPalestra Introdução a Linked Data
Palestra Introdução a Linked Data
 
OWL - Web Ontology Languages
OWL - Web Ontology LanguagesOWL - Web Ontology Languages
OWL - Web Ontology Languages
 
Modelos de base de dados
Modelos de base de dadosModelos de base de dados
Modelos de base de dados
 
Grupo 15 apres final 22 05-2010
Grupo 15   apres final 22 05-2010Grupo 15   apres final 22 05-2010
Grupo 15 apres final 22 05-2010
 
Grupo 15 apres final 22 05-2010
Grupo 15   apres final 22 05-2010Grupo 15   apres final 22 05-2010
Grupo 15 apres final 22 05-2010
 

Mais de Ícaro Medeiros

Data Science and Culture
Data Science and CultureData Science and Culture
Data Science and CultureÍcaro Medeiros
 
Why Python is better for Data Science
Why Python is better for Data ScienceWhy Python is better for Data Science
Why Python is better for Data ScienceÍcaro Medeiros
 
Statistics: the grammar of Data Science
Statistics: the grammar of Data ScienceStatistics: the grammar of Data Science
Statistics: the grammar of Data ScienceÍcaro Medeiros
 
Linked Data, Big Data, and User Science at Globo.com
Linked Data, Big Data, and User Science at Globo.comLinked Data, Big Data, and User Science at Globo.com
Linked Data, Big Data, and User Science at Globo.comÍcaro Medeiros
 
Web Semântica na Globo.com (Novas Mídias UFRJ)
Web Semântica na Globo.com (Novas Mídias UFRJ)Web Semântica na Globo.com (Novas Mídias UFRJ)
Web Semântica na Globo.com (Novas Mídias UFRJ)Ícaro Medeiros
 
Expressões regulares no Linux
Expressões regulares no LinuxExpressões regulares no Linux
Expressões regulares no LinuxÍcaro Medeiros
 

Mais de Ícaro Medeiros (9)

Data Science and Culture
Data Science and CultureData Science and Culture
Data Science and Culture
 
Why Python is better for Data Science
Why Python is better for Data ScienceWhy Python is better for Data Science
Why Python is better for Data Science
 
Statistics: the grammar of Data Science
Statistics: the grammar of Data ScienceStatistics: the grammar of Data Science
Statistics: the grammar of Data Science
 
Linked Data, Big Data, and User Science at Globo.com
Linked Data, Big Data, and User Science at Globo.comLinked Data, Big Data, and User Science at Globo.com
Linked Data, Big Data, and User Science at Globo.com
 
Web Semântica na Globo.com (Novas Mídias UFRJ)
Web Semântica na Globo.com (Novas Mídias UFRJ)Web Semântica na Globo.com (Novas Mídias UFRJ)
Web Semântica na Globo.com (Novas Mídias UFRJ)
 
Ontology matching
Ontology matchingOntology matching
Ontology matching
 
Expressões regulares no Linux
Expressões regulares no LinuxExpressões regulares no Linux
Expressões regulares no Linux
 
Ontology Learning
Ontology LearningOntology Learning
Ontology Learning
 
Tag Suggestion
Tag SuggestionTag Suggestion
Tag Suggestion
 

Analysis of owl:sameAs Networks and Implications for Linked Data

  • 1. SameAs Networks and Beyond: Analyzing Deployment Status and Implications of owl:sameAs in Linked Data Li Ding, Joshua Shinavier, Zhenning Shangguan, and Deborah L. McGuinness Ícaro globo PUC-RIO .com
  • 3. Declarações owl:sameAs em conjunto formam um enorme grafo direcionado conectando recursos RDF uns aos outros
  • 9. Rede SameAs hub autoridade
  • 11.
  • 12.
  • 13. SEMÂNTICA de owl:sameAs Oficial: URIs se referem a mesma coisa. É uma relação simétrica e transitiva Relação simétrica? Em mashups não. Duas URIs só são consideradas fortemente equivalentes se existem declarações sameAs recíprocas Na prática, sameAs é dependente do contexto, portanto a transitividade raramente é garantida
  • 14. A literatura tem apontado usos errados de sameAs, divergentes da semântica original em OWL [4]
  • 15. ANÁLISE EM LARGA ESCALA DO USO DE owl:sameAs
  • 16. Como as redes sameAs tem sido usadas na Web of Data Quais são os interesses em comum entre os datasets da Linked Data? Como e por que eles publicam mapeamentos usando owl:sameAs Como as ontologias são afetadas pela inferência a partir de owl:sameAs
  • 17. DATASET usado para testes 9 milhões de declarações owl:sameAs Cobrindo ~7 milhões de recursos RDF 168 mil tipos (rdf:type) diferentes 967 datasets diferentes
  • 19. GRAFO POUCO conectado Cada owl:sameAs cobre em média 2.4 URIs A maioria dos componentes são pares simples de nós com ligações owl:sameAs (geralmente recíprocas) A maioria das redes é na forma de estrela, onde vários nós apontam para um (e.g. DBPedia)
  • 20.
  • 21. POPULARIDADE: grau dos nós Quantidade de inbound links para os recursos Distribuição Long Tail: A imensa maioria dos recursos tem 1 inbound link e alguns recursos tem mais de 4 mil inbound links
  • 22.
  • 24.
  • 25. dbpedia:Paul_Allen nyt:Paul_Allen free_base:Paul_Allen
  • 26. dbpedia:Paul_Allen nyt:Paul_Allen free_base:Paul_Allen +
  • 27. dbpedia:Paul_Allen nyt:Paul_Allen free_base:Paul_Allen + dbpedia:Albert_Einstein nyt:Albert_Einstein free_base:Albert_Einstein
  • 28. dbpedia:Paul_Allen nyt:Paul_Allen dbpedia free_base:Paul_Allen + nyt dbpedia:Albert_Einstein free_base nyt:Albert_Einstein free_base:Albert_Einstein
  • 30.
  • 34. Por que os datasets são conectados?
  • 35. Por que os datasets são conectados? <dbtune.org,zitgist.com> tipos mais frequentes: mo:MusicArtist, mo:Record
  • 36. Por que os datasets são conectados? <dbtune.org,zitgist.com> tipos mais frequentes: mo:MusicArtist, mo:Record Conceitos de mesmo domínio
  • 38. Para saber como a inferência por owl:sameAs afeta as ontologias, foi feito um case de ontology mapping Duas classes são consideradas similares se compartilham instâncias em comum (instance- based mapping) Com essa rede é possível encontrar clusters de classes, mapeamentos de ontologias e possíveis erros de sameAs
  • 39.
  • 41. Halpin et. al [4]: owl:sameAs é um tipo especial de “link de entidade” e análise dessa entidade no Linked Data de uma perspectiva filosófica e de representação de conhecimento Análise de grafos da Web Semântica e propriedades como distribuição long tail, tamanho, diâmetro, etc [13-17]
  • 43. [4] H. Halpin and P. J. Hayes. When owl:sameAs isn’t the same: An analysis of identity links on the semantic web. In Proceedings of the International Workshop on Linked Data on the Web, 2010. [6] J. McCusker and D. L. McGuinness. owl:sameAs considered harmful to provenance. In Proceedings of the ISCB Conference on Semantics in Healthcare and Life Sciences, 2010. [13] W. Ge, J. Chen, W. Hu and Y. Qu. Object Link Structure in the Semantic Web. In Proceedings of the 7th Extended Semantic Web Conference (ESWC), 2010. [15] Y. Theoharis, Y. Tzitzikas, D. Kotzinos, and V. Christophides. On Graph Features of Semantic Web Schemas. IEEE Transactions on Knowledge and Data Engineering, Vol. 20, No. 5, May 2008.
  • 44. FIM Ícaro globo PUC-RIO .com

Notas do Editor

  1. \n
  2. \n
  3. \n
  4. \n
  5. \n
  6. \n
  7. \n
  8. \n
  9. \n
  10. \n
  11. \n
  12. \n
  13. \n
  14. \n
  15. \n
  16. \n
  17. \n
  18. \n
  19. \n
  20. \n
  21. \n
  22. \n
  23. \n
  24. \n
  25. \n
  26. \n
  27. \n
  28. \n
  29. \n
  30. \n
  31. \n
  32. \n
  33. \n
  34. \n
  35. \n
  36. \n
  37. \n
  38. \n
  39. \n