SlideShare une entreprise Scribd logo
1  sur  49
Publicatie van Linked Open Overheidsdata Rinke Hoekstra Semantic Web Rubik's Cube by dullhunk at flickr under a cc-license. Thanks!
Vragen Wat is linked data, en hoe ziet het eruit? Wat heeft de overheid eraan? Op welke manier kan het ontsloten worden? Wat zijn openstaande problemen?
De Semantic Web Ideologie Identiteit is het allerbelangrijkst Gedeeltelijkeoplossingenzijnprachtig Layer cake 8/26/10 3
Linked Data/Semantic Web Identificatie Uniform Resource Identifier (URI)  Globale identifier (NB: persistent!) Heeft de syntactische verschijningsvorm van een URL Vaak: Internationalized Resource Identifier (IRI) Beschrijving Resource DescriptionFramework (RDF) RDF Schema (RDFS) SimpleKnowledgeOrganization System (SKOS) Web OntologyLanguage (OWL) Bevragen RDF Triple stores SPARQL Query Language
Hoe ziet RDF eruit? Datamodel is een (directed) graph Elk data-item is een ‘resource’ met een URI als identifier Elke eigenschap is een binaire relatie: ‘triple’ Tussen resources: <subjectURI, predicateURI, objectURI> Tussen een resource en een ‘literal’ <subjectURI, predicateURI, “literalvalue”>
Gerechtelijke Uitspraken
Gerechtelijke Uitspraken
Waarom linkeddata? Globaal unieke identifiers Hergebruik van identifiers in andere datasets Op datum niveau(bijv. twee bronnen die iets over ‘Groningen’ zeggen) Op schema niveau(bijv. twee bronnen die elk het zelfde begrip ‘Stad’ gebruiken) In feite dus ‘linked data sets’
Linked Open Data 8/26/10 9
8/26/10 10 November 2009: 13.1Miljard triples, 142 Miljoenlinks
In 2010?	 New York Times subject catalog Data.gov.uk Linked Life Data (4 miljard triples) FreeBase is gekocht door Google FaceBook publiceert Open Graph protocol ...
Wat heeft de overheid eraan? Uniforme representatietaal voor zowel: Schema informatie (begrippen), als Gegevens (data) Gedistribueerd Wederom zowel schema als gegevens De moeite waard? Bevordert transparantie, herbruikbaarheid etc. Maakt hergebruik zichtbaar (bijv. HTTP requests)
Ontsluiten Overheidsdata Laagdrempelig Transparant Herbruikbaar Multi-channel Dezelfde content op verschillende manieren aanbieden Geïntegreerd Ruwe data en begeleidende tekst
Tim Berners-Lee: 5-sterren plan ★	Stel informatie beschikbaar op het Web ★★	Stel het beschikbaar als gestructureerde data(bijv. als Excel sheet ipv. een plaatje) ★★★	Gebruik een open formaat(bijv. CSV ipv. Excel) ★★★★	Gebruik een linked-data formaat(URI’s als id, en RDF als formaat) ★★★★★	Verbind je data aan dat van anderen (geef context) Bron: http://inkdroid.org/journal/2010/06/04/the-5-stars-of-open-linked-data/
Over de helewereld… Bron: o.a.http://www.slideshare.net/cygri/the-state-of-linked-government-data 15 of XYZ
Verenigde Staten Data.gov Nationaleruwe data en geodatacatalogi Data-gov Wiki project bij RPI “Triplifying” tabulaire datasets van Data.gov Generieke services op RDF data Wiki voor het vergaren van meerinformatie over de datasets Demos Data.govverwijstnaarRPI’s RDF (2010) Bron: o.a.http://www.slideshare.net/cygri/the-state-of-linked-government-data
Data-gov Wiki: kritiek Is dithandigerdaneentabel? <rdf:Descriptionrdf:about="#entry9053451">  <rdf:typerdf:resource="http://data-gov.tw.rpi.edu/                        2009/data-gov-twc.rdf#DataEntry"/>  <value>2.7</value>  <period>M01</period>  <year>1995</year>  <series_id>SMU55225408000000001</series_id></rdf:Description> Bron: Stefano Mazzocchihttp://www.betaversion.org/~stefano/linotype/news/351/
VerenigdKoninkrijk Grote hoeveelheidruwe datasets op data.gov.uk Selectieals five-star Linked Data Basis gelegdvoorkwalitatiefgoede Linked Data representatie URI sets Vocabulaires Best Practices Opensourcecatalogus (CKAN) Bron: o.a.http://www.slideshare.net/cygri/the-state-of-linked-government-data
Stap: Catalogus Doorzoekbare catalogus van datasets Catalogus verwijst: naar website waar data oorspronkelijk gepubliceerd is, of  naar data als bestand Eenvoudig voortborduren op Open Data  http://data.overheid.nl  (?) http://nl.ckan.net (grassroots) Relatief ‘standaard’ als oplossing ... afgezien van organisatorische problematiek Weinig ‘semantic web’ Slechts downloadbare bestanden Fulltext zoeken, geen ‘echte’ queries Geen integratie met ander materiaal
Stap: URI dereferencing Wat is het? “URI als URL” Meest eenvoudige API Een HTTP request op het URI geeft ofwel: Een RDF dump van de resource met het URI, ofwel Een HTML pagina met een beschrijving van de resource Twee mogelijkheden: Afhankelijk van de ‘agent’ (Content negotiation) Extra informatie in de URL
HTTP 303: SeeAlso
Voorbeeld: LJN BJ3703 Resource URIhttp://linkeddata.few.vu.nl/rechtspraak/uitspraak/BJ3703 Accept text/html, verwijst door naar:http://www.rechtspraak.nl/ljn.asp?ljn=BJ3703 Accept application/rdf+turtleverwijstnaar: Script dateen SPARQL query loslaat: SELECT ?p ?o WHERE {		<http://linkeddata.../BJ3703> ?p ?o .}
SPARQL output <http://linkeddata.few.vu.nl/rechtspraak/uitspraak/BJ3703> a rnl:Uitspraak;rnlrdf:datum_gepubliceerd	"24-07-2009"; rnlrdf:datum_uitspraak 	"22-07-2009"; rnlrdf:indicatie 			"Eiser wordt verondersteld de verwekker van gedaagde (nu 41 jaar oud) te zijn. Eiser vordert veroordeling van gedaagde tot medewerking aan DNA-onderzoek, ter verkrijging van zekerheid. De rechtbank wijst de vordering niet reeds af omdat de inzet daarvan louter emotioneel is. De rechtbank merkt het recht om te weten of een ander zijn kind is aan als een persoonlijkheidsrecht. Dit recht wordt afgewogen tegen het belang van gedaagde om de kwestie als afgedaan te beschouwen en vrede te hebben met wat zij weet. De vordering wordt afgewezen."; rnlrdf:instantie 			rnlrdf:Rechtbank_Groningen; rnlrdf:ljn 				"BJ3703"; rnlrdf:procedure_soort 	rnlrdf:Eerste_aanleg_-_enkelvoudig; rnlrdf:rechtsgebied_rechtspraak rnlrdf:Handelszaak; rnlrdf:status 			rnlrdf:gepubliceerd; rnlrdf:zaaknummers 		"107402 / HA ZA 09-89"; metalex:src 			"http://www.rechtspraak.nl/ljn.asp?ljn=BJ3703" .
Stap: SPARQL Endpoint RESTful service SPARQL queriesgeencodeerd in request URL Normaal gesproken read-only Zeer veel vrijheidsgraden om data uit te vragen SPARQL query language SELECT, DELETE, UPDATE Elke RDF triple store ondersteunt SPARQL Virtuoso, 4Store, OpenRDFSesame, AllegroGraph Nadeel: vereist infrastructuur
Stap: RDFa/GRDDL RDFa: RDF annotations Metadata in HTML pagina’s Manier om RDF triples te ‘verstoppen’ in HTML Zichtbaar voor Google en Yahoo crawlers Voordeel: Maakt client-side RDF applicaties mogelijk Niet alle data hoeft in RDF te zijn(bijv. copyright/licensenotice) Kan RDF produceren uit standaard databases ... en dus ontlastend voor de server GRDDL: Gleaning Resource DescriptionsfromDialects of Languages Verwijzing naar transformatie service (bijv. XSLT)
Voorbeeld <tablexmlns:rnl="http://linkeddata.few.vu.nl/rechtspraak/resource/" about="http://linkeddata.few.vu.nl/rechtspraak/uitspraak/BJ3703" typeof="rnl:Uitspraak”>  <tbody><tr><tdcolspan="2"> 	<span rel="rnl:src" content="BJ3703”>LJN BJ3703</span> </td></tr> <tr> 	<tdclass="result_attribute" style="width: 100px;">Datum</td> 	<td rel="rnl:datum_uitspraak”>2009-07-22T00:00:00Z </td></tr>  <tr> 	<td>Kenmerken</td> 	<td>Uitspraak in  		<span rel="rnl:procedure_soort" href="http://linkeddata.few.vu.nl/rechtspraak/resource/Eerste_aanleg_-_enkelvoudig”>Eerste aanleg - enkelvoudig</span>  		van  		<span rel="rnl:instantie" href="http://linkeddata.few.vu.nl/rechtspraak/resource/Rechtbank_Groningen">Rechtbank Groningen</span>  		binnen het rechtsgebied  		<span rel="rnl:rechtsgebied_rechtspraak" href="http://linkeddata.few.vu.nl/rechtspraak/resource/Handelszaak">Handelszaak</span> </td></tr>   </tbody> </table>
Voorbeeld
Reality check “Triplification” zelf is nietaltijdnuttig Linked Data gaat over syntax, data model, access, maar lost nietautomatisch de lastigeproblemen op standaardclassificatiesysteem; identifier management; data provenance; versiebeheer; context; data discovery “LD removes some technical issues, giving us a better shot at solving the organizational/political ones” (Richard Cyganiak, DERI) Bron: o.a.http://www.slideshare.net/cygri/the-state-of-linked-government-data
Een olifant in de kamer?
Openstaande Problemen (NB: “probleem” = nog geen standaard oplossing) Provenance Herkomstinformatie van gegevens Probleem: Individuele RDF triples zijn lastig adresseerbaar Geen standaard vocabulair voor uitdrukken provenance Context Lijkt op provenance, maar geeft interpretatie Waarom een probleem? Het negeren van context leidt tot het op een hoop gooien van mogelijk conflicterende gegevens Versiebeheer & Onderhoud
Context als Namespace De eigenaar van het domein van de URI wordt geacht deze te onderhouden Nadeel: Namespaces zijn geheel transparant voor clients Domein/eigenaar alleen te achterhalen door URI parsing, dereferencing, of whoislookup
Context in SKOS SKOS: SimpleKnowledgeOrganization System Lichtgewicht taal voor uitdrukken van taxonomische informatie omtrent begrippen skos:Concept skos:broader, skos:narrower, skos:related Elk skos:Concept is gerelateerd aan een skos:ConceptScheme Eenvoudige 1:1 mapping relaties mogelijk tussen concepten uit verschillende schemes Uitgebreidere mappings mogelijk dmv gebruik OWL 2 Eenvoudig en vaak voldoende Lang niet alle Linked Data is uitdrukbaar in SKOS
Mapping in SKOS 24 October 2009 Rinke Hoekstra - OWLED 2009 35
BestPortal: Requirements Translate layman description to legal terms Search using fingerprints of legal terms Context in which layman concepts co-occur in a case determines the applicability of a legal concept ,[object Object],24 October 2009 Rinke Hoekstra - OWLED 2009 36
Mappings as OWL Classes A mapping class: Classifies resources annotated using one vocabulary, and Infers annotations using the other vocabulary … it may be directed 24 October 2009 Rinke Hoekstra - OWLED 2009 37
Example 24 October 2009 Rinke Hoekstra - OWLED 2009 38
Context als NamedGraph RDF Triple stores zijn eigenlijk Quad stores: <subjectURI, predicateURI, objectURI, graphURI> Hergebruik URI’s van grafen in andere triples: <graphURI, dc:creator, “Rinke Hoekstra”, ...> SPARQL ondersteunt queries op grafen, dus: Provenance kan worden achterhaald Context kan expliciet worden gemaakt Maar: Pragmatische oplossing Nog steeds inconsistenties mogelijk Er is nog geen officiële syntax voor
The Construction of Social Reality Searle (1995): Institutional Facts Intentional categories are social constructs, they are subjective, relative to an observer, and they are attributed to brute facts. Brute facts are independent of human agreement Constitutive and regulative rules: X counts as Y in context C
Searle’s Rules Constitutive rule Why is counts-as not subsumption? Counts-as is relative to a context Counts-as does not permit substitution, and limits inheritance: Counts-as can connect anti-rigid with rigid classes Bills issued by the Bureau of Engraving and Printing (X) count as money (Y) in the United States (C) Money (Y) is the root of all evil
Standard Practice Duality of roles is a well known problem Role as class: “Person plays Student” Distinct classes for role and role player But, rather verbose  Role as relation: “Person student_at University” Avoid tautology in definition of the role But, no way to incorporate contextual information Problem: cannot have both at the same time Student equivalentClassstudent_atsome University
In short Focus either on relation or class oriented representation Observations Reification makes knowledge about a relation explicit e.g. the context of a role, the thematic roles of an action ... but comes at the cost of the relation itself, and and is rather verbose Question: can’t we have both?
Yes, we can Infer the relation from a reification ... instead of the reification from the relation Example: definition of ‘student’ A person (X) counts as a student (Y) if enrolled at some university (C)
Subjective Entity and Social Role A subjective entity is defined using counts-as Social roles are subjective entities
Observer Relative & Institutional Facts
Example: Propositional Attitudes A propositional attitude is anything held towards some proposition: “Mary believes that John killed Suzan” “Mary holds a belief towards the proposition ‘John killed Suzan’” “‘John killed Suzan’ counts as a belief in the context of Mary”
It’s like Lego™!  Communicated attitudes Actions
Versiebeheer Eenvoudige oplossing: Voor elke versie een nieuwe graaf Nadeel: Applicaties kunnen afhankelijk zijn van oude versie(bijv. URI dereferencing) Twee URI’s per resource: ‘latestversion’ URI URI met versie-datum erin verwerkt Probleem: versies zijn niet altijd zo eenvoudig

Contenu connexe

Similaire à Publicatie van Linked Open Overheids Data

Semantisch zoeken - over knowledge graph, semantisch web, rdf enz.
Semantisch zoeken - over knowledge graph, semantisch web, rdf enz.Semantisch zoeken - over knowledge graph, semantisch web, rdf enz.
Semantisch zoeken - over knowledge graph, semantisch web, rdf enz.
Eric Sieverts
 
20190329 leveranciersbijeenkomst Toekomstperspectief Informatie- en archiefbe...
20190329 leveranciersbijeenkomst Toekomstperspectief Informatie- en archiefbe...20190329 leveranciersbijeenkomst Toekomstperspectief Informatie- en archiefbe...
20190329 leveranciersbijeenkomst Toekomstperspectief Informatie- en archiefbe...
VNG Realisatie
 

Similaire à Publicatie van Linked Open Overheids Data (20)

Ruben Verborgh - Creëren, aanbieden en gebruiken van Connected Data (CC BY-SA...
Ruben Verborgh - Creëren, aanbieden en gebruiken van Connected Data (CC BY-SA...Ruben Verborgh - Creëren, aanbieden en gebruiken van Connected Data (CC BY-SA...
Ruben Verborgh - Creëren, aanbieden en gebruiken van Connected Data (CC BY-SA...
 
UBU 3.0: semantisch web & linked data voor de UB?
UBU 3.0: semantisch web & linked data voor de UB?UBU 3.0: semantisch web & linked data voor de UB?
UBU 3.0: semantisch web & linked data voor de UB?
 
Metadata, standaarden, interoperabiliteit, semantisch web en linked data
Metadata, standaarden, interoperabiliteit, semantisch web en linked dataMetadata, standaarden, interoperabiliteit, semantisch web en linked data
Metadata, standaarden, interoperabiliteit, semantisch web en linked data
 
20191114 ECP Jaarcongres 2019 - PLDN en Linked Data Intro
20191114 ECP Jaarcongres 2019 -  PLDN en Linked Data Intro20191114 ECP Jaarcongres 2019 -  PLDN en Linked Data Intro
20191114 ECP Jaarcongres 2019 - PLDN en Linked Data Intro
 
Semantisch zoeken - over knowledge graph, semantisch web, rdf enz.
Semantisch zoeken - over knowledge graph, semantisch web, rdf enz.Semantisch zoeken - over knowledge graph, semantisch web, rdf enz.
Semantisch zoeken - over knowledge graph, semantisch web, rdf enz.
 
Full presentation LOD Masterclass ESI HHS PZH Kadaster
Full presentation LOD Masterclass ESI HHS PZH KadasterFull presentation LOD Masterclass ESI HHS PZH Kadaster
Full presentation LOD Masterclass ESI HHS PZH Kadaster
 
Semantisch Zoeken - knowledge graph, semantisch web, linked data, rdf, ontolo...
Semantisch Zoeken - knowledge graph, semantisch web, linked data, rdf, ontolo...Semantisch Zoeken - knowledge graph, semantisch web, linked data, rdf, ontolo...
Semantisch Zoeken - knowledge graph, semantisch web, linked data, rdf, ontolo...
 
OSLO | Aan de slag met semantische standaarden
OSLO | Aan de slag met semantische standaardenOSLO | Aan de slag met semantische standaarden
OSLO | Aan de slag met semantische standaarden
 
De kracht van Structured Data
De kracht van Structured DataDe kracht van Structured Data
De kracht van Structured Data
 
semantischzoeken-2013.ppt
semantischzoeken-2013.pptsemantischzoeken-2013.ppt
semantischzoeken-2013.ppt
 
IOD
IODIOD
IOD
 
Metadata is a messy subject! De ontwikkeling van metadatasets voor een overhe...
Metadata is a messy subject! De ontwikkeling van metadatasets voor een overhe...Metadata is a messy subject! De ontwikkeling van metadatasets voor een overhe...
Metadata is a messy subject! De ontwikkeling van metadatasets voor een overhe...
 
Zoekt en gij zult vinden!
Zoekt en gij zult vinden!Zoekt en gij zult vinden!
Zoekt en gij zult vinden!
 
Prepare your metadata - creëer PIDs
Prepare your metadata - creëer PIDsPrepare your metadata - creëer PIDs
Prepare your metadata - creëer PIDs
 
20190417 presentatie architectuur themabijeenkomst digitale informatie en inn...
20190417 presentatie architectuur themabijeenkomst digitale informatie en inn...20190417 presentatie architectuur themabijeenkomst digitale informatie en inn...
20190417 presentatie architectuur themabijeenkomst digitale informatie en inn...
 
What the f@#% is the Semantic Web?
What the f@#% is the Semantic Web?What the f@#% is the Semantic Web?
What the f@#% is the Semantic Web?
 
20190329 leveranciersbijeenkomst Toekomstperspectief Informatie- en archiefbe...
20190329 leveranciersbijeenkomst Toekomstperspectief Informatie- en archiefbe...20190329 leveranciersbijeenkomst Toekomstperspectief Informatie- en archiefbe...
20190329 leveranciersbijeenkomst Toekomstperspectief Informatie- en archiefbe...
 
Zoekmachinemarketing
Zoekmachinemarketing Zoekmachinemarketing
Zoekmachinemarketing
 
Knowledge Graphs: Concept, mogelijkheden en aandachtspunten
Knowledge Graphs: Concept, mogelijkheden en aandachtspuntenKnowledge Graphs: Concept, mogelijkheden en aandachtspunten
Knowledge Graphs: Concept, mogelijkheden en aandachtspunten
 
Datamanagement - Helen klip
Datamanagement - Helen klipDatamanagement - Helen klip
Datamanagement - Helen klip
 

Plus de Rinke Hoekstra

Provenance and Reuse of Open Data (PILOD 2.0 June 2014)
Provenance and Reuse of Open Data (PILOD 2.0 June 2014)Provenance and Reuse of Open Data (PILOD 2.0 June 2014)
Provenance and Reuse of Open Data (PILOD 2.0 June 2014)
Rinke Hoekstra
 
Linked (Open) Data - But what does it buy me?
Linked (Open) Data - But what does it buy me?Linked (Open) Data - But what does it buy me?
Linked (Open) Data - But what does it buy me?
Rinke Hoekstra
 
Linked Science - Building a Web of Research Data
Linked Science - Building a Web of Research DataLinked Science - Building a Web of Research Data
Linked Science - Building a Web of Research Data
Rinke Hoekstra
 
Semantic Representations for Research
Semantic Representations for ResearchSemantic Representations for Research
Semantic Representations for Research
Rinke Hoekstra
 
SIKS 2011 Semantic Web Languages
SIKS 2011 Semantic Web LanguagesSIKS 2011 Semantic Web Languages
SIKS 2011 Semantic Web Languages
Rinke Hoekstra
 
The MetaLex Document Server - Legal Documents as Versioned Linked Data
The MetaLex Document Server - Legal Documents as Versioned Linked DataThe MetaLex Document Server - Legal Documents as Versioned Linked Data
The MetaLex Document Server - Legal Documents as Versioned Linked Data
Rinke Hoekstra
 

Plus de Rinke Hoekstra (20)

Knowledge Representation on the Web
Knowledge Representation on the WebKnowledge Representation on the Web
Knowledge Representation on the Web
 
Managing Metadata for Science and Technology Studies: the RISIS case
Managing Metadata for Science and Technology Studies: the RISIS caseManaging Metadata for Science and Technology Studies: the RISIS case
Managing Metadata for Science and Technology Studies: the RISIS case
 
An Ecosystem for Linked Humanities Data
An Ecosystem for Linked Humanities DataAn Ecosystem for Linked Humanities Data
An Ecosystem for Linked Humanities Data
 
QBer - Connect your data to the cloud
QBer - Connect your data to the cloudQBer - Connect your data to the cloud
QBer - Connect your data to the cloud
 
Jurix 2014 welcome presentation
Jurix 2014 welcome presentationJurix 2014 welcome presentation
Jurix 2014 welcome presentation
 
Provenance and Reuse of Open Data (PILOD 2.0 June 2014)
Provenance and Reuse of Open Data (PILOD 2.0 June 2014)Provenance and Reuse of Open Data (PILOD 2.0 June 2014)
Provenance and Reuse of Open Data (PILOD 2.0 June 2014)
 
Prov-O-Viz: Interactive Provenance Visualization
Prov-O-Viz: Interactive Provenance VisualizationProv-O-Viz: Interactive Provenance Visualization
Prov-O-Viz: Interactive Provenance Visualization
 
Linkitup: Link Discovery for Research Data
Linkitup: Link Discovery for Research DataLinkitup: Link Discovery for Research Data
Linkitup: Link Discovery for Research Data
 
A Network Analysis of Dutch Regulations - Using the Metalex Document Server
A Network Analysis of Dutch Regulations - Using the Metalex Document ServerA Network Analysis of Dutch Regulations - Using the Metalex Document Server
A Network Analysis of Dutch Regulations - Using the Metalex Document Server
 
Linked (Open) Data - But what does it buy me?
Linked (Open) Data - But what does it buy me?Linked (Open) Data - But what does it buy me?
Linked (Open) Data - But what does it buy me?
 
Linked Science - Building a Web of Research Data
Linked Science - Building a Web of Research DataLinked Science - Building a Web of Research Data
Linked Science - Building a Web of Research Data
 
COMMIT/VIVO
COMMIT/VIVOCOMMIT/VIVO
COMMIT/VIVO
 
Semantic Representations for Research
Semantic Representations for ResearchSemantic Representations for Research
Semantic Representations for Research
 
A Slightly Different Web of Data
A Slightly Different Web of DataA Slightly Different Web of Data
A Slightly Different Web of Data
 
The Knowledge Reengineering Bottleneck
The Knowledge Reengineering BottleneckThe Knowledge Reengineering Bottleneck
The Knowledge Reengineering Bottleneck
 
Linked Census Data
Linked Census DataLinked Census Data
Linked Census Data
 
Concept- en Definitie Extractie
Concept- en Definitie ExtractieConcept- en Definitie Extractie
Concept- en Definitie Extractie
 
SIKS 2011 Semantic Web Languages
SIKS 2011 Semantic Web LanguagesSIKS 2011 Semantic Web Languages
SIKS 2011 Semantic Web Languages
 
The MetaLex Document Server - Legal Documents as Versioned Linked Data
The MetaLex Document Server - Legal Documents as Versioned Linked DataThe MetaLex Document Server - Legal Documents as Versioned Linked Data
The MetaLex Document Server - Legal Documents as Versioned Linked Data
 
Querying the Web of Data
Querying the Web of DataQuerying the Web of Data
Querying the Web of Data
 

Publicatie van Linked Open Overheids Data

  • 1. Publicatie van Linked Open Overheidsdata Rinke Hoekstra Semantic Web Rubik's Cube by dullhunk at flickr under a cc-license. Thanks!
  • 2. Vragen Wat is linked data, en hoe ziet het eruit? Wat heeft de overheid eraan? Op welke manier kan het ontsloten worden? Wat zijn openstaande problemen?
  • 3. De Semantic Web Ideologie Identiteit is het allerbelangrijkst Gedeeltelijkeoplossingenzijnprachtig Layer cake 8/26/10 3
  • 4. Linked Data/Semantic Web Identificatie Uniform Resource Identifier (URI) Globale identifier (NB: persistent!) Heeft de syntactische verschijningsvorm van een URL Vaak: Internationalized Resource Identifier (IRI) Beschrijving Resource DescriptionFramework (RDF) RDF Schema (RDFS) SimpleKnowledgeOrganization System (SKOS) Web OntologyLanguage (OWL) Bevragen RDF Triple stores SPARQL Query Language
  • 5. Hoe ziet RDF eruit? Datamodel is een (directed) graph Elk data-item is een ‘resource’ met een URI als identifier Elke eigenschap is een binaire relatie: ‘triple’ Tussen resources: <subjectURI, predicateURI, objectURI> Tussen een resource en een ‘literal’ <subjectURI, predicateURI, “literalvalue”>
  • 8. Waarom linkeddata? Globaal unieke identifiers Hergebruik van identifiers in andere datasets Op datum niveau(bijv. twee bronnen die iets over ‘Groningen’ zeggen) Op schema niveau(bijv. twee bronnen die elk het zelfde begrip ‘Stad’ gebruiken) In feite dus ‘linked data sets’
  • 9. Linked Open Data 8/26/10 9
  • 10. 8/26/10 10 November 2009: 13.1Miljard triples, 142 Miljoenlinks
  • 11. In 2010? New York Times subject catalog Data.gov.uk Linked Life Data (4 miljard triples) FreeBase is gekocht door Google FaceBook publiceert Open Graph protocol ...
  • 12. Wat heeft de overheid eraan? Uniforme representatietaal voor zowel: Schema informatie (begrippen), als Gegevens (data) Gedistribueerd Wederom zowel schema als gegevens De moeite waard? Bevordert transparantie, herbruikbaarheid etc. Maakt hergebruik zichtbaar (bijv. HTTP requests)
  • 13. Ontsluiten Overheidsdata Laagdrempelig Transparant Herbruikbaar Multi-channel Dezelfde content op verschillende manieren aanbieden Geïntegreerd Ruwe data en begeleidende tekst
  • 14. Tim Berners-Lee: 5-sterren plan ★ Stel informatie beschikbaar op het Web ★★ Stel het beschikbaar als gestructureerde data(bijv. als Excel sheet ipv. een plaatje) ★★★ Gebruik een open formaat(bijv. CSV ipv. Excel) ★★★★ Gebruik een linked-data formaat(URI’s als id, en RDF als formaat) ★★★★★ Verbind je data aan dat van anderen (geef context) Bron: http://inkdroid.org/journal/2010/06/04/the-5-stars-of-open-linked-data/
  • 15. Over de helewereld… Bron: o.a.http://www.slideshare.net/cygri/the-state-of-linked-government-data 15 of XYZ
  • 16. Verenigde Staten Data.gov Nationaleruwe data en geodatacatalogi Data-gov Wiki project bij RPI “Triplifying” tabulaire datasets van Data.gov Generieke services op RDF data Wiki voor het vergaren van meerinformatie over de datasets Demos Data.govverwijstnaarRPI’s RDF (2010) Bron: o.a.http://www.slideshare.net/cygri/the-state-of-linked-government-data
  • 17. Data-gov Wiki: kritiek Is dithandigerdaneentabel? <rdf:Descriptionrdf:about="#entry9053451"> <rdf:typerdf:resource="http://data-gov.tw.rpi.edu/ 2009/data-gov-twc.rdf#DataEntry"/> <value>2.7</value> <period>M01</period> <year>1995</year> <series_id>SMU55225408000000001</series_id></rdf:Description> Bron: Stefano Mazzocchihttp://www.betaversion.org/~stefano/linotype/news/351/
  • 18. VerenigdKoninkrijk Grote hoeveelheidruwe datasets op data.gov.uk Selectieals five-star Linked Data Basis gelegdvoorkwalitatiefgoede Linked Data representatie URI sets Vocabulaires Best Practices Opensourcecatalogus (CKAN) Bron: o.a.http://www.slideshare.net/cygri/the-state-of-linked-government-data
  • 19. Stap: Catalogus Doorzoekbare catalogus van datasets Catalogus verwijst: naar website waar data oorspronkelijk gepubliceerd is, of naar data als bestand Eenvoudig voortborduren op Open Data http://data.overheid.nl (?) http://nl.ckan.net (grassroots) Relatief ‘standaard’ als oplossing ... afgezien van organisatorische problematiek Weinig ‘semantic web’ Slechts downloadbare bestanden Fulltext zoeken, geen ‘echte’ queries Geen integratie met ander materiaal
  • 20. Stap: URI dereferencing Wat is het? “URI als URL” Meest eenvoudige API Een HTTP request op het URI geeft ofwel: Een RDF dump van de resource met het URI, ofwel Een HTML pagina met een beschrijving van de resource Twee mogelijkheden: Afhankelijk van de ‘agent’ (Content negotiation) Extra informatie in de URL
  • 22. Voorbeeld: LJN BJ3703 Resource URIhttp://linkeddata.few.vu.nl/rechtspraak/uitspraak/BJ3703 Accept text/html, verwijst door naar:http://www.rechtspraak.nl/ljn.asp?ljn=BJ3703 Accept application/rdf+turtleverwijstnaar: Script dateen SPARQL query loslaat: SELECT ?p ?o WHERE { <http://linkeddata.../BJ3703> ?p ?o .}
  • 23. SPARQL output <http://linkeddata.few.vu.nl/rechtspraak/uitspraak/BJ3703> a rnl:Uitspraak;rnlrdf:datum_gepubliceerd "24-07-2009"; rnlrdf:datum_uitspraak "22-07-2009"; rnlrdf:indicatie "Eiser wordt verondersteld de verwekker van gedaagde (nu 41 jaar oud) te zijn. Eiser vordert veroordeling van gedaagde tot medewerking aan DNA-onderzoek, ter verkrijging van zekerheid. De rechtbank wijst de vordering niet reeds af omdat de inzet daarvan louter emotioneel is. De rechtbank merkt het recht om te weten of een ander zijn kind is aan als een persoonlijkheidsrecht. Dit recht wordt afgewogen tegen het belang van gedaagde om de kwestie als afgedaan te beschouwen en vrede te hebben met wat zij weet. De vordering wordt afgewezen."; rnlrdf:instantie rnlrdf:Rechtbank_Groningen; rnlrdf:ljn "BJ3703"; rnlrdf:procedure_soort rnlrdf:Eerste_aanleg_-_enkelvoudig; rnlrdf:rechtsgebied_rechtspraak rnlrdf:Handelszaak; rnlrdf:status rnlrdf:gepubliceerd; rnlrdf:zaaknummers "107402 / HA ZA 09-89"; metalex:src "http://www.rechtspraak.nl/ljn.asp?ljn=BJ3703" .
  • 24.
  • 25.
  • 26. Stap: SPARQL Endpoint RESTful service SPARQL queriesgeencodeerd in request URL Normaal gesproken read-only Zeer veel vrijheidsgraden om data uit te vragen SPARQL query language SELECT, DELETE, UPDATE Elke RDF triple store ondersteunt SPARQL Virtuoso, 4Store, OpenRDFSesame, AllegroGraph Nadeel: vereist infrastructuur
  • 27. Stap: RDFa/GRDDL RDFa: RDF annotations Metadata in HTML pagina’s Manier om RDF triples te ‘verstoppen’ in HTML Zichtbaar voor Google en Yahoo crawlers Voordeel: Maakt client-side RDF applicaties mogelijk Niet alle data hoeft in RDF te zijn(bijv. copyright/licensenotice) Kan RDF produceren uit standaard databases ... en dus ontlastend voor de server GRDDL: Gleaning Resource DescriptionsfromDialects of Languages Verwijzing naar transformatie service (bijv. XSLT)
  • 28. Voorbeeld <tablexmlns:rnl="http://linkeddata.few.vu.nl/rechtspraak/resource/" about="http://linkeddata.few.vu.nl/rechtspraak/uitspraak/BJ3703" typeof="rnl:Uitspraak”> <tbody><tr><tdcolspan="2"> <span rel="rnl:src" content="BJ3703”>LJN BJ3703</span> </td></tr> <tr> <tdclass="result_attribute" style="width: 100px;">Datum</td> <td rel="rnl:datum_uitspraak”>2009-07-22T00:00:00Z </td></tr> <tr> <td>Kenmerken</td> <td>Uitspraak in <span rel="rnl:procedure_soort" href="http://linkeddata.few.vu.nl/rechtspraak/resource/Eerste_aanleg_-_enkelvoudig”>Eerste aanleg - enkelvoudig</span> van <span rel="rnl:instantie" href="http://linkeddata.few.vu.nl/rechtspraak/resource/Rechtbank_Groningen">Rechtbank Groningen</span> binnen het rechtsgebied <span rel="rnl:rechtsgebied_rechtspraak" href="http://linkeddata.few.vu.nl/rechtspraak/resource/Handelszaak">Handelszaak</span> </td></tr> </tbody> </table>
  • 30. Reality check “Triplification” zelf is nietaltijdnuttig Linked Data gaat over syntax, data model, access, maar lost nietautomatisch de lastigeproblemen op standaardclassificatiesysteem; identifier management; data provenance; versiebeheer; context; data discovery “LD removes some technical issues, giving us a better shot at solving the organizational/political ones” (Richard Cyganiak, DERI) Bron: o.a.http://www.slideshare.net/cygri/the-state-of-linked-government-data
  • 31. Een olifant in de kamer?
  • 32. Openstaande Problemen (NB: “probleem” = nog geen standaard oplossing) Provenance Herkomstinformatie van gegevens Probleem: Individuele RDF triples zijn lastig adresseerbaar Geen standaard vocabulair voor uitdrukken provenance Context Lijkt op provenance, maar geeft interpretatie Waarom een probleem? Het negeren van context leidt tot het op een hoop gooien van mogelijk conflicterende gegevens Versiebeheer & Onderhoud
  • 33. Context als Namespace De eigenaar van het domein van de URI wordt geacht deze te onderhouden Nadeel: Namespaces zijn geheel transparant voor clients Domein/eigenaar alleen te achterhalen door URI parsing, dereferencing, of whoislookup
  • 34. Context in SKOS SKOS: SimpleKnowledgeOrganization System Lichtgewicht taal voor uitdrukken van taxonomische informatie omtrent begrippen skos:Concept skos:broader, skos:narrower, skos:related Elk skos:Concept is gerelateerd aan een skos:ConceptScheme Eenvoudige 1:1 mapping relaties mogelijk tussen concepten uit verschillende schemes Uitgebreidere mappings mogelijk dmv gebruik OWL 2 Eenvoudig en vaak voldoende Lang niet alle Linked Data is uitdrukbaar in SKOS
  • 35. Mapping in SKOS 24 October 2009 Rinke Hoekstra - OWLED 2009 35
  • 36.
  • 37. Mappings as OWL Classes A mapping class: Classifies resources annotated using one vocabulary, and Infers annotations using the other vocabulary … it may be directed 24 October 2009 Rinke Hoekstra - OWLED 2009 37
  • 38. Example 24 October 2009 Rinke Hoekstra - OWLED 2009 38
  • 39. Context als NamedGraph RDF Triple stores zijn eigenlijk Quad stores: <subjectURI, predicateURI, objectURI, graphURI> Hergebruik URI’s van grafen in andere triples: <graphURI, dc:creator, “Rinke Hoekstra”, ...> SPARQL ondersteunt queries op grafen, dus: Provenance kan worden achterhaald Context kan expliciet worden gemaakt Maar: Pragmatische oplossing Nog steeds inconsistenties mogelijk Er is nog geen officiële syntax voor
  • 40. The Construction of Social Reality Searle (1995): Institutional Facts Intentional categories are social constructs, they are subjective, relative to an observer, and they are attributed to brute facts. Brute facts are independent of human agreement Constitutive and regulative rules: X counts as Y in context C
  • 41. Searle’s Rules Constitutive rule Why is counts-as not subsumption? Counts-as is relative to a context Counts-as does not permit substitution, and limits inheritance: Counts-as can connect anti-rigid with rigid classes Bills issued by the Bureau of Engraving and Printing (X) count as money (Y) in the United States (C) Money (Y) is the root of all evil
  • 42. Standard Practice Duality of roles is a well known problem Role as class: “Person plays Student” Distinct classes for role and role player But, rather verbose Role as relation: “Person student_at University” Avoid tautology in definition of the role But, no way to incorporate contextual information Problem: cannot have both at the same time Student equivalentClassstudent_atsome University
  • 43. In short Focus either on relation or class oriented representation Observations Reification makes knowledge about a relation explicit e.g. the context of a role, the thematic roles of an action ... but comes at the cost of the relation itself, and and is rather verbose Question: can’t we have both?
  • 44. Yes, we can Infer the relation from a reification ... instead of the reification from the relation Example: definition of ‘student’ A person (X) counts as a student (Y) if enrolled at some university (C)
  • 45. Subjective Entity and Social Role A subjective entity is defined using counts-as Social roles are subjective entities
  • 46. Observer Relative & Institutional Facts
  • 47. Example: Propositional Attitudes A propositional attitude is anything held towards some proposition: “Mary believes that John killed Suzan” “Mary holds a belief towards the proposition ‘John killed Suzan’” “‘John killed Suzan’ counts as a belief in the context of Mary”
  • 48. It’s like Lego™! Communicated attitudes Actions
  • 49. Versiebeheer Eenvoudige oplossing: Voor elke versie een nieuwe graaf Nadeel: Applicaties kunnen afhankelijk zijn van oude versie(bijv. URI dereferencing) Twee URI’s per resource: ‘latestversion’ URI URI met versie-datum erin verwerkt Probleem: versies zijn niet altijd zo eenvoudig

Notes de l'éditeur

  1. imposed_on and context are disjoint properties