SlideShare une entreprise Scribd logo
1  sur  32
© Fedict 2010. All rights reserved
Van keyword tot thesaurus,
publiceren met SKOS
Fedict – Brussel – 01/2011
Bart Hanssens
© Fedict 2011. All rights reserved | p. 2
Agenda
 Waarom taxonomy... publiceren ?
 Van keyword tot thesaurus
 Terms, terms, terms
 SKOS, een eenvoudig formaat
© Fedict 2010. All rights reserved
Waarom taxonomy e.d.
publiceren ?
© Fedict 2011. All rights reserved | p. 4
Thematische indeling
 Goede indeling
 Hergebruiken ?
 In nieuwsberichten
 Andere overheden
 Uitgeverijen
 ...
© Fedict 2011. All rights reserved | p. 5
Mens
 Slim
 Niet accuraat
 Flexibel
© Fedict 2011. All rights reserved | p. 6
Machine
 Dom
 Accuraat
 Niet zo flexibel
© Fedict 2011. All rights reserved | p. 7
Automatisch vs manueel
 Services om tekst automatisch te taggen
 OpenCalais (Reuters)
 Maar:
 Niet in elke taal beschikbaar
 Vraagt veel resources
 Niet altijd correct
 Dus:
 Kleine inspanning
© Fedict 2010. All rights reserved
Van keyword tot thesaurus
© Fedict 2011. All rights reserved | p. 9
Structuur
 Keywords / free tagging
 Controlled vocabulary
 Taxonomy
 Thesaurus
© Fedict 2011. All rights reserved | p. 10
Keywords / free tagging
 Niet gestructureerd
 Zeer flexibel
 Vb: tags in blogs, "hashes" op Twitter
 #eid, overheid, Brussel
© Fedict 2011. All rights reserved | p. 11
Controlled vocabulary
 Vaste lijst
 Plat / geen hierarchie
 Vb: lijst van provincies
 Henegouwen, Limburg, ...
© Fedict 2011. All rights reserved | p. 12
Taxonomy
 Hierarchie
 Boomstructuur
 Vb: thema's op portal
 Familie > Identiteit > Identiteitskaart
© Fedict 2011. All rights reserved | p. 13
Taxonomy (voorbeeld)
 Bibliotheek
 Soms moeilijk:
 Boeken over meerdere
thema's
© Fedict 2011. All rights reserved | p. 14
Thesaurus
 Complex
 Meerdere hierarchische structuren
 Allerlei relaties
 Vb: EUROVOC
 Gelijke behandeling
 RT: vrouwenrechten
 RT: sociale overeenkomst
 RT: toegang tot het onderwijs
© Fedict 2010. All rights reserved
Terms, terms, terms
© Fedict 2011. All rights reserved | p. 16
Broader – Narrower Term
 Algemener / specifieker
 NT kan meerdere BT hebben
 Vb:
 Soundtrack (NT)
 BT: Muziek
 BT: Film
© Fedict 2011. All rights reserved | p. 17
Related term
 "een" relatie tussen termen
 "Simple" KOS
 Vb:
 Film
 RT: Projector
 RT: Popcorn
 RT: Oscars
© Fedict 2011. All rights reserved | p. 18
Use – Use For Term
 Soms ook Preferred / Deprecated
 Benaming kan wijzigen doorheen de jaren
 Voorbeeld:
 Automobiel (UF)
 USE: auto
© Fedict 2010. All rights reserved
SKOS
© Fedict 2011. All rights reserved | p. 20
Wat is SKOS ?
 Simple Knowledge Ontology System
 Eenvoudige representatie van metadata
 Gebaseerd op RDF
 W3C Recommendation
© Fedict 2011. All rights reserved | p. 21
Features
 Voor vocabularies, taxonomies, thesauri
 Multi-language terms
 Documentatie van termen
 Optioneel: mapping van thesauri
© Fedict 2011. All rights reserved | p. 22
Voorbeeld
Belgium

+ Family - Familie - Famille
| |
| + Identity - Identiteit - Identité
|
+ Justice - Justitie - Justice
|
|
...
© Fedict 2011. All rights reserved | p. 23
Voorbeeld (Turtle notatie)
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix skos: <http://www.w3.org/2004/02/skos/core#> .
<http://skos.belgif.be/belgium> rdf:type skos:ConceptScheme ;
skos:hasTopConcept <http://skos.belgif.be/belgium#family> .
<http://skos.belgif.be/belgium#family> rdf:type skos:Concept ;
skos:prefLabel "Family"@en ;
skos:prefLabel "Familie"@nl ;
skos:prefLabel "Famille"@fr ;
skos:narrower <http://skos.belgif.be/belgium#family/identity> .
<http://skos.belgif.be/belgium#family/identity> rdf:type skos:Concept ;
skos:prefLabel "Identity"@en ;
....
© Fedict 2011. All rights reserved | p. 24
Voorbeeld (XML notatie)
<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:skos="http://www.w3.org/2004/02/skos/core#">
<skos:ConceptScheme rdf:about="http://skos.belgif.be/belgium">
<skos:hasTopConcept rdf:resource="http://skos.belgif.be/belgium#family"/>
...
</skos:ConceptScheme>
<skos:Concept rdf:about="http://skos.belgif.be/belgium#family">
<skos:prefLabel xml:lang="en">Family</skos:prefLabel>
<skos:prefLabel xml:lang="nl">Familie</skos:prefLabel>
<skos:prefLabel xml:lang="fr">Famille</skos:prefLabel>
<skos:narrower rdf:resource="http//skos.belgif.be/belgium#family/identity"/>
</skos:Concept>
<skos:Concept rdf:about="http://skos.belgif.be/belgium#family/identity">
<skos:prefLabel xml:lang="en">Identity</skos:prefLabel>
...
</skos:Concept>
</rdf:RDF>
© Fedict 2011. All rights reserved | p. 25
IDs en labels, Preferred Label
 Term heeft een unieke ID
 Meerdere labels mogelijk
 Aliases
 Verschillende talen
 1 Preferred Label per taal
 Vb:
 prefLabel: elektronische identiteitskaart
 prefLabel: carte d'identité électronique
 altLabel: e-ID
© Fedict 2011. All rights reserved | p. 26
IDs en labels, Hidden Label
 De benaming kan veranderen
 Niet nodig om alle content opnieuw te taggen
 Hidden Label gebruiken voor deprecated term
 Vb:
 prefLabel: Overheidsdienst
 hiddenLabel: Ministerie
© Fedict 2011. All rights reserved | p. 27
Documentatie
 Verschillende "notes"
 Vb:
 prefLabel: Overheidsdienst
 example: Fedict
 definition: dienstenorganisatie onder politiek gezag...
 scopeNote: FODs en PODs maar geen autonome
overheidsbedrijven
 editoralNote: nog verder na te kijken door redactie
© Fedict 2011. All rights reserved | p. 28
Mappen van verschillende thesauri
 Niet iedereen gebruikt dezelfde thesaurus
 Mapping is (soms) mogelijk:
 broadMatch / narrowMatch
 relatedMatch
 closeMatch / exactMach
 Weinig automated mapping tools
© Fedict 2010. All rights reserved
Samenvatting
© Fedict 2011. All rights reserved | p. 30
Samenvatting
 Denk aan de machines
 Publiceren bevordert hergebruik
 SKOS is bruikbaar formaat
© Fedict 2010. All rights reserved
Vragen ?
bart.hanssens [at] fedict.be
© Fedict 2010. All rights reserved
Bedankt !
Bart Hanssens / Fedict
Maria-Theresiastreet 1/3
1000 Brussels, Belgium
TEL. +32 2 212 96 89 | FAX +32 2 212 96 99
bart.hanssens [at] fedict.be | www.fedict.belgium.be

Contenu connexe

Plus de Bart Hanssens

OpenFed, a Drupal distribution
OpenFed, a Drupal distributionOpenFed, a Drupal distribution
OpenFed, a Drupal distributionBart Hanssens
 
Open Summer of Code in Belgium
Open Summer of Code in BelgiumOpen Summer of Code in Belgium
Open Summer of Code in BelgiumBart Hanssens
 
Open Belgium 2022: Prepare To Code
Open Belgium 2022: Prepare To CodeOpen Belgium 2022: Prepare To Code
Open Belgium 2022: Prepare To CodeBart Hanssens
 
Werkgroep metadata: INSPIRE - DCAT-AP mapping
Werkgroep metadata: INSPIRE - DCAT-AP mappingWerkgroep metadata: INSPIRE - DCAT-AP mapping
Werkgroep metadata: INSPIRE - DCAT-AP mappingBart Hanssens
 
Quarkus, Jib én OpenJ9
Quarkus, Jib én OpenJ9Quarkus, Jib én OpenJ9
Quarkus, Jib én OpenJ9Bart Hanssens
 
Open Data at the Federal Level 2021
Open Data at the Federal Level 2021Open Data at the Federal Level 2021
Open Data at the Federal Level 2021Bart Hanssens
 
Open Data workshop Agoria ICT
Open Data workshop Agoria ICTOpen Data workshop Agoria ICT
Open Data workshop Agoria ICTBart Hanssens
 
Atelier Open Data / Agoria ICT
Atelier Open Data / Agoria ICTAtelier Open Data / Agoria ICT
Atelier Open Data / Agoria ICTBart Hanssens
 
Open Source and Open Data
Open Source and Open DataOpen Source and Open Data
Open Source and Open DataBart Hanssens
 
Open Community Projects
Open Community ProjectsOpen Community Projects
Open Community ProjectsBart Hanssens
 
From webform to API using microframeworks
From webform to API using microframeworksFrom webform to API using microframeworks
From webform to API using microframeworksBart Hanssens
 
Linked Data: Introductie
Linked Data: IntroductieLinked Data: Introductie
Linked Data: IntroductieBart Hanssens
 
Open data, what's cooking at the federal level 2020
Open data, what's cooking at the federal level 2020Open data, what's cooking at the federal level 2020
Open data, what's cooking at the federal level 2020Bart Hanssens
 
BOSA DG DT: opendata et intégrateur de services
BOSA DG DT: opendata et intégrateur de servicesBOSA DG DT: opendata et intégrateur de services
BOSA DG DT: opendata et intégrateur de servicesBart Hanssens
 
Local and Regional digital transformation in Belgium
Local and Regional digital transformation in BelgiumLocal and Regional digital transformation in Belgium
Local and Regional digital transformation in BelgiumBart Hanssens
 
Voordeel halen uit zoekmachines en semantic web
Voordeel halen uit zoekmachines en semantic webVoordeel halen uit zoekmachines en semantic web
Voordeel halen uit zoekmachines en semantic webBart Hanssens
 

Plus de Bart Hanssens (20)

OpenFed, a Drupal distribution
OpenFed, a Drupal distributionOpenFed, a Drupal distribution
OpenFed, a Drupal distribution
 
Open Summer of Code in Belgium
Open Summer of Code in BelgiumOpen Summer of Code in Belgium
Open Summer of Code in Belgium
 
Open Belgium 2022: Prepare To Code
Open Belgium 2022: Prepare To CodeOpen Belgium 2022: Prepare To Code
Open Belgium 2022: Prepare To Code
 
Werkgroep metadata: INSPIRE - DCAT-AP mapping
Werkgroep metadata: INSPIRE - DCAT-AP mappingWerkgroep metadata: INSPIRE - DCAT-AP mapping
Werkgroep metadata: INSPIRE - DCAT-AP mapping
 
Overzicht DCAT-AP
Overzicht DCAT-APOverzicht DCAT-AP
Overzicht DCAT-AP
 
Quarkus, Jib én OpenJ9
Quarkus, Jib én OpenJ9Quarkus, Jib én OpenJ9
Quarkus, Jib én OpenJ9
 
Open Data at the Federal Level 2021
Open Data at the Federal Level 2021Open Data at the Federal Level 2021
Open Data at the Federal Level 2021
 
Open Data workshop Agoria ICT
Open Data workshop Agoria ICTOpen Data workshop Agoria ICT
Open Data workshop Agoria ICT
 
Atelier Open Data / Agoria ICT
Atelier Open Data / Agoria ICTAtelier Open Data / Agoria ICT
Atelier Open Data / Agoria ICT
 
Open Source and Open Data
Open Source and Open DataOpen Source and Open Data
Open Source and Open Data
 
Données ouvertes
Données ouvertesDonnées ouvertes
Données ouvertes
 
Open Data
Open DataOpen Data
Open Data
 
Open Community Projects
Open Community ProjectsOpen Community Projects
Open Community Projects
 
From webform to API using microframeworks
From webform to API using microframeworksFrom webform to API using microframeworks
From webform to API using microframeworks
 
Linked Data: Introductie
Linked Data: IntroductieLinked Data: Introductie
Linked Data: Introductie
 
JavaVMs en GraalVM
JavaVMs en GraalVMJavaVMs en GraalVM
JavaVMs en GraalVM
 
Open data, what's cooking at the federal level 2020
Open data, what's cooking at the federal level 2020Open data, what's cooking at the federal level 2020
Open data, what's cooking at the federal level 2020
 
BOSA DG DT: opendata et intégrateur de services
BOSA DG DT: opendata et intégrateur de servicesBOSA DG DT: opendata et intégrateur de services
BOSA DG DT: opendata et intégrateur de services
 
Local and Regional digital transformation in Belgium
Local and Regional digital transformation in BelgiumLocal and Regional digital transformation in Belgium
Local and Regional digital transformation in Belgium
 
Voordeel halen uit zoekmachines en semantic web
Voordeel halen uit zoekmachines en semantic webVoordeel halen uit zoekmachines en semantic web
Voordeel halen uit zoekmachines en semantic web
 

Publiceren met SKOS

  • 1. © Fedict 2010. All rights reserved Van keyword tot thesaurus, publiceren met SKOS Fedict – Brussel – 01/2011 Bart Hanssens
  • 2. © Fedict 2011. All rights reserved | p. 2 Agenda  Waarom taxonomy... publiceren ?  Van keyword tot thesaurus  Terms, terms, terms  SKOS, een eenvoudig formaat
  • 3. © Fedict 2010. All rights reserved Waarom taxonomy e.d. publiceren ?
  • 4. © Fedict 2011. All rights reserved | p. 4 Thematische indeling  Goede indeling  Hergebruiken ?  In nieuwsberichten  Andere overheden  Uitgeverijen  ...
  • 5. © Fedict 2011. All rights reserved | p. 5 Mens  Slim  Niet accuraat  Flexibel
  • 6. © Fedict 2011. All rights reserved | p. 6 Machine  Dom  Accuraat  Niet zo flexibel
  • 7. © Fedict 2011. All rights reserved | p. 7 Automatisch vs manueel  Services om tekst automatisch te taggen  OpenCalais (Reuters)  Maar:  Niet in elke taal beschikbaar  Vraagt veel resources  Niet altijd correct  Dus:  Kleine inspanning
  • 8. © Fedict 2010. All rights reserved Van keyword tot thesaurus
  • 9. © Fedict 2011. All rights reserved | p. 9 Structuur  Keywords / free tagging  Controlled vocabulary  Taxonomy  Thesaurus
  • 10. © Fedict 2011. All rights reserved | p. 10 Keywords / free tagging  Niet gestructureerd  Zeer flexibel  Vb: tags in blogs, "hashes" op Twitter  #eid, overheid, Brussel
  • 11. © Fedict 2011. All rights reserved | p. 11 Controlled vocabulary  Vaste lijst  Plat / geen hierarchie  Vb: lijst van provincies  Henegouwen, Limburg, ...
  • 12. © Fedict 2011. All rights reserved | p. 12 Taxonomy  Hierarchie  Boomstructuur  Vb: thema's op portal  Familie > Identiteit > Identiteitskaart
  • 13. © Fedict 2011. All rights reserved | p. 13 Taxonomy (voorbeeld)  Bibliotheek  Soms moeilijk:  Boeken over meerdere thema's
  • 14. © Fedict 2011. All rights reserved | p. 14 Thesaurus  Complex  Meerdere hierarchische structuren  Allerlei relaties  Vb: EUROVOC  Gelijke behandeling  RT: vrouwenrechten  RT: sociale overeenkomst  RT: toegang tot het onderwijs
  • 15. © Fedict 2010. All rights reserved Terms, terms, terms
  • 16. © Fedict 2011. All rights reserved | p. 16 Broader – Narrower Term  Algemener / specifieker  NT kan meerdere BT hebben  Vb:  Soundtrack (NT)  BT: Muziek  BT: Film
  • 17. © Fedict 2011. All rights reserved | p. 17 Related term  "een" relatie tussen termen  "Simple" KOS  Vb:  Film  RT: Projector  RT: Popcorn  RT: Oscars
  • 18. © Fedict 2011. All rights reserved | p. 18 Use – Use For Term  Soms ook Preferred / Deprecated  Benaming kan wijzigen doorheen de jaren  Voorbeeld:  Automobiel (UF)  USE: auto
  • 19. © Fedict 2010. All rights reserved SKOS
  • 20. © Fedict 2011. All rights reserved | p. 20 Wat is SKOS ?  Simple Knowledge Ontology System  Eenvoudige representatie van metadata  Gebaseerd op RDF  W3C Recommendation
  • 21. © Fedict 2011. All rights reserved | p. 21 Features  Voor vocabularies, taxonomies, thesauri  Multi-language terms  Documentatie van termen  Optioneel: mapping van thesauri
  • 22. © Fedict 2011. All rights reserved | p. 22 Voorbeeld Belgium + Family - Familie - Famille | | | + Identity - Identiteit - Identité | + Justice - Justitie - Justice | | ...
  • 23. © Fedict 2011. All rights reserved | p. 23 Voorbeeld (Turtle notatie) @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> . @prefix skos: <http://www.w3.org/2004/02/skos/core#> . <http://skos.belgif.be/belgium> rdf:type skos:ConceptScheme ; skos:hasTopConcept <http://skos.belgif.be/belgium#family> . <http://skos.belgif.be/belgium#family> rdf:type skos:Concept ; skos:prefLabel "Family"@en ; skos:prefLabel "Familie"@nl ; skos:prefLabel "Famille"@fr ; skos:narrower <http://skos.belgif.be/belgium#family/identity> . <http://skos.belgif.be/belgium#family/identity> rdf:type skos:Concept ; skos:prefLabel "Identity"@en ; ....
  • 24. © Fedict 2011. All rights reserved | p. 24 Voorbeeld (XML notatie) <?xml version="1.0"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:skos="http://www.w3.org/2004/02/skos/core#"> <skos:ConceptScheme rdf:about="http://skos.belgif.be/belgium"> <skos:hasTopConcept rdf:resource="http://skos.belgif.be/belgium#family"/> ... </skos:ConceptScheme> <skos:Concept rdf:about="http://skos.belgif.be/belgium#family"> <skos:prefLabel xml:lang="en">Family</skos:prefLabel> <skos:prefLabel xml:lang="nl">Familie</skos:prefLabel> <skos:prefLabel xml:lang="fr">Famille</skos:prefLabel> <skos:narrower rdf:resource="http//skos.belgif.be/belgium#family/identity"/> </skos:Concept> <skos:Concept rdf:about="http://skos.belgif.be/belgium#family/identity"> <skos:prefLabel xml:lang="en">Identity</skos:prefLabel> ... </skos:Concept> </rdf:RDF>
  • 25. © Fedict 2011. All rights reserved | p. 25 IDs en labels, Preferred Label  Term heeft een unieke ID  Meerdere labels mogelijk  Aliases  Verschillende talen  1 Preferred Label per taal  Vb:  prefLabel: elektronische identiteitskaart  prefLabel: carte d'identité électronique  altLabel: e-ID
  • 26. © Fedict 2011. All rights reserved | p. 26 IDs en labels, Hidden Label  De benaming kan veranderen  Niet nodig om alle content opnieuw te taggen  Hidden Label gebruiken voor deprecated term  Vb:  prefLabel: Overheidsdienst  hiddenLabel: Ministerie
  • 27. © Fedict 2011. All rights reserved | p. 27 Documentatie  Verschillende "notes"  Vb:  prefLabel: Overheidsdienst  example: Fedict  definition: dienstenorganisatie onder politiek gezag...  scopeNote: FODs en PODs maar geen autonome overheidsbedrijven  editoralNote: nog verder na te kijken door redactie
  • 28. © Fedict 2011. All rights reserved | p. 28 Mappen van verschillende thesauri  Niet iedereen gebruikt dezelfde thesaurus  Mapping is (soms) mogelijk:  broadMatch / narrowMatch  relatedMatch  closeMatch / exactMach  Weinig automated mapping tools
  • 29. © Fedict 2010. All rights reserved Samenvatting
  • 30. © Fedict 2011. All rights reserved | p. 30 Samenvatting  Denk aan de machines  Publiceren bevordert hergebruik  SKOS is bruikbaar formaat
  • 31. © Fedict 2010. All rights reserved Vragen ? bart.hanssens [at] fedict.be
  • 32. © Fedict 2010. All rights reserved Bedankt ! Bart Hanssens / Fedict Maria-Theresiastreet 1/3 1000 Brussels, Belgium TEL. +32 2 212 96 89 | FAX +32 2 212 96 99 bart.hanssens [at] fedict.be | www.fedict.belgium.be