SlideShare une entreprise Scribd logo
1  sur  44
Een semantisch Web voor archieven:
bouw bruggen, geen muren




Jacco van Ossenbruggen
VU/CWI Amsterdam




                                     1
hool
Informatie stechnologie
       old c
“Sorry meneer, u heeft helemaal
  gelijk, maar dat past nu eenmaal
  niet in de computer.”
  – star, gesloten, beperkend, van boven
    af opgelegd, moeilijk of niet te
    veranderen
  – scheidt wat verbonden zou moeten zijn
  – metafoor: de muur


                                            2
3
Image by Thierry Noir, see http://commons.wikimedia.org/wiki/Image:Berlinermauer.jpg
4
© CERN http://mediaarchive.cern.ch/MediaArchive/Photo/Public/2009/0903028/0903028_01/0903028_01-A4-at-144-dpi.jpg
Web technologie
  “The vision we share with others is to
    allow the Web to be accessible by
    anyone, anywhere, anytime,
    anyhow.” 1)
      – flexibel, open, ”enabling”, van onder af
        opgebouwd, constant veranderend
      – verbind wat voorheen gescheiden was
      – metafoor: de brug

1) http://www.w3.org/TR/di-princ/
                                                   5
Image courtesy of Paul Gramen Raven, CC-SA license,6see 

http://www.flickr.com/photos/armchairanarchist/2869662267/
Image by Jacco van Ossenbruggen, CC-SA license, see 

                                                7
 http://www.flickr.com/photos/jrvosse/3618454739/
The Web:
“open” documents and links




  URL       Web link    URL
                              8
The Semantic, or Data Web:
    “open” data and links
         Painting                                        Painter
“Green Stripe (Mme Matisse)”                          “Henri Matisse”
Royal Museum of Fine Arts, Copenhagen
                                                        Getty ULAN




                                          creator

                                        Dublin Core




               URL                      Web link            URL
                                                                        9
10
http://www.w3.org/2001/sw/
12
http://richard.cyganiak.de/2007/10/lod/
13
http://www4.wiwiss.fu-berlin.de/bizer/pub/lod-datasets_2009-03-27.html
1
6
1
7
http://www4.wiwiss.fu-berlin.de/bizer/pub/lod-datasets_2009-03-27.html   1
                                                                         9
Soorten interoperabiliteit
• Syntactische interoperabiliteit
  – gebruik data formaten waarmee je
    kunt delen
  – De XML familie heeft vaak de voorkeur
• Semantische interoperabiliteit
  – Hoe deel je betekenis en concepten
  – Technologie voor het vinden en
    representeren van betekenisvolle links


                                             20
21
22
Multilingual labels for concepts




                                   23
24
25
http://www4.wiwiss.fu-berlin.de/bizer/pub/lod-datasets_2009-03-27.html
http://e-culture.multimedian.nl
•  BSIK (aardgasbaten) project       The image cannot be displayed. Your computer may not have enough memory to open the image, or the image may have been corrupted. Restart your computer, and then open the file again. If
                                     the red x still appears, you may have to delete the image and then insert it again.




   MultimediaN
•  Partners: VU, CWI, UvA, DEN,
   ICN
•  People:
  Alia Amin, Lora Aroyo, Mark van
  Assem, Victor de Boer, Lynda
  Hardman, Michiel Hildebrand,
  Laura Hollink, Marco de Niet,
  Borys Omelayenko, Marie-France
  van Orsouw, Jacco van
  Ossenbruggen, Guus Schreiber Jos
  Taekema, Annemiek Teesing, Anna
  Tordai, Jan Wielemaker, Bob
  Wielinga
•  Artchive.com, RKD,
   Rijksmuseum Amsterdam,
   Dutch ethnology musea
   (Amsterdam, Leiden),
   National Library (Bibliopolis)

                                                                                                                                                                                                                               26
Principe 1: semantische annotatie

•  Beschrijf
   objecten met
   “concepten”
   uit een
   gecontroleerd
   vocabulair




                                       27
Principe 2: semantisch zoeken
                            Query
•  gebruik betekenis bij    “Paris”
   het helpen formuleren
   van de zoekvraag                      Paris
•  vind objecten die een
   betekenisvolle relatie                   PartOf
   met de zoek term
   hebben
•  gebruik het soort                  Montmartre
   relatie om de
   presentatie van de
   resultaten te
   verbeteren
                                                     28
Principe 3: vocabulaires verbinden

       “Tokugawa”




  AAT style/period               SVCN period
   Edo (Japanese period)          Edo
   Tokugawa
       AAT is Getty’s          SVCN is local in-house
Art & Architecture Thesaurus   ethnology thesaurus

                                                        29
De mythe van de
geünificeerde thesaurus
•  In grote virtuele collecties heb je altijd
   meerdere vocabulaires
  – In meerdere talen
•  Elk vocabulaire kent zijn eigen
   perspectief
  – Je kunt ze niet zomaar samenvoegen
•  Maar je kunt verschillende vocabulaires
   samen gebruiken met slechts een
   beperkt aantal links
  – “Vocabulary alignment”
•  Slechts een paar links kunnen al
   verassende resultaten leveren                30
Voorbeeld metadata (XML)




                           31
Resultaat:
hyperlinks voor mens & machine




                                 32
33
34
http://www4.wiwiss.fu-berlin.de/bizer/pub/lod-datasets_2009-03-27.html
pkonline
pprime semantic
annotation
waisda home
Recept
• Technologie is niet het belangrijkste
• Sociale & juridische barrières wel
• Willen wij eigenlijk wel delen
  – Wat als anderen “enge” dingen gaan
    doen met onze data?
  – Hoe blijven we de kwaliteit
    garanderen?
  – etc.
• Maar stel je wil het echt, wat dan?
                                          38
39
http://www4.wiwiss.fu-berlin.de/bizer/pub/lod-datasets_2009-03-27.html
Open formaten & “cool” URLs
•  Op het web heeft alles een URL
  –  dus URLs voor:
     •  metadata records
     •  gedigitaliseerde bronnen
     •  termen (uit de archiefwiki?)
     •  ...
  –  let op: “cool URLs don’t change”!
•  Op het web is alle data ook beschikbaar voor
   andere applicaties
     •  elk formaat is prima, maar hoe meer applicaties het
        kunnen lezen hoe beter
     •  internationalisation (i18n)
     •  toegankelijkheid (voice browsers, mobiele telefoons, ...)
     •  gebruik vocabulaires die andere applicaties ook al
        begrijpen: Dublin Core, SKOS, (EAD), ...
                                                                    40
From metadata to
semantic metadata




                    41
Thesaurus alignment
 Linguïstisch & structuur

 Overlap in termen

 Overlap/gelijkenis in records

 Gedeelde achtergrond kennis

                                       42
Original slide by Frank van Harmelen
alignments “leren”
• Bijv. relaties tussen kunststijlen in
  AAT and schilders in ULAN door het
  scannen van kunsthistorische teksten
  – “Welke schilders waren Impressionisten”




                                              43
Open formaten & “cool” URLs
•  Op het web heeft alles een URL
  –  dus URLs voor:
     •  metadata records
     •  gedigitaliseerde bronnen
     •  termen (uit de archiefwiki?)
     •  ...
  –  let op: “cool URLs don’t change”!
•  Op het web is alle data ook beschikbaar voor
   andere applicaties
     •  elk formaat is prima, maar hoe meer applicaties het
        kunnen lezen hoe beter
     •  internationalisation (i18n)
     •  toegankelijkheid (voice browsers, mobiele telefoons, ...)
     •  gebruik vocabulaires die andere applicaties ook al
        begrijpen: Dublin Core, SKOS, (EAD), ...
                                                                    44

Contenu connexe

Similaire à Een semantisch Web voor archieven: bouw bruggen, geen muren

Beeldbank UT en Social Media
Beeldbank UT en Social MediaBeeldbank UT en Social Media
Beeldbank UT en Social MediaJulia Meijvogel
 
matthias vandermaesen_vlaamse kunstcollectie
matthias vandermaesen_vlaamse kunstcollectiematthias vandermaesen_vlaamse kunstcollectie
matthias vandermaesen_vlaamse kunstcollectieKatrien Steelandt
 
Bibliotheek 2.0
Bibliotheek 2.0Bibliotheek 2.0
Bibliotheek 2.0Moqub M
 
Datahub voor museale collecties. Xplore Bruges 03.03.2016
Datahub voor museale collecties. Xplore Bruges 03.03.2016Datahub voor museale collecties. Xplore Bruges 03.03.2016
Datahub voor museale collecties. Xplore Bruges 03.03.2016Vlaamse Kunstcollectie
 
Het AV domein binnen NDE: hoe beginnen we ermee?
Het AV domein binnen NDE: hoe beginnen we ermee?Het AV domein binnen NDE: hoe beginnen we ermee?
Het AV domein binnen NDE: hoe beginnen we ermee?maartenbrinkerink
 
20190207_collectieontsluiting op_wikimedia_platformen
20190207_collectieontsluiting op_wikimedia_platformen20190207_collectieontsluiting op_wikimedia_platformen
20190207_collectieontsluiting op_wikimedia_platformenPACKED vzw
 
Presentatie PCDB overleg Utrecht 28 juni 2016
Presentatie PCDB overleg Utrecht 28 juni 2016Presentatie PCDB overleg Utrecht 28 juni 2016
Presentatie PCDB overleg Utrecht 28 juni 2016Enno Meijers
 
Een digitaal depot in de praktijk. (Luc Schokkaert, afdelingshoofd Algemene d...
Een digitaal depot in de praktijk. (Luc Schokkaert, afdelingshoofd Algemene d...Een digitaal depot in de praktijk. (Luc Schokkaert, afdelingshoofd Algemene d...
Een digitaal depot in de praktijk. (Luc Schokkaert, afdelingshoofd Algemene d...FARO
 
Web 2.0 Levende talen Zwolle
Web 2.0 Levende talen ZwolleWeb 2.0 Levende talen Zwolle
Web 2.0 Levende talen Zwollegiedocusters
 
DEN bijdrage Museumcongres 2012
DEN bijdrage Museumcongres 2012DEN bijdrage Museumcongres 2012
DEN bijdrage Museumcongres 2012Monika Lechner
 
Partnerdag Lukas-Art in Flanders : ‘Blauwdruk gedistribueerd beeldbeheer’ doo...
Partnerdag Lukas-Art in Flanders : ‘Blauwdruk gedistribueerd beeldbeheer’ doo...Partnerdag Lukas-Art in Flanders : ‘Blauwdruk gedistribueerd beeldbeheer’ doo...
Partnerdag Lukas-Art in Flanders : ‘Blauwdruk gedistribueerd beeldbeheer’ doo...Lukas -Art in Flanders
 
Af presentatie-2nov2011-definitief
Af presentatie-2nov2011-definitiefAf presentatie-2nov2011-definitief
Af presentatie-2nov2011-definitiefMachteldsSlides
 
1206_Timmermans_Baltussen_Brinkerink_EEN_BOTTOMUP_OPEN_DATA_INITIATIEF_VANUIT...
1206_Timmermans_Baltussen_Brinkerink_EEN_BOTTOMUP_OPEN_DATA_INITIATIEF_VANUIT...1206_Timmermans_Baltussen_Brinkerink_EEN_BOTTOMUP_OPEN_DATA_INITIATIEF_VANUIT...
1206_Timmermans_Baltussen_Brinkerink_EEN_BOTTOMUP_OPEN_DATA_INITIATIEF_VANUIT...KVANdagen
 
Crowdsourcing en cultureel erfgoed: kansen & uitdagingen
Crowdsourcing en cultureel erfgoed: kansen & uitdagingenCrowdsourcing en cultureel erfgoed: kansen & uitdagingen
Crowdsourcing en cultureel erfgoed: kansen & uitdagingenJohan Oomen
 
Web 2.0 Toepassingen In Het Talenonderwijs Nuttig Of Modeverschijnsel Giedo...
Web 2.0 Toepassingen In Het Talenonderwijs Nuttig Of Modeverschijnsel   Giedo...Web 2.0 Toepassingen In Het Talenonderwijs Nuttig Of Modeverschijnsel   Giedo...
Web 2.0 Toepassingen In Het Talenonderwijs Nuttig Of Modeverschijnsel Giedo...Quentin Castel
 
Web 2.0 introductie voor bibliotheken
Web 2.0 introductie voor bibliothekenWeb 2.0 introductie voor bibliotheken
Web 2.0 introductie voor bibliothekenJohan Mijs
 
Im Tagging It
Im Tagging ItIm Tagging It
Im Tagging ItMoqub M
 

Similaire à Een semantisch Web voor archieven: bouw bruggen, geen muren (20)

Beeldbank UT en Social Media
Beeldbank UT en Social MediaBeeldbank UT en Social Media
Beeldbank UT en Social Media
 
matthias vandermaesen_vlaamse kunstcollectie
matthias vandermaesen_vlaamse kunstcollectiematthias vandermaesen_vlaamse kunstcollectie
matthias vandermaesen_vlaamse kunstcollectie
 
Bibliotheek 2.0
Bibliotheek 2.0Bibliotheek 2.0
Bibliotheek 2.0
 
Datahub voor museale collecties. Xplore Bruges 03.03.2016
Datahub voor museale collecties. Xplore Bruges 03.03.2016Datahub voor museale collecties. Xplore Bruges 03.03.2016
Datahub voor museale collecties. Xplore Bruges 03.03.2016
 
Het AV domein binnen NDE: hoe beginnen we ermee?
Het AV domein binnen NDE: hoe beginnen we ermee?Het AV domein binnen NDE: hoe beginnen we ermee?
Het AV domein binnen NDE: hoe beginnen we ermee?
 
20190207_collectieontsluiting op_wikimedia_platformen
20190207_collectieontsluiting op_wikimedia_platformen20190207_collectieontsluiting op_wikimedia_platformen
20190207_collectieontsluiting op_wikimedia_platformen
 
Presentatie PCDB overleg Utrecht 28 juni 2016
Presentatie PCDB overleg Utrecht 28 juni 2016Presentatie PCDB overleg Utrecht 28 juni 2016
Presentatie PCDB overleg Utrecht 28 juni 2016
 
Een digitaal depot in de praktijk. (Luc Schokkaert, afdelingshoofd Algemene d...
Een digitaal depot in de praktijk. (Luc Schokkaert, afdelingshoofd Algemene d...Een digitaal depot in de praktijk. (Luc Schokkaert, afdelingshoofd Algemene d...
Een digitaal depot in de praktijk. (Luc Schokkaert, afdelingshoofd Algemene d...
 
EDepots in het CVAa en het NAi
EDepots in het CVAa en het NAi EDepots in het CVAa en het NAi
EDepots in het CVAa en het NAi
 
Vanstappen De Caigny
Vanstappen De CaignyVanstappen De Caigny
Vanstappen De Caigny
 
Web 2.0 Levende talen Zwolle
Web 2.0 Levende talen ZwolleWeb 2.0 Levende talen Zwolle
Web 2.0 Levende talen Zwolle
 
DEN bijdrage Museumcongres 2012
DEN bijdrage Museumcongres 2012DEN bijdrage Museumcongres 2012
DEN bijdrage Museumcongres 2012
 
Partnerdag Lukas-Art in Flanders : ‘Blauwdruk gedistribueerd beeldbeheer’ doo...
Partnerdag Lukas-Art in Flanders : ‘Blauwdruk gedistribueerd beeldbeheer’ doo...Partnerdag Lukas-Art in Flanders : ‘Blauwdruk gedistribueerd beeldbeheer’ doo...
Partnerdag Lukas-Art in Flanders : ‘Blauwdruk gedistribueerd beeldbeheer’ doo...
 
Af presentatie-2nov2011-definitief
Af presentatie-2nov2011-definitiefAf presentatie-2nov2011-definitief
Af presentatie-2nov2011-definitief
 
De KADOC-lezer op zijn wenken bediend
De KADOC-lezer op zijn wenken bediendDe KADOC-lezer op zijn wenken bediend
De KADOC-lezer op zijn wenken bediend
 
1206_Timmermans_Baltussen_Brinkerink_EEN_BOTTOMUP_OPEN_DATA_INITIATIEF_VANUIT...
1206_Timmermans_Baltussen_Brinkerink_EEN_BOTTOMUP_OPEN_DATA_INITIATIEF_VANUIT...1206_Timmermans_Baltussen_Brinkerink_EEN_BOTTOMUP_OPEN_DATA_INITIATIEF_VANUIT...
1206_Timmermans_Baltussen_Brinkerink_EEN_BOTTOMUP_OPEN_DATA_INITIATIEF_VANUIT...
 
Crowdsourcing en cultureel erfgoed: kansen & uitdagingen
Crowdsourcing en cultureel erfgoed: kansen & uitdagingenCrowdsourcing en cultureel erfgoed: kansen & uitdagingen
Crowdsourcing en cultureel erfgoed: kansen & uitdagingen
 
Web 2.0 Toepassingen In Het Talenonderwijs Nuttig Of Modeverschijnsel Giedo...
Web 2.0 Toepassingen In Het Talenonderwijs Nuttig Of Modeverschijnsel   Giedo...Web 2.0 Toepassingen In Het Talenonderwijs Nuttig Of Modeverschijnsel   Giedo...
Web 2.0 Toepassingen In Het Talenonderwijs Nuttig Of Modeverschijnsel Giedo...
 
Web 2.0 introductie voor bibliotheken
Web 2.0 introductie voor bibliothekenWeb 2.0 introductie voor bibliotheken
Web 2.0 introductie voor bibliotheken
 
Im Tagging It
Im Tagging ItIm Tagging It
Im Tagging It
 

Plus de Jacco van Ossenbruggen

Cultural AI - KB College 2 july 2019 (Dutch)
Cultural AI -  KB College 2 july 2019 (Dutch)Cultural AI -  KB College 2 july 2019 (Dutch)
Cultural AI - KB College 2 july 2019 (Dutch)Jacco van Ossenbruggen
 
The Nature of Digitally-Produced Data: Towards Social-Scientific Tool Criticism
The Nature of Digitally-Produced Data: Towards Social-Scientific Tool CriticismThe Nature of Digitally-Produced Data: Towards Social-Scientific Tool Criticism
The Nature of Digitally-Produced Data: Towards Social-Scientific Tool CriticismJacco van Ossenbruggen
 
#kbdata: Exploring potential impact of technology limitations on DH research
#kbdata: Exploring potential impact of technology limitations on DH research#kbdata: Exploring potential impact of technology limitations on DH research
#kbdata: Exploring potential impact of technology limitations on DH researchJacco van Ossenbruggen
 
Using Semantic Web Technologies to Reproduce a Pharmacovigilance Case Study
Using Semantic Web Technologies  to Reproduce  a Pharmacovigilance Case StudyUsing Semantic Web Technologies  to Reproduce  a Pharmacovigilance Case Study
Using Semantic Web Technologies to Reproduce a Pharmacovigilance Case StudyJacco van Ossenbruggen
 
Intro talk for amalgame test with RCE; Beeld & Geluid
Intro talk for amalgame test with RCE; Beeld & GeluidIntro talk for amalgame test with RCE; Beeld & Geluid
Intro talk for amalgame test with RCE; Beeld & GeluidJacco van Ossenbruggen
 

Plus de Jacco van Ossenbruggen (7)

Cultural AI - KB College 2 july 2019 (Dutch)
Cultural AI -  KB College 2 july 2019 (Dutch)Cultural AI -  KB College 2 july 2019 (Dutch)
Cultural AI - KB College 2 july 2019 (Dutch)
 
The Nature of Digitally-Produced Data: Towards Social-Scientific Tool Criticism
The Nature of Digitally-Produced Data: Towards Social-Scientific Tool CriticismThe Nature of Digitally-Produced Data: Towards Social-Scientific Tool Criticism
The Nature of Digitally-Produced Data: Towards Social-Scientific Tool Criticism
 
#kbdata: Exploring potential impact of technology limitations on DH research
#kbdata: Exploring potential impact of technology limitations on DH research#kbdata: Exploring potential impact of technology limitations on DH research
#kbdata: Exploring potential impact of technology limitations on DH research
 
Gist 16-march-2015-jacco
Gist 16-march-2015-jaccoGist 16-march-2015-jacco
Gist 16-march-2015-jacco
 
Using Semantic Web Technologies to Reproduce a Pharmacovigilance Case Study
Using Semantic Web Technologies  to Reproduce  a Pharmacovigilance Case StudyUsing Semantic Web Technologies  to Reproduce  a Pharmacovigilance Case Study
Using Semantic Web Technologies to Reproduce a Pharmacovigilance Case Study
 
Intro talk for amalgame test with RCE; Beeld & Geluid
Intro talk for amalgame test with RCE; Beeld & GeluidIntro talk for amalgame test with RCE; Beeld & Geluid
Intro talk for amalgame test with RCE; Beeld & Geluid
 
Anna Karenina in Ontology Matching
Anna Karenina in Ontology MatchingAnna Karenina in Ontology Matching
Anna Karenina in Ontology Matching
 

Een semantisch Web voor archieven: bouw bruggen, geen muren

  • 1. Een semantisch Web voor archieven: bouw bruggen, geen muren Jacco van Ossenbruggen VU/CWI Amsterdam 1
  • 2. hool Informatie stechnologie old c “Sorry meneer, u heeft helemaal gelijk, maar dat past nu eenmaal niet in de computer.” – star, gesloten, beperkend, van boven af opgelegd, moeilijk of niet te veranderen – scheidt wat verbonden zou moeten zijn – metafoor: de muur 2
  • 3. 3 Image by Thierry Noir, see http://commons.wikimedia.org/wiki/Image:Berlinermauer.jpg
  • 5. Web technologie “The vision we share with others is to allow the Web to be accessible by anyone, anywhere, anytime, anyhow.” 1) – flexibel, open, ”enabling”, van onder af opgebouwd, constant veranderend – verbind wat voorheen gescheiden was – metafoor: de brug 1) http://www.w3.org/TR/di-princ/ 5
  • 6. Image courtesy of Paul Gramen Raven, CC-SA license,6see 
 http://www.flickr.com/photos/armchairanarchist/2869662267/
  • 7. Image by Jacco van Ossenbruggen, CC-SA license, see 
 7 http://www.flickr.com/photos/jrvosse/3618454739/
  • 8. The Web: “open” documents and links URL Web link URL 8
  • 9. The Semantic, or Data Web: “open” data and links Painting Painter “Green Stripe (Mme Matisse)” “Henri Matisse” Royal Museum of Fine Arts, Copenhagen Getty ULAN creator Dublin Core URL Web link URL 9
  • 10. 10
  • 14.
  • 15.
  • 16. 1 6
  • 17. 1 7
  • 18.
  • 20. Soorten interoperabiliteit • Syntactische interoperabiliteit – gebruik data formaten waarmee je kunt delen – De XML familie heeft vaak de voorkeur • Semantische interoperabiliteit – Hoe deel je betekenis en concepten – Technologie voor het vinden en representeren van betekenisvolle links 20
  • 21. 21
  • 22. 22
  • 23. Multilingual labels for concepts 23
  • 24. 24
  • 26. http://e-culture.multimedian.nl •  BSIK (aardgasbaten) project The image cannot be displayed. Your computer may not have enough memory to open the image, or the image may have been corrupted. Restart your computer, and then open the file again. If the red x still appears, you may have to delete the image and then insert it again. MultimediaN •  Partners: VU, CWI, UvA, DEN, ICN •  People: Alia Amin, Lora Aroyo, Mark van Assem, Victor de Boer, Lynda Hardman, Michiel Hildebrand, Laura Hollink, Marco de Niet, Borys Omelayenko, Marie-France van Orsouw, Jacco van Ossenbruggen, Guus Schreiber Jos Taekema, Annemiek Teesing, Anna Tordai, Jan Wielemaker, Bob Wielinga •  Artchive.com, RKD, Rijksmuseum Amsterdam, Dutch ethnology musea (Amsterdam, Leiden), National Library (Bibliopolis) 26
  • 27. Principe 1: semantische annotatie •  Beschrijf objecten met “concepten” uit een gecontroleerd vocabulair 27
  • 28. Principe 2: semantisch zoeken Query •  gebruik betekenis bij “Paris” het helpen formuleren van de zoekvraag Paris •  vind objecten die een betekenisvolle relatie PartOf met de zoek term hebben •  gebruik het soort Montmartre relatie om de presentatie van de resultaten te verbeteren 28
  • 29. Principe 3: vocabulaires verbinden “Tokugawa” AAT style/period SVCN period Edo (Japanese period) Edo Tokugawa AAT is Getty’s SVCN is local in-house Art & Architecture Thesaurus ethnology thesaurus 29
  • 30. De mythe van de geünificeerde thesaurus •  In grote virtuele collecties heb je altijd meerdere vocabulaires – In meerdere talen •  Elk vocabulaire kent zijn eigen perspectief – Je kunt ze niet zomaar samenvoegen •  Maar je kunt verschillende vocabulaires samen gebruiken met slechts een beperkt aantal links – “Vocabulary alignment” •  Slechts een paar links kunnen al verassende resultaten leveren 30
  • 33. 33
  • 38. Recept • Technologie is niet het belangrijkste • Sociale & juridische barrières wel • Willen wij eigenlijk wel delen – Wat als anderen “enge” dingen gaan doen met onze data? – Hoe blijven we de kwaliteit garanderen? – etc. • Maar stel je wil het echt, wat dan? 38
  • 40. Open formaten & “cool” URLs •  Op het web heeft alles een URL –  dus URLs voor: •  metadata records •  gedigitaliseerde bronnen •  termen (uit de archiefwiki?) •  ... –  let op: “cool URLs don’t change”! •  Op het web is alle data ook beschikbaar voor andere applicaties •  elk formaat is prima, maar hoe meer applicaties het kunnen lezen hoe beter •  internationalisation (i18n) •  toegankelijkheid (voice browsers, mobiele telefoons, ...) •  gebruik vocabulaires die andere applicaties ook al begrijpen: Dublin Core, SKOS, (EAD), ... 40
  • 42. Thesaurus alignment  Linguïstisch & structuur  Overlap in termen  Overlap/gelijkenis in records  Gedeelde achtergrond kennis 42 Original slide by Frank van Harmelen
  • 43. alignments “leren” • Bijv. relaties tussen kunststijlen in AAT and schilders in ULAN door het scannen van kunsthistorische teksten – “Welke schilders waren Impressionisten” 43
  • 44. Open formaten & “cool” URLs •  Op het web heeft alles een URL –  dus URLs voor: •  metadata records •  gedigitaliseerde bronnen •  termen (uit de archiefwiki?) •  ... –  let op: “cool URLs don’t change”! •  Op het web is alle data ook beschikbaar voor andere applicaties •  elk formaat is prima, maar hoe meer applicaties het kunnen lezen hoe beter •  internationalisation (i18n) •  toegankelijkheid (voice browsers, mobiele telefoons, ...) •  gebruik vocabulaires die andere applicaties ook al begrijpen: Dublin Core, SKOS, (EAD), ... 44