Nastasia Vanderperren schetst de verschillen tussen open data en linked open data, introduceert enkele belangrijke termen m.b.t.het semantische web (zoals bv. graph en triple) en gaat in op de voordelen van linked open data. Daarnaast komen aan bod: rechtenverklaringen, metadata, linkrot en persistente identificatie, de PACKED-tool voor online persistente identificatie CultURIze, hergebruik, en de data pitch.
1. Bert Lemmens Alina Saenko
bertb@packed.be
alina@packed.be
@PACKEDvzw
WORKSHOP OPEN
DATA
Nastasia Vanderperren (PACKED/VIAA)
FARO | 6 december 2019
2. INLEIDING
“De ondersteuning van deze inhaalbeweging geeft de mogelijkheid aan de
cultureel-erfgoedsector om gericht achterstanden weg te werken, maar ook om digitale
collectiedata in te zetten als open data en om de visievorming rond dit thema bij
cultureel-erfgoedorganisaties te versterken. De ondersteunde projecten hebben ook een
belangrijke voorbeeldfunctie omwille van de vernieuwende impulsen die rond open data en
visievorming op vlak van digitalisering aan bod komen in deze projecten.”
(voormalig Minister van Cultuur Sven Gatz)
4. AGENDA
● Wie ben jij?
● Wat is open data? (theorie)
● Oefening: data pitch maken (visie)
● Voorstelling data pitch
5. WIE BEN JIJ?
● organisatie
● waarom deze sessie?
● ervaringen (van jouw organisatie) met open data?
● specifieke vragen over open data?
6. WAT IS OPEN DATA?
● vrije beschikbare informatie > open licentie
● vrije toegang > voor iedereen, geen reden nodig, geen
registratie
● gebruikers mogen data hergebruiken, aanpassen en
verspreiden
● open standaarden > formaat is geen drempel
● machineleesbaar > CSV, JSON, XML, RDF
7. WAT IS OPEN DATA?
⇔ Linked Open Data?
● Semantische web / Web 3.0
● Semantische zoekvragen beantwoorden door verbanden te
leggen tussen gelinkte informatiebronnen
● Voorbeeld: Wikidata ⇒ gestructureerde, gelinkte en
machineleesbare informatie van Wikipedia
8. WAT IS OPEN DATA?
(een deel van de) Linked Open Data Cloud
op 29/03/2019
https://lod-cloud.net/
10. TIM-BERNERS-LEE
Linked (Open) Data (2006; 2010)
4 Linked Data principes (2006):
- Gebruik URI’s als namen voor dingen
- Gebruik HTTP URI waardoor mensen ze online kunnen zoeken
- Zorg dat URI’s nuttige informatie in een standaard formaat teruggeven (RDF*,
JSON-LD)
- Link naar URI’s van andere linked data bronnen
5 sterren Linked Open Data (2010)
★ Toegankelijk op het Web (eender welk formaat) maar onder een
open licentie (Open Data)
★★ Toegankelijk als machine leesbare, gestructureerd data
(vb. excel ipv pdf)
★★★ plus data in een open formaat (bv. CSV ipv Excel)
★★★★ plus data in een W3C standaard formaat (RDFof JSON-LD)
die dingen identificeren, zodat mensen er naar kunnen verwijzen.
★★★★★ plus links naar andere linked data.
11. GRAPH
1.
“Dossier over de
herstelling van het dak
van het clublokaal”
“1 stuk”
1982-1983,
1987
Rek 1. Schap
heeft als inhoud
heeft als omvang
is gevormd in de jaren
heeft als standplaats
”Koninklijke
Voetbalclub De
Pottestampers”
Alfons
Verberckmoes
is gevormd door
gaat over
12. GRAPH
1.
“Dossier over de
herstelling van het dak
van het clublokaal”
“1 stuk”
1982-1983,
1987
Rek 1. Schap
heeft als inhoud
heeft als omvang
is gevormd in de jaren
heeft als standplaats
”Koninklijke
Voetbalclub De
Pottestampers”
“1943”
“354”
“2016-20
17”
“Schoonderb
uken”
Alfons
Verberckmoes
“63”
“Vossenkot
straat 43,
Keiberg”
is gevormd door
heeft als leeftijd
woont in
gaat over
bevindt zich in
heeft als aantal leden
is gesticht in
vastgesteld op
datum
13. GRAPH
1.
“Dossier over de
herstelling van het dak
van het clublokaal”
“1 stuk”
1982-1983,
1987
Rek 1. Schap
heeft als inhoud
heeft als omvang
is gevormd in de jaren
heeft als standplaats
”Koninklijke
Voetbalclub De
Pottestampers”
“1943”
“354”
“2016-20
17”
“Schoonderb
uken”
Alfons
Verberckmoes
“63”
“Vossenkot
straat 43,
Keiberg”
is gevormd door
heeft als leeftijd
woont in
gaat over
bevindt zich in
heeft als aantal leden
is gesticht in
vastgesteld op
datum
archiefbestan
ddeel
dossier
voetbalclub
dossier
is
is is
is
14. GRAPH
http://pottenstamp
ers.be/object/4859
“Dossier over de
herstelling van het dak
van het clublokaal”
“1 stuk”
1982-1983,
1987Rek 1. Schap A
heeft als inhoud
heeft als omvang
is gevormd in de jaren
heeft als standplaats
http://pottenstamp
ers.be/agent/8574
“1943”
“354”
“2016-20
17”
“Schoonderb
uken”
http://pottensta
mpers.be/agen
t/9836
“63”
“Vossenkot
straat 43,
Keiberg”
is gevormd door
heeft als leeftijd
woont in gaat over
bevindt zich in
heeft als aantal leden
is gesticht in
vastgesteld op
datum
archiefbestan
ddeel
dossier voetbalclubdossier
Alfons
Verberckmoes
heet
1.
”Koninklijke
Voetbalclub De
Pottestampers”
is
is is
heeft
ID
heet
is
15. TRIPLES
onderwerp werkwoord predikaat
http://pottenstampers.be/object/4859 heeft als inventarisnummer 1
http://pottenstampers.be/object4859 is een archefbestanddeel
http://pottenstampers.be/object/4859 is een dossier
http://pottenstampers.be/object/4859 heeft als inhoud “Dossier over de herstelling van het dak van het clublokaal”
http://pottenstampers.be/object/4859 heeft als omvang 1 stuk
http://pottenstampers.be/object/4859 gaat over http://pottenstampers.be/agent/8574
http://pottenstampers.be/object/4859 is gevormd in de jaren 1982-1983; 1987
http://pottenstampers.be/object/4859 is gevormd door http://pottenstampers.be/agent/9836
http://pottenstampers.be/object/4859 bevindt zich op Rek 1. Schap A
http://pottenstampers.be/agent/8574 is een voetbalclub
http://pottenstampers.be/agent/8574 heet Koninklijke Voetbalclub De Pottestampers
http://pottenstampers.be/agent/8574 is gesticht in 1943
http://pottenstampers.be/agent/9836 is een man
http://pottenstampers.be/agent/9836 heet Alfons Verberckmoes
16. ONTOLOGIEËN
onderwerp werkwoord predikaat
http://pottenstampers.be/object/4859 http://purl.org/dc/terms/identifier 1
http://pottenstampers.be/object/4859 http://purl.org/dc/terms/type archefbestanddeel
http://pottenstampers.be/object/4859 http://purl.org/dc/terms/type dossier
http://pottenstampers.be/object/4859 http://purl.org/dc/terms/title “Dossier over de herstelling van het dak van het clublokaal”
http://pottenstampers.be/object/4859 http://purl.org/dc/terms/extent 1 stuk
http://pottenstampers.be/object/4859 http://purl.org/dc/terms/subject http://pottenstampers.be/agent/8574
http://pottenstampers.be/object/4859 http://purl.org/dc/terms/created 1982-1983; 1987
http://pottenstampers.be/object/4859 http://purl.org/dc/terms/creator http://pottenstampers.be/agent/9836
http://pottenstampers.be/object/4859 http://purl.org/dc/terms/location Rek 1. Schap A
http://pottenstampers.be/agent/8574 http://purl.org/dc/terms/type voetbalclub
http://pottenstampers.be/agent/8574 http://purl.org/dc/terms/title Koninklijke Voetbalclub De Pottestampers
http://pottenstampers.be/agent/8574 http://purl.org/dc/terms/created 1943
http://pottenstampers.be/agent/9836 http://purl.org/dc/terms/type man
http://pottenstampers.be/agent/9836 http://purl.org/dc/terms/title Alfons Verberckmoes
23. WAT IS OPEN DATA?
● open: drempels zo laag mogelijk
● bruikbaar: afstemmen op noden van gebruiker
● vindbaar: duurzaam toegankelijk
● bereikbaar: via online zoekactie
● zichtbaar: uitnodigen tot hergebruik
open data = wegwerken van zoveel mogelijk drempels
24. OPEN
● in principe publiek domein of open licenties (PD, CC0, CC BY) >
wegwerken juridische drempels
● zonder registratie of voorwaarden > wegwerken economische
drempels
● open formaten + platformen > wegwerken technische drempels
● geen beperkingen op hergebruik, aanpassingen of
verspreidingen
25. OPEN
Publiek domein / open licenties met maximaal hergebruik
CC0: afstand doen van je
auteursrecht
Public Doman Mark: dit werk is in
het publiek domein
vrij hergebruik, maar
naamsvermelding
vrij hergebruik, maar naamsvermelding en
delen onder dezelfde licentie
31. OPEN
Formaat:
● webpagina (HTML) > gewone eindgebruiker
● JSON / XML / CSV (machineleesbaar) > digital humanities, data
mining, developers, ...
● JPEG, PNG, TIFF > afbeeldingen
● RDF/XML, JSON-LD > linked data
32. BRUIKBAAR
Voldoen aan eisen van je doelpubliek
● gestructureerd en uitwisselbaar > verrijking mogelijk maken
● open standaarden (LIDO, JSON, XML, Dublin Core, Invulboek,
IIIF)
● kwaliteitseisen: vorm en kwaliteit die je publiek verwacht
● persistente identificatie (PID)
● gebruiksrechten
⇒ gebruiker kennen!
33.
34.
35. BRUIKBAAR
Kwaliteitseisen
● data schonen
○ begrijpbaar voor interne en externe medewerkers
○ begrijpbaar voor machines
● dataprofielen opstellen + links met thesauri
● dataformaten bepalen (CSV, XML, JSON…)
⇒ gebruikersverwachtingen omzetten naar kwaliteitseisen
36. VINDBAAR
Persistent identifiers / Persistent URI’s / PIDs
● online inventarisnummer
● onveranderlijke identifier die verwijst naar de meest actuele
data van het object
● http://
● eenvoudige, leesbare vorm
50. What is cultURIze?
Culturize is a tool for museum administrators to gather and share information
about their collection in a sustainable way.
Who needs CultURIze?
Registrars, curators and managers of small or medium cultural heritage
collections.
https://github.com/PACKED-vzw/CultURIze
https://github.com/PACKED-vzw/CultURIze/wiki
- prototype developed during Open Summer of code 2018 in Belgium
- inspired by W3id on Github
52. BEREIKBAAR
● infrastructuur die data kan hosten en doorzoekbaar maken
○ eigen platform (website, DAM …)
○ bestaande platformen (bv. Wikimedia platformen,
Erfgoedinzicht, Open Data Gent, DAMS Antwerpen...)
○ op de plek waar jouw doelpubliek ze eenvoudig kan
ophalen
● gebruikersverwachtingen! (verschil tussen mens en machine)
53. ZICHTBAAR
= content naar eindgebruiker toeleiden
● meerwaarde bieden → gebruikers uitnodigen om data te
gebruiken (gebruiksvoorwaarden)
● hoog scoren in zoekresultaten
● aanwezig zijn op de platformen die door de eindgebruiker
gebruikt wordt (bv. Wikipedia)
● data op publieke open platformen (bv. Wikidata)
59. ● welke data maak je toegankelijk?
● wat is bijzonder aan de inhoud van die data?
● voor wie is die data nuttig of relevant?
● wat zijn interessante toepassingen van deze data?
(co-creatie, onderzoek, educatie, erfgoedwerking)
● wat zijn de voorwaarden voor hergebruik van deze data?
(werk, reproductie, metadata)
● waar kan ik de data bereiken? welk online platform ga je
gebruiken?
OEFENING: DATA PITCH!