4. 4
Waarom van Open Data
Agenda
1 – Wat is Open Data
2 – Baten van Open Data (commercieel, bestuurlijk)
3 – Linked Open Data
4 – Omgevingsfactoren
5. 5
Wat is Open Data?
De essentie
Open Data is net als
andere documenten op internet.
Maar dan gemakkelijk gemaakt voor
hergebruik van de afzonderlijke gegevens.
7. 7
Wat is Open Data?
https://data.overheid.nl/
a. De data is openbaar;
b. Er berust geen auteursrecht of andere rechten
van derden op;
c. De data zijn bekostigd uit publieke middelen, beschikbaar gesteld
voor de uitvoering van die taak;
d. De data voldoen bij voorkeur aan ‘open standaarden’ (geen
barrières voor het gebruik door ICT-gebruikers of door ICT-
aanbieders);
e. Open Data is bij voorkeur computer-leesbaar, zodat zoekmachines
informatie in documenten kunnen vinden.
9. 9
Van opmaak- naar betekenisgeoriënteerd
Gestandaardiseerde metadatering
Webpagina document Open Data document
10. 10
Waarom van Open Data
Agenda
1 – Wat is Open Data
2 – Baten van Open Data (commercieel, bestuurlijk)
3 – Linked Open Data
4 – Omgevingsfactoren
11. 11
Waarom Open Data
Baten
A - Het is goed voor iedereen (+ reciprociteit)
B - Het verkoopt zichzelf - de app dan
C - Het helpt andere producten te verkopen
D - Het levert kostenbesparingen
12. 12
Waarom Open Data
Takeaway 1
A - Het is goed voor iedereen (+ reciprociteit)
B - Het verkoopt zichzelf - de app dan
C - Het helpt andere producten te verkopen
D - Het levert kostenbesparingen
13. 13
Waarom Open Data
Takeaway 2
A - Het is goed voor iedereen (+ reciprociteit)
B - Het verkoopt zichzelf - de app dan
C - Het helpt andere producten te verkopen
D - Het levert kostenbesparingen
* ... en nog méér als we het kunnen LINKEN
}*
15. 15
Casus
Reizigersinformatie voor grootstedelijk OV
“Goede reisinformatie is geen verleider,”
zegt hoofd marketing & vervoerontwikkeling bij HTM
Joep ten Brink. “Maar geen verleiding zonder
goede reisinformatie.
Zeker nu we het moeten gaan doen met
minder geld van de belastingbetaler en
meer geld van de reiziger.”
Dichter bij huis:
http://stefan.konink.de/contrib/openov/govi-nieuwsbrief-15.pdf
16. 16
Welke verleider wil je ondersteunen?
Commercieel belang: OEFENING
Met behulp van de Open Transportation Data konden lokale leveranciers
goedkoop eenvoudige countdown signs leveren.
Wie was de eerste afnemer van deze Countdown Signs?
17. 17
Welke verleider wil je ondersteunen?
OEFENING: De eerste afnemer van de Countdown Signs?
De Starbucks in de winkelstraat
met een Countdown Sign boven de counter kunnen klanten
- in de winkel (en niet buiten op straat wachtend) -
zien hoeveel tijd ze hebben voor nog een kop koffie
18. 18
Commercieel belang van Open Data
Zoek de C-tjes
A - Het is goed voor iedereen (+ reciprociteit)
B - Het verkoopt zichzelf - de app dan
C - Het helpt andere producten te verkopen
D - Het levert kostenbesparingen
Moraal: vind de link tussen de data en de koffie
19. 19
Voorbeeld van baten (1)
Vrije parkeerplaatsen
A - Het is goed voor iedereen
B - Het verkoopt zichzelf
C - Het verkoopt andere producten
D - Het levert kostenbesparingen
B
A
C
verhoogde
bezetting
P-plaats
20. 20
Voorbeeld van baten (2)
Wob
A - Het is goed voor iedereen
B - Het verkoopt zichzelf
C - Het verkoopt andere producten
D - Het levert kostenbesparingen
D
21. 21
Open Data voor gemeenten
Checklist op data.overheid.nl/voor-gemeenten/top-20
22. 22
Wat levert het op?
data.overheid.nl/handreiking/Wat-levert-het-op-voor-de-overheid
• Financiële besparing
• Verhoging datakwaliteit
• Versterking van de legitimiteit
• Vergroting van de externe oriëntatie van de organisatie
• Standaardisatievoordelen
24. 24
Open Data Benefits (UK)
A report for the Department for Business, Innovation and Skills
Key research findings
Value to consumers, businesses and the public
sector between £1.2 billion and £2.2 billion
much larger downstream impacts affecting all areas of
society beyond the direct customer.
MARKET ASSESSMENT OF PUBLIC SECTOR INFORMATION Written by Deloitte MAY 2013
There is a link between the
provision and use/re-use of
public sector information and
economic growth.
25. 25
Waarom van Open Data
Agenda
1 – Wat is Open Data
2 – Baten van Open Data (commercieel, bestuurlijk)
3 – Linked Open Data
4 – Omgevingsfactoren
26. 26
Het wereld voedsel probleem
Meerdere factoren, meerdere datasets
The Global Hunger Index (GHI) […] provides insights into the drivers of hunger.
By raising awareness and understanding of regional and country differences in
hunger, the GHI aims to trigger actions to reduce hunger
http://semanticweb.com/fighting-global-hunger-with-semantics-and-how-you-can-help_b38141
The IFPRI decided to provide the GHI as Linked Open Data so that it can be
combined with other relevant information and […] indirectly contribute to
direct global hunger solutions
28. 28
Wat noemen we Linked Data?
(Voor IT-ers:) W3C, Tim Berners-Lee, Semantic Web
LOD
Linked
Data
Open
Data
(5 !)
Linked Data is data die is gepubliceerd m.b.v.
standaarden (RDF, SPARQL) waarmee
makkelijk verbanden gelegd kunnen worden
tussen verschillende datasets
29. 29
Linked Data sterren (toe)passen op Open Data
Idealiter gebruik je RDF formaat (atomaire data, z.g. “triples”)
Er berust geen auteursrecht of
andere rechten van derden op;
De data voldoen bij voorkeur
aan ‘open standaarden’
Open Data is bij voorkeur
computer-leesbaar
bij voorkeur
Open Data ≥ 3 DATA
30. 30
Ander aspect van Open Data publiceren
Bulk (down te loaden bestand) versus gedoseerd (online API)
BESTAND API
31. 31
“Gebruikersgemak” Open Data
is afhankelijk van bij publicatie toegepaste standaarden
minder afhankelijk
van verbinding
ingebouwde
selectielogica
computer-
leesbaar
vrij van
rechten
simpel te linken aan
andere datasets
open
formaat
“triple”
formaat
onlinedownte
loaden
BESTAND
SPARQL
RDF
API
proprietary
formaat
paywall
API
CSV, …Excel, …
≥ 4 DATA2 DATA 3 DATA
API
actualiteit niet
gegarandeerd !
32. 32
Duurzaamheid (≠ -gebruikersgemak)
VB: RaadsInformatieSystemen en de Archiefwet
Houdbaarheid van bijvoorbeeld Word ?
Wie kan nog Word 3.1 of Word 95 inlezen ?
Niet duurzaam:
Microsoft Word
Excel
Windows Media
Flash Video
BMP
PowerPoint
Apple iWork, Keynote
Twijfelgevallen:
OpenOffice (.odf, .odt, .sxw)
PostScript.
Wel duurzaam:
PDF
HTML mits conform Webrichtlijnen
JPEG
PNG
MPEG
MP3 en MP4
SOAP XML
API
( )
(een)
standaard
voor
33. 33
Kwaliteit Open Data publicatie
Samenvatting
Open Data
met open API
Linked (RDF, SPARQL)
34. 34
Waarom Open Data
Takeaway 1
A - Het is goed voor iedereen (+ reciprociteit)
B - Het verkoopt zichzelf - de app dan
C - Het helpt andere producten te verkopen
D - Het levert kostenbesparingen
35. 35
Waarom Open Data
Takeaway 2
A - Het is goed voor iedereen (+ reciprociteit)
B - Het verkoopt zichzelf - de app dan
C - Het helpt andere producten te verkopen
D - Het levert kostenbesparingen
* ... en nog méér als we het kunnen LINKEN
}*
36. 36
Waarom van Open Data
Agenda
1 – Wat is Open Data
2 – Baten van Open Data (commercieel, bestuurlijk)
3 – Linked Open Data
4 – Omgevingsfactoren
37. 37
Burger verwacht state-of-the-art service
state-of-the-art = APP User Experience
• Appification of the world
• Icoon klikken ; webadres tikken !
• Consument bepaalt zelf
hoe hij/zij informatie zoekt
• App (meer nog dan het web zelf)
ontkoppelt produceren & consumeren van data
38. 38
Appification of the world
Ontkoppelt produceren & consumeren van data
http://www.forbes.com/sites/anthonykosner/2012/12/16/forecast-2013-
the-appification-of-everything-will-turn-the-web-into-an-app-o-verse/
Instead of thinking about the web
as a hierarchical tree of documents
we need to start thinking about all
of that content as an underlying
service layer for application-based
interfaces [ API]
39. 39
Data producent data consument
Evolutie informatievoorziening
systeem
opslag
in uit
systeem
opslag
in uit
app
40. 40
Data consument bepaalt integratiebehoefte !
Koppelen van datasets door integratie in de APP
systeem
opslag
systeem
opslag
systeem
opslag
integratie
app
Linked
Open Data
41. 41
Generieke integratielogica infrastructuur
Koppelen door standaardisatie datacenters + integratie via de cloud
http
systeem
opslag
systeem
opslag
systeem
opslag
app
RDFRDFRDF
SPARQL
SPARQL
SPARQL
http
APP koppelt met
één SPARQL endpoint
en linkt naar keuze
Linked Open Data
48. 48Ook Europa is het nu eens over Open Data
RICHTLIJN 2013/37/EU VAN HET EUROPEES PARLEMENT EN DE RAAD
Artikel 5
Beschikbare formaten
1. Openbare lichamen stellen hun documenten ter beschikking in de reeds
bestaande formaten of talen en, indien mogelijk en passend, in een open en
machinaal leesbaar formaat, samen met hun metadata. Zowel het formaat als de
metadata dient voor zover mogelijk aan formele open standaarden te voldoen.
Artikel 9
Praktische regelingen
De lidstaten stellen praktische regelingen vast die het zoeken naar voor
hergebruik beschikbare documenten vereenvoudigen, zoals overzichtslijsten
van de belangrijkste documenten met relevante metagegevens, die indien
mogelijk en passend online en in machinaal leesbare formaten toegankelijk zijn„
en portaalsites met links naar de overzichtslijsten. Indien mogelijk
vergemakkelijken de lidstaten het taaloverschrijdend zoeken naar documenten.
De lidstaten moeten de richtlijn voor 18 juli 2015 implementeren
in hun eigen wetgeving. In Nederland gebeurt dat waarschijnlijk
via wijziging van de Wet openbaarheid Bestuur en de Archiefwet.
51. 51
Bezuinigen door Open Data investeringen
Bezuinig door stroomlijnen van je organisatie
informatievoorziening
stroomlijnt organisatieprocessen
(Linked) Open Data
stroomlijnt informatievoorziening
52. 52
Waarom van Open Data
Agenda
1 – Wat is Open Data
2 – Baten van Open Data (commercieel, bestuurlijk)
3 – Linked Open Data
4 – Omgevingsfactoren er zijn ook belemmeringen
53. 53
Geschikt voor publicatie?
Doe de toets
a. De data is openbaar;
b. Er berust geen auteursrecht of andere rechten
van derden op;
c. De data zijn bekostigd uit publieke middelen, beschikbaar gesteld
voor de uitvoering van die taak;
d. De data voldoen bij voorkeur aan ‘open standaarden’ (geen
barrières voor het gebruik door ICT-gebruikers of door ICT-
aanbieders);
e. Open Data is bij voorkeur computer-leesbaar, zodat zoekmachines
informatie in documenten kunnen vinden.
54. 54
Zóo 2012 ?
Casuscitaat KOOP in COLLEGE STANDAARDISATIE CS 12-06-05
“Voor de vindbaarheid van data moet er een paradigmashift
plaatsvinden. Er wordt nog veel zelf georganiseerd binnen de eigen muren,
maar dat zou eigenlijk moeten zonder muren eromheen. Eigenlijk moet men
er van meet af aan van uit gaan dat overheidsdata Open Data is.
Er wordt nu nog veel gedacht in „mijn data‟ en aarzelingen zoals als de data
„open‟ wordt is het dan nog mijn data. Maar collecties vullen elkaar aan,
moeten overlap hebben. Dit maakt het beeld completer. Het belang, de
noodzaak om gevonden te worden ontbreekt nog. Er wordt vaak nog voor
een traditionele manier van publiceren gekozen – via
communicatieafdelingen etc. – in plaats van het online zetten van de data.”
55. 55
In de herhaling: waarom Linked Open Data
Casuscitaat KOOP in COLLEGE STANDAARDISATIE CS 12-06-05
“Voor de vindbaarheid van data moet er een paradigmashift plaatsvinden. Er
wordt nog veel zelf georganiseerd binnen de eigen muren, maar dat zou
eigenlijk moeten zonder muren eromheen. Eigenlijk moet men er van meet af
aan van uit gaan dat overheidsdata Open Data is.
Er wordt nu nog veel gedacht in „mijn data‟ en aarzelingen zoals als de data
„open‟ wordt is het dan nog mijn data. Maar collecties vullen elkaar aan,
moeten overlap hebben. Dit maakt het beeld completer. Het belang,
de noodzaak om gevonden te worden ontbreekt nog. Er wordt vaak nog voor
een traditionele manier van publiceren gekozen – via communicatieafdelingen
etc. – in plaats van het online zetten van de data.”
Linked Data regelt dat
56. 56
Maar: vandaag, meer dan een jaar later …
koop.overheid.nl/producten/linked-data gaat nog niet heel snel
57. 57
Publicatie door datacenter
Linked (met RDF/SPARQL) = paradigma shift veranderdrempel
• Bestaande dataset bestand beschikbaar stellen
business as usual (NB: exportfrequentie?)
• API per backoffice systeem
business as usual (NB: security? beschikbaarheid?)
• API over meerdere systemen heen
serious business €€ (meestal)
• Publiceren met RDF via triplestore, API = SPARQL
paradigma shift (relationele model links laten liggen +
anders omgaan met metadata)
58. 58
Hoe wil je data ontsluiten vanuit een APP ?
binnen de mogelijkheden die de gepubliceerde datasets bieden
http://www.pilod.nl/index.php?title=Boek/GeurtsEtAl
ditzijnniet
Tim’ssterren
59. 59
Welke API standaarden
APP bouwers hebben zo hun stijlen veranderdrempel ?
SOAP SPARQL
OData
REST/JSON
flexibel
ingewikkeld
lean & mean
houtje-touwtje
structuur
log
60. 60
Wijzigingen in data, applicaties, infrastructuur
Kosten datacenter
• Datasets ontsluiten en publiceren éénmalige kosten
• Kosten voor onderhoud ontsluiting terugkerende kosten !
• Goede afspraken maken over toekomstvastheid publicatie !
• Toekomst: Linked Open Data architectuur
• Geen terugkerende kosten meer
• Minder ontsluitingskosten (generieke infrastructuur is er al)
• STAP 1: zet je data in een triplestore met RDF (≥ 4 DATA)
61. 61
Eenduidigheid
”Wat bedoel je precies?” ! projectkosten x 10
• Bestaande dataset beschikbaar stellen
business as usual
• Preciese betekenis achterhalen van data-element
zweet en tranen (documentatie meestal ontoereikend)
• Meerdere datasets met “vergelijkbare” gegevens
serious business €€ (inzet materiedeskundigen)
Uitdaging: definieren van betekenis in context
- semantiek
- data governance
http://prezi.com/sfrwqcxat55c/workshop-semantic-web/
http://www.ordina.nl/nl-nl/diensten-en-
oplossingen/business-oplossingen/performance-
management-en-bi/data-governance/
62. 62
Waarom Open Data
Takeaway 1
A - Het is goed voor iedereen (+ reciprociteit)
B - Het verkoopt zichzelf - de app dan
C - Het helpt andere producten te verkopen
D - Het levert kostenbesparingen
63. 63
Waarom Open Data
Takeaway 2
A - Het is goed voor iedereen (+ reciprociteit)
B - Het verkoopt zichzelf - de app dan
C - Het helpt andere producten te verkopen
D - Het levert kostenbesparingen
* ... en nog méér als we het kunnen LINKEN
}*
64. 64
Waarom Open Data
Takeaway 3
Let bij publicatie op omgevingsfactoren
• Ride the appification wave
• Gebruik het streven naar transparantie en bezuinigingen
• Let op regelgeving en best practice stappenplannen
• Stap op tijd in Linked Data technologieën (lagere beheerkosten)
• Houd rekening met veranderdrempels bij
- data eigenaren (“van mij”)
- data centers (RDB - RDF paradigma shift)
- app bouwers (eigen stijl)
• Scan op eenduidigheids- en governanceissues