Tross all publisiteten har få utviklere erfaring med bruk og publisering av åpne data. Foredraget gir deg praktisk innføring i teori og praksis du trenger for å bruke åpne data på egenhånd.
Dette foredraget ble holdt først på Software konferansen den 13.februar 2013.
8. Retten til data
Hva er egentlig åpne data?
• Data som er utenfor opphavsrett
• Data dekket av offentlighetsloven
• Data som er åpent lisensiert
8 13. februar 2013 Some rights reserved by nickwheeleroz
9. Open Knowledge Definition
http://www.opendefinition.org/
Open data/content/information must:
1. Be Available and Accessible at Reproduction Cost “As a Whole”
2. Permit Free Redistribution
3. Permit Reuse Under Same Terms
4. Be Absent of Technological Restrictions
5. Be Attributed as Required
6. Keep Source Integrity
7. Not Discriminate Access From Persons or Groups
8. Not Discriminate Against Fields of Endeavor
9. Be Distributed with only the Original License
10. Must Not Be Licensed Specific to a Package
11. Must Not by License Restrict the Distribution of Other Works
9 13. februar 2013 Graphic by ronin691 @ Flickr, CC BY-SA
10. Tre hovedtyper åpne lisenser
o Public Domain – sets no requirements on your usages.
o Attribution (“By”) – you must give credit to the originator.
o ShareAlike (“SA”) – if published, the adapted data must be
made available in the same way and under the same license.
10 13. februar 2013 Some rights reserved by tinou bao
11. Åpne lisenser etter OKD-kriteriene
Public Domain – Kun etter utløpt opphavsrett
Lisenser for åpent innhold
Creative Commons Attribution, Share-Alike, CCZero (Link)
GNU Free Documentation License (Link)
Open Government License for PSI (Link)
Norsk Lisens for Offentlige Data (Link)
Lisenser for åpne databaser
Public Domain Dedication and License (Link)
Creative Commons CCZero (Link)
Open Data Commons Attribution License (Link)
Open Database License ODbL (Link)
11
Photo by suttonhoo @ Flickr, CCa goldmine
Open Data - BY-NC-SA
12. Åpne formater
Åpent format:
o Format basert på en underliggende åpen standard
o Standarden må være fullt dokumentert og offentlig tilgjengelig
o Standarden må ikke tillate proprietære utvidelser
o Det skal være kostnadsfritt å lese og bruke standarden
o Utvikling av standarden skal skje i en offentlig tilgjengelig
arbeidsprosess gjennom en uavhengig organisasjon
Fritt format:
o Et åpent format fritt for restriksjoner knyttet til
opphavsrett, lisenser, patenter, varemerker eller annen juss.
12 13. februar 2013 Kilde: http://en.wikipedia.org/wiki/Open_format
13. Kilder til åpne data
Datakataloger
Data.norge.no – http://data.norge.no/
Data.gov – http://www.data.gov/
CKAN – Comprehensive Knowledge Archive Network
http://www.ckan.net http://no.ckan.net/
Dataaggregatorer
Infochimps - http://www.infochimps.com/
Data Market - http://datamarket.com/
Google Public Data Explorer -
http://www.google.com/publicdata/directory
Programmable Web - http://www.programmableweb.com/
The Linked Open Data Cloud
13 13. februar 2013
14. Hvilke data finnes
- et utvalg fra data.norge.no
o Helsedata Museumsfotografier
Behandlingsdata
o Natur & Miljø
(Ventedøgn, epikriseutsending, etc
Naturvernområder
)
Rødlistebasen for artsmangfold
Kvalitetsdata
(Infeksjoner, tilbakemelding Artskart og artsnavnebasen
fastlege, etc)
Radioaktivitetsmåling
o Trafikkdata
o Andre data
Kollektivtrafikkdata
Frie læringsressurser ved
Flydata fra Avinor videregående opplæring
Ruteplantjeneste for bil, Reisetider Stortingets Datatjeneste
Bomstasjoner i Norge BIBSYS Bibliotekdatabase
Trafikkmeldinger fra Vegvesenet Kraftpriser fra Konkurransetilsynet
o Kulturdata Værdata fra Meterologisk institutt
Norvegiana Kartdata fra Statens kartverk og
(kulturarvsinformasjon) OpenStreetMap
Digitale fortellinger Idrettsanleggregisteret
14 13. februar 2013
15. Bruke åpne data i applikasjon
Finn eksisterende åpne datasett eller
prøv å få frigitt data med offentlighetsloven.
Gjør deg kjent med dataformatet og innholdet
Flate filer er vanlig, f.eks. CSV eller XML
Sjekk datakvaliteten, og formatstrukturen!
Håndtering av oppdateringer
Webservicer har fordeler og ulemper
Vurder behovet for flere datasett
Felles nøkkel finnes ikke alltid
Håndtering av datakonflikter kan være vanskelig
15 13. februar 2013
16. The 5-star model for open data Lenket RDF
by Tim Berners-Lee
Having an open license is a Adresserbar
prerequisite for open data!
Åpent format
Strukturert
Publisert
16 13. februar 2013
17. Linked Open Data Principles
“The Semantic Web isn't just about putting data on the web.
It is about making links, so that a person or machine
can explore the web of data.”
1. Use URIs as names for things
2. Use HTTP URIs so that people can look up those names.
3. When someone looks up a URI, provide useful information,
using the standards (RDF, SPARQL)
4. Include links to other URIs. so that they can discover more things.
17 13. februar 2013
18. Resource Description Framework
“RDF is a standard model for data interchange on the Web
as well as a general method to decompose any
type of knowledge into small pieces.”
o RDF is a data format, not meant to be displayed for human use!
o Always consists of triples: Subject, Predicate, Object
o Can be written in multiple formats: XML, N3/Turtle
o The meaning of RDF terms can be defined as an ontology
using RDF Schema or the Web Ontology Language (OWL)
o For storage use an RDF database, also known as a Triple-store
o Triple-stores kan be queried using SPARQL
18 13. februar 2013
19. SPARQL Protocol and RDF Query Language
“SPARQL is the query language of the Semantic Web to be used
for querying graph patterns across diverse data sources.”
Connecting to a SPARQL endpoint lets you:
o Pull values from structured and semi-structured data
o Explore data by querying unknown relationships
o Perform complex joins of disparate databases in a single, simple
query
o Transform RDF data from one vocabulary to another
This is essentially SQL for RDF Triple-stores, but more powerful!
19 13. februar 2013
21. Over til publisering av egne data
21 13. februar 2013 Some rights reserved by The California National Guard
22. Åpning av egne data
Noen retningslinjer for å gjøre suksess:
o Hold det enkelt
Start der du kan, ikke forsøk å gjøre alt på en gang.
Selv et enkelt eller bare deler av et større datasett kan gi verdi!
o Engasjer deg i bruk og gjenbruk
De fleste vil se dine data gjennom tredjepartstjenester.
Snakk med utviklerne av disse om hva du kan gjøre bedre!
o Ta tak i spørsmål og misforståelser
Spesielt viktig i store organisasjoner hvor det kan være mye
intern bekymring for risikoen med dette nye.
o Finn en lisens som passer organisasjonen
Norsk Lisens for Offentlige data er ofte egnet.
22 13. februar 2013
23. Tilgjengeliggjøring
Hvordan publisere egne data
o Legg ut filer eller tjenester på egne nettsider
o Benytt en eksisterende åpen datakatalog
CKAN – http://no.ckan.net
o Sett opp din egen datakatalog (om du har mye data)
o Benytt et offentlig datahotell
Datahotellet - http://data.norge.no/datahotellet
Computas Linked Data Server - http://data.computas.com/
23 13. februar 2013
24. Promotering i datakataloger
“Potensielle brukere må få vite at datasettet ditt eksisterer, samt
hva det er for noe og hvordan de kan ta det i bruk.”
Nøkkelinformasjon du bør tilby:
Hvilke data er publisert?
Hvilken lisens gjelder?
Når og hvordan ble/blir dataene samlet inn?
Hvor ofte blir dataene oppdatert, om i det hele tatt?
Hva ble/blir dataene brukt til?
Hvem er kontaktperson?
Hvordan ønskes tilbakemeldinger?
24 13. februar 2013
25. PDDL Community Norms
Give credit where credit is due
Avoid technical protection measures
Use open formats
Let others know!
Inspire users to share their work too!
25 13. februar 2013 Some rights reserved by stringer_bel
26. Veien mot åpne data er altså tung…
… men det er hjelp å få!
26 13. februar 2013 Some rights reserved by DarrenHunter
30. Flere miljøer som kan være til hjelp
DnD – Faggruppe for Semantisk Web
IKT Norge – Forum for Offentlige Data
NUUG - Norwegian Unix Users Group
Computas Linked Data Lab
Friprogsenteret
CKAN Norway
Origo
30 13. februar 2013 Some rights reserved by Community Eye Health
31. Hva kan og bør du gjøre?
Ta i bruk eksisterende datasett på en verdiøkende måte
– Gode eksempler kan bli grunnlag for frigivning av mer data!
Bidra til kvalitetssikring av datasett du kjenner til
– Høyere datakvalitet kan gi flere bruksområder
Ta initiativ til å få frigitt interessante datasett fra din
arbeidsgiver eller offentlig virksomhet du kjenner til
Publiser eventuelle datasett du selv har eierskap til
– Du vet aldri hvilke innovasjoner andre kan skape med dine data!
Tenk på datatilgjengelighet i løsninger du utarbeider!
31 13. februar 2013
32. Veien til åpen kunnskap
starter her!
Spørsmål?
32 13. februar 2013 Photo by danesparza, CC BY-ND
Notes de l'éditeur
Transparency and democratic controlParticipationSelf-empowermentImproved or new private products and servicesInnovationImproved efficiency of government servicesImproved effectiveness of government servicesImpact measurement of policiesNew knowledge from combined data sources and patterns in large data volumes
Løsningen: Even Westvang brukte offentlighetsloven til å få datagrunnlaget og laget sitt eget kart.Data ble overlevert uten ordentlige nøkler på skoler og prøver, for det ville bli for arbeidskrevende for utdanningsdirektoratet.
Løsningen: Even Westvang brukte offentlighetsloven til å få datagrunnlaget og laget sitt eget kart.Data ble overlevert uten ordentlige nøkler på skoler og prøver, for det ville bli for arbeidskrevende for utdanningsdirektoratet.
I tillegg kommer personlige data om deg selv som du har krav på både fra offentlige og private virksomheter.Opphavsretten varer i opphavsmannens levetid og 70 år efter utløpet av hans dødsår.
Large circlesrepresent databaseswith more than 1 billion triples!Mid-sizedcirclesrepresent 10 million to 1 billion triples.Small circlesrepresent 500k to 10 million triples.
Heldigvis har vi aktivt og engasjert miljø rundt åpne data i Norge som kan bistå med mange forskjellige ting!