Gli Open Data: cosa sono, a cosa servono, dove si trovano. Una visione della realtà attuale sugli Open Data, nel mondo ed in Italia.
Per fruire al meglio della presentazione, che include video e note, vi consiglio di scaricarla.
On the Road to Benchmarking BPMN 2.0 Workflow Engines
Open Data
1. Open Data 1
UNIVERSITA’ DEGLI STUDI DI MILANO BICOCCA
VINCENZO FERME
Trasparenza | Governo | Informazioni locali | Partecipazione
2. Open Data 2
OPEN DATA: COSA SONO - IN BREVE
Gli Open Data sono dati che possono essere utilizzati
gratuitamente, riutilizzati e ridistribuiti da tutti. L’unico
vincolo che possono avere nell’utilizzo, è al più quello di
indicare la fonte e condividerli utilizzando la stessa licenza da
questa adottata.
Fonte: http://www.opendefinition.org/
Trasparenza | Governo | Informazioni locali | Partecipazione
3. Open Data 3
OPEN DATA: COSA SONO - IL CASO CSI PIEMONTE
Fonte: http://www.youtube.com/watch?v=xU8dsLgpF84
Trasparenza | Governo | Informazioni locali | Partecipazione
4. Open Data 4
OPEN DATA: COSA SONO - IN DETTAGLIO
COMPLETI
Tutti i dati appartenenti ad un particolare set di dati
accessibile al pubblico devono essere pubblicati, compresi i
dati di archiviazione non digitali e i dati utilizzati per generare
dati aggregati o derivati.
I dati aggregati o derivati devono essere distribuiti assieme ai dati
di origine utilizzati e le spiegazioni dei metodi utilizzati
per aggregarli o derivarli.
Fonte: http://transparency.ge/sites/default/files/tig-open-data-guidelines-en_0.html
Trasparenza | Governo | Informazioni locali | Partecipazione
5. Open Data 5
OPEN DATA: COSA SONO - IN DETTAGLIO
ELEMENTARI
I dati devono essere raccolti alla fonte, e devono essere
pubblicati con il livello di dettaglio con cui sono stati raccolti.
I dati non possono essere sempre in una forma utilizzabile quando
sono raccolti (ad esempio i dati dei sensori). In questi casi,
l'elaborazione post-raccolta può essere eseguita. Questo
trattamento, tuttavia, dovrebbe portare i dati in un formato che
rifletta le capacità e la granularità del meccanismo di raccolta
originario.
Fonte: http://transparency.ge/sites/default/files/tig-open-data-guidelines-en_0.html
Trasparenza | Governo | Informazioni locali | Partecipazione
6. Open Data 6
OPEN DATA: COSA SONO - IN DETTAGLIO
TEMPESTIVI
I dati devono essere resi disponibili il più rapidamente
possibile al fine di massimizzare il valore per il pubblico.
L’individuazione degli aggiornamenti all'interno del più ampio
insieme di dati deve essere semplice, attraverso meccanismi come i
feed RSS, funzioni di ricerca in grado di filtrare in base alla data e
archivi che contengono istantanee della serie di dati realizzate ad
intervalli regolari.
Fonte: http://transparency.ge/sites/default/files/tig-open-data-guidelines-en_0.html
Trasparenza | Governo | Informazioni locali | Partecipazione
7. Open Data 7
OPEN DATA: COSA SONO - IN DETTAGLIO
ACCESSIBILI
I dati devono essere resi disponibili al maggior numero di
utenti possibile, per la più vasta gamma di scopi possibili.
I dati devono essere facili da condividere digitalmente. Ad ogni
pagina e documento pubblicato deve essere assegnato un URI
univoco e facilmente reperibile (URL).
L’accesso ai dati non deve mai richiedere la registrazione o il
pagamento.
Fonte: http://transparency.ge/sites/default/files/tig-open-data-guidelines-en_0.html
Trasparenza | Governo | Informazioni locali | Partecipazione
8. Open Data 8
OPEN DATA: COSA SONO - IN DETTAGLIO
UTILIZZABILI DA UNA MACCHINA
I dati devono essere memorizzati in un formato tale da
permetterne l'elaborazione automatizzata.
La leggibilità da parte della macchina non deve sostituire la
leggibilità umana; entrambi i formati devono essere presentati.
In tutti i casi, il significato di ciascun campo nei dati deve essere
ben documentato e questa documentazione va offerta assieme ai
dati stessi.
Fonte: http://transparency.ge/sites/default/files/tig-open-data-guidelines-en_0.html
Trasparenza | Governo | Informazioni locali | Partecipazione
9. Open Data 9
OPEN DATA: COSA SONO - IN DETTAGLIO
NON PROPRIETARI
I dati devono essere disponibili in un formato aperto sul quale
nessun ente ha il controllo esclusivo.
Un formato aperto non è soggetto a controlli di proprietà
intellettuale in nessun paese, e i documenti che definiscono la
struttura del formato stesso sono liberamente disponibili. HTML e
XML sono esempi di formati aperti.
Fonte: http://transparency.ge/sites/default/files/tig-open-data-guidelines-en_0.html
Trasparenza | Governo | Informazioni locali | Partecipazione
10. Open Data 10
OPEN DATA: COSA SONO - IN DETTAGLIO
UTILIZZABILI LIBERAMENTE
I dati non devono essere sottoposti a copyright per limitare i
potenziali utenti o usi.
I dati devono essere resi liberi per tutti i tipi di utilizzo, compreso
l'uso commerciale, senza alcuna restrizione.
Fonte: http://transparency.ge/sites/default/files/tig-open-data-guidelines-en_0.html
Trasparenza | Governo | Informazioni locali | Partecipazione
11. Open Data 11
OPEN DATA: COSA SONO - IN DETTAGLIO
SINDACABILI
Ogni ente pubblico o privato, rilasciando i dati deve designare
una persona atta a rispondere alle domande e reclami relativi
ai dati. Le informazioni di contatto di questa persona devono
essere incluse nei dati stessi.
Fonte: http://transparency.ge/sites/default/files/tig-open-data-guidelines-en_0.html
Trasparenza | Governo | Informazioni locali | Partecipazione
12. Open Data 12
OPEN DATA: COSA SONO - IN DETTAGLIO
INDIVIDUABILI
I dati devono essere facilmente individuabili. Devono essere
raccolti in liste appropriate, che devono essere rese accessibili
ai motori di ricerca.
Fonte: http://transparency.ge/sites/default/files/tig-open-data-guidelines-en_0.html
Trasparenza | Governo | Informazioni locali | Partecipazione
13. Open Data 13
OPEN DATA: COSA SONO - IN DETTAGLIO
PERMANENTI
Con il passare del tempo, i dati devono essere archiviati in
modo che soddisfino i criteri precedenti.
Fonte: http://transparency.ge/sites/default/files/tig-open-data-guidelines-en_0.html
Trasparenza | Governo | Informazioni locali | Partecipazione
14. Open Data 14
OPEN DATA: A COSA SERVONO
Vi sono diversi scenari di utilizzo, caratterizzati da diverse
necessità stringenti in relazione ai punti discussi in
precedenza, eccone alcuni:
•Utilizzo per Analisi e Simulazioni:
• La qualità dei dati è molto importante
• I dati devono essere aggiornati (Tempestivi)
•Utilizzo per «Mashup» e aggregazione di più dati:
• I dati devono essere Accessibili
• I dati devono essere Interoperabili
•Dati utili ai cittadini:
• I dati devono essere Individuabili e Sindacabili
Trasparenza | Governo | Informazioni locali | Partecipazione
15. Open Data 15
OPEN DATA: INTEROPERABILI
L’interoperabilità dei dati è l’unico modo per abilitare, in
termini di tempi e costi ragionevoli, il riutilizzo delle
informazioni per ottenere qualcosa di inespresso dai semplici
insiemi di dati.
I dati devono essere distribuiti in modo da essere
interoperabili. In relazione ai principi indicati in precedenza,
bisogna quantomeno distribuirli in formati non proprietari.
Al fine di garantire al meglio l’interoperabilità vi è la
necessità di standard.
Trasparenza | Governo | Informazioni locali | Partecipazione
16. Open Data 16
OPEN DATA: COME SI PRESENTANO
Ad oggi, gli Open Data sono resi disponibili sotto diverse
forme:
•Non vi è uno standard ben definito
•L’interoperabilità è ridotta, anche per via di questa
eterogeneità di forma
Questa eterogeneità è intrinseca degli Open Data, in seguito
vedremo uno schema di Tim Berners-Lee che renderà ancora
più evidente la situazione attuale.
Fonte: http://www.w3.org/DesignIssues/LinkedData.html
Trasparenza | Governo | Informazioni locali | Partecipazione
17. Open Data 17
OPEN DATA: DOVE SI TROVANO
Uno dei principi è che i dati devono essere Individuabili
Vi sono diversi portali di riferimento:
ITALIANI ESTERI
America:
PA: http://www.dati.gov.it
http://www.data.gov
Camera: http://dati.camera.it
Europa:
Piemonte: http://www.dati.piemonte.it/
http://publicdata.eu/
Lombardia: https://dati.lombardia.it/
Regno Unito:
CKAN: http://it.ckan.net/
http://data.gov.uk
http://thedatahub.org/
Trasparenza | Governo | Informazioni locali | Partecipazione
18. Open Data 18
OPEN DATA: ESEMPIO – DATI.GOV.IT
Vediamo quali dati offre http://www.dati.gov.it:
Trasparenza | Governo | Informazioni locali | Partecipazione
19. Open Data 19
OPEN DATA: ESEMPIO – DATI.GOV.IT
Un dato disponibile è relativo ai cinema del comune di Torino, dei
quali si dice:
SU DATI.GOV.IT SUL SITO DELLA FONTE
Data ultimo aggiornamento: Ultimo aggiornamento:
Venerdì, 16 Marzo, 2012 29-03-2012
Periodo validità:
Domenica, 1 Gennaio, 2012 to
Lunedì, 31 Dicembre, 2012
Problemi:
•Informazioni incoerenti e in nessun modo codificate assieme ai dati.
•Non sono Tempestivi (E' indicato un periodo di validità non meglio definito)
•Non si capisce se sono completi
Trasparenza | Governo | Informazioni locali | Partecipazione
20. Open Data 20
OPEN DATA: ESEMPIO – DATI.GOV.IT
Estratto dei dati (file csv):
wkt_geom ID_CINEMA DENOMINAZ INDIRIZZO URL
POINT(1396215.405000
21 ERBA CORSO MONCALIERI 241 http://www.torinospettacoli.it
4988074.438000)
POINT(1394727.790000
22 ESEDRA VIA PIETRO BAGETTI 30/A http://www.esedratorino.it/
4992130.260000)
POINT(1395409.708000 CORSO GIAMBATTISTA
27 IDEAL CITYPLEX http://www.idealcityplex.it/
4992432.409000) BECCARIA 4/A
POINT(1396856.306000
28 KING KONG MICROPLEX VIA PO 21 http://www.kingkongmicro.it
4991453.338000)
POINT(1395083.312000
29 PATHE' LINGOTTO VIA NIZZA 230 http://www.pathe.it
4987616.431000)
Problemi:
•Cosa rappresentano i dati delle colonne wkt_geom, ID_CINEMA?
•Non sono facilmente utilizzabili da una macchina, perché non è definita
in alcun modo la semantica dei dati
Trasparenza | Governo | Informazioni locali | Partecipazione
21. Open Data 21
OPEN DATA: ESEMPIO – DATI.LOMBARDIA.IT
Supponiamo di voler avere informazioni sui musei della regione Lombardia, il sito
dati.lombardia.it ci fornisce un file da cui ho estratto alcune informazioni:
SEDE_ORARI_APERTU
SEDE_CODICE SEDE_ACCESSIBILE_AI_DISABILI SEDE_DESCR_ORARIO_APERTURA
RA_NOTA
Venerdì 9.30-12.00 15.00-18.30
Sabato 15.00-19.00
2211 PARZIALMENTE Apertura solo il sabato
Su richiesta per gruppi o scolaresche, il Museo
viene aperto anche in giorni e orari diversi
La sezione è aperta al pubblico tre volte la
A partire dal 6/11/2010 i
settimana:
musei del sistema
2266 TOTALMENTE Lunedì pomeriggio, ore 14,00-17,00.
saranno aperti a turno il
mercoledì mattina ore 9 - 12,00
sabato dalle 9 alle 12.
Venerdì mattina, ore 9,00-12,00.
orari: martedì-domenica 9.00-17.30; (ultimo Il museo è chiuso il lunedì
ingresso 17.00) per il pubblico generico
2771 TOTALMENTE
Chiusura: lunedì, 1 gennaio, 1 maggio, 25 ma aperto per visite
dicembre guidate a pagamento
Voglio creare un’applicazione che indica gli orari di apertura -> IMPOSSIBILE
Voglio sapere se un disabile potrà fare una determinata attività -> IMPOSSIBILE
Trasparenza | Governo | Informazioni locali | Partecipazione
22. Open Data 22
OPEN DATA: ESEMPIO – DATI.LOMBARDIA.IT
Problemi:
Una persona non può accedere facilmente alle informazioni: Il file
ha in totale 56 colonne
Il significato di molte colonne è oscuro
I dati non sono coerenti neppure nel contesto dello stesso file
I dati non sono elaborabili automaticamente (ad esempio gli orari)
Trasparenza | Governo | Informazioni locali | Partecipazione
23. Open Data 23
OPEN DATA: DOVE SI TROVANO
La situazione non è migliore per www.dati.piemonte.it, e neppure
per i portali esteri. Ovviamente alcuni dati sono completi ed
utilizzabili al meglio, ma questa dovrebbe essere la regola, non
l’eccezione.
Dati.camera.it è invece una realtà
in cui è stata posta maggiore cura
ai vari aspetti legati agli Open
Data, infatti forniscono una
semantica alle informazioni che
pubblicano, codificata nei dati.
Trasparenza | Governo | Informazioni locali | Partecipazione
24. Open Data 24
OPEN DATA: DOVE SI TROVANO
Voi vi fidereste di dati così per realizzare applicazioni,
ricerche o semplicemente per poter approfondire le vostre
conoscenze riguardo quanto accade nella vostra città?
IO, E MOLTI ALTRI, NO
Eppure le Pubbliche Amministrazioni investono dei soldi, in
particolare i nostri.
Trasparenza | Governo | Informazioni locali | Partecipazione
25. Open Data 25
OPEN DATA: ESEMPIO – AMBITI DI UTILIZZO
Salute
•Rilasciare dati relativi agli ospedali sul sito
http://opendatauganda.com/ ha permesso di ridurre il tasso di
mortalità (Jakob Svensson, The Economist).
Cultura
•Ad Esempio: BOOKZEE – Permette di individuare la biblioteca
più vicina che ha il libro cercato.
Ambiente
•Ad Esempio: CYCLE HIRE – Permette di trovare la stazione per
le bici più vicina alla propria posizione, dove siano disponibili
biciclette
Sicurezza
Scienza
Trasparenza | Governo | Informazioni locali | Partecipazione
26. Open Data 26
OPEN DATA: ESEMPIO – AMBITI DI UTILIZZO
Geografici
Governo
Fonte: http://www.youtube.com/watch?v=BkdRQipqodE
Trasparenza | Governo | Informazioni locali | Partecipazione
27. Open Data 27
LINKED OPEN DATA: COSA SONO
I Linked Open Data sono degli Open Data connessi tra loro
Ogni insieme di dati ha, di norma, qualche relazione con altri
insiemi di dati. Quando vi sono queste relazioni, i Linked
Open Data permettono di esprimerle nei dati stessi
I Linked Open Data sono ricchi di semantica e tramite
«vocabolari» condivisi si associa ad ogni dato il suo
significato, leggibile dall’umano e dalla macchina
I Linked Open Data sono uno «standard» che permette di
ottenere dati fruibili sia dall’uomo, che da una macchina (in
modo automatico)
Trasparenza | Governo | Informazioni locali | Partecipazione
28. Open Data 28
LINKED OPEN DATA: COSA SONO
Fonte: http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenData
Trasparenza | Governo | Informazioni locali | Partecipazione
29. Open Data 29
LINKED OPEN DATA: COSA SONO
Una descrizione più dettagliata: http://www.youtube.com/watch?v=GKfJ5onP5SQ
Trasparenza | Governo | Informazioni locali | Partecipazione
30. Open Data 30
LINKED OPEN DATA: TIM BERNERS-LEE
Tim Berners-Lee nel 2010 ha suggerito uno schema di
distribuzione per i Linked Open Data:
Rendi i tuoi dati disponibili sul web (in qualunque formato) sotto
★
una licenza aperta – Open Data
Rendi i dati disponibili in formato strutturato (e.g., Excel invece
★★
di una scansione di una tabella)
★★★ Utilizza formati non proprietari (e.g., CSV invece di Excel)
Utilizza standard aperti (e.g. RDF) per identificare le risorse, in
★★★★
modo che le persone possano inserire collegamenti ai dati
★★★★★ Collega i tuoi dati ad altri, al fine di creare un contesto.
Fonte: http://www.w3.org/DesignIssues/LinkedData.html
Approfondimento ed Esempi: http://lab.linkeddata.deri.ie/2010/star-scheme-by-example/
Trasparenza | Governo | Informazioni locali | Partecipazione
31. Open Data 31
LINKED OPEN DATA: VS MASHUP
Che differenza c’è nell’utilizzare i Linked Open Data nella
mia applicazione o sito web, rispetto a realizzare un Mashup
classico?
I Mashup classici lavorano su un numero predeterminato di
sorgenti che devono esporre servizi specifici, i dati forniti
dalle singole sorgenti spesso non sono correlati tra loro. I
Linked Open Data (a 5 stelle con metadati) lavorano a partire
da una sorgente che è collegata a molte altre e, per
definizione, forniscono dati correlati tra loro.
Esempio BBC Music: http://www.bbc.co.uk/music
Trasparenza | Governo | Informazioni locali | Partecipazione
32. Open Data 32
LINKED OPEN DATA: APPLICAZIONI ESISTENTI
Mapping America:
•Visualizza i dati del censo Americano, fornendo diverse
visualizzazioni utili per accedere alle informazioni raccolte.
•Offre ad esempio la visualizzazione basata su: costi delle
abitazioni, etnie.
Url: http://projects.nytimes.com/census/2010/explorer
Trasparenza | Governo | Informazioni locali | Partecipazione
33. Open Data 33
LINKED OPEN DATA: APPLICAZIONI ESISTENTI
Crime Reports:
•Visualizza i dati dei crimini su una mappa
•Offre diverse visualizzazioni e filtri sui dati da visualizzare
•C’è una versione per gli Stati Uniti e Canada, e una per il
Regno Unito
Url: https://www.crimereports.co.uk/
Trasparenza | Governo | Informazioni locali | Partecipazione
34. Open Data 34
LINKED OPEN DATA: APPLICAZIONI ESISTENTI
Bike Share Map:
•Visualizza i dati sulla diponibilità delle biciclette nelle
banchine, in tempo reale
•Fornisce dati storici sull’utilizzo e la disponibilità, con la
possibilità di visualizzarli nel tempo
•Offre la possibilità di visualizzare le informazioni per oltre
30 città, tra cui Milano
Url: http://bikes.oobrien.com/?city=milan
Trasparenza | Governo | Informazioni locali | Partecipazione
35. Open Data 35
LINKED OPEN DATA: APPLICAZIONI ESISTENTI
DBpedia Mobile:
•DBpedia è la versione Linked Open Data di wikipedia, e
contiene tutte le informazioni strutturate presenti su wikipedia
•DBpedia Mobile utilizza la posizione geografica per
riportare le informazioni strutturate su una mappa in base alla
posizione corrente.
Url: http://mes-semantics.com/DBpediaMobile/?location=London/
Trasparenza | Governo | Informazioni locali | Partecipazione
36. Open Data 36
Trasparenza | Governo | Informazioni locali | Partecipazione
37. Open Data 37
OPEN DATA - LINKED OPEN DATA: CONCLUSIONI
• Gli Open Data sono una valida risorsa, se opportunamente
gestita
• Attualmente i Governi non hanno intrapreso la strada della
qualità, ma della quantità:
• Abbiamo molti dati
• Molti dei dati disponibili sono inutilizzabili
• Bisogna cambiare rotta, puntare alla qualità e ai Linked
Open Data
Trasparenza | Governo | Informazioni locali | Partecipazione
38. Open Data 38
LINKED OPEN DATA - OPEN DATA: APPROFONDIMENTI
• Linked Data - The Story So Far
Estratto: In this article we present the concept and technical principles of
Linked Data, and situate these within the broader context of related
technological developments.
• Linked Data Applications
Estratto: This memo outlines the current state-of-the-art, highlights (research)
issues and tries to anticipate some of the future developments of linked data.
• Linked Data: Evolving the Web into a Global Data Space
Estratto: This book gives an overview of the principles of Linked Data as well
as the Web of Data that has emerged through the application of these
principles. The book discusses patterns for publishing Linked Data, describes
deployed Linked Data applications and examines their architecture.
Trasparenza | Governo | Informazioni locali | Partecipazione
39. Open Data 39
LINKED OPEN DATA: PROVATE A REALIZZARLI
Google Refine
È uno strumento molto potente per lavorare con dati grezzi,
renderli maggiormente comprensibili e collegarli ad altri
insiemi di dati, associando informazioni semantiche. Il
servizio lavora in particolare con Freebase, ma è estendibile
anche con altri Linked Open Data.
Multipiattaforma: Windows, Mac, Linux
Per provarlo e saperne di più: http://code.google.com/p/google-refine/
Trasparenza | Governo | Informazioni locali | Partecipazione
40. Open Data 40
UNIVERSITA’ DEGLI STUDI DI MILANO BICOCCA
FACOLTA’ DI SCIENZE MM. FF. NN.
CORSO DI LAUREA MAGISTRALE IN INFORMATICA
GRAZIE
VINCENZO FERME
Trasparenza | Governo | Informazioni locali | Partecipazione
Editor's Notes
Il titolo della slide riporta la tag cloud associata agli «Open Data». Riprenderemo nel seguito alcune di queste tag, in quanto caratteristiche strettamente legate al concetto di Open Data. Fonte immagine: http://tech.fanpage.it/i-dati-delle-pubbliche-amministrazioni-aperti-a-tutti-ecco-tutti-i-vantaggi-dell-open-data-made-in-italy/
Ci si potrebbe chiedere: Che differenza c’è dai dati già attualmente presenti sul web, sottoposti ad una licenza di tipo equivalente a quella degli Open Data? Per capire dobbiamo analizzare la definizione dettagliata. Prima, però, guardiamo un video che introduce alcuni di questi aspetti di dettaglio. Il video è relativo alla maggiore realtà italiana sugli Open Data, a cui il comune di Milano si sta rivolgendo per il suo progetto.
Nel video si fa riferimento, anche se in maniera molto marginale, alla necessità di standard per rendere i dati fruibili dalle macchine. Questo è un punto che affronteremo in seguito, quando parlerò dei Linked Open Data, perché a giudicare da quanto disponibile sul web, è poco preso in considerazione in questa fase.
Inizio: Vediamo ora in dettaglio cosa sono gli Open Data, o meglio i principi che li descrivono completamente. Nel video precedente non se ne parla
Nel video precedente non se ne parla
Nel video precedente non se ne parla
A questo scopo si utilizzano, di norma, licenze Creative Commons.
Nel video precedente non se ne parla
Nel video precedente non se ne parla
Punto 1: la qualità del dato è legata, in particolar modo, al principio di completezza dei dati espresso in precedenza. Punto 2: Approfondiremo il concetto di interoperabilità nella slide successiva Punto 3: Sindacabili perché il cittadino è di norma interessato a dati vicini alla propria vita, e talvolta necessita di chiarimenti in relazione alle informazioni disponibili.
Questa è una delle distinzione che vi sono rispetto ai «semplici» dati, per cui di norma non è richiesta questa caratteristica.
Vediamo ad oggi come si presentano gli Open Data, ovvero come questi sono resi disponibili e quanto aderiscono ai principi indicati in precedenza (poco purtroppo).
Fine : Vediamone alcuni esempi
E’ evidente l’eterogeneità di formati presente, molti di questi non aderiscono ai principi, neppure ai più basilari (ad esempio relativo a formati aperti ed elaborabili automaticamente: XLS, PDF, PGN)
Esaminiamo la situazione a noi più vicina.
Fine: Riprenderemo in seguito l’utilizzo e l’importanza della semantica associata ai dati.
Fine: In seguito vi parlerò dei Linked Open Data, una proposta che permette di pubblicare dei dati che rispettino tutti i principi che vi ho illustrato e che permette di rendere disponibili dati «di cui ci si può fidare» (se gestiti con cura).
Ma prima vediamo alcuni ambiti di utilizzo, con relativi esempi di applicazioni.
Governo: Ricollegandoci agli esempi tratti dai siti delle PA italiane, ora vi mostro un video che spiega il motivo per cui i governi devono e pubblicano i dati.
Attualmente vi sono già tantissimi Open Data che sono connessi tra loro Questa immagini riporta un sottoinsieme dei principali insiemi di dati e le connessioni esistenti (aggiornata a settembre 2011) Vediamo ora un video che presenta metaweb, ora freebase di Google, che illustra i principali vantaggi di utilizzare i Linked Open Data
Ho inserito anche un link ad un video dove i Linked Open Data sono descritti in termini più tecnici, per chi è interessato. Fonte video: http://www.youtube.com/watch?v=tBSdYi4EY3s
Qualche slide prima abbiamo accennato all’eterogenità di formati in cui gli Open Data sono resi disponibili, e citavo Tim Berners-Lee come partecipe di questo risultato. Vediamo cosa propone Tim Berners-Lee riguardo i Linked Open Data. Schema: Tim Berners-Lee aggiunge come nota allo schema che, dopo le richieste degli utenti, ritiene la necessità di aggiungere un nuovo requisito: la presenza di metadati codificati nei dati stessi. Questi metadati devono essere collegati ad un vocabolario condiviso, e servono per dare semantica alle informazioni. Come vedete i dati a 3 stelle, non sono molto diversi da quelli che vi ho presentato negli esempi precedenti tratti dalle PA, per questo indico anche Tim Berners-Lee come partecipe del risultato, scarso, attualmente raggiunto...anche se sono le P.A. i maggiori responsabili. I dati a 4, e ancora di più a 5 stelle sono quelli più vicini a dati «di cui ci si può fidare», ma è fondamentale aggiungervi i metadati (condivisi) per renderli processabili al meglio da parte delle macchine, e maggiormente informativi. Approfondimento ed Esempi: A partire da un esempio comune, fa vedere come si presentano i dati per ogni stella e ne indica i costi e i benefici sia per creatore dei dati che per gli utenti degli stessi.
Una domanda che mi sono posto da sviluppatore Dettagli: Per realizzare un Mashup classico dobbiamo scegliere i singoli servizi da utilizzare e i dati sono limitati a quelli gestiti dal servizio e decisi dal fornitore del servizio. Questi dati sono spesso eterogenei tra i servizi e non correlati gli uni agli altri, infatti chi realizza un mashup deve provvedere a correlare le informazioni. Utilizzando i Linked Open Data dobbiamo scegliere la sorgente informativa primaria, i dati a disposizione possono estere estesi anche da terze parti che decidono di connettere i loro dati alla sorgente da noi scelta. Esempio: BBC Music ottiene i dati relativi agli artisti collegati al singolo artista tramite i Linked Open Data di Musicbrainz . Il testo introduttivo relativo ad ogni artista è estratto da Linked Open Data ottenuti a partire dai dati di Wikipedia.
Per provare digitare: winchester Hampshire, uk
Ogni informazione è arricchita utilizzando i dati di DBpedia. È evidente come non tutte le applicazioni siano utili allo stesso modo, alcune sono frutto di sperimentazioni.
Riporto alcuni approfondimenti utili per arricchire la conoscenza sui Linked Open Data.