1. Public Sector Information / Open Data
opportunità e sfide
i Venerdì dell’AGCOM
Federico Morando
(federico.morando@gmail.com)
NEXA Center for Internet & Society, Politecnico di Torino
(http://nexa.polito.it)
Roma, 23 Settembre 2011
Questa presentazione è rilasciata con licenza Creative Commons Attribuzione Italia 3.0 (http://creativecommons.org/licenses/by/3.0/it/)
2. Agenda
● PSI / open data: di cosa stiamo parlando?
● potenziale economico
● il tempo è denaro
● trasparenza & efficienza
● principi e linee guida
● diritto (normativa, licenze, tutela dei dati personali);
● economia (costo marginale, costi di transazione);
● tecnologia (raw data, accenno ai linked data).
● in pratica
● le principali esperienze internazionali e nazionali.
● i protagonisti del processo di apertura in Italia
● conclusioni
● punti fermi (“Raw data now!”)
● sfide per il futuro
4. Mashups
● Mapumental: trovare casa (v. 3.0)
● prezzi case
– Land Registry for England and Wales
● tempi di viaggio
– National Public Transport Data Repository
● Mappe
www.mysociety.org – OpenStreetMap (UGC + PSI)
● "amenità"
– mySociety > game ScenicOrNot (UGC)
10. valore economico diretto
mercati già affermati
● dati catastali
● dati camerali
● dati meteorologici
● dati geografici
● dati normativi e giurisprudenziali
14. PA: tanti punti di forza...
● le PA detengono dati di grande utilità
● uniche fonti di alcuni;
● qualità superiore
– affidabilità
– imparzialità
– completezza
– raccolta nel lungo periodo
● es. orari di apertura di negozi, farmacie, uffici
pubblici, etc.
15. ...e qualche debolezza
● normalmente, le PA non sono i soggetti più
capaci di far arrivare questi dati ai cittadini (o
alle imprese) in modo efficace
● limiti normativi e regolamentari
● limiti di risorse (€, tempo)
✔ l'intelligenza è sempre là fuori
✔ vale per Google o Microsoft come per la PA
➔ creare occasioni di incontro!
16. es. orari & percorsi trasporti
● GoogleMaps, OpenStreetMap, mashups
● facile da trovare ed usare per chiunque
– es., turisti stranieri ↔ interfaccia tradotta
● applicazioni per iPhone, Android, etc.
● la PA non spende per N sviluppi
– (così evitando sospetti di favori mirati a Apple, Google...)
● incamera tasse sui profitti sviluppatori
18. fare di più spendendo meno:
possibile ? !
● dati online, come servizio
● site scraping → apps per iPhone & Android
● dati a disposizione di Google
● GoogleMaps
● stessi dati, grezzi, a disposizione di tutti
● miglioramento delle apps + varie applicazioni per
TorinoOpenDataContest
23. diamo i numeri
● studi internazinali sul valore potenziale PSI (diretto)
● Pira: $750 bln US vs. €68 bln EU
● MEPSIR: € 27 bln EU
● UK OFT: £ 600 mln UK
● valori (forse più realistici) rivisti da Dialogic
● ~ €5 bln EU
● ma con effetti indiretti, si ripropongono € 30 bln
✔ il bello è che non credere a stime faraoniche
➔ portali nazionali europei hanno costi ragionevoli
• voci di corridoio: (150.000, 300.000) € + vari costi indiretti per partire
➔ si possono fare anche progetti a costo ~0
34. Operazione trasparenza 2.0
● esempio (& suggerimento)
● pubblicare informazioni relative a contratti, fornitori, bandi, etc.
– meno problemi di privacy (rispetto ai CV dell'Operazione trasparenza)
● immaginate che tutti i produttori sappiano in tempo reale quali
PA comprano beni & servizi simili a quelli che offrono
● dalle matite alla manutenzione degli orologi...
● immaginate che tutti quelli che cercano un lavoro sappiano
esattamente quali bandi siano aperti
● magari con informazioni sui profili simili al loro
35. Operazione trasparenza 2.0
● non parliamo di un superservizio della PA!
● pubblichiamo i dati
● tabelle (CSV, XLS) o dati strutturati (XML, RDF)
● qualcuno vedrà l'opportunità di business
● es. VoglioIlRuolo
– graduatorie per i posti di ruolo nella scuola
38. principi
● partire da cose semplici
● es. no dati personali (salvo si abbiano consultenti legali super
esperti che danno l'OK tranquillamente e sicuramente)
● es. no dati attualmente usati come mezzo cruciale per finanziare
istituzioni (es. Camere di Commercio)
● raw data
● nella forma in cui li si usa
– XML, RDF... fantastico, ma può essere un passo successivo
– NO (solo) PDF
● licenze aperte → esplicitare la libertà di riuso
● libere anche per riuso commerciale
39. paure standard
● “vizi” tipici della PA “di buona volontà”,
in ordine decrescente di gravità:
● divieto di uso commerciale
● obbligo di registrazione
● obbligo di contribuzione (delle correzioni)
● obbligo di attribuzione (citazione della fonte)
40. il profitto non è male!
● pochi hanno da ridire su progetti come
OpenStreetMaps
● esempio di Haiti e mappe per i soccorritori
● non sempre così per i progetti “for profit”
● “arricchimento” con risorse pubbliche
● “perdita di risorse” per la PA, se non si “spremono”
prezzi significativi
41. tesi (in pillole)
non è il profitto di qualcuno a dover far paura,
ma il profitto di uno solo
la giusta cautela rispetto agli usi commerciali è
che tutti possano accedere alla pari alla PSI per
fare business
42. obbligo di registrazione: perché?
● perché gli utenti dovrebbero registrarsi per scaricare e riusare i dati?
● non per prevenire abusi dolosi
– tipicamente, chi volesse compierli non avrebbe difficoltà ad aggirare la registrazione (salvo sia così
complicata che il costo salirebbe troppo anche per gli onesti)
● non per avvisare di errori e correzioni
– chi riusa davvero i dati, torna spesso alla fonte per aggiornarli
● non per monitorare il riuso
– quando si registra, il riutilizzatore non sa ancora se e come riuserà e non vuole perder tempo
● meglio dare incentivi per segnalare ex post i casi di riuso
● es.: segnala la tua app; racconta la tua storia
● importante beneficio: dati accessibili nel “surface web”, non nel “deep web”
↔ motori di ricerca
43. obbligo di contribuzione delle
modifiche (e/o sharealike)
● se non c'è redistribuzione, obbligo astratto e di difficile
enforcement
● se c'è redistribuzione, il modello sperimentato è quello
dello “share alike”
● ma serve ad evitare il “free riding” su nuove creazioni e può
inibire non pochi usi commerciali
– val la pena per informazioni già create per altri scopi dalla PA?
● nell'etica del web, questo è un tipico caso da “inviti
informali”
● condivido liberamente e ti chiedo di aiutarmi, se ti costa poco e
puoi far sì che io ti dia un servizio migliore
44. attribuzione: il peccato veniale
● probabilmente, sarebbe meglio non pretenderla, ma
“raccomandarla” semplicemente
● in alcuni contesti tecnologici, ha un costo
(specie se si impongono certe modalità)
● dove il costo è basso, spesso ci sarebbe comunque
interesse a citare la fonte
– credibilità; completezza
● l'attribuzione può, però, avere un ritorno positivo sugli
incentivi di chi facilita il riuso
● carriera, visibilità ↔ sostenibilità politica, soddisfazione
● il bilancio è più incerto...
46. <normativa>
EU: Direttiva PSI – 2003/98/CE
IT: Decreto Legislativo 36/2006 (& L. 96/2010)
linee guida piemontesi
DGR 3111679 del giugno 2009
DGR 361109 del novembre 2010
(legge regionale già in bozza)
delibere comunali
</normativa>
51. struttura modulare
Attribuzione
Non Commerciale
Non Opere Derivate
Condividi allo stesso modo
52. Le Licenze Creative Commons
6 combinazioni possibili
Attribuzione Non commerciale Non opere derivate
Attribuzione Non commerciale Condividi allo stesso modo
Attribuzione Non commerciale
Attribuzione Non opere derivate
Attribuzione Condividi allo stesso modo
Attribuzione
53. Le Licenze Creative Commons
solo alcune OK per PSI
Attribuzione Non commerciale Non opere derivate
Attribuzione Non commerciale Condividi allo stesso modo
Attribuzione Non commerciale
Attribuzione Non opere derivate
Attribuzione Condividi allo stesso modo
Attribuzione
54. Pubblico Dominio
alcuni intangible sono nel PD “per legge”
● le opere del passato (es. Dante o Manzoni)
● le “idee”, che restano “libere come l'aria”
● le libere utilizzazioni (es. citazione)
● altre possono entrarvi “per scelta”
● Creative Commons Zero
e altre liberatorie/dediche al PD
55. liberi tutti: CC0
● rinunciare a tutti i diritti d’autore e connessi
(inclusi quelli sulle banche di dati) su un’opera
● in ogni caso, allentare il più possibile i legami
giuridici con quell’opera
● waiver of rigths: rinuncia ad ogni diritto
● in subordine, licenza gratuita ed irrevocabile
● in subordine, impegno a non esercitare i diritti
rimasti in capo al detentore
58. <tutela dei dati personali>
hic sunt leones
la privacy rappresenta un'area delicata
finalità vs. serendipità
può essere opportuno affrontare il tema dopo aver
ben avviato un progetto di apertura dei dati
anonimizzazione; aggregazione; consenso
</tutela dei dati personali>
62. le stelle di Berners Lee
★ dati sul Web, in qualsiasi formato
★★ dati strutturati (es. formato Excel)
★★★ formati nonproprietari/aperti (es. CSV)
★★★★ URLs (stabili) per creare puntatori
★★★★★ dati collegati ad altri dati per fornire un contesto
5★ + Open → Linked Open Data
63. <geek mode>
“No taxation without representation”
“No taxation without
Open Linked Data implementation”
</geek mode>
64.
65. (for the records)
● i Linked Open Data sono ancora un lusso, ma...
● NO ai (soli) PDF è un must
● PDF = ottimo per paper & slides
● solido come fosse scolpito nel marmo per la
pubblicazione
● (in)utile come fosse un pezzo di marmo per gli
sviluppatori!
● tabelle: CSV, ODS, eventualmente anche XLS
68. c'è chi è già partito
● www.dati.piemonte.it
● approccio “beta permanente”
● pubblicare subito
● continuare a piccoli passi
● cominciare dalle cose semplici
● dati non sensibili
● già in digitale (magari già online, come servizi!)
● pubblicati così come le si usa internamente
● costi ridotti
● massima apertura di default (CC0)
● la massima apertura è la regola...
● ...chi ha ragioni per fare diversamente, (le spieghi e) lo faccia
69. Piemonte – l'ecosistema
● ricerca multidisciplinare
● evpsi.org
– Università, Politecnico (Centro NEXA),
Fondazione Rosselli
● contatti internazionali
● Creative Commons
● Open Knowledge Foundation
● communiaproject.eu
● lapsiproject.eu
● supporto alla policy
● Centro NEXA, TopIX, CSP
● infrastruttura informativa (CSI)
70.
71. ● CC0 come soluzione di default,
con una precisazione:
+ …esplicito riferimento al possesso dei diritti
● licenza diretta ed automatica, tramite Delibera,
di tutti i dataset anonimi ed aggregati già online
tramite CC0
72. ● caso di studio sui costi di transazione
(situazione passata)
● 50.000 € = introiti annui da vendita geodati
● costo = 1 persona full time + riunioni, etc.
73. c'è chi può aiutare
● “Open Data Manual” (OKFN) http://opendatamanual.org/
● “Come si fa Open Data” http://www.datagov.it/
● centri di competenza
● Piemonte
– EVPSI e LAPSI (UniTO, Centro NEXA, Fondazione Rosselli)
– tavolo di lavoro regionale (Regione Piemonte, CSI, TopIX, NEXA, CSP)
● Toscana: Scuola Superiore Sant'Anna, ITTIG CNR
● Associazione Italiana per l’Open Government
● CISIS Centro di competenza Open Data
– Piemonte, EmiliaRomagna, Liguria, Lombardia, Sicilia, Toscana, Pro. Trento, Veneto...
● communities
● SpaghettiOpenData.org
● IT.CKAN.NET
● LinkedOpenData.it
74. subito è meglio
● fermento nelle comunities & fame di dati
● attivisti
● sviluppatori
● ricercatori
● aprire i dati ORA
➔ massima visibilità
– Torino Open Data Contest (esempio passato)
– APPS4ITALY (opportunità attuale!)
➔ massimo supporto (gratuito)
78. l'esempio val più dei consigli
✔ abbiamo le licenze
● pubblico dominio / solo attribuzione
– standard internazionali: CC0 / CC BY
● Italian Open Data License v. 1.0
– riuso (anche) commerciale
– compatibilità con licenze “copyleft” standard
● CC BYSA, ODC ODbL
➔ ora è prioritario dare l'esempio sui dati