Rapport donneespubliques2011 ecole des ponts paristech

4 539 vues

Publié le

Les données publiques au service de l’innovation et de la transparence : pour une politique ambitieuse de réutilisation des données publiques

Ce rapport met en perspective la problématique et les enjeux de l’Open Data, propose un état des lieux de la réutilisation des données publiques en France, et dessine trois scénarios prospectifs pour l’évolution future de ce mouvement. Enfin, il présente seize propositions pour une politique nationale ambitieuse d’ouverture et de réutilisation des données publiques.
Source : media.wegf.org
Ecole des Ponts ParisTech, juillet 2011

0 commentaire
2 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
4 539
Sur SlideShare
0
Issues des intégrations
0
Intégrations
1
Actions
Partages
0
Téléchargements
181
Commentaires
0
J’aime
2
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Rapport donneespubliques2011 ecole des ponts paristech

  1. 1. Romain Lacombe Ecole des Ponts ParisTechPierre-Henri Bertin François Vauglin Rapport remis le 13 juillet 2011 au Ministre de l’Industrie, Alice Vieillefosse de l’Énergie et de l’Économie numérique Pour  une  politique   ambitieuse  des données  publiques Juillet Les données publiques 2011 au service de l’innovation et de la transparence
  2. 2. École des Ponts ParisTech. 2011. Pour une politique ambitieuse des donnéespubliques : Les données publiques au service de l’innovation et de la transparence.Rapport à la Délégation aux usages de l’Internet, remis au Ministre de l’Industrie,de l’Energie et de l’Economie numérique le 13 juillet 2011.
  3. 3. ! ! ! ! "#$%&!&(!)$*+(!),-.(/&#0! ! 1,22$-+!3!%,!45%56,+.$*!,78!9(,6&(!&!%:;*+&-*&+!! ,*(!%&!#,-&!7!2$-+,.%!)-$8.<,!=$>.%&!! &!(&-?.#&(!,78!#.+$@&*(!(7-!+&-<.*,78!<$>.%&(! ! 1&<.(!,7!=.*.(+-&!&!%:;*7(+-.&A!&!%:"*&-6.&!! &+!&!%:"#$*$<.&!*7<5-.B7&!! %&!CD!E7.%%&+!FGCC! ! ! )$7-!7*&!2$%.+.B7&!,<>.+.&7(&!&(! $**5&(!27>%.B7&(! ! "#$!%&(#$!)*+,-.*#$!/*!$#01-2#! %#!,3-&1/4-&!#4!%#!,/!40/$)/0#2#! ! ! ! ! ! ! !!!!!!! H7.%%&+!FGCC!
  4. 4. École des Ponts ParisTech. 2011. Pour une politique ambitieuse des donnéespubliques : Les données publiques au service de l’innovation et de la transparence.Rapport à la Délégation aux usages de l’Internet, remis au Ministre de l’Industrie,de l’Energie et de l’Economie numérique le 13 juillet 2011. Vous pouvez contacter les auteurs de ce rapport sur http://rapport-opendata-2011.fr
  5. 5. 5!)0&)&$!%#!2#!0/))&04! L’ouverture et la réutilisation des données Deux personnalités académiques expertespubliques sont des enjeux majeurs de l’action de l’économie numérique et de ses nouveauxpublique à l’ère numérique. À la croisée des modes de gouvernance, MM. Pierre-Jeanusages innovants d’Internet et des modes de Benghozi et Laurent Gille, ont acceptégouvernance collaborative les plus récents, ils d’encadrer le travail de ce groupe.ouvrent le champ à des domaines nouveaux de M. Benghozi est Directeur de recherchel’action de l’État. CNRS, Directeur du Pôle de Recherche en Ce rapport présente une étude sur la Économie et Gestion et professeur d’économieréutilisation des données publiques, menée à l’École Polytechnique (titulaire de la Chairepour la Délégation aux usages de l’Internet du Orange Innovation et Régulation des ServicesMinistère de l’Enseignement supérieur et de la Numériques), et responsable du pôleRecherche dans le cadre du Master d’Action Innovation du Master Innovation et RégulationPublique de l’École des Ponts ParisTech. de l’Économie Numérique de Télécom ParisTech. M. Laurent Gille, enseignant- Il met en perspective la problématique et chercheur au Département de Sciencesles enjeux de l’Open Data, propose un état des économiques et sociales de Télécomlieux de la réutilisation des données publiques ParisTech, est responsable du parcoursen France, et dessine trois scénarios prospectifs Industries de Réseaux du Master Innovation etpour l’évolution future de ce mouvement. Elle Régulation de l’Économie Numérique.présente seize propositions pour une politiquenationale ambitieuse d’ouverture et de Les conclusions de l’étude ont été rédigéesréutilisation des données publiques. de novembre à janvier 2011, et présentées au public le 20 janvier 2011 au Ministère de la Quatre élèves de l’École des Ponts Recherche et de l’Enseignement supérieur.ParisTech, Pierre-Henri Bertin, RomainLacombe, François Vauglin et Alice Ce rapport a été finalisé par RomainVieillefosse ont mené cette analyse de Lacombe entre mars et début mai 2011. Il neseptembre 2010 à janvier 2011, en rencontrant fait qu’évoquer les développements les plusles acteurs clés de la réutilisation des données récents, et présente une synthèse despubliques, en prenant part à des colloques évolutions qui ont eu lieu au printemps 2011internationaux, et en s’appuyant sur la en France, notamment au niveau national.bibliographie existante.Les recommandations et propositions exprimées ne reflètent que les conclusions de l’analyse menéepar les membres du groupe d’étude, et n’engagent en aucune manière leurs institutions, employeurs oucorps respectifs. Toutes les erreurs ou omissions qui subsisteraient dans ce document ne sont le fait quede ses auteurs. 1
  6. 6. 6#7#02-#7#4$! Nous tenons, très modestement, à chercheur en sciences économiques et socialestémoigner toute notre gratitude envers à Télécom ParisTech. Leurs conseils pertinentsMonsieur le Ministre de l’Industrie, de et le temps qu’ils nous ont consacré, tout aul’Energie et de l’Economie numérique, pour long de notre étude, nous ont été très précieux.avoir bien voulu nous faire l’honneur de Nous souhaitons également remercierrecevoir ce rapport sur l’ouverture et la l’équipe du Mastère d’Action Publique deréutilisation des données publiques, ainsi qu’à l’École des Ponts ParisTech pour l’opportunitéremercier Séverin Naudet, Directeur de la qu’elle nous a accordée : le directeurmission Etalab auprès du Premier ministre, Dominique Schwartz, le directeur adjointpour avoir accepté d’en présenter la synthèse, Vincent Spenlehauer et la secrétaire Sylviele 13 juillet 2011, à l’occasion du lancement du Berte.concours européen « Open Data ProximaMobile ». Nos remerciements s’adressent enfin à l’ensemble des interlocuteurs qui nous ont Nous remercions M. Bernard Benhamou, reçus ou nous ont fait part de leurs réflexionsDélégué aux Usages de l’Internet, pour sa sur le sujet des données publiques, ainsi qu’àdisponibilité, la confiance qu’il nous a toutes celles qui ont répondu à nos nombreusestémoignée, et ses conseils avisés et constructifs questions.lors de la rédaction de ce rapport. Nous tenonsaussi à remercier pour leur aide l’ensemble des Merci de nous avoir donné la chance deéquipes de la Délégation. contribuer, modestement, à la réflexion sur un sujet fondamental pour le futur de l’économie Nous remercions également M. Pierre-Jean numérique et l’avenir de notre démocratie.Benghozi, Directeur de recherche au CNRS etprofesseur d’économie à l’ÉcolePolytechnique, et M. Laurent Gille, enseignant 3
  7. 7. 6($*7(!!Les évolutions technologiques récentes ont placé le sujet de la réutilisation des données au cœur del’action publique. L’administration collecte et produit un champ très vaste de données, depuis lesbudgets des institutions publiques jusqu’aux mesures de la qualité de l’air que nous respirons, enpassant par des statistiques précises sur notre économie, notre société et nos territoires. Ouvrir l’accèsle plus large aux informations publiques, c’est tout d’abord améliorer la transparence de l’État et de sesinstitutions, éclairer le débat démocratique, et rapprocher la puissance publique des citoyens. Favoriserl’ouverture et la réutilisation de ces données (« l’Open Data »), c’est permettre à la communauté desdéveloppeurs et des entrepreneurs d’inventer de nouveaux usages et de nouvelles applications utilesaux citoyens. C’est donc encourager l’innovation, donner naissance à la société de l’information, etcontribuer au développement des secteurs stratégiques d’avenir pour notre pays, de l’économienumérique au développement durable. L’État doit s’approprier pleinement cette opportunité majeure. Illui faut prendre le virage de cette nouvelle dimension des politiques publiques, pour la mettre auservice de l’ensemble des acteurs du pays.Mots-clés : Open Data, données publiques, information publique, accès aux documents administratifs, politique publique,gouvernance ouverte, transparence, démocratie, politique industrielle, politique des technologies, innovation, recherche,entreprenariat, compétitivité, croissance, emploi, économie numérique, Web sémantique, Internet.8+$40/24!Recent evolutions of technology have placed public data at the central focus of public policy.Government collects and produces a vast array of data, from the budgets of our institutions to thequality of the air we breathe, through precise statistics on our economy, our society or our territories.Opening public sector information means improving the transparency of our Government and itsinstitutions, enlightening the democratic debate, and strengthening the bond between the nation and itsrepresentatives. Encouraging reuse of this data (« Open Data ») allows the community of Webdevelopers and Internet entrepreneurs to invent new, useful applications for citizens. It is an importantpublic policy lever in favour of innovation, which can ignite the information society and contribute tothe development of strategic sectors of the economy, from sustainable development to the growth of thedigital economy. Government must fully embrace this major opportunity and this new dimension ofpublic policy, and put its power to work at the service of the nation’s every constituent.Keywords : Open Data, public data, public sector information, freedom of information, public policy, Open Government,transparency, democracy, industrial policy, technology policy, innovation, R&D, entrepreneurship, competitiveness, growth, jobscreation, digital economy, semantic Web, Internet. 5
  8. 8. 15(7<5!,*,%@+.B7&! Les évolutions technologiques récentes ont Une évolution du cadre législatif :placé le sujet de la réutilisation des données au l’Union Européenne a adopté deux directivescœur de l’action publique. en la matière, la directive « Informations du secteur public » (PSI) en 2003 et la directive L’administration collecte et produit un INSPIRE en 2008. Une consultation publiquechamp très vaste de données, depuis les récente sur la directive PSI a notamment portébudgets des institutions publiques jusqu’aux sur l’opportunité de réviser son champmesures de la qualité de l’air que nous dapplication, les redevances et licencesrespirons, en passant par des statistiques relatives aux données, ainsi que les formatsprécises sur notre économie, notre société et électroniques utilisés.nos territoires. L’émergence de la notion politique de Ouvrir l’accès le plus large aux « Gouvernement Ouvert » : les politiques deinformations publiques, c’est tout d’abord diffusion des données publiques ont fortementaméliorer la transparence de l’État et de ses évolué dans les pays anglo-saxons du fait deinstitutions, éclairer le débat démocratique, et l’émergence de la notion d’Open Government,rapprocher la puissance publique des citoyens. thème de campagne du Président Barack Favoriser l’ouverture et la réutilisation de Obama. Les États-Unis et la Grande Bretagneces données (« l’Open Data »), c’est permettre ont créé des portails de données publiquesà la communauté des développeurs et des réutilisables, data.gov et data.gov.uk. Enentrepreneurs d’inventer de nouveaux usages. France, la mission Etalab vient d’être créée,C’est donc encourager l’innovation, et sous l’autorité du Premier ministre Françoiscontribuer au développement des secteurs Fillon, pour coordonner les administrations enstratégiques d’avenir, de l’économie matière de données publiques et mettre ennumérique au développement durable. place la future plateforme data.gouv.fr. L’État doit s’approprier pleinement cette Des initiatives citoyennes en faveur deopportunité majeure. Il lui faut prendre le l’Open Data : une série d’initiatives récentes,virage de cette nouvelle dimension des issues de la société civile et des communautéspolitiques publiques, pour la mettre au service de développeurs, s’efforcent de promouvoir lesde l’ensemble des acteurs du pays. concepts de l’Open Data, avec le soutien d’associations et de fondations comme la9#!)0&+,(7/4-.*#!/*!20&-$#7#4!%#$! Sunlight Foundation aux États Unis, l’Open(1&,*4-&$!4#2:&,&;-.*#$<!)&,-4-.*#$!#4! Knowledge Foundation (OKFN) en Grande(2&&7-.*#$!0(2#4#$=! Bretagne, et la FING, LiberTIC et Regards L’ouverture et la réutilisation des données Citoyens en France.publiques constituent désormais une attente La double rupture du Web 2.0 et desévidente de la société civile. Cette technologies mobiles : les innovations deproblématique a émergé récemment au service rendues possibles par les technologiescroisement de plusieurs évolutions profondes. 2.0 (interfaces dynamiques, cartographie en Une prise de conscience de la valeur ligne, ouverture des API) ont amené à laéconomique de la réutilisation des données : généralisation du remix et du phénomène deschaque année dans lUnion Européenne, la mashups de données. La nouvelle générationréutilisation de données issues du secteur d’applications géolocalisées sur smartphonespublic générerait un chiffre daffaires de plus repose pour une part importante sur desde 27 milliards deuros. Pour Neelie Kroes, données géographiques. Ces rupturesvice-présidente de la Commission européenne technologiques ont révélé le besoin croissantchargée de la stratégie numérique, « une de pouvoir réutiliser des données publiques.grande partie de ces informations, en Europe, Toutes ces évolutions récentes confèrentsont sous-exploitées. Nous devons examiner une actualité nouvelle à la problématique de lalopportunité de modifier les règles de lUnion réutilisation des données publiques.en matière de réutilisation, pour libérerpleinement leur potentiel économique ». 7
  9. 9. 9#!&))&04*-4(!7/>#*0#!)&*0!,3?4/4!#4! 9#!7-$#!#!@*10#!2&7),#A#!.*-!)&*00/-4!B40#! ,3/%7--$40/4-&! $-7),-C-(#! L’ouverture des données publiques permet Le cadre juridique est établi pour la à des entrepreneurs, des chercheurs, des majorité des données publiques, mais les types développeurs d’accéder aux données collectées de licences et de contrats se multiplient. Le dans le cadre du fonctionnement des statut des données issues d’organismes administrations. parapublics reste à préciser. L’interopérabilité technique et juridique est cruciale : il convient En les réutilisant, ils inventent de nouveaux de clarifier les formats et les licences usages et peuvent créer de nouvelles acceptables dans une optique d’encouragement applications utiles aux citoyens. Cette à l’ouverture et à la réutilisation. coproduction de services au public peut constituer la base d’une nouvelle relation La gratuité pour la réutilisation des numérique de l’administration à l’usager, et données à titre commercial favorise d’un fonctionnement plus efficace de la l’innovation et les nouveaux usages. Nous puissance publique. préconisons donc de la généraliser le plus possible, et d’éviter à tout prix la L’ouverture des données publiques est de multiplication et le maintien de redevances plus un outil puissant d’amélioration de la excessives, qui pourrait conduire à des transparence de l’État. En donnant à tous les incohérences et freiner la réutilisation. citoyens qui le souhaitent accès aux détails du fonctionnement des institutions publiques, D#$!0-$.*#$!$*07&4/+,#$! cette ouverture nourrit et éclaire le débat démocratique. Elle peut contribuer à fonder les Esquissées dans la loi 1978 sur l’accès aux choix politiques sur des analyses éclairées et documents administratifs, consacrées par deux ancrées dans le réel. directives européennes, l’ouverture et la réutilisation des données publiques s’inscrivent Enfin, un accès plus large aux données dans une évolution durable de nos sociétés. publiques peut contribuer à renforcer la confiance des consommateurs, et donc la Elles induisent une transformation de la stabilité de notre économie. culture et du mode de fonctionnement des administrations. Des freins au changement 9!&*4-,!$40/4(;-.*#!)&*0!&40#!(2&&7-#! subsistent, et des risques peuvent émerger. Rien n’indique cependant qu’ils ne puissent Des conditions de réutilisation plus libres être surmontés, surtout si l’État s’engage dans encourageraient l’innovation et pourraient une collaboration rapprochée avec la contribuer au développement de l’économie communauté des réutilisateurs. numérique : les nouveaux services et applications mobiles, qui en bénéficieraient E0&-$!/A#$!$40/4(;-.*#$!)&*0!C/1&0-$#0!,/! particulièrement, connaissent actuellement une 0(*4-,-$/4-&!%#$!%&(#$!)*+,-.*#$! très forte croissance. L’économie numérique est un facteur clé de croissance économique et Nous proposons les trois axes stratégiques de création d’emplois en France. suivants pour favoriser la réutilisation des données publiques et permettre à la société L’accès aux données publiques offre de d’en retirer l’ensemble des bénéfices attendus. plus les prémisses d’une « infrastructure informationnelle », qui pourrait faciliter le Simplifier pour accélérer : réduire les développement durable en permettant aux efforts nécessaires d’une part à la diffusion des consommateurs de faire des choix mieux données par les acteurs publics, et d’autre part informés. à leur réutilisation, afin d’accélérer le développement de services utiles à partir des Enfin, la réutilisation des données données publiques. publiques constitue un élément de soutien aux objectifs stratégiques d’investissement Faciliter l’expérimentation : adapter les d’avenir pour l’économie française, de la conditions de réutilisation des données société numérique aux villes de demain, aux publiques pour faciliter l’expérimentation par transports intelligents, en passant par les citoyens, les associations et la communauté l’encouragement à la recherche scientifique et des développeurs et des entrepreneurs. à l’innovation. Favoriser l’émergence d’un écosystème : favoriser l’émergence d’un écosystème de producteurs et de réutilisateurs de données publiques en France, autour de la mission Etalab et du futur portail data.gouv.fr.8
  10. 10. F#-G#!)0&)&$-4-&$!)&*0!*#!)&,-4-.*#!/4-&/,#! 6. Impliquer des acteurs publics pilotes dans/7+-4-#*$#!%#$!%&(#$!)*+,-.*#$! les projets de recherche sur le Web Ce rapport formule seize propositions, sémantique.articulées selon les trois axes stratégiquesprécédents. Elles sont présentées de manièredétaillée au chapitre 8, et visent à proposer une 7. Rendre la réutilisation des donnéesfeuille de route claire pour mettre en place une gratuite pour toute réutilisation à titrepolitique ambitieuse des données publiques. personnel. 8. Encadrer strictement les cas dans lesquels1. Formaliser les bonnes pratiques de une redevance est légitime, et charger lesdiffusion des données publiques attendues producteurs de données d’établir l’absoluepar la communauté des réutilisateurs : nécessité de toute tarification : • Expliciter l’effort minimal attendu des • Dépasser une valorisation purement différents acteurs publics. commerciale des données publiques et • Assurer la formation des agents et leur encourager leur réutilisation la plus accès à des guides clairs et explicatifs. large. • Simplifier les formats de diffusion. • Généraliser la réutilisation libre et gratuite la plus large possible.2. Mettre en cohérence les conditions légales • Restreindre la tarification à coûtsde réutilisation des données issues de moyens aux marchés matures.sources différentes : • Établir une « licence données ouvertes » 9. Conditionner toute redevance pour pour réutilisation gratuite qui réutilisation de données à valeur ajoutée à la s’appliquerait le plus largement possible. mise à disposition gratuite des données • Encourager un marquage graphique des brutes qui les sous-tendent. droits de réutilisation. 10. Explorer des conditions alternatives de3. Encourager l’utilisation de formats réutilisation pour laisser carte blanche àfacilement réexploitables, qui respectent les l’expérimentation :normes d’interopérabilité et de « lisibilité • Privilégier les partenariats avec lesmachine » : nouveaux acteurs de l’innovation. • Privilégier les formats ouverts respectant • Explorer les licences gratuites avec les normes d’interopérabilité. partage des conditions initiales à • Communiquer auprès des agents sur l’identique (share alike). l’importance des formats réexploitables. • Explorer la rémunération par l’accès aux • Maintenir une liste de formats données d’usage. correspondants à ces critères. • Explorer la rémunération par le service client.4. Faire en sorte que chaque contrat public • Faciliter l’expérimentation avec les Webclarifie à l’avenir le financement de Services.l’ouverture et les droits de réutilisation liésaux données produites dans son cadre : 11. Impliquer la communauté des • Clarifier le financement de louverture et réutilisateurs dans les initiatives de mise à les droits de réutilisation de données disposition de données publiques : dans les contrats publics. • Créer un point d’accès unique centralisé • Établir des bonnes pratiques et des et mis à jour automatiquement. clauses types. • Développer une offre grand public qui • Élargir le périmètre des données mette en valeur des applications utiles. réutilisables aux ressources essentielles. • Investir dans l’accompagnement de la communauté.5. Faciliter l’enrichissement des données et • Démultiplier le service aux utilisateurs.l’intégration de corrections éventuelles par • Organiser des séminaires ou ateliers dela communauté : travail ponctuels sur les sujets • Faciliter l’intégration des métadonnées. techniques d’intérêt pour la • Permettre l’enrichissement collectif des communauté. jeux de données. 9
  11. 11. 12. Mettre en place des assises des données • Illustrer la réutilisation des données publiques et animer la communauté des publiques par le développement de réutilisateurs : services aux citoyens. • Regrouper l’ensemble de l’écosystème • Faire des données et de leur réutilisation pour des assises des données publiques. un outil d’éclairage du débat public. • Animer la communauté des 15. Développer une stratégie nationale à réutilisateurs. partir du rôle de coordination des 13. Encourager le développement institutions publiques de la mission Etalab : d’applications à partir des données • Mutualiser des solutions de mise en publiques : ligne pour les administrations et les • Organiser un concours national de collectivités. développement d’applications. • Développer une stratégie nationale pour • Prendre en compte la réutilisation des les données publiques. données publiques dans les appels à projets de R&D numérique. 16. Élargir le champ de l’Open Data : • Pérenniser l’offre d’applications créées à • Élargir le champ de la libre réutilisation partir des données publiques. des données publiques. • Explorer l’application de l’Open Data 14. Intégrer au débat démocratique les aux entreprises privées. données publiques et leur réutilisation : • Développer une stratégie européenne et • Communiquer aux administrations internationale. l’importance des données pour mettre en lumière leurs métiers.10
  12. 12. /,>%&!&(!<,+.I-&(!Résumé analytique__________________________________________________________________ 7Table des matières _________________________________________________________________ 11Introduction ______________________________________________________________________ 13Partie 1. « Open Data » : Contexte et enjeux d’une question sociétale ________________________ 17Chapitre I. Données publiques : émergence d’une question sociétale __________________________ 19 1. La donnée au cœur des nouveaux usages ___________________________________________ 19 2. Les données publiques et leur réutilisation __________________________________________ 21Chapitre II. La libre réutilisation des données publiques à l’international ______________________ 25 1. Le mouvement Open Data _______________________________________________________ 25 2. États-Unis : initiatives locales, puis démarche fédérale_________________________________ 26 3. Grande Bretagne : une impulsion transpartisane du gouvernement________________________ 28 4. Situations contrastées en Europe __________________________________________________ 30Chapitre III. Les enjeux de la réutilisation des données publiques ____________________________ 33 1. Démocratie, transparence et débat public ___________________________________________ 33 2. Modernisation de l’État _________________________________________________________ 34 3. Innovation et soutien à l’économie numérique _______________________________________ 35 4. Des données stratégiques pour l’économie __________________________________________ 38 5. Un nouveau mode d’action publique _______________________________________________ 42Partie 2. État des lieux de la réutilisation des données publiques en France _____________________ 47Chapitre IV. Le cadre de la réutilisation des données publiques en France _____________________ 49 1. Le cadre juridique pose en principe la liberté de réutilisation ____________________________ 49 2. Les acteurs de la réutilisation de données publiques ___________________________________ 53 11
  13. 13. Chapitre V. Premières expériences d’ouverture des données publiques en France ________________ 57 1. La réutilisation des données dans les collectivités territoriales ___________________________ 57 2. L’ouverture des données au niveau national : trois études de cas _________________________ 62 3. La mise en place d’une politique nationale des données publiques________________________ 65 Partie 3. Comment favoriser la réutilisation des données publiques ?__________________________ 69 Chapitre VI. Abaisser les barrières à la réutilisation _______________________________________ 71 1. Répondre aux contraintes techniques ______________________________________________ 71 2. Gérer la complexité juridique ____________________________________________________ 72 3. Anticiper l’impact organisationnel ________________________________________________ 74 4. Établir des modèles économiques propices à l’innovation ______________________________ 75 Chapitre VII. Prospective : Trois scénarios pour l’avenir ___________________________________ 83 1. « Inertie » : Développement de l’offre de données publiques à son rythme historique _________ 83 2. « Capture » : Des monopoles informationnels se substituent à la puissance publique _________ 85 3. « Symbiose » : Catalyser le développement d’un écosystème____________________________ 87 Chapitre VIII. Seize propositions pour une politique ambitieuse des données publiques ___________ 91 1. Simplifier pour accélérer ________________________________________________________ 91 2. Faciliter l’expérimentation pour encourager l’innovation _______________________________ 94 3. Soutenir l’émergence d’un écosystème _____________________________________________ 96 Bibliographie ____________________________________________________________________ 101 Textes règlementaires _____________________________________________________________ 105 Interlocuteurs____________________________________________________________________ 107 Liens et références ________________________________________________________________ 10912
  14. 14. ;*+-$7#+.$*! « Si l’on partage des données sur le Web, des données publiques, des données scientifiques, des données citoyennes, quelles qu’elles soient, d’autres que nous sauront en tirer des créations merveilleuses que nous n’aurions jamais imaginées. » Tim Berners-Lee, Inventeur du Web Hal Varian, Économiste en Chef chez inventer de nouveaux usages. Tous typesGoogle, le précise : « Je répète sans cesse que d’objets numériques sont concernés : desla profession sexy dans les dix prochaines tableaux chiffrés, des mesures numériques, desannées, ce sera statisticien. Et ce n’est pas de bases de données, des cartes ou encore desl’humour.1 » jeux de données géolocalisées. On peut émettre des réserves quant au Les applications en question vont despouvoir de séduction d’un tableur services les plus simples aux plus complexes,informatique ; il reste que l’attrait de la science de l’expérimentation au produit professionnel :des données s’est considérablement accru ces des étudiants développent une applicationdernières années. Ses algorithmes ont gagné en mobile, des citoyens quantifient l’action depuissance et ses applications jouent un rôle leurs députés, des journalistes créent decentral dans la société de l’information. nouvelles infographies plus instructives, une entreprise calcule des itinéraires de transports À mesure que nos outils informatiques publics au service des internautes.deviennent plus mobiles, leurs applicationsgagnent en importance dans nos vies Les développements technologiquesquotidiennes. En recoupant des données récents ont largement accéléré lenumériques diverses, en les adaptant à notre développement de ce phénomène, et lesusage à travers une ergonomie simple, les attentes d’une partie du public sont aujourd’huismartphones et les tablettes tactiles simplifient très fortes.bon nombre des tâches de la vie quotidienne etprofessionnelle. 9#!)0&+,(7/4-.*#!&*1#,,#!#4!2&7),#A#!)&*0! ,#!$#24#*0!)*+,-2!"/!0(*4-,-$/4-&!%#$!%&(#$!)*+,-.*#$! La réutilisation des données publiques offre Un mouvement de réutilisation des données des possibilités nouvelles à la sphère publique.publiques2 a vu le jour depuis plusieurs années. Elle appelle une évolution de la culture et duConcrètement, il s’agit pour des développeurs mode de fonctionnement des administrations.informatiques ou tout autre citoyen d’accéder à Elle soulève surtout de nombreuses questions.des données produites initialement dans le Quelles opportunités ? Quels risques ?cadre du fonctionnement de l’État, et de leur Quelles pistes pour en faire profiter au mieux la société ? Quels enseignements tirer de1 l’expérience d’autres pays en la matière ? Steve Lohr. 5 août 2009. « For Today’s Graduate, One Quel(s) public(s) cette politique vise-t-elle,Word: Statistics ». The New York Times.http://www.nytimes.com/2009/08/06/technology/06stats.ht avec quels objectifs et quels moyens ? Quellesml limites et quelles garanties donner au droit à la2 À l’exclusion bien sûr des données personnelles et des réutilisation ?données confidentielles (loi de 1978 sur la liberté d’accésaux documents administratifs, modifiée par Ordonnancen°2005-650 du 6 juin 2005). 13
  15. 15. 9#!&))&04*-4(!-7)&04/4#!)&*0!,#! 2011 dans le monde, et un historique des %(1#,&))#7#4!%*!*7(0-.*#! évolutions récentes dans les pays occidentaux Grâce aux réseaux mobiles à haut débit, la (chapitre 2). connectivité devient ubiquitaire. Les nouvelles Nous nous attachons ensuite à cerner les plateformes mobiles permettent désormais bénéfices que l’on peut attendre d’une d’accéder en direct à des services ou des politique de soutien à la réutilisation des informations dans le contexte dans lequel données publiques. Nous évoquons les enjeux ceux-ci sont le plus utiles. Ces évolutions ont liés à la participation démocratique et à donné naissance à une industrie nouvelle et en l’efficacité de l’action publique. Nous forte croissance, celle des applications explicitons les différents mécanismes à travers mobiles. lesquels la donnée publique peut contribuer au Des acteurs internationaux du Web ont su développement économique (chapitre 3). prendre des positions fortes sur ce marché. La France possède des atouts pour réussir dans ce "/!0(*4-,-$/4-&!%#$!%&(#$!)*+,-.*#$!#! I0/2#! secteur. Faciliter l’accès aux données publiques en vue d’une réutilisation Une deuxième partie fait ensuite le point commerciale pourrait favoriser la création sur la réutilisation des données publiques en d’activités économiques novatrices. France aujourd’hui (chapitre 4). 9!%(+/4!)/$$-&(! Le chapitre suivant vise à fournir aux agents publics des pistes et références à partir Opportunité de développement économique desquelles construire leur réflexion. Nous et avancée en matière de transparence d’une cherchons en particulier à comprendre le part, érosion potentielle de la capacité d’action contexte de cette politique, son cadre juridique de l’État et de ses ressources propres de et technique, et les acteurs qu’elle met en jeu l’autre : la tarification de la réutilisation des (chapitre 5). données publiques est l’objet d’âpres débats, quand elle ne donne pas lieu à des contentieux. H&77#4!C/1&0-$#0!,/!0(*4-,-$/4-&!%#$! %&(#$!)*+,-.*#$!J! L’ouverture des données elle-même peut faire peur, quand ce n’est pas Le mouvement de réutilisation de données l’incompréhension quant à l’intérêt d’un droit étant durablement amorcé, il convient de à la réutilisation de données qui interpelle. s’interroger sur les difficultés auxquelles il risque de se heurter dans l’administration, les 9!7&*1#7#4!#;/;(!$*0!,#!,&;!4#07#! établissements publics et les collectivités : difficultés d’ordre juridique, organisationnel, La mise à disposition des données technique et financier. Nous abordons la publiques pour leur réutilisation n’est pourtant question de la tarification optimale, et des pas un effet de mode : il s’agit d’un droit modèles économiques qui doivent s’appliquent opposable consacré par la loi, basé sur une aux données publiques (chapitre 6). Directive de 2003 que la Commission Européenne envisage d’étendre et de renforcer. À partir des dynamiques en présence, nous avons imaginé trois scénarios futurs pour la Cette évolution engagée confronte chaque réutilisation des données publiques : l’Inertie, administration centrale, chaque collectivité la Capture et la Symbiose. Nous détaillons les locale, chaque établissement public à des caractéristiques et les implications de chacun questions difficiles. Qu’attend-on d’eux de ces futurs possibles (chapitre 7). exactement, et comment bien faire ? H&2,*$-&$!#4!0#2&77/%/4-&$! H&4#A4#!#4!#>#*A!%3*!$*>#4!%#!$&2-(4(!! Le scénario de la Symbiose et du Le premier chapitre s’attelle à esquisser un développement d’un écosystème présente de portrait synthétique des grandes évolutions qui loin le plus d’avantages : travailler à ont amené la question des données publiques à l’ouverture des données publiques en devenir, en l’espace de quelques années, un collaboration avec la communauté de ceux qui véritable sujet de société. Nous passons les réutilisent est une nécessité pragmatique notamment en revue les évolutions plus qu’un choix idéologique. technologiques récentes qui l’ont portée sur le devant de la scène (chapitre 1). Pour que la société puisse tirer l’ensemble des bénéfices potentiels de la réutilisation des Le second chapitre dresse un état des lieux données publiques, il convient cependant de la réutilisation des données publiques en14
  16. 16. d’encourager son développement au rythme le développement de services utiles à partir desplus rapide. données publiques. Nous proposons enfin (chapitre 8) seize Faciliter l’expérimentation : adapter lespropositions groupées en trois axes conditions de réutilisation des donnéesstratégiques, visant à établir une feuille de publiques pour faciliter l’expérimentation parroute claire vers une politique ambitieuse des les citoyens, les associations et la communautédonnées publiques. des développeurs et des entrepreneurs. Simplifier pour accélérer : réduire les Favoriser l’émergence d’un écosystème :efforts nécessaires d’une part à la diffusion des favoriser l’émergence d’un écosystème dedonnées par les acteurs publics, et d’autre part producteurs et de réutilisateurs de donnéesà leur réutilisation, afin d’accélérer le publiques en France, autour de la mission Etalab et du futur portail data.gouv.fr. 15
  17. 17. ),-+.&!CJ!K!K)#!D/4/!L!M!!N$*+&8+&!&+!&*E&78!:7*&!B7&(+.$*!($#.5+,%&! 17
  18. 18. N0,2.+-&!;J! 4$**5&(!27>%.B7&(!M!5<&-6&*#&!:7*&!B7&(+.$*!($#.5+,%&! Les évolutions technologiques récentes ont avait pour but de faciliter l’accès et lerendu possible le partage rapide et aisé de tous référencement de documents en symbolisanttypes de données. Elles réactivent, sous un jour leur manipulation sous forme de phrases, liantnouveau, le débat déjà ancien sur l’accès aux verbes intuitifs (lire, afficher, remplacer,documents administratifs, maintenant sous effacer) et métadonnées d’adressage universelforme électronique et bien plus aisément (URL ou Uniform Resource Locator5).diffusables. Bien que basées sur un réseau d’échange de L’Internet a fait apparaître une économie documents, les techniques du Web ontdes données. Les stratégies de croissance des naturellement développé un tropisme de plusacteurs du Web, via l’ouverture de leurs en plus marqué vers les données elles-mêmes.interfaces de programmation (API), ont illustré L’introduction des bases de donnéesle potentiel de la réutilisation des données, et relationnelles dans les outils de développementsuscité des attentes similaires des développeurs a permis la création de sites dynamiques, c’est-vis-à-vis du secteur public. Ils exercent une à-dire dont les pages s’adaptent auxpression pour que les États, en facilitant l’accès circonstances (évolutions de prix, listesà leurs informations, s’insèrent et tiennent leur d’objets changeants, « unes » de journauxrang dans ce « Web des Données ». électroniques mises à jour fréquemment). À partir de 2004, une technique émergente a vu Ces ruptures technologiques ont le jour qui consiste à utiliser les fonctionnalitésaccompagné par ailleurs une prise de de scripting6 présentes dans les navigateursconscience de l’importance des données pour permettre la mise à jour en temps réel deproduites par l’administration et le secteur pages déjà chargées, en allant chercher enpublic. La possibilité novatrice de réutiliser ces tâche de fond des données remises à jour.données sous forme brute, pour leur trouver de Nommée AJAX7 pour JavaScript Asynchronenouveaux usages utiles et instructifs, a abouti à et XML (Asynchronous Javascript And XML),l’émergence de la question des données à partir du langage de scripting JavaScript etpubliques en tant que véritable question du format d’échanges de données XML, cettesociétale. technique à la croisée de différentes technologies Web est reconnaissable derrièreCJ O,!$**5&!,7!#P7-!&(! des applications Web hautement réactives dont les pages ont rarement besoin d’être rafraîchies*$7?&,78!7(,6&(! – telles que GMail8, Quora9 ou Facebook10. Internet et les ruptures technologiquesrécentes on fait apparaître une nouvelle« économie des données ». http://www.w3.org/People/Berners-Lee/ 5 World Wide Web Consortium (W3C). 1994. Uniform Resource Locators (URL) : A Syntax for the Expression ofL-M "#!N#+!#$4!$40*24*0(!/*4&*0!%#!,3(2:/;#!%#! Access Information of Objects on the Network.%&(#$=! http://www.w3.org/Addressing/URL/url-spec.txt 6 Capacité d’un navigateur à faire tourner dynamiquement Le génie informatique (computer science un programme qui agit en temps réel sur la page affichée.dans le monde anglo-saxon) est défini comme Par exemple, une page qui affiche l’heure repose sur unla manipulation algorithmique de données et de script qui demande au navigateur de mettre à jour l’heure, les minutes et les secondes à mesure qu’elles s’écoulent.leurs structures de représentation. Le Web, Dans le cas d’un service de courrier en ligne, c’est souventavant d’être un phénomène social, est une un script qui réagit au click sur l’intitulé d’un email etarchitecture logicielle3 conçue par un change l’affichage pour détailler le contenu du mail plutôtchercheur britannique en physique des hautes que celui de la boîte de réception. C’est aussi un script qui vérifie automatiquement l’arrivée de nouveaux courriersénergies au CERN, Sir Tim Berners-Lee4. Elle en tâche de fond, et réintègre éventuellement ces nouvelles données dans le corps de la page affichée. 7 Garrett, J.J. 18 février 2005. « Ajax : A New Approach3 World Wide Web Consortium (W3C), 2010, HTTP – To Web Applications ».Hypertext Transfer Protocol Overview – draft 09. http://www.adaptivepath.com/ideas/essays/archives/00038http://www.w3.org/Protocols/ 5.php4 8 World Wide Web Consortium (W3C). Sir Tim Berners- GMail, service de boîte de courrier électronique en ligneLee: Bio. Téléchargée le 10 janvier 2011. de Google, Inc. : http://www.gmail.com 19
  19. 19. Pour supporter cette technologie, de plus en gagne en utilité pour ses utilisateurs, et le plus d’applications en ligne ont développé à la système producteur voit sa position fois deux interfaces : une interface graphique compétitive renforcée par la dépendance classique accessible aux utilisateurs à travers accrue du marché à ses services. En l’essence, leur navigateur, et une interface exclusivement c’est une transaction de marché où l’accès à consacrée aux machines, qui permet justement des données est échangé contre leur diffusion à au moteur de scripting du navigateur de un nouveau public ou dans un nouveau récupérer des données à la volée. C’est cette contexte. interface, qu’on peut se représenter comme un L’exposition d’une interface API est protocole d’échange de données de machine à aujourd’hui une étape presque obligée du machine, qu’on appelle interface de développement d’un nouveau produit en ligne. programmation ou API (sigle anglophone pour La généralisation de ce phénomène est d’une Application Programming Interface). grande importance pour la question des données publiques, car elle a permis de prendre L--M "/!%&(#<!7&/-#!%3(2:/;#!#4!,#1-#0! %3-C,*#2#!$*0!,#!N#+=! conscience de l’omniprésence des données derrière les services qu’utilisent Les API sont devenues un véritable outil quotidiennement les internautes. stratégique pour les sociétés de services en ligne.11 Par exemple, c’est dans une large En un mot, « l’économie des données » mesure grâce à l’ouverture de leur API12 que s’est construite autour de l’échange et de la Twitter a pu permettre à une communauté de fluidité sur le Web : les données ont souvent développeurs de se créer, et de multiplier les plus de valeur comme outil d’échange et applications permettant d’utiliser le service en d’influence qu’isolées au sein des entrepôts de dehors du site Web principal (notamment dans données des entreprises13. les premiers jours de l’App Store d’Apple durant l’été 2008). Ce grand nombre L---M 81#2!,#!N#+!O=P<!,/!%&(#!%#1-#4! 2&,,#24-1#! d’applications a servi de « force de vente » virtuelle pour Twitter, et est un des facteurs Un corollaire de la montée en puissance de principaux qui expliquent son succès la donnée est son rôle de liant social sur le populaire. Web. En particulier, avec l’apparition de phénomènes de collaboration de masse tels que Bien documentées et basées sur des Wikipedia, on s’aperçoit que l’échelle standards acceptés (tels que JSON ou XML) d’échanges rendue possible par Internet ouvre pour éviter les problèmes d’interopérabilité, des possibilités insoupçonnées jusqu’alors. ces interfaces s’adressent à des développeurs informaticiens. Selon le degré d’ouverture Des services tels que Delicious (site de (fonction des choix stratégiques de la société) partage de bookmarks, qui agrège les et les conditions de licences (souvent conçues catégories dans lesquelles les utilisateurs pour encourager la réutilisation) consentis à rangent différents liens, et permet ensuite de ces derniers, ils peuvent extraire, trouver des liens par catégorie d’intérêt) ou éventuellement modifier, et transformer les Flickr (qui permet de chercher des données du service Web en question, pour les photographies libres de droits sur un sujet réutiliser, notamment à la construction de particulier, en se basant sur les tags de nouveaux services ou de nouvelles catégorisation produits par l’ensemble des applications. utilisateurs) ont ainsi profité de ce phénomène de folksonomy, la taxonomie par les foules ou L’échange est mutuellement bénéfique : le classification par l’intelligence collective14. nouveau service, consommateur de données, D’autres services tels qu’Amazon ou Netflix ont, eux, profité de la masse 9 Quora, Inc., site de questions et réponses dynamique caractérisé par l’expertise pointue de sa communauté d’utilisateurs, fondé en 2009 et qui a connu une très forte 13 Ed Parsons - Geospatial Technologist for Europe, croissance en 2010 : http://www.quora.com 10 Facebook, Inc., le réseau social dominant qu’on ne Middle East and Africa chez Google, au séminaire présente plus, fondé par Mark Zuckerberg en 2004 et « Innovations et développement du secteur de approchant 600 millions d’utilisateurs début 2011 : l’information géographique » organisé le 5 octobre 2009 à http://www.facebook.com la Grande Arche de la Défense par le Conseil National de 11 Shah S., 28 August 2010, « Cannibalize Business l’Information Géographique (CNIG), l’AFIGÉO et Development by Popularizing your API » : l’Institut des Sciences et des Techniques de l’Équipement http://shaivalshah.com/cannabilize-business-development- pour le Développement (ISTED) by-populariz 14 12 Entretien le 12 novembre 2010 avec Henri Verdier, Tapscott, D. and Williams, A. 2006. Wikinomics : How Président de Cap Digital. Mass Collaboration Changes Everything.20
  20. 20. d’utilisateurs se servant de leurs sites pour en « différentes sources au sein d’une seuleextraire des modèles de préférences des plateforme, (…) l’une des facettes du designconsommateurs, qui leur permettent de faire collaboratif sur le Web17 ». Cette nouvelledes recommandations hautement tendance a connu un tel succès au tournant despersonnalisées selon les goûts de leurs clients. années 2006 à 2008 que le prestigieux Museum of Modern Art de New York y a L’un des enseignements de la nouvelle consacré une exposition phare18.incarnation sociale et collaborative du Web,c’est que la valeur des données n’est pas Au-delà de l’incidence culturelle de ceintrinsèque, mais dérive de leur agrégation, de phénomène19, la réappropriation du local et deleur recoupement, de leur analyse et de la l’espace géographique par le biais du Web etréutilisation qui en est faite. du mobile annonçait l’importance croissante de la donnée informatique géographique, et, au- Le Web a ainsi mis à jour une économie delà, l’émergence du phénomène culturel dudes données, qui joue un rôle de monnaie remix et de la réutilisation des données.d’échange parmi les entreprises d’Internet etles services en ligne. FJ O&(!$**5&(!27>%.B7&(!&+!L-1M D&(#$!;(&;0/):-.*#$!#4!Q!7/$:R*)$!S! %&7-!-57+.%.(,+.$*! L’autre développement technologique qui aconduit à prendre conscience de l’importance La génération des digital natives, qui ades données, c’est la démocratisation de grandi dans l’habitude de la réutilisation, dul’information géographique. remix et de la recombinaison permanente, devait nécessairement s’intéresser aux Google indique par exemple que son informations collectées par l’État.approche est « d’utiliser la géographie pour L’émergence de la réutilisation des donnéesorganiser toute l’information mondiale, qu’elle publiques comme sujet de société, poussée parsoit géographique ou non. C’est un principe les nouveaux usages, a révélé une chaîne ded’organisation qui sera utilisé pour mieux valeur fondée sur ces données qui, lorsqu’ellescomprendre l’information. »15. sont mises à disposition de façon brute et Si les briques technologiques sont réexploitable, permet aux développeurs et auxdisponibles pour utiliser et manipuler la entrepreneurs de créer de nouveaux services.donnée géographique à loisir, ou même pourl’utiliser pour structurer d’autres données, le L-M "#$!%&(#$!*7(0-.*#$!&4!1&2/4-&!T!,/! %-CC*$-&!,/!),*$!,/0;#!défi qui reste posé est celui de la constitutiond’une véritable infrastructure des données Contrairement aux documents papiers dontgéographiques. Ces données sont aujourd’hui l’impression engendre des coûts variablesaccessibles en nombre et de qualité, mais les conséquents et qui nécessitent des délais derepérer et les réutiliser peut rester obscur et traitement et d’acheminement, les donnéescomplexe16. numériques ont un coût marginal de diffusion nul ou presque20, et sont accessibles quasiment Conséquence récente des évolutions du instantanément.Web, des applications cartographiquespuissantes réservées jusque-là à des experts Le travail éventuel de mise à disposition desont devenues accessibles à tous. Le monde du données numériques est donc un coût fixe : laWeb collaboratif a largement repris à son diffusion la plus large, en distribuant ce coût,compte la possibilité de représenter des est donc le modèle le plus efficace d’un pointdonnées sur des cartes. Grâce à l’ouverture de vue économique.gratuite (dans des limites relativement largesde volume) de son API, Google Maps estdevenu une base de choix pour la création de 17 Google Earth mashups 5 of 14, in « Design and the« mashups », ces applications Web combinant Elastic Mind. » Museum of Modern Art. New York, NY. 2008. http://www.moma.org/interactives/exhibitions/2008/elastic15 Ed Parsons – Ibid. mind/#/98/16 18 Voir l’intervention de Max Craglia, coordonateur « Design and the Elastic Mind. » Museum of Moderntechnique d’Inspire pour la Commission Européenne Art. New York, NY. 2008.(centre commun de recherche) au séminaire « Innovations http://www.moma.org/interactives/exhibitions/2008/elasticet développement du secteur de l’information mind/ 19géographique » organisé le 5 octobre 2009 à la Grande Lessig, L. 2009. Remix : Making art and commerceArche de la Défense par le Conseil National de thrive in the hybrid economy. http://remix.lessig.org/ 20l’Information Géographique (CNIG), l’AFIGÉO et Les volumes qui peuvent être atteints font que le coût del’Institut des Sciences et des Techniques de l’Équipement diffusion n’est en revanche pas négligeable et peut danspour le Développement (ISTED). certains cas devenir important. 21
  21. 21. L’instantanéité de diffusion et l’ubiquité riches et très variées ; certaines ont une forte d’accès offrent de plus des perspectives tout à valeur économique. Le marché de fait nouvelles en terme de périmètre de l’information est estimé en France à diffusion et d’audience potentielle, notamment 3,7 milliards d’euros dont 60 % sont des au regard de la démocratisation de l’Internet. données publiques21. Au niveau européen, ce chiffre représenterait près de 27 milliards L--M H&7+-#0!,#$!%&(#$!+0*4#$!/7),-C-#!,#*0! d’euros22 par an. )&4#4-#,! La valorisation passe par différentes étapes Marqué par les traditions et les habitudes nécessaires pour rendre les données publiques d’un monde de communication par le papier, utilisables ou réutilisables. D’une part l’État diffuse le plus souvent ses informations l’institution productrice doit définir sous forme de « produits finis », tels que des précisément quelles données elle doit diffuser analyses, des pages Web explicatives ou des en ligne et de quelle manière, par un travail rapports écrits – en quelque sorte des données d’analyse et de collecte. S’imposent à ce stade « retravaillées » afin d’être intelligibles par le respect de critères de bon sens comme la tous. À l’inverse, les données brutes qui sous- protection de la vie privée, de la propriété tendent ces études sont rarement mises à intellectuelle des tiers, ou de la sécurité disposition du public, car leur intérêt pour une nationale. réutilisation potentielle est encore très inégalement perçu par les producteurs de D’autre part, pour faciliter la réutilisation, données publiques. l’institution productrice doit s’assurer de fournir une donnée qualifiée et mise à jour. Aujourd’hui, les technologies de Pour cela, il semble important de créer des lots l’information permettent une mise à de données cohérents et de s’assurer de la disposition des données à l’état brut. Loin présence d’une légende et plus généralement d’être un obstacle à leur réutilisation de la présence des métadonnées. ultérieurement à leur mise à disposition par l’administration, leur caractère brut permet au Il faut les mettre à disposition via un contraire de les recombiner plus facilement, ce support adapté mais en réalisant un catalogage qui amplifie leur potentiel et permet la création précis : il ne suffit pas de mettre à disposition de services impossibles à réaliser sans ces des données, encore faut-il qu’elles puissent croisements. être découvertes et facilement accessibles grâce à un portail de données publiques ou un Par exemple, des mesures locales de bruit moteur de recherche. permettent de mettre en perspective la corrélation positive mesurée entre les dépenses Enfin, les données publiques numériques mises énergétiques d’un ménage et son taux à disposition peuvent être réutilisées par la d’équipement en doubles vitrages, paradoxale communauté des développeurs et des au premier abord. Dans le cadre d’un concours entrepreneurs, qui peuvent leur inventer de organisé par la ville de Washington, D.C., des nouveaux usages. Ces données représentent données sur les vols, croisées avec les tracés aussi un outil interne au service des des pistes cyclables, ont aussi permis de créer administrations, qui peut leur permettre des une carte des zones à éviter pour les cyclistes. échanges d’information plus fluides et efficaces. Parce qu’elle favorise ces croisements et ces combinaisons fertiles sur des sujets L-1M "/!1-$*/,-$/4-&!%#!%&(#$!>&*#!*!0V,#! recoupant des champs extrêmement vastes de $40*24*0/4! l’économie, de la société et de Les données géographiques ont un rôle l’environnement, la mise à disposition des structurant dans la chaîne de valeur. Elles données brutes de l’État et des collectivités est rendent possible la spatialisation et la un terreau fertile pour des réutilisateurs, qui visualisation sur carte d’autres jeux de peuvent inventer de nouveaux usages à ces données, notamment géolocalisées. Selon données. l’Association Française pour l’Information L---M "#$!%&(#$!)*+,-.*#$!#4!,#*0!0(*4-,-$/4-&! $&4!T!,3&0-;-#!%3*#!2:/U#!%#!1/,#*0! 21 http://www.rgpp.modernisation.gouv.fr/index.php?id=51 &tx_ttnews[tt_news]=531&tx_ttnews[backPid]=11&cHas L’État et le secteur public au sens large, h=89b9c6970f dans le cadre de leurs opérations, touchent à 22 Dekkers, M. et al., 2006, « MEPSIR, Measuring Public l’ensemble des secteurs de notre économie, Sector Information Resources, Final Report of Study on notre société et notre environnement. Les Exploitation of public sector information », données qu’il collecte sont donc naturellement http://ec.europa.eu/information_society/policy/psi/docs/pdf s/mepsir/final_report.pdf22
  22. 22. Géographique (AFIGÉO)23, 80 % des Le processus de recherche, d’analyse puisinformations qui sont utilisées possèdent une de représentation graphique synthétique desdimension géographique. Cela leur confère données sous forme interactive, quidonc une importance particulière à la fois d’un s’apparente à du journalisme et qu’on appellepoint de vue technique, mais aussi en tant parfois « datajournalism » ou journalisme dequ’outil de recoupement et de recombinaison données, a participé à créer une demande pourde données. plus de transparence de la part des gouvernements, et à l’émergence du sujet de la Ainsi, dès 1854, John Snow détermina les réutilisation des données publiques.causes de la propagation du choléra grâce à lavisualisation de données sur une carte. À cetteépoque, on pensait que la maladie sepropageait par inhalation. Le médecin ______________________superposa sur une carte les adresses desvictimes du choléra à Exeter (quartier deLondres) durant un épisode aigu, et constataqu’elles coïncidaient avec l’accès à la pompe àeau de la Broad Street. Par déduction, il en Les données publiques offrent, par le biaisconclut au rôle de l’eau et des conditions des réutilisations qui peuvent en être faites, unsanitaires dans la propagation de l’épidémie, ce fort potentiel d’innovation, tant à titrequi permit de la contrôler, et de réduire commercial que pour la recherche, ledrastiquement le taux de mortalité lié à cette développement de nouveaux services auxpathologie dans les décennies qui suivirent. citoyens ou l’amélioration du travail de De manière plus générale, le succès de l’administration.l’infographie en ligne et des nouveaux modes Les nouvelles possibilités dede visualisation dynamique ont amené les recombinaison et de réutilisation offertes pargraphistes et designers à rechercher de les technologies de l’information ont révélénouvelles informations et de nouvelles sources l’importance de leur réutilisation, et contribuéde données à mettre en scène dans leurs à en faire une question sociétale.productions.23 http://www.afigeo.asso.fr/ 23
  23. 23. Carte d’Exeter tirée de History of the Cholera in Exeter in 1832, T. Shapter.24
  24. 24. N0,2.+-&!;;J! O,!%.>-&!-57+.%.(,+.$*!&(!$**5&(!27>%.B7&(!3!%:.*+&-*,+.$*,%! Le sujet de la réutilisation des données nouvelles évolutions, et collaborer à lapubliques et l’appel à la mise à disposition rédaction d’articles scientifiques, se répandd’informations publiques sous forme brute a largement au sein de la communauté desémergé dans le contexte des ruptures chercheurs. Il trouve ensuite un écho dans latechnologiques et économiques de ces communauté des développeurs, notammentdernières années. parmi les contributeurs de projets Open Source, dont le mouvement d’ouverture des C’est pourtant par deux ruptures politiques, données est philosophiquement proche.au plus haut niveau de l’État, d’abord auxÉtats-Unis puis en Grande-Bretagne, chaque Des développeurs, des chercheurs et desfois dans un contexte d’alternance politique, économistes de l’information créent ainsiqu’il a été concrétisé par une politique l’Open Knowledge Foundation (OKFN) enambitieuse d’ouverture des données publiques. 2003 et l’Open Data Foundation (ODaF)25 en 2006 – organismes à but non lucratif qui Le chapitre suivant présente un tour cherchent à promouvoir l’adoption de normesd’horizon de ce mouvement d’ouverture des mondiales de formats et de métadonnéesdonnées publiques, et l’historique récent de ces (description des jeux de données), et ledeux principales initiatives gouvernementales, développement de solutions open source pourqui l’ont concrétisée à l’international. mutualiser les outils de mise en ligne de données.CJ O&!<$7?&<&*+!K)#!D/4/! Les promoteurs de l’Open Data ont ainsi Le terme Open Data, littéralement développé des définitions formelles des« données ouvertes » ou « données libres » (au critères qui caractérisent des donnéessens « libres de droits »), est utilisé pour « ouvertes ». Un groupe de travail « Opendésigner des données en libre accès et ouvertes Government Data » (OGD) d’experts du Webà la réutilisation. Il trouve son origine en 1995 s’est fixé huit critères assez larges de définitiondans une publication du Comité sur les des données publiques ouvertes26. L’OpenDonnées géophysiques et environnementales Knowledge Foundation (OKFN), pour sa part,du Conseil national de la Recherche aux États- propose onze critères27, plus axé sur lesUnis intitulée « De l’échange complet et ouvert conditions juridiques acceptables qui doiventdes données scientifiques »24 : se retrouver dans la licence de réutilisation. « Les programmes internationaux de Les deux ensembles de critères, qui recherche sur le changement global et la établissent une première définition des données surveillance environnementale dépendent ouvertes, sont détaillés ci-dessous. du principe d’un échange complet et ouvert Données complètes : toutes les données des données (i.e. les données et les sont mises à disposition, sauf exceptions de informations sont rendues disponibles sans bon sens. restriction, sur une base non discriminatoire, pour un coût réduit à celui Données brutes : les données sont telles des besoins de reproduction et de que collectées à la source. Elles ont la plus fine distribution). » granularité possible et ne se présentent pas sous des formes agrégées ou modifiées. Le terme, qui désigne donc à l’origine leprocessus de collaboration des scientifiques Données récentes : les données sont misesautour de données d’expériences partagées afin en ligne aussi rapidement que possible.de multiplier les chances de détecter deserreurs, se tenir mutuellement au courant des24 25 http://www.opendatafoundation.org/ 26http://www.nap.edu/readingroom.php?book=exch&page=s http://www.opengovdata.org/home/8principles 27ummary.html http://www.opendefinition.org/okd/ 25
  25. 25. Données accessibles : les données sont public) et l’opportunité politique ont mené au accessibles au plus grand nombre d’utilisateurs lancement, aux États-Unis, en Grande- possible, et réutilisables pour des usages les Bretagne et ailleurs en Europe notamment, plus variés. d’initiatives majeures d’ouverture et de réutilisation des données publiques. Données libres de droits : les données ne sont pas soumises au droit d’auteur, à brevet, au droit des marques, ou au secret commercial. FJ Q+,+(R9*.(!M!.*.+.,+.?&(! Formats exploitables : les données sont %$#,%&(A!27.(!5<,-#0&! structurées pour permettre le traitement automatisé, et disponibles sous une forme S55-,%&!! pratique et modifiable. L’ouverture des données s’est effectuée aux États-Unis du bas vers le haut. Les villes Formats non-propriétaires : les données de Washington, New York, San Francisco, ont sont accessibles dans un format sur lequel entrepris de recenser les collections de données aucune entité n’a de contrôle exclusif. qu’elles envisagent de mettre à disposition, Conditions non discriminatoires : les puis d’ouvrir des « data stores » pour mettre données sont accessibles à quiconque sans ces jeux de données à la disposition du public aucune obligation préalable ni inscription, et des entreprises, des développeurs et des sans discrimination entre les domaines citoyens.28 d’application. Les données sont notamment Ces démarches de « libération » des disponibles aussi bien pour des réutilisations données publiques sont très souvent commerciales que personnelles. accompagnées de concours d’applications pour Paternité : la licence peut exiger, comme encourager la réutilisation des données rendues condition pour la redistribution et la publiques. réutilisation des données, d’identifier Ce mouvement, amorcé par les grandes clairement les créateurs de l’œuvre ou les métropoles, fait désormais l’objet d’une contributeurs initiaux. Si cette condition est politique au niveau fédéral. imposée, elle ne doit pas être indûment complexe à remplir, et notamment la liste des L-M "/!0(*4-,-$/4-&!%#$!%&(#$!(7#0;#!%/$! contributeurs à citer doit être clairement ,#$!;0/%#$!7(40&)&,#$=! indiquée. L’année 2005 est marquée par une rupture Distribution de la licence : les droits majeure : l’ouverture par Google des attachés aux données s’appliquent à tous ceux « interfaces de programmation » (API) du à qui elles sont distribuées. service Google Maps donne lieu à une Non-transitivité de la licence : la licence ne floraison d’applications et de mashups29. Un peut exiger que toute donnée distribuée grand nombre de ces applications consistent à conjointement avec une donnée sous licence positionner sur les cartes Google Maps des libre soit aussi elle-même sous licence libre, ce données d’origine publique. qui serait un frein à la réutilisation de ces Ainsi, à Chicago en 2005, Adrian données. Holovaty, journaliste et programmeur30 lance Droit d’extraction : si les données sont ChicagoCrime.org, un site qui renseigne sur extraites d’un jeu de données, les utilisateurs une carte les données relatives aux crimes et de l’extrait doivent bénéficier des mêmes délits commis dans la ville et récupérées droits que ceux qui sont accordés au jeu de auprès de la municipalité31. Suite au succès de données dans son ensemble. l’application, et grâce à un don d’un million de dollars de la Knight Foundation32 en 2007, il Bien que ce modèle des données ouvertes puisse s’appliquer à tous types de données, qu’elles soient produites par le secteur public 28 Benhamou, B., 2010, « Les concours d’applications ou non, l’importance démocratique de l’accès mobiles dans le monde », Délégation aux Usages de aux informations publiques a conduit à l’Internet, 21 octobre 2010. 29 focaliser le débat sur l’Open Government Data, Applications web combinant différentes sources au sein d’une seule plateforme, l’une des facettes du design ou la réutilisation des données publiques. collaboratif sur le web. 30 Auteur de la librairie de développement en langage Les évolutions technologiques, le cadre Python à succès, Django. réglementaire (notamment les lois sur le droit à 31 Entretien le 18 octobre 2010 avec Sylvain Parasie, l’information et la Directive européenne sur la LATTS, Ecole des Ponts ParisTech. 32 réutilisation des informations du secteur Organisation caritative dédiée aux avancées dans le domaine du journalisme. Ce type d’acteurs dotés en fonds26
  26. 26. développe une version commerciale du site, de sa cérémonie d’investiture, le PrésidentEveryBlock33 (pour « chaque pâté de Obama signe son premier acte politique : unmaison »), qui recense et agrège un grand mémorandum à destination des ministres etnombre de données potentiellement utiles pour directeurs d’agences intitulé « Transparencyles citoyens dans un plusieurs municipalités. and Open Government » (Transparence et Gouvernement Ouvert). Il assigne aux services Des services du même type, conçus à partir fédéraux américains trois objectifs :de données publiques des municipalités voient transparence, implication des citoyens,le jour dans les domaines de l’éducation, de et collaboration.l’environnement ou de la santé. Adrian Fenty, le maire de Washington,L--M F*22W$!7(%-/4-.*#!%#$!2&2&*0$! D.C. à l’époque, recommande Vivek Kundra%3/)),-2/4-&$=! au Président Obama : le 5 mars 2009, ce Vivek Kundra, responsable des systèmes dernier est nommé Chief Information Officerd’information du District de Columbia du gouvernement fédéral américain (Directeur(autorité administrative de la ville de des Systèmes d’Information), un posteWashington), s’empare en 2008 du sujet. Il nouveau et symbolique créé sur mesure, aveclance Apps for Democracy, un concours de pour mission de mettre en place lesdéveloppement d’applications de services technologies pour concrétiser la visionpublics, ouvert à tous les développeurs, libres politique du chef de l’exécutif.de s’approprier des jeux de données mis à leurdisposition pour l’occasion34. L-1M "#!)&04/-,!C(%(0/,!D/4/=;&1!! Contre toute attente, le concours Dès le 11 mars, Vivek Kundra demanded’application, doté par la Mairie d’un prix de aux DSI de toutes les agences fédérales50 000 dollars, connaît un succès considérable. américaines de désigner des jeux de donnéesAlors qu’ils espéraient une dizaine de (« datasets ») susceptibles d’être mis en ligne.réponses, les organisateurs reçurent 47 dossiers Se basant sur son expérience à Washington, ilen 30 jours seulement. Le coût estimé du se concentre sur les données brutes. Data.govtravail de conception et de programmation sera un point focal faisant autorité pourainsi mis à disposition des habitants de diffuser les données publiques brutes, sous desWashington a été évalué à plus de formats réexploitables.2 600 000 dollars, soit un retour sur Son équipe développe une première versioninvestissement de 5 100 % et un effet de levier beta du site en trois mois, grâce à l’utilisationde 52 pour 1. de techniques de développement dites Apps for Democracy fait école : les « agiles » qui découpent la réalisation duconcours d’applications essaiment au sein des produit en cycles rapides (de vingt-quatregrandes métropoles américaines (notamment heures à quelques jours).New York, San Francisco, et Vancouver au Cette méthodologie aboutit à un processusCanada)35. En 2010, la Banque Mondiale elle- de développement rapide et itératif, qui assuremême lance son concours (Apps for une rapidité de développement et la possibilitéDevelopment), qui reçoit plus d’une centaine d’intégrer continuellement les évolutions desde contributions. besoins qui apparaissent très fréquemment dans le cadre de projets de développementL---M "#!Q!;&*1#0#7#4!&*1#04!S!%*!X0($-%#4! logiciel : « commencer petit à petit, réfléchirK+/7/! vite, faire un premier jet, le construire de façon Le candidat Barack Obama avait fait du incrémentale, prendre du recul. Trouver un« Gouvernement ouvert » un des axes de son moyen pour avancer »36.programme. Le 21 janvier 2009, au lendemain Le site est mis en ligne le 21 mai 2009, 120 jours seulement après la signature du Mémorandum par le Président avec seulementet organisés pour soutenir des programmes d’action ciblés,reste rare en France mais joue un rôle important dans le 47 ensembles de données. Le portail connaîtdébat social aux États-Unis. dans les mois suivants une évolution très33 EveryBlock.com est désormais une filiale de MSNBC.http://www.everyblock.com/34 Lakhani, R., Austin, R. and Yi, Y. Data.gov Case Study.Harvard Business School.http://www.data.gov/documents/hbs_datagov_case_study.pdf35 Bernard Benhamou. 2010. « Les Concours 36d’Applications Mobiles dans le Monde », note de la Lakhani, R., Austin, R. and Yi, Y. Data.gov Case Study.Délégation aux Usages de l’Internet. Harvard Business School (voir plus haut). 27

×