Data transparence pont

4 365 vues

Publié le

Publié dans : Business
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
4 365
Sur SlideShare
0
Issues des intégrations
0
Intégrations
4
Actions
Partages
0
Téléchargements
194
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Data transparence pont

  1. 1. Ecole des Ponts ParisTech Rapport à la Délégation aux Usages d’InternetPour  une  politique  ambitieuse  desdonnées  publiquesMai 2011 Ouvrir et réutiliser les données publiques pour l’innovation et la transparence
  2. 2. École des Ponts ParisTech. 2011. Pour une politique ambitieuse des donnéespubliques. Ouvrir et réutiliser les données publiques pour l’innovation et latransparence. Rapport à la Délégation aux usages de l’Internet, 18 mai 2011.
  3. 3. Ecole des Ponts ParisTech Rapport à la Délégation aux Usages de l’InternetPour une politique ambitieuse des données publiques Ouvrir et réutiliser les données publiques pour l’innovation et la transparence Mai 2011
  4. 4. École des Ponts ParisTech. 2011. Pour une politique ambitieuse des donnéespubliques. Ouvrir et réutiliser les données publiques pour l’innovation et latransparence. Rapport à la Délégation aux usages de l’Internet, 18 mai 2011. Vous pouvez contacter les auteurs de ce rapport à l’adresse suivante : rapport.opendata.2011@gmail.comIllustration de couverture : data-visualisation des émissions de gaz à effet deserre par habitant dans les grands pays industrialisés et les BRIC, illustrantl’importance de l’Open Data pour le développement durable.Crédit : visualisation par Romain Lacombe et Sylvain Zimmer/Joshfire, àpartir du code source de l’application WebGL Globe développée par l’équipeGoogle Data Arts. Données World Bank Human Development Indextéléchargées depuis le site Google Public Data Explorer. Applicationdisponible en ligne : http://co2webgl.appspot.com
  5. 5. À propos de ce rapport La réutilisation des données publiques est Benghozi et Laurent Gille, ont acceptéun enjeu majeur de l’action publique à l’ère d’encadrer le travail de ce groupe.numérique. À la croisée des usages innovants M. Benghozi est Directeur de recherched’Internet et des modes de gouvernance CNRS, Directeur du Pôle de Recherche enouverte les plus récents, il ouvre le champ à de Économie et Gestion et professeur d’économienouveaux domaines de l’action de l’État. à l’École Polytechnique (titulaire de la Chaire Ce rapport présente une étude sur la Orange Innovation et Régulation des Servicesréutilisation des données publiques, menée Numériques), et responsable du pôlepour la Délégation aux usages de l’Internet du Innovation du Master Innovation et RégulationMinistère de l’Enseignement supérieur et de la de l’Économie Numérique de TélécomRecherche dans le cadre du Master d’Action ParisTech. M. Laurent Gille, enseignant-Publique de l’École des Ponts ParisTech. chercheur au Département de Sciences économiques et sociales de Télécom Il met en perspective la problématique et ParisTech, est responsable du parcoursles enjeux de l’Open Data, propose un état des Industries de Réseaux du Master Innovation etlieux de la réutilisation des données publiques Régulation de l’Économie Numérique.en France, et dessine trois scénarios prospectifspour l’évolution future de ce mouvement. Elle Les conclusions de l’étude ont été rédigéesprésente seize propositions pour une politique de novembre à janvier 2011, et présentées aunationale ambitieuse d’ouverture et de public le 20 janvier 2011 au Ministère de laréutilisation des données publiques. Recherche et de l’Enseignement supérieur. Quatre élèves de l’École des Ponts Ce rapport a été finalisé par RomainParisTech, Pierre-Henri Bertin, Romain Lacombe entre mars et début mai 2011. Il neLacombe, François Vauglin et Alice fait qu’évoquer les développements les plusVieillefosse ont mené cette analyse de récents, et présente une synthèse desseptembre 2010 à janvier 2011, en rencontrant évolutions qui ont eu lieu au printemps 2011les acteurs clés de la réutilisation des données en France, notamment au niveau national.publiques, en prenant part à des colloques Les recommandations et propositionsinternationaux, et en s’appuyant sur la exprimées ne reflètent que les conclusions debibliographie existante. l’analyse menée par les membres du groupe Deux personnalités académiques expertes d’étude, et n’engagent en aucune manière leursde l’économie numérique et de ses nouveaux institutions, employeurs ou corps respectifs.modes de gouvernance, MM. Pierre-Jean 1
  6. 6. Remerciements Nous tenons à remercier M. Bernard Nous souhaitons également remercierBenhamou, Délégué aux Usages de l’Internet, l’équipe du Mastère d’Action Publique depour sa disponibilité, la confiance qu’il nous a l’École des Ponts ParisTech pour l’opportunitétémoignée, et ses conseils avisés et qu’elle nous a accordée : le directeurconstructifs. Nous tenons aussi à remercier Dominique Schwartz, le directeur adjointpour leur aide l’ensemble des équipes de la Vincent Spenlehauer et la secrétaire SylvieDélégation. Berte. Nous remercions également M. Pierre-Jean Nos remerciements s’adressent enfin àBenghozi, Directeur de recherche au CNRS et l’ensemble des interlocuteurs qui nous ontprofesseur d’économie à l’École reçus ou nous ont fait part de leurs réflexionsPolytechnique, et M. Laurent Gille, sur le sujet des données publiques, ainsi qu’àenseignant-chercheur en sciences économiques toutes celles qui ont répondu à nos nombreuseset sociales à Télécom ParisTech. Leurs questions.conseils pertinents et le temps qu’ils nous ont Toutes les erreurs ou omissions quiconsacré, tout au long de notre étude, nous ont subsisteraient dans ce document ne sont le faitété très précieux. que de ses auteurs. 3
  7. 7. Résumé analytique Les évolutions technologiques récentes ont Une évolution du cadre législatif :placé le sujet de la réutilisation des données au l’Union Européenne a adopté deux directivescœur de l’action publique. en la matière, la directive « Informations du secteur public » (PSI) en 2003 et la directive L’administration collecte et produit un INSPIRE en 2008. Une consultation publiquechamp très vaste de données, depuis les récente sur la directive PSI a notamment portébudgets des institutions publiques jusqu’aux sur l’opportunité de réviser son champmesures de la qualité de l’air que nous dapplication, les redevances et licencesrespirons, en passant par des statistiques relatives aux données, ainsi que les formatsprécises sur notre économie, notre société et électroniques utilisés.nos territoires. L’émergence de la notion politique de Ouvrir l’accès le plus large aux « Gouvernement Ouvert » : les politiques deinformations publiques, c’est tout d’abord diffusion des données publiques ont fortementaméliorer la transparence de l’État et de ses évolué dans les pays anglo-saxons du fait deinstitutions, éclairer le débat démocratique, et l’émergence de la notion d’Open Government,rapprocher la puissance publique des citoyens. thème de campagne du Président Barack Favoriser l’ouverture et la réutilisation de Obama. Les États-Unis et la Grande Bretagneces données (« l’Open Data »), c’est permettre ont créé des portails de données publiquesà la communauté des développeurs et des réutilisables, data.gov et data.gov.uk. Enentrepreneurs d’inventer de nouveaux usages. France, la mission Etalab vient d’être créée,C’est donc encourager l’innovation, et sous l’autorité du Premier ministre Françoiscontribuer au développement des secteurs Fillon, pour coordonner les administrations enstratégiques d’avenir, de l’économie matière de données publiques et mettre ennumérique au développement durable. place la future plateforme data.gouv.fr. L’État doit s’approprier pleinement cette Des initiatives citoyennes en faveur deopportunité majeure. Il lui faut prendre le l’Open Data : une série d’initiatives récentes,virage de cette nouvelle dimension des issues de la société civile et des communautéspolitiques publiques, pour la mettre au service de développeurs, s’efforcent de promouvoir lesde l’ensemble des acteurs du pays. concepts de l’Open Data, avec le soutien d’associations et de fondations comme laUne problématique au croisement des Sunlight Foundation aux États Unis, l’Openévolutions technologiques, politiques et Knowledge Foundation (OKFN) en Grandeéconomiques récentes. Bretagne, et la FING, LiberTIC et Regards L’ouverture et la réutilisation des données Citoyens en France.publiques constituent désormais une attente La double rupture du Web 2.0 et desévidente de la société civile. Cette technologies mobiles : les innovations deproblématique a émergé récemment au service rendues possibles par les technologiescroisement de plusieurs évolutions profondes. 2.0 (interfaces dynamiques, cartographie en Une prise de conscience de la valeur ligne, ouverture des API) ont amené à laéconomique de la réutilisation des données : généralisation du remix et du phénomène deschaque année dans lUnion Européenne, la mashups de données. La nouvelle générationréutilisation de données issues du secteur d’applications géolocalisées sur smartphonespublic générerait un chiffre daffaires de plus repose pour une part importante sur desde 27 milliards deuros. Pour Neelie Kroes, données géographiques. Ces rupturesvice-présidente de la Commission européenne technologiques ont révélé le besoin croissantchargée de la stratégie numérique, « une de pouvoir réutiliser des données publiques.grande partie de ces informations, en Europe, Toutes ces évolutions récentes confèrentsont sous-exploitées. Nous devons examiner une actualité nouvelle à la problématique de lalopportunité de modifier les règles de lUnion réutilisation des données publiques.en matière de réutilisation, pour libérerpleinement leur potentiel économique ». 5
  8. 8. Une opportunité majeure pour l’État et Une mise en œuvre complexe qui pourrait être l’administration simplifiée L’ouverture des données publiques permet Le cadre juridique est établi pour la à des entrepreneurs, des chercheurs, des majorité des données publiques, mais les types développeurs d’accéder aux données collectées de licences et de contrats se multiplient. Le dans le cadre du fonctionnement des statut des données issues d’organismes administrations. parapublics reste à préciser. L’interopérabilité technique et juridique est cruciale : il convient En les réutilisant, ils inventent de nouveaux de clarifier les formats et les licences usages et peuvent créer de nouvelles acceptables dans une optique d’encouragement applications utiles aux citoyens. Cette à l’ouverture et à la réutilisation. coproduction de services au public peut constituer la base d’une nouvelle relation La gratuité pour la réutilisation des numérique de l’administration à l’usager, et données à titre commercial favorise d’un fonctionnement plus efficace de la l’innovation et les nouveaux usages. Nous puissance publique. préconisons donc de la généraliser le plus possible, et d’éviter à tout prix la L’ouverture des données publiques est de multiplication et le maintien de redevances plus un outil puissant d’amélioration de la excessives, qui pourrait conduire à des transparence de l’État. En donnant à tous les incohérences et freiner la réutilisation. citoyens qui le souhaitent accès aux détails du fonctionnement des institutions publiques, Des risques surmontables cette ouverture nourrit et éclaire le débat démocratique. Elle peut contribuer à fonder les Esquissées dans la loi 1978 sur l’accès aux choix politiques sur des analyses éclairées et documents administratifs, consacrées par deux ancrées dans le réel. directives européennes, l’ouverture et la réutilisation des données publiques s’inscrivent Enfin, un accès plus large aux données dans une évolution durable de nos sociétés. publiques peut contribuer à renforcer la confiance des consommateurs, et donc la Elles induisent une transformation de la stabilité de notre économie. culture et du mode de fonctionnement des administrations. Des freins au changement Un outil stratégique pour notre économie subsistent, et des risques peuvent émerger. Rien n’indique cependant qu’ils ne puissent Des conditions de réutilisation plus libres être surmontés, surtout si l’État s’engage dans encourageraient l’innovation et pourraient une collaboration rapprochée avec la contribuer au développement de l’économie communauté des réutilisateurs. numérique : les nouveaux services et applications mobiles, qui en bénéficieraient Trois axes stratégiques pour favoriser la particulièrement, connaissent actuellement une réutilisation des données publiques très forte croissance. L’économie numérique est un facteur clé de croissance économique et Nous proposons les trois axes stratégiques de création d’emplois en France. suivants pour favoriser la réutilisation des données publiques et permettre à la société L’accès aux données publiques offre de d’en retirer l’ensemble des bénéfices attendus. plus les prémisses d’une « infrastructure informationnelle », qui pourrait faciliter le Simplifier pour accélérer : réduire les développement durable en permettant aux efforts nécessaires d’une part à la diffusion des consommateurs de faire des choix mieux données par les acteurs publics, et d’autre part informés. à leur réutilisation, afin d’accélérer le développement de services utiles à partir des Enfin, la réutilisation des données données publiques. publiques constitue un élément de soutien aux objectifs stratégiques d’investissement Faciliter l’expérimentation : adapter les d’avenir pour l’économie française, de la conditions de réutilisation des données société numérique aux villes de demain, aux publiques pour faciliter l’expérimentation par transports intelligents, en passant par les citoyens, les associations et la communauté l’encouragement à la recherche scientifique et des développeurs et des entrepreneurs. à l’innovation. Favoriser l’émergence d’un écosystème : favoriser l’émergence d’un écosystème de producteurs et de réutilisateurs de données6
  9. 9. publiques en France, autour de la mission • Permettre l’enrichissement collectif desEtalab et du futur portail data.gouv.fr. jeux de données.Seize propositions pour une politique nationale 6. Impliquer des acteurs publics pilotes dansambitieuse des données publiques les projets de recherche sur le Web sémantique. Ce rapport formule seize propositions,articulées selon les trois axes stratégiquesprécédents. Elles sont présentées de manière 7. Rendre la réutilisation des donnéesdétaillée au chapitre 8, et visent à proposer une gratuite pour toute réutilisation à titrefeuille de route claire pour mettre en place une personnel.politique ambitieuse des données publiques. 8. Encadrer strictement les cas dans lesquels1. Formaliser les bonnes pratiques de une redevance est légitime, et charger lesdiffusion des données publiques attendues producteurs de données d’établir l’absoluepar la communauté des réutilisateurs : nécessité de toute tarification : • Expliciter l’effort minimal attendu des • Dépasser une valorisation purement différents acteurs publics. commerciale des données publiques et • Assurer la formation des agents et leur encourager leur réutilisation la plus accès à des guides clairs et explicatifs. large. • Simplifier les formats de diffusion. • Généraliser la réutilisation libre et gratuite la plus large possible. • Restreindre la tarification à coûts2. Mettre en cohérence les conditions légales moyens aux marchés matures.de réutilisation des données issues desources différentes : • Établir une « licence données ouvertes » 9. Conditionner toute redevance pour pour réutilisation gratuite qui réutilisation de données à valeur ajoutée à la s’appliquerait le plus largement possible. mise à disposition gratuite des données • Encourager un marquage graphique des brutes qui les sous-tendent. droits de réutilisation. 10. Explorer des conditions alternatives de3. Encourager l’utilisation de formats réutilisation pour laisser carte blanche àfacilement réexploitables, qui respectent les l’expérimentation :normes d’interopérabilité et de « lisibilité • Privilégier les partenariats avec lesmachine » : nouveaux acteurs de l’innovation. • Privilégier les formats ouverts respectant • Explorer les licences gratuites avec les normes d’interopérabilité. partage des conditions initiales à • Communiquer auprès des agents sur l’identique (share alike). l’importance des formats réexploitables. • Explorer la rémunération par l’accès aux • Maintenir une liste de formats données d’usage. correspondants à ces critères. • Explorer la rémunération par le service client. • Faciliter l’expérimentation avec les Web4. Faire en sorte que chaque contrat public Services.clarifie à l’avenir le financement del’ouverture et les droits de réutilisation liésaux données produites dans son cadre : 11. Impliquer la communauté des • Clarifier le financement de louverture et réutilisateurs dans les initiatives de mise à les droits de réutilisation de données disposition de données publiques : dans les contrats publics. • Créer un point d’accès unique centralisé • Établir des bonnes pratiques et des et mis à jour automatiquement. clauses types. • Développer une offre grand public qui • Élargir le périmètre des données mette en valeur des applications utiles. réutilisables aux ressources essentielles. • Investir dans l’accompagnement de la communauté. • Démultiplier le service aux utilisateurs.5. Faciliter l’enrichissement des données et • Organiser des séminaires ou ateliers del’intégration de corrections éventuelles par travail ponctuels sur les sujetsla communauté : techniques d’intérêt pour la • Faciliter l’intégration des métadonnées. communauté. 7
  10. 10. 12. Mettre en place des assises des données • Illustrer la réutilisation des données publiques et animer la communauté des publiques par le développement de réutilisateurs : services aux citoyens. • Regrouper l’ensemble de l’écosystème • Faire des données et de leur réutilisation pour des assises des données publiques. un outil d’éclairage du débat public. • Animer la communauté des 15. Développer une stratégie nationale à réutilisateurs. partir du rôle de coordination des 13. Encourager le développement institutions publiques de la mission Etalab : d’applications à partir des données • Mutualiser des solutions de mise en publiques : ligne pour les administrations et les • Organiser un concours national de collectivités. développement d’applications. • Développer une stratégie nationale pour • Prendre en compte la réutilisation des les données publiques. données publiques dans les appels à projets de R&D numérique. 16. Élargir le champ de l’Open Data : • Pérenniser l’offre d’applications créées à • Élargir le champ de la libre réutilisation partir des données publiques. des données publiques. • Explorer l’application de l’Open Data 14. Intégrer au débat démocratique les aux entreprises privées. données publiques et leur réutilisation : • Développer une stratégie européenne et • Communiquer aux administrations internationale. l’importance des données pour mettre en lumière leurs métiers.8
  11. 11. Table des matièresRésumé analytique __________________________________________________________________ 5Table des matières___________________________________________________________________ 9Introduction_______________________________________________________________________ 11Partie 1. « Open Data » : Contexte et enjeux d’une question sociétale _________________________ 15Chapitre I. Données publiques : émergence d’une question sociétale __________________________ 17 1. La donnée au cœur des nouveaux usages ____________________________________________ 17 2. Les données publiques et leur réutilisation ___________________________________________ 19Chapitre II. La libre réutilisation des données publiques à l’international _______________________ 23 1. Le mouvement Open Data _______________________________________________________ 23 2. États-Unis : initiatives locales, puis démarche fédérale _________________________________ 24 3. Grande Bretagne : une impulsion transpartisane du gouvernement ________________________ 26 4. Situations contrastées en Europe __________________________________________________ 28Chapitre III. Les enjeux de la réutilisation des données publiques_____________________________ 31 1. Démocratie, transparence et débat public ____________________________________________ 31 2. Modernisation de l’État__________________________________________________________ 32 3. Innovation et soutien à l’économie numérique ________________________________________ 33 4. Des données stratégiques pour l’économie___________________________________________ 36 5. Un nouveau mode d’action publique _______________________________________________ 40Partie 2. État des lieux de la réutilisation des données publiques en France _____________________ 45Chapitre IV. Le cadre de la réutilisation des données publiques en France ______________________ 47 1. Le cadre juridique pose en principe la liberté de réutilisation ____________________________ 47 2. Les acteurs de la réutilisation de données publiques ___________________________________ 51 9
  12. 12. Chapitre V. Premières expériences d’ouverture des données publiques en France ________________ 55 1. La réutilisation des données dans les collectivités territoriales ___________________________ 55 2. L’ouverture des données au niveau national : trois études de cas _________________________ 60 3. La mise en place d’une politique nationale des données publiques ________________________ 63 Partie 3. Comment favoriser la réutilisation des données publiques ? __________________________ 67 Chapitre VI. Abaisser les barrières à la réutilisation _______________________________________ 69 1. Répondre aux contraintes techniques _______________________________________________ 69 2. Gérer la complexité juridique _____________________________________________________ 70 3. Anticiper l’impact organisationnel _________________________________________________ 72 4. Établir des modèles économiques propices à l’innovation _______________________________ 73 Chapitre VII. Prospective : Trois scénarios pour l’avenir ___________________________________ 81 1. « Inertie » : Développement de l’offre de données publiques à son rythme historique _________ 81 2. « Capture » : Des monopoles informationnels se substituent à la puissance publique__________ 83 3. « Symbiose » : Catalyser le développement d’un écosystème ____________________________ 85 Chapitre VIII. Seize propositions pour une politique ambitieuse des données publiques ___________ 89 1. Simplifier pour accélérer_________________________________________________________ 89 2. Faciliter l’expérimentation pour encourager l’innovation _______________________________ 92 3. Soutenir l’émergence d’un écosystème _____________________________________________ 94 Bibliographie______________________________________________________________________ 99 Textes règlementaires ______________________________________________________________ 103 Interlocuteurs ____________________________________________________________________ 105 Liens et références ________________________________________________________________ 10710
  13. 13. Introduction « Si l’on partage des données sur le Web, des données publiques, des données scientifiques, des données citoyennes, quelles qu’elles soient, d’autres que nous sauront en tirer des créations merveilleuses que nous n’aurions jamais imaginées. » Tim Berners-Lee, Inventeur du Web Hal Varian, Économiste en Chef chez Les applications en question vont desGoogle, le précise : « Je répète sans cesse que services les plus simples aux plus complexes,la profession sexy dans les dix prochaines de l’expérimentation au produit professionnel :années, ce sera statisticien. Et ce n’est pas de des étudiants développent une applicationl’humour.1 » mobile, des citoyens quantifient l’action de leurs députés, des journalistes créent de On peut émettre des réserves quant au nouvelles infographies plus instructives, unepouvoir de séduction d’un tableur entreprise calcule des itinéraires de transportsinformatique ; il reste que l’attrait de la science publics au service des internautes.des données s’est considérablement accru cesdernières années. Ses algorithmes ont gagné en Les développements technologiquespuissance et ses applications jouent un rôle récents ont largement accéléré lecentral dans la société de l’information. développement de ce phénomène, et les attentes d’une partie du public sont aujourd’hui À mesure que nos outils informatiques très fortes.deviennent plus mobiles, leurs applicationsgagnent en importance dans nos vies Une problématique nouvelle et complexe pourquotidiennes. En recoupant des données le secteur publicnumériques diverses, en les adaptant à notreusage à travers une ergonomie simple, les La réutilisation des données publiques offresmartphones et les tablettes tactiles simplifient des possibilités nouvelles à la sphère publique.bon nombre des tâches de la vie quotidienne et Elle appelle une évolution de la culture et duprofessionnelle. mode de fonctionnement des administrations. Elle soulève surtout de nombreuses questions.La réutilisation des données publiques Quelles opportunités ? Quels risques ? Un mouvement de réutilisation des données Quelles pistes pour en faire profiter au mieuxpubliques2 a vu le jour depuis plusieurs années. la société ? Quels enseignements tirer deConcrètement, il s’agit pour des développeurs l’expérience d’autres pays en la matière ?informatiques ou tout autre citoyen d’accéder à Quel(s) public(s) cette politique vise-t-elle,des données produites initialement dans le avec quels objectifs et quels moyens ? Quellescadre du fonctionnement de l’État, et de leur limites et quelles garanties donner au droit à lainventer de nouveaux usages. Tous types réutilisation ?d’objets numériques sont concernés : destableaux chiffrés, des mesures numériques, des Une opportunité importante pour lebases de données, des cartes ou encore des développement du numériquejeux de données géolocalisées. Grâce aux réseaux mobiles à haut débit, la connectivité devient ubiquitaire. Les nouvelles plateformes mobiles permettent désormais d’accéder en direct à des services ou des1 Steve Lohr. 5 août 2009. « For Today’s Graduate, One informations dans le contexte dans lequelWord: Statistics ». The New York Times. ceux-ci sont le plus utiles. Ces évolutions onthttp://www.nytimes.com/2009/08/06/technology/06stats.html donné naissance à une industrie nouvelle et en2 À l’exclusion bien sûr des données personnelles et des forte croissance, celle des applicationsdonnées confidentielles (loi de 1978 sur la liberté d’accés mobiles.aux documents administratifs, modifiée par Ordonnancen°2005-650 du 6 juin 2005). 11
  14. 14. Des acteurs internationaux du Web ont su La réutilisation des données publiques en prendre des positions fortes sur ce marché. La France France possède des atouts pour réussir dans ce Une deuxième partie fait ensuite le point secteur. Faciliter l’accès aux données sur la réutilisation des données publiques en publiques en vue d’une réutilisation France aujourd’hui (chapitre IV). commerciale pourrait favoriser la création d’activités économiques novatrices. Le chapitre suivant vise à fournir aux agents publics des pistes et références à partir Un débat passionné desquelles construire leur réflexion. Nous cherchons en particulier à comprendre le Opportunité de développement économique contexte de cette politique, son cadre juridique et avancée en matière de transparence d’une et technique, et les acteurs qu’elle met en jeu part, érosion potentielle de la capacité d’action (chapitre V). de l’État et de ses ressources propres de l’autre : la tarification de la réutilisation des Comment favoriser la réutilisation des données publiques est l’objet d’âpres débats, données publiques ? quand elle ne donne pas lieu à des contentieux. Le mouvement de réutilisation de données L’ouverture des données elle-même peut étant durablement amorcé, il convient de faire peur, quand ce n’est pas s’interroger sur les difficultés auxquelles il l’incompréhension quant à l’intérêt d’un droit risque de se heurter dans l’administration, les à la réutilisation de données qui interpelle. établissements publics et les collectivités : difficultés d’ordre juridique, organisationnel, Un mouvement engagé sur le long terme technique et financier. Nous abordons la La mise à disposition des données question de la tarification optimale, et des publiques pour leur réutilisation n’est pourtant modèles économiques qui doivent s’appliquent pas un effet de mode : il s’agit d’un droit aux données publiques (chapitre VI). opposable consacré par la loi, basé sur une À partir des dynamiques en présence, nous Directive de 2003 que la Commission avons imaginé trois scénarios futurs pour la Européenne envisage d’étendre et de renforcer. réutilisation des données publiques : l’Inertie, Cette évolution engagée confronte chaque la Capture et la Symbiose. Nous détaillons les administration centrale, chaque collectivité caractéristiques et les implications de chacun locale, chaque établissement public à des de ces futurs possibles (chapitre VII). questions difficiles. Qu’attend-on d’eux exactement, et comment bien faire ? Conclusions et recommandations Le scénario de la Symbiose et du Contexte et enjeux d’un sujet de société développement d’un écosystème présente de Le premier chapitre s’attelle à esquisser un loin le plus d’avantages : travailler à portrait synthétique des grandes évolutions qui l’ouverture des données publiques en ont amené la question des données publiques à collaboration avec la communauté de ceux qui devenir, en l’espace de quelques années, un les réutilisent est une nécessité pragmatique véritable sujet de société. Nous passons plus qu’un choix idéologique. notamment en revue les évolutions Pour que la société puisse tirer l’ensemble technologiques récentes qui l’ont portée sur le des bénéfices potentiels de la réutilisation des devant de la scène (chapitre 1). données publiques, il convient cependant Le second chapitre dresse un état des lieux d’encourager son développement au rythme le de la réutilisation des données publiques en plus rapide. 2011 dans le monde, et un historique des Nous proposons enfin (chapitre 8) seize évolutions récentes dans les pays occidentaux propositions groupées en trois axes (chapitre 2). stratégiques, visant à établir une feuille de Nous nous attachons ensuite à cerner les route claire vers une politique ambitieuse des bénéfices que l’on peut attendre d’une données publiques. politique de soutien à la réutilisation des Simplifier pour accélérer : réduire les données publiques. Nous évoquons les enjeux efforts nécessaires d’une part à la diffusion des liés à la participation démocratique et à données par les acteurs publics, et d’autre part l’efficacité de l’action publique. Nous à leur réutilisation, afin d’accélérer le explicitons les différents mécanismes à travers développement de services utiles à partir des lesquels la donnée publique peut contribuer au données publiques. développement économique (chapitre 3).12
  15. 15. Faciliter l’expérimentation : adapter les Favoriser l’émergence d’un écosystème :conditions de réutilisation des données favoriser l’émergence d’un écosystème depubliques pour faciliter l’expérimentation par producteurs et de réutilisateurs de donnéesles citoyens, les associations et la communauté publiques en France, autour de la missiondes développeurs et des entrepreneurs. Etalab et du futur portail data.gouv.fr. 13
  16. 16. Partie 1. « Open Data » :Contexte et enjeux d’une question sociétale 15
  17. 17. Chapitre I. Données publiques : émergence d’unequestion sociétale Les évolutions technologiques récentes ont avait pour but de faciliter l’accès et lerendu possible le partage rapide et aisé de tous référencement de documents en symbolisanttypes de données. Elles réactivent, sous un jour leur manipulation sous forme de phrases, liantnouveau, le débat déjà ancien sur l’accès aux verbes intuitifs (lire, afficher, remplacer,documents administratifs, maintenant sous effacer) et métadonnées d’adressage universelforme électronique et bien plus aisément (URL ou Uniform Resource Locator5).diffusables. Bien que basées sur un réseau d’échange de L’Internet a fait apparaître une économie documents, les techniques du Web ontdes données. Les stratégies de croissance des naturellement développé un tropisme de plusacteurs du Web, via l’ouverture de leurs en plus marqué vers les données elles-mêmes.interfaces de programmation (API), ont illustré L’introduction des bases de donnéesle potentiel de la réutilisation des données, et relationnelles dans les outils de développementsuscité des attentes similaires des développeurs a permis la création de sites dynamiques, c’est-vis-à-vis du secteur public. Ils exercent une à-dire dont les pages s’adaptent auxpression pour que les États, en facilitant l’accès circonstances (évolutions de prix, listesà leurs informations, s’insèrent et tiennent leur d’objets changeants, « unes » de journauxrang dans ce « Web des Données ». électroniques mises à jour fréquemment). À partir de 2004, une technique émergente a vu Ces ruptures technologiques ont le jour qui consiste à utiliser les fonctionnalitésaccompagné par ailleurs une prise de de scripting6 présentes dans les navigateursconscience de l’importance des données pour permettre la mise à jour en temps réel deproduites par l’administration et le secteur pages déjà chargées, en allant chercher enpublic. La possibilité novatrice de réutiliser ces tâche de fond des données remises à jour.données sous forme brute, pour leur trouver de Nommée AJAX7 pour JavaScript Asynchronenouveaux usages utiles et instructifs, a abouti à et XML (Asynchronous Javascript And XML),l’émergence de la question des données à partir du langage de scripting JavaScript etpubliques en tant que véritable question du format d’échanges de données XML, cettesociétale. technique à la croisée de différentes technologies Web est reconnaissable derrière1. La donnée au cœur des des applications Web hautement réactives dont les pages ont rarement besoin d’être rafraîchiesnouveaux usages – telles que GMail8, Quora9 ou Facebook10. Internet et les ruptures technologiquesrécentes on fait apparaître une nouvelle« économie des données ». http://www.w3.org/People/Berners-Lee/ 5 World Wide Web Consortium (W3C). 1994. Uniform Resource Locators (URL) : A Syntax for the Expression of(i) Le Web est structuré autour de l’échange de Access Information of Objects on the Network.données. http://www.w3.org/Addressing/URL/url-spec.txt 6 Capacité d’un navigateur à faire tourner dynamiquement Le génie informatique (computer science un programme qui agit en temps réel sur la page affichée.dans le monde anglo-saxon) est défini comme Par exemple, une page qui affiche l’heure repose sur unla manipulation algorithmique de données et de script qui demande au navigateur de mettre à jour l’heure, les minutes et les secondes à mesure qu’elles s’écoulent.leurs structures de représentation. Le Web, Dans le cas d’un service de courrier en ligne, c’est souventavant d’être un phénomène social, est une un script qui réagit au click sur l’intitulé d’un email etarchitecture logicielle3 conçue par un change l’affichage pour détailler le contenu du mail plutôtchercheur britannique en physique des hautes que celui de la boîte de réception. C’est aussi un script qui vérifie automatiquement l’arrivée de nouveaux courriersénergies au CERN, Sir Tim Berners-Lee4. Elle en tâche de fond, et réintègre éventuellement ces nouvelles données dans le corps de la page affichée. 7 Garrett, J.J. 18 février 2005. « Ajax : A New Approach3 World Wide Web Consortium (W3C), 2010, HTTP – To Web Applications ».Hypertext Transfer Protocol Overview – draft 09. http://www.adaptivepath.com/ideas/essays/archives/00038http://www.w3.org/Protocols/ 5.php4 8 World Wide Web Consortium (W3C). Sir Tim Berners- GMail, service de boîte de courrier électronique en ligneLee: Bio. Téléchargée le 10 janvier 2011. de Google, Inc. : http://www.gmail.com 17
  18. 18. Pour supporter cette technologie, de plus en gagne en utilité pour ses utilisateurs, et le plus d’applications en ligne ont développé à la système producteur voit sa position fois deux interfaces : une interface graphique compétitive renforcée par la dépendance classique accessible aux utilisateurs à travers accrue du marché à ses services. En l’essence, leur navigateur, et une interface exclusivement c’est une transaction de marché où l’accès à consacrée aux machines, qui permet justement des données est échangé contre leur diffusion à au moteur de scripting du navigateur de un nouveau public ou dans un nouveau récupérer des données à la volée. C’est cette contexte. interface, qu’on peut se représenter comme un L’exposition d’une interface API est protocole d’échange de données de machine à aujourd’hui une étape presque obligée du machine, qu’on appelle interface de développement d’un nouveau produit en ligne. programmation ou API (sigle anglophone pour La généralisation de ce phénomène est d’une Application Programming Interface). grande importance pour la question des (ii) La donnée, monnaie d’échange et levier données publiques, car elle a permis de prendre d’influence sur le Web. conscience de l’omniprésence des données derrière les services qu’utilisent Les API sont devenues un véritable outil quotidiennement les internautes. stratégique pour les sociétés de services en ligne.11 Par exemple, c’est dans une large En un mot, « l’économie des données » mesure grâce à l’ouverture de leur API12 que s’est construite autour de l’échange et de la Twitter a pu permettre à une communauté de fluidité sur le Web : les données ont souvent développeurs de se créer, et de multiplier les plus de valeur comme outil d’échange et applications permettant d’utiliser le service en d’influence qu’isolées au sein des entrepôts de dehors du site Web principal (notamment dans données des entreprises13. les premiers jours de l’App Store d’Apple durant l’été 2008). Ce grand nombre (iii) Avec le Web 2.0, la donnée devient collective d’applications a servi de « force de vente » virtuelle pour Twitter, et est un des facteurs Un corollaire de la montée en puissance de principaux qui expliquent son succès la donnée est son rôle de liant social sur le populaire. Web. En particulier, avec l’apparition de phénomènes de collaboration de masse tels que Bien documentées et basées sur des Wikipedia, on s’aperçoit que l’échelle standards acceptés (tels que JSON ou XML) d’échanges rendue possible par Internet ouvre pour éviter les problèmes d’interopérabilité, des possibilités insoupçonnées jusqu’alors. ces interfaces s’adressent à des développeurs informaticiens. Selon le degré d’ouverture Des services tels que Delicious (site de (fonction des choix stratégiques de la société) partage de bookmarks, qui agrège les et les conditions de licences (souvent conçues catégories dans lesquelles les utilisateurs pour encourager la réutilisation) consentis à rangent différents liens, et permet ensuite de ces derniers, ils peuvent extraire, trouver des liens par catégorie d’intérêt) ou éventuellement modifier, et transformer les Flickr (qui permet de chercher des données du service Web en question, pour les photographies libres de droits sur un sujet réutiliser, notamment à la construction de particulier, en se basant sur les tags de nouveaux services ou de nouvelles catégorisation produits par l’ensemble des applications. utilisateurs) ont ainsi profité de ce phénomène de folksonomy, la taxonomie par les foules ou L’échange est mutuellement bénéfique : le classification par l’intelligence collective14. nouveau service, consommateur de données, D’autres services tels qu’Amazon ou Netflix ont, eux, profité de la masse 9 Quora, Inc., site de questions et réponses dynamique caractérisé par l’expertise pointue de sa communauté d’utilisateurs, fondé en 2009 et qui a connu une très forte 13 Ed Parsons - Geospatial Technologist for Europe, croissance en 2010 : http://www.quora.com 10 Facebook, Inc., le réseau social dominant qu’on ne Middle East and Africa chez Google, au séminaire présente plus, fondé par Mark Zuckerberg en 2004 et « Innovations et développement du secteur de approchant 600 millions d’utilisateurs début 2011 : l’information géographique » organisé le 5 octobre 2009 à http://www.facebook.com la Grande Arche de la Défense par le Conseil National de 11 Shah S., 28 August 2010, « Cannibalize Business l’Information Géographique (CNIG), l’AFIGÉO et Development by Popularizing your API » : l’Institut des Sciences et des Techniques de l’Équipement http://shaivalshah.com/cannabilize-business-development- pour le Développement (ISTED) by-populariz 14 12 Entretien le 12 novembre 2010 avec Henri Verdier, Tapscott, D. and Williams, A. 2006. Wikinomics : How Président de Cap Digital. Mass Collaboration Changes Everything.18
  19. 19. d’utilisateurs se servant de leurs sites pour en « différentes sources au sein d’une seuleextraire des modèles de préférences des plateforme, (…) l’une des facettes du designconsommateurs, qui leur permettent de faire collaboratif sur le Web17 ». Cette nouvelledes recommandations hautement tendance a connu un tel succès au tournant despersonnalisées selon les goûts de leurs clients. années 2006 à 2008 que le prestigieux Museum of Modern Art de New York y a L’un des enseignements de la nouvelle consacré une exposition phare18.incarnation sociale et collaborative du Web,c’est que la valeur des données n’est pas Au-delà de l’incidence culturelle de ceintrinsèque, mais dérive de leur agrégation, de phénomène19, la réappropriation du local et deleur recoupement, de leur analyse et de la l’espace géographique par le biais du Web etréutilisation qui en est faite. du mobile annonçait l’importance croissante de la donnée informatique géographique, et, au- Le Web a ainsi mis à jour une économie delà, l’émergence du phénomène culturel dudes données, qui joue un rôle de monnaie remix et de la réutilisation des données.d’échange parmi les entreprises d’Internet etles services en ligne. 2. Les données publiques et(iv) Données géographiques et « mash-ups » leur réutilisation L’autre développement technologique qui aconduit à prendre conscience de l’importance La génération des digital natives, qui ades données, c’est la démocratisation de grandi dans l’habitude de la réutilisation, dul’information géographique. remix et de la recombinaison permanente, devait nécessairement s’intéresser aux Google indique par exemple que son informations collectées par l’État.approche est « d’utiliser la géographie pour L’émergence de la réutilisation des donnéesorganiser toute l’information mondiale, qu’elle publiques comme sujet de société, poussée parsoit géographique ou non. C’est un principe les nouveaux usages, a révélé une chaîne ded’organisation qui sera utilisé pour mieux valeur fondée sur ces données qui, lorsqu’ellescomprendre l’information. »15. sont mises à disposition de façon brute et Si les briques technologiques sont réexploitable, permet aux développeurs et auxdisponibles pour utiliser et manipuler la entrepreneurs de créer de nouveaux services.donnée géographique à loisir, ou même pour (i) Les données numériques ont vocation à lal’utiliser pour structurer d’autres données, le diffusion la plus largedéfi qui reste posé est celui de la constitutiond’une véritable infrastructure des données Contrairement aux documents papiers dontgéographiques. Ces données sont aujourd’hui l’impression engendre des coûts variablesaccessibles en nombre et de qualité, mais les conséquents et qui nécessitent des délais derepérer et les réutiliser peut rester obscur et traitement et d’acheminement, les donnéescomplexe16. numériques ont un coût marginal de diffusion nul ou presque20, et sont accessibles quasiment Conséquence récente des évolutions du instantanément.Web, des applications cartographiquespuissantes réservées jusque-là à des experts Le travail éventuel de mise à disposition desont devenues accessibles à tous. Le monde du données numériques est donc un coût fixe : laWeb collaboratif a largement repris à son diffusion la plus large, en distribuant ce coût,compte la possibilité de représenter des est donc le modèle le plus efficace d’un pointdonnées sur des cartes. Grâce à l’ouverture de vue économique.gratuite (dans des limites relativement largesde volume) de son API, Google Maps estdevenu une base de choix pour la création de 17 Google Earth mashups 5 of 14, in « Design and the« mashups », ces applications Web combinant Elastic Mind. » Museum of Modern Art. New York, NY. 2008. http://www.moma.org/interactives/exhibitions/2008/elastic15 Ed Parsons – Ibid. mind/#/98/16 18 Voir l’intervention de Max Craglia, coordonateur « Design and the Elastic Mind. » Museum of Moderntechnique d’Inspire pour la Commission Européenne Art. New York, NY. 2008.(centre commun de recherche) au séminaire « Innovations http://www.moma.org/interactives/exhibitions/2008/elasticet développement du secteur de l’information mind/ 19géographique » organisé le 5 octobre 2009 à la Grande Lessig, L. 2009. Remix : Making art and commerceArche de la Défense par le Conseil National de thrive in the hybrid economy. http://remix.lessig.org/ 20l’Information Géographique (CNIG), l’AFIGÉO et Les volumes qui peuvent être atteints font que le coût del’Institut des Sciences et des Techniques de l’Équipement diffusion n’est en revanche pas négligeable et peut danspour le Développement (ISTED). certains cas devenir important. 19
  20. 20. L’instantanéité de diffusion et l’ubiquité riches et très variées ; certaines ont une forte d’accès offrent de plus des perspectives tout à valeur économique. Le marché de fait nouvelles en terme de périmètre de l’information est estimé en France à diffusion et d’audience potentielle, notamment 3,7 milliards d’euros dont 60 % sont des au regard de la démocratisation de l’Internet. données publiques21. Au niveau européen, ce chiffre représenterait près de 27 milliards (ii) Combiner les données brutes amplifie leur d’euros22 par an. potentiel La valorisation passe par différentes étapes Marqué par les traditions et les habitudes nécessaires pour rendre les données publiques d’un monde de communication par le papier, utilisables ou réutilisables. D’une part l’État diffuse le plus souvent ses informations l’institution productrice doit définir sous forme de « produits finis », tels que des précisément quelles données elle doit diffuser analyses, des pages Web explicatives ou des en ligne et de quelle manière, par un travail rapports écrits – en quelque sorte des données d’analyse et de collecte. S’imposent à ce stade « retravaillées » afin d’être intelligibles par le respect de critères de bon sens comme la tous. À l’inverse, les données brutes qui sous- protection de la vie privée, de la propriété tendent ces études sont rarement mises à intellectuelle des tiers, ou de la sécurité disposition du public, car leur intérêt pour une nationale. réutilisation potentielle est encore très inégalement perçu par les producteurs de D’autre part, pour faciliter la réutilisation, données publiques. l’institution productrice doit s’assurer de fournir une donnée qualifiée et mise à jour. Aujourd’hui, les technologies de Pour cela, il semble important de créer des lots l’information permettent une mise à de données cohérents et de s’assurer de la disposition des données à l’état brut. Loin présence d’une légende et plus généralement d’être un obstacle à leur réutilisation de la présence des métadonnées. ultérieurement à leur mise à disposition par l’administration, leur caractère brut permet au Il faut les mettre à disposition via un contraire de les recombiner plus facilement, ce support adapté mais en réalisant un catalogage qui amplifie leur potentiel et permet la création précis : il ne suffit pas de mettre à disposition de services impossibles à réaliser sans ces des données, encore faut-il qu’elles puissent croisements. être découvertes et facilement accessibles grâce à un portail de données publiques ou un Par exemple, des mesures locales de bruit moteur de recherche. permettent de mettre en perspective la corrélation positive mesurée entre les dépenses Enfin, les données publiques numériques mises énergétiques d’un ménage et son taux à disposition peuvent être réutilisées par la d’équipement en doubles vitrages, paradoxale communauté des développeurs et des au premier abord. Dans le cadre d’un concours entrepreneurs, qui peuvent leur inventer de organisé par la ville de Washington, D.C., des nouveaux usages. Ces données représentent données sur les vols, croisées avec les tracés aussi un outil interne au service des des pistes cyclables, ont aussi permis de créer administrations, qui peut leur permettre des une carte des zones à éviter pour les cyclistes. échanges d’information plus fluides et efficaces. Parce qu’elle favorise ces croisements et ces combinaisons fertiles sur des sujets (iv) La visualisation de données joue un rôle recoupant des champs extrêmement vastes de structurant l’économie, de la société et de Les données géographiques ont un rôle l’environnement, la mise à disposition des structurant dans la chaîne de valeur. Elles données brutes de l’État et des collectivités est rendent possible la spatialisation et la un terreau fertile pour des réutilisateurs, qui visualisation sur carte d’autres jeux de peuvent inventer de nouveaux usages à ces données, notamment géolocalisées. Selon données. (iii) Les données publiques et leur réutilisation sont à l’origine d’une chaîne de valeur 21 http://www.rgpp.modernisation.gouv.fr/index.php?id=51 &tx_ttnews[tt_news]=531&tx_ttnews[backPid]=11&cHas L’État et le secteur public au sens large, h=89b9c6970f dans le cadre de leurs opérations, touchent à 22 Dekkers, M. et al., 2006, « MEPSIR, Measuring Public l’ensemble des secteurs de notre économie, Sector Information Resources, Final Report of Study on notre société et notre environnement. Les Exploitation of public sector information », données qu’il collecte sont donc naturellement http://ec.europa.eu/information_society/policy/psi/docs/pdf s/mepsir/final_report.pdf20
  21. 21. l’Association Française pour l’Information Le processus de recherche, d’analyse puisGéographique (AFIGÉO)23, 80 % des de représentation graphique synthétique desinformations qui sont utilisées possèdent une données sous forme interactive, quidimension géographique. Cela leur confère s’apparente à du journalisme et qu’on appelledonc une importance particulière à la fois d’un parfois « datajournalism » ou journalisme depoint de vue technique, mais aussi en tant données, a participé à créer une demande pourqu’outil de recoupement et de recombinaison plus de transparence de la part desde données. gouvernements, et à l’émergence du sujet de la réutilisation des données publiques. Ainsi, dès 1854, John Snow détermina lescauses de la propagation du choléra grâce à lavisualisation de données sur une carte. À cetteépoque, on pensait que la maladie se ______________________propageait par inhalation. Le médecinsuperposa sur une carte les adresses desvictimes du choléra à Exeter (quartier deLondres) durant un épisode aigu, et constataqu’elles coïncidaient avec l’accès à la pompe à Les données publiques offrent, par le biaiseau de la Broad Street. Par déduction, il en des réutilisations qui peuvent en être faites, unconclut au rôle de l’eau et des conditions fort potentiel d’innovation, tant à titresanitaires dans la propagation de l’épidémie, ce commercial que pour la recherche, lequi permit de la contrôler, et de réduire développement de nouveaux services auxdrastiquement le taux de mortalité lié à cette citoyens ou l’amélioration du travail depathologie dans les décennies qui suivirent. l’administration. De manière plus générale, le succès de Les nouvelles possibilités del’infographie en ligne et des nouveaux modes recombinaison et de réutilisation offertes parde visualisation dynamique ont amené les les technologies de l’information ont révélégraphistes et designers à rechercher de l’importance de leur réutilisation, et contribuénouvelles informations et de nouvelles sources à en faire une question sociétale.de données à mettre en scène dans leursproductions.23 http://www.afigeo.asso.fr/ 21
  22. 22. Carte d’Exeter tirée de History of the Cholera in Exeter in 1832, T. Shapter.22
  23. 23. Chapitre II. La libre réutilisation des donnéespubliques à l’international Le sujet de la réutilisation des données nouvelles évolutions, et collaborer à lapubliques et l’appel à la mise à disposition rédaction d’articles scientifiques, se répandd’informations publiques sous forme brute a largement au sein de la communauté desémergé dans le contexte des ruptures chercheurs. Il trouve ensuite un écho dans latechnologiques et économiques de ces communauté des développeurs, notammentdernières années. parmi les contributeurs de projets Open Source, dont le mouvement d’ouverture des C’est pourtant par deux ruptures politiques, données est philosophiquement proche.au plus haut niveau de l’État, d’abord auxÉtats-Unis puis en Grande-Bretagne, chaque Des développeurs, des chercheurs et desfois dans un contexte d’alternance politique, économistes de l’information créent ainsiqu’il a été concrétisé par une politique l’Open Knowledge Foundation (OKFN) enambitieuse d’ouverture des données publiques. 2003 et l’Open Data Foundation (ODaF)25 en 2006 – organismes à but non lucratif qui Le chapitre suivant présente un tour cherchent à promouvoir l’adoption de normesd’horizon de ce mouvement d’ouverture des mondiales de formats et de métadonnéesdonnées publiques, et l’historique récent de ces (description des jeux de données), et ledeux principales initiatives gouvernementales, développement de solutions open source pourqui l’ont concrétisée à l’international. mutualiser les outils de mise en ligne de données.1. Le mouvement Open Data Les promoteurs de l’Open Data ont ainsi Le terme Open Data, littéralement développé des définitions formelles des« données ouvertes » ou « données libres » (au critères qui caractérisent des donnéessens « libres de droits »), est utilisé pour « ouvertes ». Un groupe de travail « Opendésigner des données en libre accès et ouvertes Government Data » (OGD) d’experts du Webà la réutilisation. Il trouve son origine en 1995 s’est fixé huit critères assez larges de définitiondans une publication du Comité sur les des données publiques ouvertes26. L’OpenDonnées géophysiques et environnementales Knowledge Foundation (OKFN), pour sa part,du Conseil national de la Recherche aux États- propose onze critères27, plus axé sur lesUnis intitulée « De l’échange complet et ouvert conditions juridiques acceptables qui doiventdes données scientifiques »24 : se retrouver dans la licence de réutilisation. « Les programmes internationaux de Les deux ensembles de critères, qui recherche sur le changement global et la établissent une première définition des données surveillance environnementale dépendent ouvertes, sont détaillés ci-dessous. du principe d’un échange complet et ouvert Données complètes : toutes les données des données (i.e. les données et les sont mises à disposition, sauf exceptions de informations sont rendues disponibles sans bon sens. restriction, sur une base non discriminatoire, pour un coût réduit à celui Données brutes : les données sont telles des besoins de reproduction et de que collectées à la source. Elles ont la plus fine distribution). » granularité possible et ne se présentent pas sous des formes agrégées ou modifiées. Le terme, qui désigne donc à l’origine leprocessus de collaboration des scientifiques Données récentes : les données sont misesautour de données d’expériences partagées afin en ligne aussi rapidement que possible.de multiplier les chances de détecter deserreurs, se tenir mutuellement au courant des24 25 http://www.opendatafoundation.org/ 26http://www.nap.edu/readingroom.php?book=exch&page=s http://www.opengovdata.org/home/8principles 27ummary.html http://www.opendefinition.org/okd/ 23
  24. 24. Données accessibles : les données sont public) et l’opportunité politique ont mené au accessibles au plus grand nombre d’utilisateurs lancement, aux États-Unis, en Grande- possible, et réutilisables pour des usages les Bretagne et ailleurs en Europe notamment, plus variés. d’initiatives majeures d’ouverture et de réutilisation des données publiques. Données libres de droits : les données ne sont pas soumises au droit d’auteur, à brevet, au droit des marques, ou au secret commercial. 2. États-Unis : initiatives Formats exploitables : les données sont locales, puis démarche structurées pour permettre le traitement fédérale automatisé, et disponibles sous une forme pratique et modifiable. L’ouverture des données s’est effectuée aux États-Unis du bas vers le haut. Les villes Formats non-propriétaires : les données de Washington, New York, San Francisco, ont sont accessibles dans un format sur lequel entrepris de recenser les collections de données aucune entité n’a de contrôle exclusif. qu’elles envisagent de mettre à disposition, Conditions non discriminatoires : les puis d’ouvrir des « data stores » pour mettre données sont accessibles à quiconque sans ces jeux de données à la disposition du public aucune obligation préalable ni inscription, et des entreprises, des développeurs et des sans discrimination entre les domaines citoyens.28 d’application. Les données sont notamment Ces démarches de « libération » des disponibles aussi bien pour des réutilisations données publiques sont très souvent commerciales que personnelles. accompagnées de concours d’applications pour Paternité : la licence peut exiger, comme encourager la réutilisation des données rendues condition pour la redistribution et la publiques. réutilisation des données, d’identifier Ce mouvement, amorcé par les grandes clairement les créateurs de l’œuvre ou les métropoles, fait désormais l’objet d’une contributeurs initiaux. Si cette condition est politique au niveau fédéral. imposée, elle ne doit pas être indûment complexe à remplir, et notamment la liste des (i) La réutilisation des données émerge dans contributeurs à citer doit être clairement les grandes métropoles. indiquée. L’année 2005 est marquée par une rupture Distribution de la licence : les droits majeure : l’ouverture par Google des attachés aux données s’appliquent à tous ceux « interfaces de programmation » (API) du à qui elles sont distribuées. service Google Maps donne lieu à une Non-transitivité de la licence : la licence ne floraison d’applications et de mashups29. Un peut exiger que toute donnée distribuée grand nombre de ces applications consistent à conjointement avec une donnée sous licence positionner sur les cartes Google Maps des libre soit aussi elle-même sous licence libre, ce données d’origine publique. qui serait un frein à la réutilisation de ces Ainsi, à Chicago en 2005, Adrian données. Holovaty, journaliste et programmeur30 lance Droit d’extraction : si les données sont ChicagoCrime.org, un site qui renseigne sur extraites d’un jeu de données, les utilisateurs une carte les données relatives aux crimes et de l’extrait doivent bénéficier des mêmes délits commis dans la ville et récupérées droits que ceux qui sont accordés au jeu de auprès de la municipalité31. Suite au succès de données dans son ensemble. l’application, et grâce à un don d’un million de dollars de la Knight Foundation32 en 2007, il Bien que ce modèle des données ouvertes puisse s’appliquer à tous types de données, qu’elles soient produites par le secteur public 28 Benhamou, B., 2010, « Les concours d’applications ou non, l’importance démocratique de l’accès mobiles dans le monde », Délégation aux Usages de aux informations publiques a conduit à l’Internet, 21 octobre 2010. 29 Applications web combinant différentes sources au sein focaliser le débat sur l’Open Government Data, d’une seule plateforme, l’une des facettes du design ou la réutilisation des données publiques. collaboratif sur le web. 30 Auteur de la librairie de développement en langage Les évolutions technologiques, le cadre Python à succès, Django. réglementaire (notamment les lois sur le droit à 31 Entretien le 18 octobre 2010 avec Sylvain Parasie, l’information et la Directive européenne sur la LATTS, Ecole des Ponts ParisTech. 32 réutilisation des informations du secteur Organisation caritative dédiée aux avancées dans le domaine du journalisme. Ce type d’acteurs dotés en fonds24
  25. 25. développe une version commerciale du site, de sa cérémonie d’investiture, le PrésidentEveryBlock33 (pour « chaque pâté de Obama signe son premier acte politique : unmaison »), qui recense et agrège un grand mémorandum à destination des ministres etnombre de données potentiellement utiles pour directeurs d’agences intitulé « Transparencyles citoyens dans un plusieurs municipalités. and Open Government » (Transparence et Gouvernement Ouvert). Il assigne aux services Des services du même type, conçus à partir fédéraux américains trois objectifs :de données publiques des municipalités voient transparence, implication des citoyens,le jour dans les domaines de l’éducation, de et collaboration.l’environnement ou de la santé. Adrian Fenty, le maire de Washington,(ii) Succès médiatique des concours D.C. à l’époque, recommande Vivek Kundrad’applications. au Président Obama : le 5 mars 2009, ce Vivek Kundra, responsable des systèmes dernier est nommé Chief Information Officerd’information du District de Columbia du gouvernement fédéral américain (Directeur(autorité administrative de la ville de des Systèmes d’Information), un posteWashington), s’empare en 2008 du sujet. Il nouveau et symbolique créé sur mesure, aveclance Apps for Democracy, un concours de pour mission de mettre en place lesdéveloppement d’applications de services technologies pour concrétiser la visionpublics, ouvert à tous les développeurs, libres politique du chef de l’exécutif.de s’approprier des jeux de données mis à leur (iv) Le portail fédéral Data.govdisposition pour l’occasion34. Contre toute attente, le concours Dès le 11 mars, Vivek Kundra demanded’application, doté par la Mairie d’un prix de aux DSI de toutes les agences fédérales50 000 dollars, connaît un succès considérable. américaines de désigner des jeux de donnéesAlors qu’ils espéraient une dizaine de (« datasets ») susceptibles d’être mis en ligne.réponses, les organisateurs reçurent 47 dossiers Se basant sur son expérience à Washington, ilen 30 jours seulement. Le coût estimé du se concentre sur les données brutes. Data.govtravail de conception et de programmation sera un point focal faisant autorité pourainsi mis à disposition des habitants de diffuser les données publiques brutes, sous desWashington a été évalué à plus de formats réexploitables.2 600 000 dollars, soit un retour sur Son équipe développe une première versioninvestissement de 5 100 % et un effet de levier beta du site en trois mois, grâce à l’utilisationde 52 pour 1. de techniques de développement dites Apps for Democracy fait école : les « agiles » qui découpent la réalisation duconcours d’applications essaiment au sein des produit en cycles rapides (de vingt-quatregrandes métropoles américaines (notamment heures à quelques jours).New York, San Francisco, et Vancouver au Cette méthodologie aboutit à un processusCanada)35. En 2010, la Banque Mondiale elle- de développement rapide et itératif, qui assuremême lance son concours (Apps for une rapidité de développement et la possibilitéDevelopment), qui reçoit plus d’une centaine d’intégrer continuellement les évolutions desde contributions. besoins qui apparaissent très fréquemment dans le cadre de projets de développement(iii) Le « gouvernement ouvert » du Président logiciel : « commencer petit à petit, réfléchirObama vite, faire un premier jet, le construire de façon Le candidat Barack Obama avait fait du incrémentale, prendre du recul. Trouver un« Gouvernement ouvert » un des axes de son moyen pour avancer »36.programme. Le 21 janvier 2009, au lendemain Le site est mis en ligne le 21 mai 2009, 120 jours seulement après la signature duet organisés pour soutenir des programmes d’action ciblés, Mémorandum par le Président avec seulementreste rare en France mais joue un rôle important dans le 47 ensembles de données. Le portail connaîtdébat social aux États-Unis. dans les mois suivants une évolution très33 EveryBlock.com est désormais une filiale de MSNBC.http://www.everyblock.com/34 Lakhani, R., Austin, R. and Yi, Y. Data.gov Case Study.Harvard Business School.http://www.data.gov/documents/hbs_datagov_case_study.pdf35 Bernard Benhamou. 2010. « Les Concours 36d’Applications Mobiles dans le Monde », note de la Lakhani, R., Austin, R. and Yi, Y. Data.gov Case Study.Délégation aux Usages de l’Internet. Harvard Business School (voir plus haut). 25
  26. 26. rapide. Lors du premier anniversaire, en numérique, notamment d’un des principaux mai 2010, l’équipe de Data.gov annonçait37 : journaux britanniques, le Guardian, qui avait fait campagne pour l’ouverture des données • 250 000 jeux de données uniques en publiques (« Free Our Data »). ligne ; • Plus de 97 millions de requêtes en 1 À Gordon Brown qui l’interrogeait début an, soit près de 2 millions de pages 2009 sur les mesures phares qu’il pourrait vues ; prendre pour faire progresser le numérique • Plus d’un millier d’applications listées britannique, Tim Berners-Lee avait répondu construites à partir des « ensembles de que la mise en ligne des données publiques données » mis à disposition des britanniques serait à elle seule une avancée développeurs. majeure38. Quelques enseignements peuvent être tirés « L’aspect le plus fascinant du Web de cette expérience : c’est que, quand vous mettez quelque chose en ligne, vous ne savez pas qui va l’utiliser • La demande pour des données – mais vous savez que quelqu’un va publiques brutes a un potentiel élevé ; l’utiliser. » • L’intérêt du public est variable selon les types de données, mais difficile à Si ces données – performances scolaires, prévoir a priori ; localisation des adresses postales, météo, et • La rapidité de mise à disposition des surtout les cartes – étaient mises en ligne, données, sous forme brute et explique-t-il, chacun y trouverait une utilité.39 réexploitable, a créé les conditions du Avec le Professeur Nigel Shadbolt, succès ; chercheur reconnu dans les technologies du • Les fonctionnalités d’abord limitées Web sémantique, Tim Berners-Lee se voit de la plateforme n’ont pas empêché alors chargé d’accompagner les efforts de mise une expansion rapide par la suite ; en ligne d’un portail d’informations publiques • Les résistances à l’ouverture des sur le modèle du Data.gov américain, données ont pu être dépassées par un Data.Gov.uk. Une première version du portail appui politique de premier ordre, et le est ouverte le 30 septembre 200940, préfigurant rôle de démonstrateur joué par la le concours d’idées civiques Show Us A Better première version beta de la Way41. En parallèle, s’amorce un mouvement plateforme. de mise en ligne de données géographiques, dont une grande partie a été rendue gratuite, 3. Grande Bretagne : une une révolution pour l’Ordnance Survey, l’institut géographique national britannique42. impulsion transpartisane du gouvernement 38 Tom Chatfield and James Crabtree. 27 janvier L’initiative britannique a pris corps sous le 2010. « Mash the state : opening up public sector data is an gouvernement de Gordon Brown : elle a été old geek hobbyhorse, but could the man who invented the reconduite et même amplifiée par le web reinvent the British government ? ». Prospect gouvernement Cameron. L’annonce le Magazine. http://www.prospectmagazine.co.uk/2010/01/mash-the- 12 janvier 2011 de la création prochaine de la state/ UK Public Data Corporation (agence 39 Texte original, tiré de l’article de Chatfield et Crabtree britannique pour les données publiques) est cité plus haut : une première. As Berners-Lee explains: « The thing people are amazed about with the web is that, when you put something online, you don’t know who is going to (i) Une genèse qui doit au hasard use it—but it does get used. » So his pitch to Gordon Brown was simple: if this data—exam Sir Tim Berners-Lee, inventeur du Web en results, postbox locations, weather reports, and 1989 et artisan de l’émergence du « Web most crucially, maps—was put online, people sémantique » a joué un rôle essentiel. Son 40 would find a use for it. « Sneak Peek Site Open ». 30 septembre 2009. appel à mettre en ligne les données publiques Data.gov.uk Blog. http://data.gov.uk/blog/sneak-peek-site- brutes lors de la conférence TED en 2009 avait open reçu un écho important dans le monde 41 « What would you create with public information ? » 20 janvier 2010. Show Us A Better Way Blog. http://webarchive.nationalarchives.gov.uk/2010080700435 0/http://showusabetterway.co.uk 37 42 The White House. 21 mai 2010. « Data.gov : Pretty Great Brittan’s Ordnance Survey Annual report 2009. Advanced for a One Year Old ». http://www.ordnancesurvey.co.uk/oswebsite/aboutus/repor http://www.whitehouse.gov/blog/2010/05/21/datagov- ts/annualreport/09- pretty-advanced-a-one-year-old 10/os_annual_report_and_accounts_2010.pdf26

×