Rapport données publiques 2011 - #Opendata

3 639 vues

Publié le

Rapport données publiques 2011 - #Opendata

Publié dans : Technologie, Économie & finance
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
3 639
Sur SlideShare
0
Issues des intégrations
0
Intégrations
105
Actions
Partages
0
Téléchargements
93
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Rapport données publiques 2011 - #Opendata

  1. 1. Les Données publiquesau service de l’Innovationet de la TransparencePour une politique ambitieusede réutilisation des données publiquesEcole des Ponts ParisTechRapport remis à la Délégation aux Usages de l’Internetdans le cadre du portail Proxima Mobilede services aux citoyens sur terminaux mobilesJuillet 2011
  2. 2. A propos de ce rapport La réutilisation des données publiques est modes de gouvernance, MM. Pierre-Jean un enjeu majeur de l’action publique à l’ère Benghozi et Laurent Gille, ont accepté numérique. A la croisée des nouveaux usages d’encadrer le travail de ce groupe. d’Internet et des modes de gouvernance M. Benghozi est Directeur de recherche ouverte les plus récents, il ouvre le champ à de CNRS, Directeur du Pôle de Recherche en nouveaux domaines de l’action de l’État. Économie et Gestion et professeur d’économie Ce rapport présente les conclusions d’une à l’École Polytechnique (titulaire de la Chaire étude sur la réutilisation des données Orange Innovation et Régulation des Services publiques, menée pour la Délégation aux Numériques), et responsable du pôle usages de l’Internet auprès du Ministère de Innovation du Master Innovation et Régulation l’Industrie, de l’Energie et de l’Economie de l’Economie Numérique de Télécom numérique et du Ministère de l’Enseignement ParisTech. M. Laurent Gille, enseignant- supérieur et de la Recherche dans le cadre du chercheur au Département de Sciences Master d’Action Publique de l’École des Ponts économiques et sociales de Télécom ParisTech. ParisTech, est responsable du parcours Industries de Réseaux du Master Innovation et Elle met en perspective la problématique et Régulation de l’Economie Numérique. les enjeux de l’Open Data, propose un état des lieux de la réutilisation des données publiques Les conclusions de l’étude ont été rédigées en France, et dessine trois scénarios prospectifs de novembre à janvier 2011, et présentées au pour l’évolution future de ce mouvement. Elle public le 20 janvier 2011 au Ministère de la présente seize propositions pour une politique Recherche et de l’Enseignement supérieur. nationale ambitieuse d’ouverture et de Ce rapport a été finalisé par Romain réutilisation des données publiques. Lacombe entre mars et début juin 2011. Il ne Quatre élèves de l’Ecole des Ponts fait qu’évoquer les développements les plus ParisTech, Pierre-Henri Bertin, Romain récents, et présente une synthèse des Lacombe, François Vauglin et Alice évolutions qui ont eu lieu au printemps 2011 Vieillefosse ont mené cette analyse de en France, notamment au niveau national. septembre 2010 à janvier 2011, en rencontrant Les recommandations et propositions les acteurs clés de la réutilisation des données exprimées ne reflètent que les conclusions de publiques, en prenant part à des colloques l’analyse menée par les membres du groupe internationaux, et en s’appuyant sur la d’étude, et n’engagent en aucune manière leurs bibliographie existante. institutions, employeurs ou corps d’affectation. Deux personnalités académiques expertes de l’économie numérique et de ses nouveaux Ecole des Ponts ParisTech 2011. Les Données publiques au service de l’Innovation et de la Transparence. Pour une politique ambitieuse de réutilisation des données publiques. Rapport à la Délégation aux usages de l’Internet, juillet 2011. Vous pouvez contacter les auteurs de ce rapport à l’adresse suivante : rapport.opendata.2011@gmail.com1
  3. 3. Remerciements Nous tenons à remercier vivement M. Nous souhaitons également remercier Bernard Benhamou, Délégué aux Usages de l’équipe du Mastère d’Action Publique de l’Internet, pour sa disponibilité, la confiance l’École des Ponts ParisTech pour l’opportunité qu’il nous a témoignée, et ses conseils avisés et qu’elle nous a accordée : le directeur constructifs. Nous tenons aussi à remercier Dominique Schwartz, le directeur adjoint pour leur aide l’ensemble des équipes de la Vincent Spenlehauer et la secrétaire Sylvie Délégation aux Usages de l’Internet. Berte. Nous remercions également M. Pierre-Jean Nos remerciements s’adressent enfin à Benghozi, Directeur de recherche au CNRS et l’ensemble des interlocuteurs qui nous ont professeur d’économie à l’École reçus ou nous ont fait part de leurs réflexions Polytechnique, et M. Laurent Gille, sur le sujet des données publiques, ainsi qu’à enseignant-chercheur en sciences économiques toutes celles qui ont répondu à nos nombreuses et sociales à Télécom ParisTech. Leurs questions. conseils pertinents et le temps qu’ils nous ont Toutes les erreurs ou omissions qui consacré, tout au long de notre étude, nous ont subsisteraient dans ce document ne sont le fait été très précieux. que de ses auteurs.3
  4. 4. Résumé analytique Les évolutions technologiques récentes ont Une évolution du cadre législatif : placé le sujet de la réutilisation des données au l’Union Européenne a adopté deux directives cœur de l’action publique. en la matière, la directive « Informations du secteur public » (PSI) en 2003 et la directive L’administration collecte et produit un INSPIRE en 2008. Une consultation publique champ très vaste de données, depuis les récente sur la directive PSI a notamment porté budgets des institutions publiques jusqu’aux sur l’opportunité de réviser son champ mesures de la qualité de l’air que nous dapplication, les redevances et licences respirons, en passant par des statistiques relatives aux données, ainsi que les formats précises sur notre économie, notre société et électroniques utilisés. nos territoires. L’émergence de la notion politique de Ouvrir l’accès le plus large aux « Gouvernement Ouvert » : les politiques de informations publiques, c’est tout d’abord diffusion des données publiques ont fortement améliorer la transparence de l’État et de ses évolué dans les pays anglo-saxons du fait de institutions, éclairer le débat démocratique, et l’émergence de la notion d’Open Government, rapprocher la puissance publique des citoyens. thème de campagne du Président Barack Favoriser la réutilisation de ces données Obama. Les États-Unis et la Grande Bretagne (« l’Open Data »), c’est permettre à la ont créé des portails de données publiques communauté des développeurs et des réutilisables, data.gov et data.gov.uk. En entrepreneurs de leur inventer de nouveaux France, la mission Etalab vient d’être créée, usages. C’est donc encourager l’innovation, et sous l’autorité du Premier ministre François contribuer au développement des secteurs Fillon, pour coordonner les administrations en stratégiques d’avenir, de l’économie matière de données publiques et mettre en numérique au développement durable. place la future plateforme data.gouv.fr. L’État doit s’approprier pleinement cette Des initiatives citoyennes en faveur de opportunité majeure. Il lui faut prendre le l’Open Data : une série d’initiatives récentes, virage de cette nouvelle dimension des issues de la société civile et des communautés politiques publiques, pour la mettre au service de développeurs, s’efforcent de promouvoir les de l’ensemble des acteurs du pays. concepts de l’Open Data, avec le soutien d’associations et de fondations comme la Une problématique au croisement des Sunlight Foundation aux États Unis, l’Open évolutions technologiques, politiques et Knowledge Foundation (OKFN) en Grande économiques récentes. Bretagne, et la FING, LiberTIC et Regards La réutilisation des données publiques Citoyens en France. constitue désormais une attente évidente de la La double rupture du Web 2.0 et des société civile. Cette problématique nouvelle a technologies mobiles : les innovations de émergé récemment au croisement de plusieurs service rendues possibles par les technologies évolutions profondes. 2.0 (interfaces dynamiques, cartographie en Une prise de conscience de la valeur ligne, ouverture des API) ont amené à la économique de la réutilisation des données : généralisation du remix et du phénomène des chaque année dans lUnion Européenne, la mashups de données. La nouvelle génération réutilisation de données issues du secteur d’applications géolocalisées sur smartphones public génèrerait un chiffre daffaires de plus repose pour une part importante sur des de 27 milliards deuros. Pour Neelie Kroes, données géographiques. Ces ruptures vice-présidente de la Commission européenne technologiques ont révélé le besoin croissant chargée de la stratégie numérique, « une de pouvoir réutiliser des données publiques. grande partie de ces informations, en Europe, Toutes ces évolutions récentes confèrent sont sous-exploitées. Nous devons examiner une actualité nouvelle à la problématique de la lopportunité de modifier les règles de lUnion réutilisation des données publiques. en matière de réutilisation, pour libérer pleinement leur potentiel économique ».5
  5. 5. Une opportunité majeure pour l’État et Une mise en œuvre complexe qui pourrait êtrel’administration simplifiée L’ouverture des données publiques permet Le cadre juridique est établi pour laà des entrepreneurs, des chercheurs, des majorité des données publiques, mais les typesdéveloppeurs d’accéder aux données collectées de licences et contrats se multiplient. Le statutdans le cadre du fonctionnement des des données issues d’organismes parapublicsadministrations. reste à préciser. L’interopérabilité technique et juridique est cruciale : il convient de clarifier En les réutilisant, ils leur inventent de les formats et les licences acceptables dans unenouveaux usages et peuvent créer de nouvelles optique d’encouragement à la réutilisation.applications utiles aux citoyens. Cettecoproduction de services au public peut La gratuité pour la réutilisation desconstituer la base d’une nouvelle relation données à titre commercial favorisenumérique de l’administration à l’usager, et l’innovation et les nouveaux usages. Nousd’un fonctionnement plus efficace de la préconisons donc de la généraliser le pluspuissance publique. possible, et d’éviter à tout prix la multiplication et le maintien de redevances L’ouverture des données publiques est de excessives, qui pourrait conduire à desplus un outil puissant d’amélioration de la incohérences et freiner la réutilisation.transparence de l’État. En donnant à tous lescitoyens qui le souhaitent accès aux détails du Des risques surmontablesfonctionnement des institutions publiques,cette ouverture nourrit et éclaire le débat Esquissée dans la loi 1978 sur l’accès auxdémocratique. Elle peut contribuer à baser les documents administratifs, consacrée par deuxchoix politiques sur des analyses informées et directives européennes, la réutilisation desancrées dans le réel plutôt que des positions données publiques s’inscrit dans une évolutionidéologiques formulées a priori. durable de nos sociétés. Enfin, un accès plus large aux données Elle induit une transformation de la culturepubliques peut contribuer à renforcer la et du mode de fonctionnement desconfiance des consommateurs, et donc la administrations. Des freins au changementstabilité de notre économie. subsistent, et des risques peuvent émerger. Rien n’indique cependant qu’ils ne puissentUn outil stratégique pour notre économie être surmontés, surtout si l’État s’engage dans une collaboration rapprochée avec la Des conditions de réutilisation plus libres communauté des réutilisateurs.encourageraient l’innovation et pourraientcontribuer au développement de l’économie Trois axes stratégiques pour favoriser lanumérique : les nouveaux services et réutilisation des données publiquesapplications mobiles, qui en bénéficieraientparticulièrement, connaissent actuellement une Nous proposons les trois axes stratégiquestrès forte croissance. L’économie numérique suivants pour favoriser la réutilisation desest un facteur clé de croissance économique et données publiques et permettre à la sociétéde création d’emplois en France. d’en retirer l’ensemble des bénéfices attendus. L’accès aux données publiques offre de Simplifier pour accélérer : réduire lesplus les prémisses d’une « infrastructure efforts nécessaires d’une part à la diffusion desinformationnelle », qui pourrait faciliter le données par les acteurs publics, et d’autre partdéveloppement durable en permettant aux à leur réutilisation, afin d’accélérer leconsommateurs de faire des choix mieux développement de services utiles à partir desinformés. données publiques. Enfin, la réutilisation des données Faciliter l’expérimentation : adapter lespubliques constitue un élément de soutien aux conditions de réutilisation des donnéesobjectifs stratégiques d’investissement publiques pour faciliter l’expérimentation pard’avenir pour l’économie française, de la les citoyens, les associations et la communautésociété numérique aux villes de demain et aux des développeurs et des entrepreneurs.transports intelligents, en passant par Favoriser l’émergence d’un écosystème :l’encouragement à la recherche scientifique et favoriser l’émergence d’un écosystème deà l’innovation. producteurs et de réutilisateurs de données publiques en France, autour de la mission Etalab et du futur portail data.gouv.fr. 6
  6. 6. Seize propositions pour une politique nationale 7. Rendre la réutilisation des données ambitieuse des données publiques gratuite pour toute réutilisation à titre Ce rapport formule seize propositions, personnel. articulées selon les trois axes stratégiques précédents. Elles sont présentées de manière 8. Encadrer strictement les cas dans lesquels détaillée au chapitre 8, et visent à proposer une une redevance est légitime, et charger les feuille de route claire pour mettre en place une producteurs de données d’établir l’absolue politique ambitieuse des données publiques. nécessité de toute tarification : 1. Formaliser les bonnes pratiques de • Dessaisir l’État du rôle de valorisation diffusion des données publiques attendues des données publiques. par la communauté des réutilisateurs : • Généraliser la gratuité pour les données • Expliciter l’effort minimal attendu. nouvellement mises à disposition. • Assurer la formation des agents et leur • Restreindre la tarification à coûts accès à des guides synthétiques moyens aux marchés matures. explicatifs. • Simplifier les formats de diffusion. 9. Conditionner toute redevance pour réutilisation de données à valeur ajoutée à la 2. Mettre en cohérence les conditions légales mise à disposition gratuite des données de réutilisation des données issues de brutes qui les sous-tendent. sources différentes : • Etablir une licence gratuite par défaut. 10. Explorer des conditions alternatives de • Encourager un marquage graphique des réutilisation pour laisser carte blanche à droits de réutilisation. l’expérimentation : • Explorer les licences gratuites avec 3. Encourager l’utilisation de formats partage des conditions initiales à facilement réexploitables, qui respectent les l’identique (share alike). normes d’interopérabilité et de « lisibilité • Explorer la rémunération par l’accès aux machine » : métadonnées. • Privilégier les formats ouverts respectant • Explorer la rémunération par le service les normes d’interopérabilité. client. • Communiquer sur l’importance des • Faciliter l’expérimentation avec les Web formats réexploitables auprès des agents. Services. • Maintenir une liste de formats correspondants à ces critères. 11. Impliquer la communauté des réutilisateurs autour de la plateforme 4. Faire en sorte que chaque contrat public data.gouv.fr : clarifie à l’avenir les droits de réutilisation • Créer un point d’accès unique centralisé liés aux données produites dans son cadre : et mis à jour automatiquement. • Clarifier les droits de réutilisation de • Développer une offre grand public qui données dans les contrats publics. mette en valeur des applications utiles. • Etablir des bonnes pratiques et des • Investir dans l’accompagnement de la clauses types. communauté. • Elargir le périmètre des données • Démultiplier le service aux utilisateurs. réutilisables aux ressources essentielles. • Organiser des séminaires ou ateliers de travail ponctuels sur les sujets techniques d’intérêt pour la 5. Faciliter l’enrichissement des données et communauté. l’intégration de corrections éventuelles par la communauté : • Faciliter l’intégration des métadonnées. 12. Mettre en place des assises des données • Permettre l’enrichissement collectif des publiques et animer la communauté des jeux de données. réutilisateurs : • Regrouper l’ensemble de l’écosystème pour des assises des données publiques. 6. Impliquer des acteurs publics pilotes dans • Animer la communauté des les projets de recherche sur le Web réutilisateurs. sémantique.7
  7. 7. 13. Encourager le développement • Faire des données et de leur réutilisationd’applications à partir des données un outil d’éclairage du débat public.publiques : 15. Développer une stratégie nationale à • Organiser un concours national de partir du rôle de coordination des développement d’applications. institutions publiques de la mission Etalab : • Prendre en compte la réutilisation des • Mutualiser des solutions de mise en données publiques dans les appels à ligne pour les administrations et les projets de R&D numérique. collectivités. • Pérenniser l’offre d’applications créées à • Développer une stratégie nationale pour partir des données publiques. les données publiques.14. Intégrer les données publiques et leur 16. Elargir le champ de l’Open Data :réutilisation au débat démocratique : • Elargir le champ de la libre réutilisation • Communiquer aux administrations des données publiques. l’importance des données pour mettre en lumière leurs métiers. • Explorer l’application de l’Open Data aux entreprises privées. • Illustrer la réutilisation des données publiques par le développement de • Développer une stratégie européenne et services aux citoyens. internationale. 8
  8. 8. Table des matières Résumé analytique 5 Table des matières 9 Introduction 11 Partie 1. « Open Data » : contexte et enjeux d’un sujet de société 15 Chapitre I. Les données publiques : émergence d’un sujet de société Erreur ! Signet non défini. 1. La donnée au cœur des nouveaux usages 17 2. Les données publiques et de leur réutilisation 19 Chapitre II. La libre réutilisation des données publiques à l’international 23 1. Le mouvement Open Data 23 2. États-Unis : initiatives locales, puis démarche fédérale 24 3. Grande Bretagne : une impulsion du gouvernement national sur fond d’alternance politique 26 4. Situations contrastées en Europe 28 Chapitre III. Les enjeux de la réutilisation des données publiques 31 1. Démocratie, transparence et débat public 31 2. Modernisation de l’État 32 3. Innovation et soutien à l’économie numérique 33 4. Des données stratégiques pour l’économie 36 5. Un nouveau mode d’action publique 40 Partie 2. État des lieux de la réutilisation des données publiques en France 45 Chapitre IV. Le cadre de la réutilisation des données publiques en France 47 1. Le cadre juridique pose en principe la liberté de réutilisation 47 2. Les acteurs de la réutilisation de données publiques 50 Chapitre V. Premières expériences d’ouverture des données publiques en France 55 1. La réutilisation des données dans les collectivités territoriales 55 2. L’ouverture des données au niveau national : trois études de cas 60 3. La mise en place d’une politique nationale des données publiques 63 Partie 3. Comment favoriser la réutilisation des données publiques ? 67 Chapitre VI. Abaisser les barrières à la réutilisation 69 1. Répondre aux contraintes techniques 69 2. Gérer la complexité juridique 70 3. Anticiper l’impact organisationnel 72 4. Modèles économiques propices à l’innovation 739
  9. 9. Chapitre VII. Prospective : Trois scénarios pour l’avenir 81 1. « Inertie » : Développement de l’offre de données publiques à son rythme historique 81 2. « Capture » : Des monopoles informationnels se substituent à la puissance publique 83 3. « Symbiose » : Catalyser le développement d’un écosystème 85Chapitre VIII. Seize propositions pour une politique ambitieuse des données publiques 89 1. Simplifier pour accélérer 89 2. Faciliter l’expérimentation pour encourager l’innovation 92 3. Soutenir l’émergence d’un écosystème 93Bibliographie 99Textes règlementaires 103Interlocuteurs 105Liens et références 107 10
  10. 10. Introduction « Si l’on partage des données sur le Web, des données publiques, des données scientifiques, des données citoyennes, quelles qu’elles soient, d’autres que nous sauront en tirer des créations merveilleuses que nous n’aurions jamais imaginées. » Tim Berners-Lee, Inventeur du Web Hal Varian, Économiste en Chef chez Les applications en question vont des Google, le précise : « Je répète sans cesse que services les plus simples aux plus complexes, la profession sexy dans les dix prochaines de l’expérimentation au produit professionnel : années, ce sera statisticien. Et ce n’est pas de des étudiants développent une application l’humour.1 » mobile, des citoyens quantifient l’action de leurs députés, des journalistes créent de On peut émettre des réserves quant au nouvelles infographies plus instructives, une pouvoir de séduction d’un tableur entreprise calcule des itinéraires de transports informatique ; il reste que l’attrait de la science publics au service des internautes. des données s’est considérablement accru ces dernières années. Ses algorithmes ont gagné en Les développements technologiques puissance et ses applications jouent un rôle récents ont largement accéléré le central dans la société de l’information. développement de ce phénomène, et les attentes d’une partie du public sont aujourd’hui À mesure que nos outils informatiques très fortes. deviennent plus mobiles, leurs applications gagnent en importance dans nos vies Une problématique nouvelle et complexe pour quotidiennes. En recoupant des données le secteur public numériques diverses, en les adaptant à notre contexte d’usage à travers une ergonomie La réutilisation des données publiques offre simple, les smartphones et les tablettes tactiles des possibilités nouvelles à la sphère publique. simplifient bon nombre des tâches de la vie Elle appelle une évolution de la culture et du quotidienne et professionnelle. mode de fonctionnement des administrations. Elle soulève surtout de nombreuses questions. La réutilisation des données publiques Quelles opportunités ? Quels risques ? Un mouvement de réutilisation des données Quelles pistes pour en faire profiter au mieux publiques2 a vu le jour depuis plusieurs années. la société ? Quels enseignements tirer de Concrètement, il s’agit pour des développeurs l’expérience d’autres pays en la matière ? informatiques d’accéder à des données Quel(s) public(s) cette politique vise-t-elle, produites initialement dans le cadre du avec quels objectifs et quels moyens ? Quelles fonctionnement de l’État, et de leur inventer de limites et quelles garanties donner au droit à la nouveaux usages. Tous types d’objets réutilisation ? numériques sont concernés : des tableaux chiffrés, des mesures numériques, des bases de Une opportunité importante pour le données, des cartes ou bien des jeux de développement du numérique données géolocalisées… Grâce aux réseaux mobiles à haut débit, la connectivité devient ubiquitaire. Les nouvelles plateformes mobiles permettent désormais d’accéder en direct à des services ou des 1 Steve Lohr. 5 août 2009. « For Today’s Graduate, One informations dans le contexte dans lequel Word: Statistics ». The New York Times. ceux-ci sont le plus utiles. Ces évolutions ont http://www.nytimes.com/2009/08/06/technology/06stats.ht ml donné naissance à une industrie nouvelle et en 2 A l’exclusion bien sûr des données personnelles et des forte croissance, celle des applications données confidentielles (loi de 1978 sur la liberté d’accés mobiles. aux documents administratifs, modifiée par Ordonnance n°2005-650 du 6 juin 2005).11
  11. 11. Des acteurs internationaux du Web ont su La réutilisation des données publiques enprendre des positions fortes sur ce marché. La FranceFrance possède des atouts pour réussir dans ce Une deuxième partie fait ensuite le pointsecteur. Faciliter l’accès aux données sur la réutilisation des données publiques enpubliques en vue d’une réutilisation France aujourd’hui (chapitre 4).commerciale pourrait favoriser la créationd’activités économiques novatrices. Le chapitre suivant vise à fournir aux agents publics des pistes et références à partirUn débat passionné desquelles construire leur réflexion. Nous cherchons en particulier à comprendre le Opportunité de développement économique contexte de cette politique, son cadre juridiqueet avancée en matière de transparence d’une et technique, et les acteurs qu’elle met en jeupart, érosion potentielle de la capacité d’action (chapitre 5).de l’État et de ses ressources propres del’autre : la tarification de la réutilisation des Comment favoriser la réutilisation desdonnées publiques est l’objet d’âpres débats, données publiques ?quand elle ne donne pas lieu à des contentieux. Le mouvement de réutilisation de données L’ouverture des données elle-même pet étant durablement amorcé, il convient defaire peur, quand ce n’est pas s’interroger sur les difficultés auxquelles ill’incompréhension quant à l’intérêt d’un droit risque de se heurter dans l’administration, lesà la réutilisation de données qui interpelle. établissements publics et les collectivités : difficultés d’ordre juridique, organisationnel,Un mouvement engagé sur le long terme technique et financier. Nous abordons la La mise à disposition des données question de la tarification optimale, et despubliques pour leur réutilisation n’est pourtant modèles économiques qui doivent s’appliquentpas un effet de mode : il s’agit d’un droit aux données publiques (chapitre 6).opposable consacré par la loi, basé sur une A partir des dynamiques en présence, nousDirective de 2003 que la Commission avons imaginé trois scénarios futurs pour laEuropéenne envisage d’étendre et de renforcer. réutilisation des données publiques : l’Inertie, Cette évolution engagée confronte chaque la Capture et la Symbiose. Nous détaillons lesadministration centrale, chaque collectivité caractéristiques et les implications de chacunlocale, chaque établissement public à des de ces futurs possibles (chapitre 7).questions difficiles. Qu’attend-on d’euxexactement, et comment bien faire ? Conclusions et recommandations Le scénario de la Symbiose et duContexte et enjeux d’un sujet de société développement d’un écosystème présente de Le premier chapitre s’attèle à esquisser un loin le plus d’avantages : travailler àportrait synthétique des grandes évolutions qui l’ouverture des données publiques enont amené la question des données publiques à collaboration avec la communauté de ceux quidevenir, en l’espace de quelques années, un les réutilisent est une nécessité pragmatiquevéritable sujet de société. Nous passons plus qu’un choix idéologique.notamment en revue les évolutions Pour que la société puisse tirer l’ensembletechnologiques récentes qui l’ont portée sur le des bénéfices potentiels de la réutilisation desdevant de la scène (chapitre 1). données publiques, il convient cependant Le second chapitre dresse un état des lieux d’encourager son développement au rythme lede la réutilisation des données publiques en plus rapide.2011 dans le monde, et un historique des Nous proposons enfin (chapitre 8) seizeévolutions récentes dans les pays occidentaux propositions groupées en trois axes(chapitre 2). stratégiques, visant à établir une feuille de Nous nous attachons ensuite à cerner les route claire vers une politique ambitieuse desbénéfices que l’on peut attendre d’une données publiques.politique de soutien à la réutilisation des Simplifier pour accélérer : réduire lesdonnées publiques. Nous évoquons les enjeux efforts nécessaires d’une part à la diffusion desliés à la participation démocratique et à données par les acteurs publics, et d’autre partl’efficacité de l’action publique. Nous à leur réutilisation, afin d’accélérer leexplicitons les différents mécanismes à travers développement de services utiles à partir deslesquels la donnée publique peut contribuer au données publiques.développement économique (chapitre 3). 12
  12. 12. Faciliter l’expérimentation : adapter les Favoriser l’émergence d’un écosystème : conditions de réutilisation des données favoriser l’émergence d’un écosystème de publiques pour faciliter l’expérimentation par producteurs et de réutilisateurs de données les citoyens, les associations et la communauté publiques en France, autour de la mission des développeurs et des entrepreneurs. Etalab et du futur portail data.gouv.fr.13
  13. 13. Partie 1. « Open Data » : contexte et enjeux d’un sujet de société15
  14. 14. Chapitre I. données publiques : émergence d’un sujet de société Les évolutions technologiques récentes ont avait pour but de faciliter l’accès et le rendu possible le partage rapide et aisé de tous référencement de documents en symbolisant types de données. Elles réactivent, sous un jour leur manipulation sous forme de phrases, liant nouveau, le débat déjà ancien sur l’accès aux verbes intuitifs (lire, afficher, remplacer, documents administratifs, maintenant sous effacer) et métadonnées d’adressage universel forme électronique et bien plus aisément (URL ou Uniform Resource Locator5). diffusables. Bien que basées sur un réseau d’échange de L’Internet a fait apparaître une économie documents, les techniques du Web ont des données. Les stratégies de croissance des naturellement développé un tropisme de plus acteurs du Web, via l’ouverture de leurs en plus marqué vers les données elles-mêmes. interfaces de programmation (API), ont illustré L’introduction des bases de données le potentiel de la réutilisation des données, et relationnelles dans les outils de développement suscité des attentes similaires des développeurs a permis la création de sites dynamiques, c’est- vis-à-vis du secteur public. Ils exercent une à-dire dont les pages s’adaptent aux pression pour que les États, en facilitant l’accès circonstances (évolutions de prix, listes à leurs informations, s’insèrent et tiennent leur d’objets changeants, une de journaux rang dans ce « Web des Données ». électroniques mise à jour fréquemment). A partir de 2004, une technique émergente a vu Ces ruptures technologiques ont le jour qui consiste à utiliser les fonctionnalités accompagné par ailleurs une prise de de scripting6 présentes dans les navigateurs conscience de l’importance des données pour permettre la mise à jour en temps réel de produites par l’administration et le secteur pages déjà chargées, en allant chercher en public. La possibilité novatrice de réutiliser ces tâche de fond des données remises à jour. données sous forme brute, pour leur inventer Nommée AJAX7 pour JavaScript Asynchrone de nouveaux usages utiles et instructifs, a et XML (Asynchronous Javascript And XML), abouti à l’émergence de la question des à partir du langage de scripting JavaScript et données publiques en tant que véritable sujet du format d’échanges de données XML, cette de société. technique à la croisée de différentes technologies Web est reconnaissable derrière 1. La donnée au cœur des des applications Web hautement réactives dont les pages ont rarement besoin d’être rafraîchies nouveaux usages – telles que GMail8, Quora9 ou Facebook10. Internet et les ruptures technologiques récentes on fait apparaître une nouvelle « économie des données ». 5 World Wide Web Consortium (W3C). 1994. Uniform Resource Locators (URL) : A Syntax for the Expression of (i) Le Web est structuré autour de l’échange de Access Information of Objects on the Network. données. http://www.w3.org/Addressing/URL/url-spec.txt 6 Capacité d’un navigateur à faire tourner dynamiquement Le génie informatique (computer science un programme qui agit en temps réel sur la page affichée. dans le monde anglo-saxon) est défini comme Par exemple, une page qui affiche l’heure repose sur un la manipulation algorithmique de structures de script qui demande au navigateur de mettre à jour l’heure, les minutes et les secondes à mesure qu’elles s’écoulent. représentation de données. Le Web, avant Dans le cas d’un service de courrier en ligne, c’est souvent d’être un phénomène social, est une un script qui réagit au click sur l’intitulé d’un email et architecture logicielle3 conçue par un change l’affichage pour détailler le contenu du mail plutôt chercheur britannique en physique des hautes que celui de la boîte de réception. C’est aussi un script qui vérifie automatiquement l’arrivée de nouveau courrier en énergies au CERN, Sir Tim Berners-Lee4. Elle tâche de fond, et réintègre éventuellement ces nouvelles données dans le corps de la page affichée. 3 7 World Wide Web Consortium (W3C), 2010, HTTP – Garrett, J.J. 18 février 2005. « Ajax : A New Approach Hypertext Transfer Protocol Overview – draft 09. To Web Applications ». http://www.w3.org/Protocols/ http://www.adaptivepath.com/ideas/essays/archives/00038 4 World Wide Web Consortium (W3C). Sir Tim Berners- 5.php 8 Lee: Bio. Téléchargée le 10 janvier 2011. GMail, service de boîte de courrier électronique en ligne http://www.w3.org/People/Berners-Lee/ de Google, Inc. : http://www.gmail.com17
  15. 15. Pour supporter cette technologie, de plus en système producteur voit sa positionplus d’applications en ligne ont développé à la compétitive renforcée par la dépendancefois deux interfaces : une interface graphique accrue du marché à ses données. En l’essence,classique accessible aux utilisateurs à travers c’est une transaction de marché où l’accès àleur navigateur, et une interface exclusivement des données est échangé contre leur diffusion àconsacrée aux machines, qui permet justement un nouveau public ou dans un nouveauau moteur de scripting du navigateur de contexte.récupérer des données à la volée. C’est cette L’exposition d’une interface API estinterface, qu’on peut se représenter comme un aujourd’hui une étape presque obligée duprotocole d’échange de données de machine à développement d’un nouveau produit en ligne.machine, qu’on appelle interface de La généralisation de ce phénomène est d’uneprogrammation ou API (sigle anglophone pour grande importance pour la question desApplication Programming Interface). données publiques, car elle a permis de prendre conscience de l’omniprésence des données(ii) La donnée, monnaie d’échange et levierd’influence sur le Web. derrière les services qu’utilisent quotidiennement les internautes. Les API sont devenues un véritable outilstratégique pour les sociétés de services en En un mot, « l’économie des données »ligne.11 Par exemple, c’est dans une large s’est construite autour de l’échange et de lamesure grâce à l’ouverture de leur API12 que fluidité sur le Web : les donnée ont souventTwitter a pu permettre à une communauté de plus de valeur comme outil d’échange etdéveloppeurs de se créer, et de multiplier les d’influence qu’isolées au sein des entrepôts deapplications permettant d’utiliser le service en données des entreprises13.dehors du site Web principal (notamment dansles premiers jours de l’App Store d’Apple (iii) Avec le Web 2.0, la donnée devient collectivedurant l’été 2008). Ce grande nombred’applications a servi de « force de vente » Un corollaire de la montée en puissance devirtuelle pour Twitter, et est un des facteurs la donnée est son rôle de liant social sur leprincipaux qui expliquent son succès Web. En particulier, avec l’apparition depopulaire. phénomènes de collaboration de masse tels que Wikipedia, on s’aperçoit que l’échelle Bien documentées et basées sur des d’échanges rendue possible par Internet ouvrestandards acceptés (tels que JSON ou XML) des possibilités insoupçonnées jusqu’alors.pour éviter les problèmes d’interopérabilité,ces interfaces s’adressent à des développeurs Des services tels que Delicious (site deinformaticiens. Selon le degré d’ouverture partage de bookmarks, qui agrège les(fonction des choix stratégiques de la société) catégories dans lesquelles les utilisateurset les conditions de licences (souvent conçues rangent différents liens, et permet ensuite depour encourager la réutilisation) consentis à trouver des liens par catégorie d’intérêt) ouces derniers, ils peuvent extraire, Flickr (qui permet de chercher deséventuellement modifier, et transformer les photographies libres de droits sur un sujetdonnées du service Web en question, pour les particulier, en se basant sur les tags deréutiliser, notamment à la construction de catégorisation produits par l’ensemble desnouveaux services ou de nouvelles utilisateurs) ont ainsi profité de ce phénomèneapplications. de folksonomy, la taxonomie par les foules ou classification par l’intelligence collective14. L’échange est mutuellement bénéfique : lenouveau service, consommateur de données, D’autres services tels qu’Amazon ougagne en utilité pour ses utilisateurs, et le Netflix ont, eux, profité de la masse d’utilisateurs se servant de leurs sites pour en extraire des modèles de préférences des9 Quora, Inc., site de questions et réponses dynamiquecaractérisé par l’expertise pointue de sa communauté 13 Ed Parsons - Geospatial Technologist for Europe,d’utilisateurs, fondé en 2009 et qui a connu une très fortecroissance en 2010 : http://www.quora.com Middle East and Africa chez Google, au séminaire10 Facebook, Inc., le réseau social dominant qu’on ne « Innovations et développement du secteur deprésente plus, fondé par Mark Zuckerberg en 2004 et l’information géographique » organisé le 5 octobre 2009 àapprochant 600 millions d’utilisateurs début 2011 : la Grande Arche de la Défense par le Conseil National dehttp://www.facebook.com l’Information Géographique (CNIG), l’AFIGÉO et11 Shah S., 28 August 2010, « Cannibalize Business l’Institut des Sciences et des Techniques de l’ÉquipementDevelopment by Popularizing your API » : pour le Développement (ISTED)http://shaivalshah.com/cannabilize-business-development- 14by-populariz Tapscott, D. and Williams, A. 2006. Wikinomics : How12 Entretien avec Henri Verdier, Président de Cap Digital. Mass Collaboration Changes Everything. 18
  16. 16. consommateurs, qui leur permettent de faire plateforme, (…) l’une des facettes du design des recommandations hautement collaboratif sur le Web17 ». Cette nouvelle personnalisées selon les goûts de leurs clients. tendance a connu un tel succès au tournant des années 2006 à 2008 que le prestigieux L’un des enseignements de la nouvelle Museum of Modern Art de New York y a incarnation sociale et collaborative du Web, consacré une exposition phare18. c’est que la valeur des données n’est pas intrinsèque, mais dérive de leur agrégation, de Au-delà de l’incidence culturelle de ce leur recoupement, de leur analyse et de la phénomène19, la réappropriation du local et de réutilisation qui en est faite. l’espace géographique par le biais du Web et du mobile annonçait l’importance croissante de Le Web a ainsi mis à jour une économie la donnée informatique géographique, et, au- des données, qui joue un rôle de monnaie delà, l’émergence du phénomène culturel du d’échange parmi les entreprises d’Internet et remix et de la réutilisation des données. les services en ligne. (iv) Données géographiques et « mash-ups » 2. Les données publiques et de L’autre développement technologique qui a leur réutilisation mené à prendre conscience de l’importance des données, c’est la démocratisation de La génération des digital natives, qui a l’information géographique. grandi dans l’habitude de la réutilisation, du remix et de la recombinaison permanente, Google indique par exemple que son devait nécessairement s’intéresser aux approche est « d’utiliser la géographie pour informations collectées par l’État. organiser toute l’information mondiale, qu’elle L’émergence de la réutilisation des données soit géographique ou non. C’est un principe publiques comme sujet de société, poussée par d’organisation qui sera utilisé pour mieux les nouveaux usages, a révélé une chaîne de comprendre l’information. »15. valeur fondée sur ces données qui, lorsqu’elles Si les briques technologiques sont sont mises à disposition de façon brute et disponibles pour utiliser et manipuler la réexploitable, permet aux développeurs et aux donnée géographique à loisir, ou même pour entrepreneurs de créer de nouveaux services. l’utiliser pour structurer d’autres données, le défi qui reste posé est celui de la constitution (i) Les données numériques ont vocation à la diffusion la plus large d’une véritable infrastructure des données géographiques. Ces données sont aujourd’hui Contrairement aux documents papiers dont accessibles en nombre et de qualité, mais les l’impression engendre des coûts variables repérer et les réutiliser peut rester obscur et conséquents et qui nécessitent des délais de complexe16. traitement et d’acheminement, les données numériques ont un coût marginal de diffusion Conséquence récente des évolutions du nul ou presque, et sont accessibles quasiment Web, des applications cartographiques instantanément. puissantes réservées jusque là à des experts sont devenues accessibles à tous. Le monde du Le travail éventuel de mise à disposition de Web collaboratif a largement repris à son données numériques est donc un coût fixe : la compte la possibilité de représenter des diffusion la plus large, en distribuant ce coût, données sur des cartes. Grâce à l’ouverture est donc le modèle le plus efficace d’un point gratuite (dans des limites relativement larges de vue économique. de volume) de son API, Google Maps est L’instantanéité de diffusion et l’ubiquité devenu une base de choix pour la création de d’accès offrent de plus des perspectives tout à « mashups », ces applications Web combinant fait nouvelles en terme de périmètre de « différentes sources au sein d’une seule diffusion et d’audience potentielle, notamment 15 Ed Parsons - Geospatial Technologist for Europe, 17 Middle East and Africa chez Google, au séminaire Google Earth mashups 5 of 14, in « Design and the « Innovations et développement du secteur de Elastic Mind. » Museum of Modern Art. New York, NY. l’information géographique » organisé le 5 octobre 2009 à 2008. la Grande Arche de la Défense par le Conseil National de http://www.moma.org/interactives/exhibitions/2008/elastic l’Information Géographique (CNIG), l’AFIGÉO et mind/#/98/ 18 l’Institut des Sciences et des Techniques de l’Équipement « Design and the Elastic Mind. » Museum of Modern pour le Développement (ISTED). Art. New York, NY. 2008. 16 Voir l’intervention de Max Craglia, coordonateur http://www.moma.org/interactives/exhibitions/2008/elastic technique d’Inspire pour la Commission Européenne mind/ 19 (centre commun de recherche) au séminaire du 5 octobre Lessig, L. 2009. Remix : Making art and commerce 2009 cité plus haut. thrive in the hybrid economy. http://remix.lessig.org/19
  17. 17. au regard de la démocratisation de l’Internet l’information est estimé en France à 3,7fixe avec un taux de pénétration qui s’élève à milliards d’euros dont 60% sont des donnéesplus de 70% de la population en France. publiques20. Au niveau européen, ce chiffre représenterait près de 27 milliards d’euros21(ii) Combiner les données brutes amplifie leur par an.potentiel La valorisation passe par différentes étapes Marqué par les traditions et les habitudes nécessaires pour rendre les données publiquesd’un monde de communication par le papier, utilisables ou réutilisables. D’une partl’État diffuse le plus souvent ses informations l’institution productrice doit définirsous forme de « produits finis », tels que des précisément quelles données elle doit diffuseranalyses, des pages Web explicatives ou des en ligne et de quelle manière, par un travailrapports écrits – en quelque sorte des données d’analyse et de collecte. S’imposent à ce stade« retravaillées » afin d’être intelligible par le respect de critères de bon sens comme latous. A l’inverse, les données brutes qui sous- protection de la vie privée, de la propriététendent ces études sont rarement mises à intellectuelle des tiers, ou de la sécuritédisposition du public, car leur intérêt pour une nationale.réutilisation potentielle est encore trèsinégalement perçu par les producteurs de D’autre part, pour faciliter la réutilisation,données publiques. l’institution productrice doit s’assurer de fournir une donnée qualifiée et mise à jour. Aujourd’hui, les technologies de Pour cela, il semble important de créer des lotsl’information permettent une mise à de données cohérents et de s’assurer de ladisposition des données à l’état brut à coût nul. présence d’une légende et plus généralementLoin d’être un obstacle à leur réutilisation de la présence des métadonnées.ultérieurement à leur mise à disposition parl’administration, leur caractère brut permet au Il faut les mettre à disposition via uncontraire de les recombiner plus facilement, ce support adapté mais en réalisant un catalogagequi amplifie leur potentiel et permet la création précis : il ne suffit pas de mettre à dispositionde services impossibles à réaliser sans ces des données, encore faut-il qu’elle puissentcroisements. être découvertes et facilement accessibles grâce à un portail de données publiques ou un Par exemple, des mesures locales de bruit moteur de recherche.permettent de mettre en perspective lacorrélation positive mesurée entre les dépenses Enfin, les données publiques numériques misesénergétiques d’un ménage et son taux à disposition peuvent être réutilisées par lad’équipement en doubles vitrages, paradoxale communauté des développeurs et desau premier abord. Dans le cadre d’un concours entrepreneurs, qui peuvent leur inventer deorganisé par la ville de Washington, D.C., des nouveaux usages. Ces données représententdonnées sur les vols croisées avec les tracés aussi un outil interne au service desdes pistes cyclables ont aussi permis de créer administrations, qui peut leur permettre desune carte des zones à éviter pour les cyclistes. échanges d’information plus fluides et efficaces. Parce qu’elle favorise ces croisements etces combinaisons fertiles sur des sujets (iv) La visualisation de données joue un rôlerecoupant des champs extrêmement vastes de structurantl’économie, de la société et de Les données géographiques ont un rôlel’environnement, la mise à disposition des structurant dans la chaîne de valeur. Ellesdonnées brutes de l’État et des collectivités est rendent possible la spatialisation et laun terreau fertile pour des réutilisateurs, qui visualisation sur carte d’autres jeux depeuvent inventer à ces données de nouveaux données, notamment géolocalisées. Selonusages. l’Association Française pour l’Information Géographique (AFIGÉO)22, 80% des(iii) Les données publiques et leur réutilisationsont à l’origine d’une chaîne de valeur 20 http://www.rgpp.modernisation.gouv.fr/index.php?id=51 L’État et le secteur public au sens large, &tx_ttnews[tt_news]=531&tx_ttnews[backPid]=11&cHasdans le cadre de leurs opérations, touchent à h=89b9c6970fl’ensemble des secteurs de notre économie, 21 Dekkers, M. et al., 2006, « MEPSIR, Measuring Publicnotre société et notre environnement. Les Sector Information Resources, Final Report of Study ondonnées qu’il collecte sont donc naturellement Exploitation of public sector information »,riches et très variées ; certaines ont une forte http://ec.europa.eu/information_society/policy/psi/docs/pdf s/mepsir/final_report.pdfvaleur économique. Le marché de 22 http://www.afigeo.asso.fr/ 20
  18. 18. informations qui sont utilisées possèdent une De manière plus générale, le succès de dimension géographique. Cela leur confère l’infographie en ligne et des nouveaux modes donc une importance particulière à la fois d’un de visualisation dynamique ont amené les point de vue technique, mais aussi en tant graphistes et designers à rechercher de qu’outil de recoupement et de recombinaison nouvelles informations et de nouvelles sources de données. de données à mettre en scène dans leurs productions. Un exemple historique : en 1854, John Snow détermina les causes de la propagation Le processus de recherche, d’analyse puis du choléra grâce à la visualisation de données de représentation graphique synthétique des sur une carte. A cette époque, on pensait que la données sous forme interactive, qui maladie se propageait par inhalation. Le s’apparente à du journalisme et qu’on appelle médecin superposa sur une carte les adresses parfois « datajournalisme » ou journalisme de des victimes du cholera à Exeter (quartier de données, a participé à créer une demande pour Londres) durant un épisode aigu, et constata plus de transparence de la part des qu’elles coïncidaient avec l’accès à la pompe à gouvernements, et à l’émergence du sujet de la eau de la Broad Street. Par déduction il en réutilisation des données publiques. conclut au rôle de l’eau et des conditions sanitaires dans la propagation de l’épidémie, ce *** qui permit de la contrôler, et de réduire drastiquement le taux de mortalité lié à cette Les données publiques offrent, par le biais pathologie dans les décennies qui suivirent. des réutilisations qui peuvent en être faites, un fort potentiel d’innovation, tant à titre commercial que pour la recherche, le développement de nouveaux services aux citoyens ou l’amélioration du travail de l’administration. Les nouvelles possibilités de recombinaison et de réutilisation offertes par les technologies de l’information ont révélé l’importance de leur réutilisation, et contribué à en faire un sujet de société.21
  19. 19. Carte d’Exeter tirée de History of the Cholera in Exeter in 1832, T. Shapter. 22
  20. 20. Chapitre II. La libre réutilisation des données publiques à l’international Le sujet de la réutilisation des données nouvelles évolutions, et collaborer à la publiques et l’appel à la mise à disposition rédaction d’articles scientifiques, se répand d’informations publiques sous forme brute a largement au sein de la communauté des émergé dans le contexte des ruptures chercheurs. Il trouve ensuite un écho dans la technologiques et économiques de ces communauté des développeurs, notamment dernières années. parmi les contributeurs de projets Open Source, dont le mouvement d’ouverture des C’est pourtant par deux ruptures politiques, données est philosophiquement proche. au plus haut niveau de l’État, d’abord aux États-Unis puis en Grande-Bretagne, chaque Des développeurs, des chercheurs et des fois dans un contexte d’alternance politique, économistes de l’information créent ainsi qu’il a été concrétisé par une politique l’Open Knowledge Foundation (OKFN) en ambitieuse d’ouverture des données publiques. 2003 et l’Open Data Foundation (ODaF)24 en 2006 – organismes à but non lucratif qui Le chapitre suivant présente un tour cherchent à promouvoir l’adoption de normes d’horizon de ce mouvement d’appel à mondiales de formats et de métadonnées l’ouverture des données publiques, et (description des jeux de données), et le l’historique récent de ces deux principales développement de solutions open-source pour initiatives gouvernementales, qui l’ont mutualiser les outils de mise en ligne de concrétisé à l’international. données. Les promoteurs de l’Open Data ont ainsi 1. Le mouvement Open Data développé des définitions formelles des Le terme Open Data, littéralement données critères qui caractérisent des données ouvertes ou données libres (au sens de libre de « ouvertes ». Un groupe de travail « Open droits), est utilisé pour désigner des données en Government Data » (OGD) d’experts du Web libre accès et ouvertes à la réutilisation. Il s’est par exemplepour fixer huit critères assez trouve son origine en 1995 dans une larges de définition des données publiques publication du Comité sur les Données ouvertes25. L’Open Knowledge Foundation géophysiques et environnementales du Conseil (OKFN), pour sa part, propose onze critères26, national de la Recherche aux États-Unis plus axé sur les conditions juridiques intitulée « De l’échange complet et ouvert des acceptables qui doivent se retrouver dans la données scientifiques »23 : licence de réutilisation. « Les programmes internationaux de Les deux ensembles de critères, qui recherche sur le changement global et la établissent une première définition des données surveillance environnementale dépendent du ouvertes, sont détaillés ci-dessous. principe d’un échange complet et ouvert des Données complètes : toutes les données données (i.e. les données et les informations sont mises à disposition, sauf exceptions de sont rendues disponibles sans restriction, sur bon sens. une base non discriminatoire, pour un coût réduit à celui des besoins de reproduction et de Données brutes : les données sont telles distribution). » que collectées à la source. Elles ont la plus fine granularité possible et ne se présentent pas Le terme, qui désigne donc à l’origine le sous des formes agrégées ou modifiées. processus de collaboration des scientifiques autour de données d’expériences partagées afin Données récentes : les données sont mises de multiplier les chances de détecter des en ligne aussi rapidement que possible. erreurs, se tenir mutuellement au courant des 23 24 http://www.opendatafoundation.org/ 25 http://www.nap.edu/readingroom.php?book=exch&page=s http://www.opengovdata.org/home/8principles 26 ummary.html http://www.opendefinition.org/okd/23
  21. 21. Données accessibles : les données sont public) et l’opportunité politique ont mené auaccessibles au plus grand nombre d’utilisateurs lancement, aux États-Unis, en Grande-possible, et réutilisables pour des usages les Bretagne et en Europe notamment, d’initiativesplus variés. majeures d’ouverture et de réutilisation des données publiques. Données libres de droits : les données nesont pas soumises au droit d’auteur, à brevet,au droit des marques, ou au secret commercial. 2. États-Unis : initiatives Formats exploitables : les données sont locales, puis démarchestructurées pour permettre le traitementautomatisé, et disponibles sous une forme fédéralepratique et modifiable. L’ouverture des données s’est effectuée aux États-Unis du bas vers le haut. Les villes Formats non propriétaires : les données de Washington, New York, San Francisco, ontsont accessibles dans un format sur lequel entrepris de recenser les collections de donnéesaucune entité n’a de contrôle exclusif. qu’elles envisagent de mettre à disposition, Conditions non discriminatoires : les puis d’ouvrir des « data stores » pour mettredonnées sont accessibles à quiconque sans ces collections de données à la disposition duaucune obligation préalable ni inscription, et public des entreprises, des développeurs et dessans discrimination entre les domaines citoyens.d’application. Les données sont notamment Ces démarches de « libération » desdisponibles aussi bien pour des réutilisations données publiques sont très souventcommerciales que personnelles. accompagnées de concours d’applications pour Paternité : la licence peut exiger, comme encourager la réutilisation des données renduescondition pour la redistribution et la publiques.réutilisation des données, d’identifier Ce mouvement, amorcé par les grandesclairement les créateurs de l’œuvre ou les métropoles, fait désormais l’objet d’unecontributeurs initiaux. Si cette condition est politique au niveau fédéral.imposée, elle ne doit pas être indûmentcomplexe à remplir, et notamment la liste des (i) La réutilisation des données émerge danscontributeurs à citer doit être clairement les grandes métropoles.indiquée. L’année 2005 est marquée par une rupture Distribution de la licence : les droits majeure : l’ouverture par Google desattachés aux données s’appliquent à tous ceux « interfaces de programmation » (API) duà qui elles sont distribuées. service Google Maps donne lieu à une Non transitivité de la licence : la licence ne floraison d’applications et de mashups27 . Unpeut exiger que toute donnée distribuée grand nombre de ces applications consistent àconjointement avec une donnée sous licence positionner sur les cartes Google Maps deslibre soit aussi elle-même sous licence libre, ce données d’origine publique.qui serait un frein à la réutilisation de ces Ainsi, à Chicago en 2005, Adriandonnées. Holovaty, journaliste et programmeur28 lance Droit d’extraction : si les données sont ChicagoCrime.org, un site qui renseigne surextraites d’une collection, les utilisateurs de une carte les données relatives aux crimes etl’extrait doivent bénéficier des mêmes droits délits commis dans la ville et récupéréesque ceux qui sont accordés à la collection dans auprès de la municipalité29. Suite au succès deson ensemble. l’application, et grâce à un don d’un million de dollars de la Knight Foundation30 en 2007, il Bien que ce modèle des données ouvertes développe une version commerciale du site,puisse s’appliquer à tous types de données,qu’elle soient produites par le secteur public ou 27 « Applications web combinant différentes sources aunon, l’importance démocratique de l’accès aux sein d’une seule plateforme, (…) l’une des facettes duinformations publiques a conduit à focaliser le design collaboratif sur le web ». Voir section 3.3.4. 28débat sur l’Open Government Data, ou la Auteur de la librairie de développement en langage Python à succès, Django.réutilisation des données publiques. 29 Entretien avec Sylvain Parasie, LATTS, Ecole des Ponts ParisTech. Les évolutions technologiques, le cadre 30 Organisation caritative dédiée aux avancées dans leréglementaire (notamment les lois sur le droit à domaine du journalisme. Ce type d’acteurs dotés en fondsl’information et la Directive européenne sur la et organisés pour soutenir des programmes d’action ciblés,réutilisation des informations du secteur reste rare en France mais joue un rôle important dans le débat social aux États-Unis. 24
  22. 22. EveryBlock31 (pour « chaque pâté de Gouvernement Ouvert). Il assigne aux services maison »), qui recense et agrège un grand fédéraux américains trois objectifs : nombre de données potentiellement utiles pour transparence, implication des citoyens, les citoyens dans un plusieurs municipalités. et collaboration. Des services du même type, conçus à partir Adrian Fenty, le maire de Washington, de données publiques des municipalités voient D.C. à l’époque, recommande Vivek Kundra le jour dans les domaines de l’Éducation, de au Président Obama : le 5 mars 2009, ce l’environnement ou de la santé. dernier est nommé Chief Information Officer du gouvernement fédéral américain (Directeur (ii) Succès médiatique des concours des Systèmes d’Information), un poste d’applications. nouveau et symbolique créé sur mesure, avec Vivek Kundra, responsable des systèmes pour mission de mettre en place les d’information du District de Columbia technologies pour concrétiser la vision (autorité administrative de la ville de politique du chef de l’exécutif. Washington), s’empare en 2008 du sujet Il (iv) Le portail fédéral Data.gov lance Apps for Democracy, un concours de développement d’applications de service Dès le 11 mars, Vivek Kundra demande public, ouvert à tous les développeurs, libres aux DSI de toutes les agences fédérales de s’approprier des jeux de données mis à leur américaines de désigner des ensembles de disposition pour l’occasion32. données (« datasets ») susceptibles d’être mis Contre toute attente, le concours en ligne. Se basant sur son expérience à d’application, doté par la Mairie d’un prix de Washington, il se concentre sur les données 50 000 dollars, connaît un succès considérable. brutes. Data.gov sera un point focal faisant Alors qu’ils espéraient une dizaine de autorité pour diffuser les données publiques réponses, les organisateurs reçurent 47 brutes, sous des formats réexploitables. dossiers en 30 jours seulement. Le coût estimé Son équipe développe une première version du travail de conception et de programmation beta du site en trois mois, grâce à l’utilisation ainsi mis à disposition des habitants de de techniques de développement dites Washington a été évalué à plus de 2 600 000 « agiles » qui découpent la réalisation du dollars, soit un retour sur investissement de produit en cycles rapides (de vingt-quatre 5100 % et un effet de levier de 52 pour 1. heures à quelques jours). Apps for Democracy fait école : les Cette méthodologie aboutit à un processus concours d’applications essaiment au sein des de développement rapide et itératif, qui assure grandes métropoles américaines (notamment une rapidité de développement et la possibilité New York, San Francisco, et Vancouver au d’intégrer continuellement les évolutions des Canada)33. En 2010, la Banque Mondiale elle- besoins qui apparaissent très fréquemment même lance son concours (Apps for dans le cadre de projets de développement Development), qui reçoit plus d’une centaine logiciel : « commencer petit à petit, réfléchir de contributions. vite, faire un premier jet, le construire de façon incrémentale, prendre du recul. Trouver un (iii) Le « gouvernement ouvert » du moyen pour avancer »34. Président Obama Le site est mis en ligne le 21 mai 2009, 120 Le candidat Barack Obama avait fait du jours seulement après la signature du « Gouvernement ouvert » un des axes de son Mémorandum par le Président avec seulement programme. Le 21 janvier 2009, au lendemain 47 ensembles de données. Le portail connaît de sa cérémonie d’investiture, le Président dans les mois suivants une évolution très Obama signe son premier acte politique : un rapide. Lors du premier anniversaire, en mai mémorandum à destination des ministres et 2010, l’équipe de Data.gov annonçait35 : directeurs d’agences intitulé « Transparency and Open Government » (Transparence et • 250 000 jeux de données uniques en ligne ; 31 EveryBlock.com est désormais une filiale de MSNBC. http://www.everyblock.com/ 32 Lakhani, R., Austin, R. and Yi, Y. Data.gov Case Study. 34 Harvard Business School. Lakhani, R., Austin, R. and Yi, Y. Data.gov Case Study. http://www.data.gov/documents/hbs_datagov_case_study. Harvard Business School (voir plus haut). 35 pdf The White House. 21 mai 2010. « Data.gov : Pretty 33 Bernard Benhamou. 2010. « Les Concours Advanced for a One Year Old ». d’Applications Mobiles dans le Monde », note de la http://www.whitehouse.gov/blog/2010/05/21/datagov- Délégation aux Usages de l’Internet. pretty-advanced-a-one-year-old25
  23. 23. • Plus de 97 millions de hits en 1 an, britanniques serait à elle seule une avancée soit près de 2 millions de visites ; majeure36. • Plus d’un millier d’applications listées « L’aspect le plus fascinant du Web c’est construites à partir des «ensembles de que, quand vous mettez quelque chose en ligne, données » mis à disposition des vous ne savez pas qui va l’utiliser – mais vous développeurs. savez que quelqu’un va l’utiliser. » Quelques enseignements peuvent être tirés Si ces données – performances scolaires,de cette expérience : localisation des adresses postales, météo, et • La demande pour des données surtout les cartes – étaient mises en ligne, publiques brutes est très marquée ; explique-t-il, chacun y trouvera une utilité.37 • L’intérêt du public est variable selon Avec le Professeur Nigel Shadbolt, les types de données, mais difficile à chercheur reconnu dans les technologies du prévoir a priori ; Web sémantique, Tim Berners-Lee se voit • La rapidité de mise à disposition des alors chargé d’accompagner les efforts de mise données, sous forme brute et en ligne d’un portail d’informations publiques réexploitable, a créé les conditions du sur le modèle du Data.gov américain, succès ; Data.Gov.uk. Une premiére version du portail • Les fonctionnalités d’abord limitées est ouverte le 30 septembre 200938, de la plateforme n’ont pas empêché préfigurant le concours d’idées civiques Show une expansion rapide par la suite ; Us A Better Way39. En parallèle, s’amorce un • Les résistances à l’ouverture des mouvement de mise en ligne de données données ont pu être dépassées par un géographiques, dont une grande partie a été appui politique de premier ordre, et le rendue gratuite, une révolution pour rôle de démonstrateur joué par la l’Ordnance Survey, l’institut géographique première version beta de la national britannique40. plateforme. (ii) Un mieux-disant politique autour de la mise en ligne des données publiques3. Grande Bretagne : une Le thème acquiert une visibilité politique àimpulsion du gouvernement l’occasion des élections parlementaires de mainational sur fond d’alternance 2010. En réaction au retentissement médiatiquepolitique du scandale des notes de frais des parlementaires à l’été 2009, le thème de la L’initiative britannique a pris corps sous le transparence et celui de l’ouverture desgouvernement de Gordon Brown : elle a été données publiques figure dans le programmereconduite et même amplifiée par legouvernement Cameron. L’annonce le 12 36 Tom Chatfield and James Crabtree. 27 janvierjanvier 2011 de la création prochaine de la UK 2010. « Mash the state : opening up public sector data is anPublic Data Corporation (agence britannique old geek hobbyhorse, but could the man who invented the web reinvent the British government ? ». Prospectpour les données publiques) est une première. Magazine. http://www.prospectmagazine.co.uk/2010/01/mash-the-(i) Une genèse qui doit au hasard state/ 37 Texte original, tiré de l’article de Chatfield et Crabtree Sir Tim Berners-Lee, inventeur du Web en cité plus haut :1989 et artisan de l’émergence du « Web As Berners-Lee explains: « The thing people aresémantique » a joué un rôle essentiel. Son amazed about with the web is that, when you put something online, you don’t know who is going toappel à mettre en ligne les données publiques use it—but it does get used. » So his pitch tobrutes lors de la conférence TED en 2009 avait Gordon Brown was simple: if this data—examreçu un écho important dans le monde results, postbox locations, weather reports, andnumérique, notamment d’un des principaux most crucially, maps—was put online, people would find a use for it.journaux britanniques, le Guardian, qui avait 38 « Sneak Peek Site Open ». 30 septembre 2009.fait campagne pour l’ouverture des données Data.gov.uk Blog. http://data.gov.uk/blog/sneak-peek-site-publiques (« Free Our Data »). open 39 « What would you create with public information ? » 20 A Gordon Brown qui l’interrogeait début janvier 2010. Show Us A Better Way Blog.2009 sur les mesures phares qu’il pourrait http://webarchive.nationalarchives.gov.uk/2010080700435prendre pour faire progresser le numérique 0/http://showusabetterway.co.uk 40 Great Brittan’s Ordnance Survey Annual report 2009.britannique, Tim Berners-Lee avait répondu http://www.ordnancesurvey.co.uk/oswebsite/aboutus/reporque la mise en ligne des données publiques ts/annualreport/09- 10/os_annual_report_and_accounts_2010.pdf 26

×