Ce diaporama a bien été signalé.
Nous utilisons votre profil LinkedIn et vos données d’activité pour vous proposer des publicités personnalisées et pertinentes. Vous pouvez changer vos préférences de publicités à tout moment.

Open data : faire parler les données

750 vues

Publié le

Conférence sur l'open data ayant eu lieu le 19 septembre 2017 lors du digital tour ima 2017 :
- Qu’est-ce que l’Open Data ?
- Quelles sont les données ouvertes ?
- Comment valoriser les données ?
- Rex : 48h pour faire parler les données ouvertes

Publié dans : Technologie
  • Identifiez-vous pour voir les commentaires

Open data : faire parler les données

  1. 1. F U N# G E N I E U R
  2. 2. Page ‹N°›Public SII SII Nantes Immeuble Rafale - 1 rue Charles Lindberg - 44346 BOUGUENAIS CEDEX Tél : 02 40 05 28 28 - Fax : 02 40 05 28 29 Public SII 19/09/2017 S4_0396_04 www.groupe-sii.com Open Data Faire parler les données Data Manager @maciflo Florent POUSSEROT
  3. 3. Public SII SOMMAIRE Qu’est-ce que l’Open Data ? Quelles sont les données ouvertes ? Comment valoriser les données ? Rex : 48h pour faire parler les données de la ville de La Rochelle
  4. 4. Page ‹N°›Public SII Page N°Public SII Qu’est-ce que l’Open Data ?
  5. 5. Page ‹N°›Public SII ➢ Qu’est-ce que l’Open Data ? Public SII L’Open Data
  6. 6. Page ‹N°›Public SII ➢ Qu’est-ce que l’Open Data ? Public SII Définition : données ouvertes "U ne donnée ouverte est une donnée qui peut être librement utilisée, réutilisée et redistribuée par quiconque - sujette seulement, au plus, à une exigence d’attribution et de partage à l’identique. " Exploitable RéutilisableAccessible Donnée Ouverte TECHNIQUE JURIDIQUEORGANISATIONNEL Pour être « open data » une donnée doit être : ✓Accessible électroniquement de façon pérenne ✓Complète, ✓Lisible par une machine, ✓Dans un format ouvert, ✓Disponible sous licence claire.
  7. 7. Page ‹N°›Public SII ➢ Qu’est-ce que l’Open Data ? Public SII Les acteurs L’ETAT ENTREPRENEURSCITOYENS Donnée Ouverte Total, Enedis, La Poste, SNCF, Veolia, Orange, JCDecaux LiberTIC, Regards citoyens, Midata, mesinfos.fing.org Collectivités locales, établissements publics, Etalab
  8. 8. Page ‹N°›Public SII ➢ Qu’est-ce que l’Open Data ? Public SII "Toutes les données ouvertes sont accessibles au public, mais toutes les données accessibles au public ne sont pas ouvertes" Données disponibles, données ouvertes Carte Foresaère de l’IGN ➡ 0-100km2 : 29.93€ ➡ 10.000 – 100.000 km2 : 7 344.93 € Meteo France ➡ Modèle de prévision (annuel) : 50 000 € ➡ Accès annuel aux données climatologiques de base : 200 000 €
  9. 9. Page ‹N°›Public SII ➢ Qu’est-ce que l’Open Data ? Public SII Données ouvertes Pourquoi est il important d’être clair à propos de ce qu’ouvert signifie ?
  10. 10. Page ‹N°›Public SII ➢ Qu’est-ce que l’Open Data ? Public SII Définition
  11. 11. Page ‹N°›Public SII ➢ Qu’est-ce que l’Open Data ? Public SII Les données ouvertes Fournir une définiion claire de l’ouverture garanit que, lorsqu’on obient deux fichiers de données de deux origines différentes, il est possible de les combiner, et nous permet d’éviter notre propre tour de Babel. INTEROPERABILITE
  12. 12. Page ‹N°›Public SII ➢ Qu’est-ce que l’Open Data ? Public SII Les licences pour l’Open Data LICENCE DOMAINE PUBLIC OU ATTRIBUTIVE 4 droits 1. celui d’uiliser, 2. d’étudier, 3. de modifier 4. et de redistribuer les modificaions Licences à votre disposition LO : Licence ouverte, Exemple data.gouv.fr LICENCE CONTRIBUTIVE Ajout d’une clause « copyleft » 5. Partage à l’idenique Licences à votre disposition ODbl : Open Database Licence Exemple Wikipedia ; Open Street Map
  13. 13. Page ‹N°›Public SII ➢ Qu’est-ce que l’Open Data ? Public SII Une brève histoire de l’Open Data 1995 Le terme d’open data apparaît pour la 1ère fois, dans un document d’une agence scienifique américaine 2011 Lancement du projet data.gouv.fr, 2013 Créaion de l’associaion Opendata France 1789 Déclaraaon des droits de l’Homme et du Citoyen, aracle XV : “La Société a le droit de demander compte à tout Agent public de son administra8on” 2008 Elecion de Barack Obama (adopion du concept)2009 Lancement du projet data.gov (US) Définiaon du concept des données ouvertes et publiques (Réunion de Sébastopol) Tim O’Reilly : auteur et éditeur américain, avant-garde informaique et Internet. Lawrence Lessig : professeur de droit à Stanford est l’iniiateur des licences Creaive Commons. Aaron Swartz : inventeur du système de flux RSS et militant de la connaissance libre. 2007
  14. 14. Page ‹N°›Public SII ➢ Qu’est-ce que l’Open Data ? Public SII LOI CADA de 1978 (Commission d’Accès aux Données Administraives) L’ouverture des données produites dans le cadre des missions de service public : administraions, collecivités, autorités organisatrices, paricipants au service public. Données publiques : pas de données nominaives (sauf accord explicite), ne relevant pas de la vie privée ni de la sécurité Direcave Européenne 2003/98/CE sur la réualisaaon des données publiques Ne reient plus la disincion entre une uilisaion commerciale ou non commerciale Décret Etalab 2011 La gratuité posée comme cadre général, la tarificaion comme excepion LOI n° 2016-1321 du 7 octobre 2016 pour une République numérique L’ouverture des données devient la règle et non plus l’excepion, cela pour les collecivités de plus de 3500 habitants L’Open Data et la Loi en France
  15. 15. Page ‹N°›Public SII ➢ Qu’est-ce que l’Open Data ? Public SII L’Open Data en France
  16. 16. Page ‹N°›Public SII ➢ Qu’est-ce que l’Open Data ? Public SII L’Open Data en France 150 Collectivités « ouvertes » • 8 Régions • 17 Départements • 13 Métropoles • Nombreuses petites ou moyennes villes 19 500 jeux de données • Dont 45% de données Géographiques • 50% Licence Ouverte vs 50% OdbL • 80% Portail local, 20% portail régional ou national • Editeurs spécialisés (20% du marché) 346 applications utilisatrices • 76% applications mobiles • 40 Appels à projet et Hackathons Etat/ Etalab • Portail du gouvernement : data.gouv.fr • 224 Services Publics • 28 000 datasets issus du gouv. et de ses agences
  17. 17. Page ‹N°›Public SII ➢ Qu’est-ce que l’Open Data ? Public SII La France, 10ème Mondiale (Open Data Index 2015) https://index.okfn.org/place/ L’Open Data dans le monde
  18. 18. Page ‹N°›Public SII ➢ Qu’est-ce que l’Open Data ? Public SII Quelle différence entre Open Data et Big Data ? Le Big Data concerne les méthodes de collecte et de traitement d’un grand volume de données, en temps réel, et d’une grande richesse. Gouv DataBig Data Open Data L’ Open Data est un mode d’accès à l’informaaon. Vous pouvez être un consommateur d’open data sans avoir les problémaiques du Big Data. Tout dépend de la façon dont vous consommez l’open data : si vous accédez en temps réel à des banques de données ouvertes sans pour autant les stocker (comme les points d’intérêt de Google Maps par exemple), le Big Data ne vous concerne pas. En revanche, si vous préférez récupérer l’informaion dans votre système d’informaion, pour l’enrichir ou la retraiter avant de la diffuser, il se peut que votre uilisaion de l’open data engendre le besoin d’expert en big data. Tout dépend du volume de données que vous récupérez, et à quelle fréquence.
  19. 19. Page ‹N°›Public SII Page N°Public SII Quelles sont les données ouvertes ?
  20. 20. ➢ Quelles sont les données ouvertes ? Page ‹N°›Public SII Public SII La thématique des transports et des déplacements domine très largement. Les données géographiques sont très présentes sur les plateformes. Au Grand Lyon par exemple, elles représentent 95% des données mises en ligne. Quelles sont les données ouvertes ?
  21. 21. ➢ Quelles sont les données ouvertes ? Page ‹N°›Public SII Public SII Accidents, tracés d'autoroutes, accessibilité des troyoirs, pistes cyclables, staionnements payants, infracions emplacements handicapés, staions de vélos, staions d'auto-partage, schémas directeurs accessibilité, horaires de passage des transports en commun, horodateurs, comptage du trafic, disponibilités des parkings, localisaion sur voie, lignes de bus, administraion portuaire, réseau de transport, transport rouier, courbe de circulaaon en temps réel, état du trafic en temps réel. Transports et déplacements JCDecaux Depuis 2013, les données relaives aux vélos en libre-service sont disponibles en Open Data sur le portail web JCDecaux Developer Fichier BAAC Base de données accidents corporels de la circulaion. SNCF Horaires planifiés et temps réel, équipements et services en gare, régularité des trains, accessibilité des gares. 10 millions de voyageurs chaque jour
  22. 22. ➢ Quelles sont les données ouvertes ? Page ‹N°›Public SII Public SII Localisation et information géographiques Photographies aériennes, cartographie, modèles numériques de terrain, plans, limites d'arrondissement, bureaux de vote, périmètres de quarier, cantons, téléphones publics, sites de proximité, plans d'urgence, horodateurs, points adresses, caméras, seniers nature, aménagements cyclables, plans cadastraux, courbes de niveau, pharmacies, staaons service, boîtes à leyres, limites communales. La Base Adresse Naaonal Un référeniel naional ouvert. Pour que les services d’urgence arrivent au bon endroit, pour permeyre de réaliser une analyse cartographique en quelques clics, ou encore pour que les opérateurs publics et privés coordonnent mieux leurs chaniers. https://adresse.data.gouv.fr
  23. 23. ➢ Quelles sont les données ouvertes ? Page ‹N°›Public SII Public SII Electeurs, conseillers, indemnités des élus, ordres du jour, résultats d'élecions, liste des bureaux de vote, liste des maires, discriminaion ethnique, liste des associaions, subvenions, acivités associaives, référenael des données associaaves, périmètre conseil de quarier, accès à l'informaion, délibéraions, staasaques santé, cantons, circonscripions, actes administraifs, financements européens, impôts, aide sociale, budget, achats-marchés, taxes de séjour, facturaion, effecif des agents itulaires. Regards Citoyens Associaion consituée de citoyens qui propose un accès simplifié au foncionnement des insituions publiques. Elle est à l’iniiaive de plusieurs sites : regardscitoyens.org, nosdonnees.fr, nosdeputes.fr. Agence Régional de Santé L’ARS de la région Paca publie les dépenses de santé Vie démocratique et données financières
  24. 24. ➢ Quelles sont les données ouvertes ? Page ‹N°›Public SII Public SII Statistiques de créations d'actes d'état civil, cimetières, liste des prénoms, historique des fils d'attente du service état civil, recensement de la population, diagnostic territorial, aires d'accueil. Filae L'entreprise privée Filae (ex genealogie.com) a profité début décembre 2016 de l'absence de mise en conformité des archives départementales avec la loi Valter pour réuiliser à des fins commerciales les données numérisées par ces départements. Ancestry Au niveau internaional Ancestry propose de nombreux services de généalogie et s’appuie sur un nombre important de jeux de données publiques ouvertes. Etat-civil, démographie, population
  25. 25. ➢ Quelles sont les données ouvertes ? Page ‹N°›Public SII Public SII Commerces, revenus fiscaux, emploi, entreprise, activités économiques, distributeurs de billets, liste des marchés, politique de développement, aménagement du territoire, économie sociale, agriculture. Economie DatainfoGreffe La nouvelle plateforme Datainfogreffe permet d'accéder en libre accès aux jeux de données sur les sociétés commerciales. Naguère payantes, ces données d'uilité publique sont désormais gratuites. 3 millions d’entreprises, 2 millions de visites chaque mois SIREN Depuis le 1er janvier 2017, la plus grande base de données existante sur l’état-civil des entreprises. 10 millions d’établissements ac;fs mis à jour le 1er de chaque mois Data Publica (C-Radar) Entreprise Française qui propose différents services sur le marché de la donnée dont un portail de données publiques.
  26. 26. ➢ Quelles sont les données ouvertes ? Page ‹N°›Public SII Public SII Zone artistique temporaire, emprunts et réservations bibliothèques, agendas culturels, lieu de tournage de films, liste des ouvrages de bibliothèques, statistiques de prêts, statistiques de fréquentation d'expositions, prêts d’œuvres du musée, annuaires, campings, hôtels, chambres d'hôtes, lieux de visite, restaurants, photographies des monuments, monuments et sites classés, inventaire équipements, inventaire patrimoine, liste des bibliothèques, gîtes communaux, ambassades. Art, Culture, Patrimoine et Tourisme Bibliothèque Naaonale de France Le projet s’inscrit dans une démarche d’ouverture de la BnF au Web de données et d’adopion des standards du Web sémanique. Les données brutes de data.bnf.fr sont disponibles selon la Licence ouverte française, uilisée par data.gouv.fr CultureClic, la culture augmentée 850 œuvres et documents, 1350 musées et monuments en réalité augmentée. DataTourisme La plateforme Open Data de l’informaion tourisique et documents (API disponible fin d’année 2017).
  27. 27. ➢ Quelles sont les données ouvertes ? Page ‹N°›Public SII Public SII Parcours, Tour de France, aires de jeux, manifestaaons sporaves, équipements sporifs, jardins familiaux, aires de pique-nique, borne d'eau potable, passeport jeune, localisaion et liste des écoles, nombre d'enfants par année par école, éducaion, carte scolaire, effecifs, pôle jeunesse, accès à l’éducaion. Sport, Loisirs et Education DataFrance.fr DataFrance est une plateforme de visualisaion de données ouvertes. Grâce à une carte interacive et à plus de 36 000 fiches dédiées à chaque commune, nous permeyons la consultaion, la comparaison et l’analyse de données sur tout le territoire français
  28. 28. ➢ Quelles sont les données ouvertes ? Page ‹N°›Public SII Public SII Collecte des déchets, qualité de l'air, parcs et jardins, cours d'eau, botanique, poteaux incendie, distributeurs de sacs canins, remplacement des saniseyes et des urinoirs, caniseyes, bilan carbone, espaces végétalisés, corbeilles de propreté, points de regroupement des ordures ménagères, développement durable, eau et assainissement, polluaon automobile, gesion des ressources, prévenaon des risques, chanaers perturbants, ressources naturelles. Environnement Enedis Consommaion, producion et moyens mis en oeuvre. IOT avec les boiiers connecté Linky RATP Qualité de l’air mesurée dans les staions souterraines. Grand Poiaers Arrêtés de travaux voirie SIE : Système d’informaaon sur l’Eau Diffusion des données et des indicateurs sur l’eau, les milieux aquaiques, leurs usages et les services publics de distribuion d’eau et d’assainissement.
  29. 29. ➢ Quelles sont les données ouvertes ? Page ‹N°›Public SII Public SII Cadastre, zones urbaines, déclaraion d'intenion d'aliéné, permis de construire, zones piétonnes, découpage quarier, voirie, plans de ville, données géographiques, plan parcellaire, éclairage public, arrêtés d'insalubrité, autorisaion d'urbanisme, ouvrage d'art, terrain d’accueil gens du voyage, bancs publics, poliique de la ville. Urbanisme et habitat KelQuaraer.com Kel Quarier vous aide à trouver le quarier où habiter, en vous donnant toutes les réponses aux quesions que l’on se pose lorsque l’on change de quarier et de ville. Kel Quarier offre des jeux de données et des API à desinaion des acteurs immobiliers, des cabinets de conseil et des réseaux de distribuion. Home’n’go Home’n’go est un service enièrement gratuit qui centralise toutes les annonces immobilières des principaux sites immobiliers et vous permet, grâce à des données privées et publiques, d’obtenir des informaions détaillées et perinentes concernant la vie autour du logement qui vous intéresse.
  30. 30. ➢ Quelles sont les données ouvertes ? Page ‹N°›Public SII Public SII Feux et panneaux de signalisaion, panneaux d'affichage, hébergement d'urgence, fontaines, bâiments, espaces chiens, éclairages publics, bâiments publics, bornes de recharge de véhicules électriques, accessibilité, occupaion du domaine public, déclaraion d'intenion de commencement de travaux, mobilier urbain, réseau d'eau pluviale, WC public, défibrillateurs, distributeurs de préservaifs, catalogue des cours municipaux d'adultes, consultaaon des centres de santé, liste des kiosques, point d'apport volontaire du texile. Equipements et services d’interêt public Borne de recharge pour voiture électrique L’Open Data devient la règle, sauf pour les données en temps réel (décret du 13 janvier 2017) HAS : Haute Autorité de Santé Les premières données mises en ligne concernent l’évaluaion du médicament, la cerificaion et les indicateurs de qualité et de sécurité des soins des établissements de santé.
  31. 31. Public SII Comment valoriser les données ?
  32. 32. ➢ Comment valoriser les données ? Public SII L’Open Data Journalism Le journalisme de données est un mouvement visant à exploiter les données dans une opique journalisique. S’il s’agit esseniellement de collecter des données (et d’en vérifier la source et l’actualité), le mouvement fait appel aux ouils de visualisaion des données pour transcrire l’informaion. Le Data Journalism est un processus à 3 étapes qui consiste à
 - collecter la donnée (en pariculier l’open data),
 - la préparer et l’analyser (via des staisiques descripives par exemple),
 - la présenter et l’expliquer par des visualisaions intelligibles.
 Le but étant de faire émerger de nouvelles connaissances, de nouveaux récits. Exemple : La révélaion du scandale des notes de frais des parlementaires britanniques
  33. 33. ➢ Comment valoriser les données ? Public SII Le LOD (Linked Open Data) Linked Data Comme le nom l’indique, les Linked Data décrivent des données reliées entre elles. Pour qu’elles puissent être reliées, il faut a) qu’elles soient publiées sur le web et b) qu’elles aient un idenafiant unique sous forme de HTTP URI. Les données sont liées entre elles au travers de combinaisons « donnée-lien-donnée », ou « sujet-prédicat-objet » Linked Open Data Le linked open data (LOD) est un concept qui associe systémaiquement les deux concepts suivants : la donnée liée et la donnée ouverte. 
 Aujourd’hui le nuage des données ouvertes liées est consitué de plus d’un millier de jeux de données. Google, Facebook, Amazon, DBpedia, GeoNames, MusicBrainz
  34. 34. ➢ Comment valoriser les données ? Public SII Monétisation de la donnée ou le Data Marketing Le « Big data » se mue en « Data Markeang » lorsqu'il met les données au service d'un markeang plus performant. Quelques chiffres • 85% des organisaaons envisagent d'échanger leurs données avec des aers* • 27% ont iniaé une réflexion autour de la monéasaaon de la donnée • Gartner esime qu’à l’horizon 2017, 30% des entreprises mondiales seront amenées à commercialiser leurs données Pourquoi ouvrir ses données ? On va me disputer On va comprendre ma stratégie Il va y avoir un problème de sécurité Pourquoi investir dans l’analyse des mes datas quand j’ai d’autres chantier à aborder ? Améliorer l’expérience consommateur Générer des nouveaux clients ou des revenus complémentaires Réduire les coûts tout en s’améliorant Conserver une position de leader «  Fin mars 2017, Google fait sensation en annonçant la mort prochaine du moteur de recherche tel que nous le connaissons aujourd’hui pour rentrer peu à peu dans « l’ère de l’assistance ». DataMarketing Paris, 16&17 novembre 2017 https://datamarketingparis.com https://www.thinkwithgoogle.com
  35. 35. ➢ Comment valoriser les données ? Public SII Open Data et Open Innovation L’Open Innovation (innovation ouverte) est le paradigme selon lequel une entreprise a adapté sa stratégie complète d’innovation afin de tirer le meilleur parti du microcosme qui l’entoure. Cela consiste notamment : • à maximiser le recours à des solutions développées en EXTERNE • à monétiser des technologies développées en INTERNE.
  36. 36. ➢ Comment valoriser les données ? Public SII Self Data La production, l’exploitation et le partage de données personnelles par les individus, sous leur contrôle et à leurs propres fins. • Self Data en France, • Mydata en Finlande, • Midata en Angleterre, • Smart Disclosure aux Etats-Unis, • VRM (Vendor RelationShip Management), • Quantified Self, Devenir l’acteur de ses données personnelles : contrôler ses données ; faire des choix ; ou encore contribuer à des projets collectifs 1. Un individu obtient ses données personnelles des organisations avec lesquelles il est en relation et en ajoute d’autres qu’il capte ou produit lui-même. 2. Il les stocke et les administre de manière sécurisée (par exemple à l’aide de Pims – Personal Information Management Systems, comme les Cloud Personnels) 3. Et il les exploite à ses propres fins à l’aide d’applications et de services tiers Ticket de caisse, déplacements, SMS, appels, publications réseaux sociaux, navigation web, formation et emploi, données administratives Les organisations vont également y gagner, en retrouvant la confiance et la fidélité de leurs clients, en améliorant la qualité des données et en gagnant en compétitivité. http://mesinfos.fing.org/
  37. 37. Public SII Retour d’expérience
  38. 38. ➢ REX Public SII REX : 48h pour faire parler les données open data de la ville de La Rochelle DATA LE PROJET 348 Datasets EXTRACTION 1,5 Go de données TRAITEMENT +4 Millions de records INDEXATION VISUALISATION Intégration Adaptable
  39. 39. ➢ REX Public SII La qualité de la donnée ouverte Quelques dimensions de qualité Utilité , Accessibilité , Compréhensibilité , Visibilité , Fraicheur , Complétude , Cohérence , Traçabilité , Redondance , Unicité , Sécurité de l’accès , Confidentialité , Interconnexion Etudions maintenant le jeux de données suivant : « File d’attente du service Etat-Civil »
  40. 40. ➢ REX Public SII Définit à quel point les données sont localisables par l’utilisateur. Moteur de recherche du portail Google (1er résultat retour le portail) Catalogue des métadonnées Détails • Catégorie : Gestion Interne • Sous Catégorie : File d’attente du service Etat-Civil • Mots clés : attente file Visibilité
  41. 41. ➢ REX Public SII Définit à quel point les données apportent une valeur ajoutée dans leur utilisation • Combien de tickets par jour, semaine, mois, année ? • Combien de tickets par service ? • Combien de tickets par site ? • Quel est le délai d’attente mini, moyen, max ? • Quel est le délai d’attente en temps réel ? Qualité de service : la prévision du délai d’attente Utilité
  42. 42. ➢ REX Public SII Définit à quel point les données sont disponibles, récupérables Licence LO/OL Consommation à partir du portail web Format XML Format JSON (double quote manquante sur date, ISO 8601) Format CSV (retour à ligne dans champ texte/saisie) Format XLSX (propriétaire) Consommation à partir de l’API REST Format XML Format JSON Méta-Données Pagination (mécanisme d’offset / limit insuffisant) Accessibilité
  43. 43. ➢ REX Public SII Définit à quel point les données portent l’information de leur provenance. Source d’origine Identification du producteur Métadonnées Techniques (RDF,CSV,TXT,JSON) Processus de transformation subi avant publication Détails • Producteur : VLR - Etat civil, formalités et élections • Origine : File d’attente et ticket du service Etat-Civil • Propriété intellectuelle : Ville de La Rochelle Traçabilité
  44. 44. ➢ REX Public SII Définit à quel point les données sont compréhensibles, incluant par exemple l’éventuelle présence d’un support et d’une documentation Métadonnées Techniques (RDF,CSV,TXT,JSON) Métadonnées Fonctionnelles (pas de normalisation, pas de documentation, présence de liens inconnu) Example (fichier ticket) ti_site : 2 => Quel est le site 2, existe t’il une autre source contenant cette référence ? ti_file_id => Cela représente une référence externe au fichier file ? Quand ti_attente est vide, cela veut dire qu’il n’y à pas eu d’attente ? Compréhensibilité
  45. 45. ➢ REX Public SII Définit le niveau de couverture avec lequel le phénomène observé est représenté dans l’assemblage des données. Information manquante ou non cohérente L’identifiant et le numéro du dernier ticket appelé = dernier ticket retiré ET l’heure du dernier ticket retiré est présente MAIS l’heure du dernier ticket appelé est vide / nulle "data": [{ "file_heure_dern_ticket_appele": null, "file_id_dern_ticket_appele": "2-2010-8-24-2", "file_id_dern_ticket_retire": "2-2010-8-24-2", "file_num_dern_ticket_retire": 991, "file_num_dern_ticket_appele": 991, "file_heure_dern_ticket_retire": Tue Aug 24 17: 57: 42 CEST 2010 }] Complétude
  46. 46. ➢ REX Public SII Définit à quel point les données sont redondantes. 1 sujet « file d’attente état-civil » mais plusieurs jeux de données : un jeux de données agrégé (file d’attente) + un jeux de données global (ticket) Redondance + =
  47. 47. ➢ REX Public SII Définit à quel point les données sont suffisamment récentes. Pas de temps réel Dernière publication : 23 mai 2012 Fraîcheur
  48. 48. ➢ REX Public SII Définit à quel point l’accès aux données est contrôlé. API SSL (https://) L’api est contrôlé par une clé developpeur, dans un but de contrôler les ressources / requêtes Sécurité de l’accès
  49. 49. ➢ REX Public SII Définit à quel point la confidentialité des informations personnelles est préservée. Aucune référence vers la personne ayant retirée un ticket La CNIL recommande de ne pas faire figurer de statistiques conçues à partir d'une agrégation inférieure à dix éléments Autre exemple, l’agrégation des données par mois, afin d’anonymiser. Confidentialité
  50. 50. ➢ REX Public SII Définit à quel point les données sont riches et précises en terme de lien vers des sources externe complémentaires. Pas de format RDF (linked data) Pas de liens vers d’autres sources (le site par exemple, pour géolocalisation, horaire, etc.) Interconnexion RDF (modèle de description de données sous forme de graphes) Faire du RDF consiste, à écrire l'équivalent de phrases simples pour que des machines puissent se parler et échanger des données de façon intelligente.
  51. 51. ➢ REX Public SII La qualité de la donnée ouverte : les outils QUALIDATA Retenu dans le cadre de l’appel à projets soutenu par le Programme d’Investissement d’Avenir (PIA2), « Open Data au sein des territoires », le projet QUALIDATA propose de créer une plateforme nationale capable de tester la qualité des données publiées au niveau local, de qualifier les sources et de permettre des exploitations cohérentes au niveau national. Il s’adresse aux collectivités ou producteurs privés souhaitant disposer d’un outil externe de validation (sur le modèle du Validator du W3C) pour améliorer leurs propres données publiées en Open Data. Le projet se déroulera d’Octobre 2017 à Mi-2019 http://www.opendatafrance.net/wp-content/uploads/2017/09/QUALIDATA_ODF_Extract.pdf Opquast 72 règles destinées aux producteurs de données ouvertes http://checklists.opquast.com/fr/opendata/

×