1. Atelier Etalab
François Bancilhon twitter.com/fbancilhon
Christian Frisch
www.data-publica.com
20 juillet 2011
2. Plan
• Disruption de l’éco-système de la distribution des données
électroniques
• Technologies clé pour cet éco-système
• Modèle économique de Data Publica
• Annuaire de Data Publica : présent et futur
3. Eco-système de la distribution de données
• Les vendeurs traditionnels
• En France, 1,6Md Euros, 160 acteurs, 9 verticaux (GFII)
• Les nouveaux acteurs
• US : Factual, Datamarket, Socrata, Infochimps, etc.
• UK : éco-système autour de data.gov.uk (Timetric, OpenLocal,
OpenCorporates, etc.)
• Les mastodontes
• Google, IBM, Microsoft, Amazon
Et la Gaule ?
4. Les technologies clé pour cet éco-système
• Traitement de données
• ETL (extract, transform & load), crawling, scraping, text mining,
data cleansing, web sémantique, etc.
• Livraison de données
• Téléchargement, API génériques et spécifiques, DSPL, OData
• NoSQL, MapReduce
En Gaule : bonne technologie, PME et Labos recherche
5. Modèle économique de Data Publica
Catalogue Supermarché
de données des données
chercher acheter
Jeux de données Actu des
sur mesure données
commander s’informer
6. L’annuaire actuel Data Publica
• www.data-publica.com
• Libre, gratuit, ouvert
• 180 éditeurs, 2 600 jeux de données, 5 200 publications
• Données + méta-données et moteur de recherche
• Périmètre visé
• PPGP (public/privé & gratuit/payant)
• RNE (régional/national/européen)
• Focalisé France
8. Notre contribution à l’ouverture des données
• Recenser (en mode pull)
• Instrumenter (méta-données, catégories, formats, etc.)
• Fournir des outils (recherche, navigation, stats, API, etc.)
• Plateforme gratuite et ouverte
• Mise à disposition d’une plateforme en open source
prévue