SlideShare une entreprise Scribd logo
Open Data
Quelques bonnes pratiques sur Excel
Jeudi 27 juin 2013
Page 2 - Bonnes pratiques sur Excel
Sommaire
 La qualité d’une donnée
 Les étapes de publication
 Bonnes pratiques sur Excel
 Structure
 Données
 Présentation
Page 3 - Bonnes pratiques sur Excel
Contexte : la « qualité » d'une donnée
1. Données (non filtrées c'est-à-dire dégradées) en ligne quel que soit leur format
2. Données structurées (par exemple données tabulaires en CSV, XML,
Excel, …)
3. Données libres d'être exploitées juridiquement et techniquement
dans des formats non-propriétaires
(notamment pas Excel)
4. Une URL par jeu de données, de sorte que l'on
puisse pointer dessus
5. Lier les données à d'autres
personnes ou infos
pour fournir un contexte
à ces données
Échelle de qualité
définie en 2010 par
Tim Berners-Lee
Page 4 - Bonnes pratiques sur Excel
Les étapes de publication
Fichier Excel
Fichier(s) Excel « nettoyé(s) »
(structure, données, présentation)
Ajout ou reformatage des adresses
Filtre sur l’IDF pour les données
externes
Géocodage via API
OSM ou Google Map
+ corrections (environ
5% des données)
Fichier CSV
Contrôle, nettoyage des données
pour géocoder, …
Publication avec
les métadonnées
Page 5 - Bonnes pratiques sur Excel
Bonnes pratiques sur Excel : structure
 Une feuille = un jeu de données
Un tableau par feuille
 1 onglet = un jeu de données
 Ou 1 jeu = fusion des onglets
 Exemples
 Recensement des équipement sportifs = 1 fichier redécoupé en
8 jeux de données (1 par département)
 Domaines d’intérêt majeur (DIM) : équipements mi-lourds
financés en 2012 = 1 jeu de données reprenant l’ensemble des
onglets
Page 6 - Bonnes pratiques sur Excel
Bonnes pratiques sur Excel : structure
 En-têtes sur la 1ère ligne (= titres de colonnes)
 Pas de cellule vide dans les titres de colonnes
Page 7 - Bonnes pratiques sur Excel
Bonnes pratiques sur Excel : structure
 Pas de cellule fusionnée (titres et contenu)
 Attention aux lignes masquées !
 elles s’affichent en CSV
 Éviter les lignes ou colonnes vides
 Attention aux données « orphelines » !
Page 8 - Bonnes pratiques sur Excel
Bonnes pratiques sur Excel : données
 Indiquer des adresses quand cela est possible
 Formater l'adresse en 3 champs mini (voie, cp, ville)
 Indiquer les unités de mesures
(dans le fichier ou dans les métadonnées)
 Préciser les dates (mois, année)
 Pas de totaux ou sous-totaux
 Attention aux formules "cassées" qu’il est parfois
difficile de corriger
Page 9 - Bonnes pratiques sur Excel
Bonnes pratiques sur Excel : présentation
 Pas d’information transmise par la couleur
 Dans le format CSV, ces données sont supprimées !
http://www.data.gouv.fr/DataSet/30382387?xtmc=frequentation+des+musees+de+france&xtcr=2
http://data.iledefrance.fr/explore/dataset/frequentation_des_musees_franciliens_entre_2006_et_2010#?tab=table
Page 9 - Bonnes pratiques sur Excel
Bonnes pratiques sur Excel : présentation
 Pas d’information transmise par la couleur
 Dans le format CSV, ces données sont supprimées !
http://www.data.gouv.fr/DataSet/30382387?xtmc=frequentation+des+musees+de+france&xtcr=2
http://data.iledefrance.fr/explore/dataset/frequentation_des_musees_franciliens_entre_2006_et_2010#?tab=table

Contenu connexe

Similaire à OpenData : quelques bonnes pratiques sur Excel

Comment utiliser microsoft Excel ? Guide Complet et Conseils Pratiques ( Oui)
Comment utiliser microsoft Excel ? Guide Complet et Conseils Pratiques ( Oui)Comment utiliser microsoft Excel ? Guide Complet et Conseils Pratiques ( Oui)
Comment utiliser microsoft Excel ? Guide Complet et Conseils Pratiques ( Oui)
mar yame
 
xml_bd_ouahdikrid.ppt
xml_bd_ouahdikrid.pptxml_bd_ouahdikrid.ppt
xml_bd_ouahdikrid.ppt
LeilaAmrane
 
Data visualisations sur les données des représentants d’intérêts (lobbies) en...
Data visualisations sur les données des représentants d’intérêts (lobbies) en...Data visualisations sur les données des représentants d’intérêts (lobbies) en...
Data visualisations sur les données des représentants d’intérêts (lobbies) en...
Thibaud Aschbacher
 
COURS EXCEL Présentation EXCEL Création d’un document Sauvegarder le fichier
COURS EXCEL  Présentation EXCEL  Création d’un document Sauvegarder le fichierCOURS EXCEL  Présentation EXCEL  Création d’un document Sauvegarder le fichier
COURS EXCEL Présentation EXCEL Création d’un document Sauvegarder le fichier
Bassim ELKHATTABY
 
Gathering Tools Presentation CXP
Gathering Tools Presentation CXPGathering Tools Presentation CXP
Gathering Tools Presentation CXP
Calame Software
 
Modèles de données et langages de description ouverts 2021-2022 - 3
Modèles de données et langages de description ouverts   2021-2022 - 3Modèles de données et langages de description ouverts   2021-2022 - 3
Modèles de données et langages de description ouverts 2021-2022 - 3
François-Xavier Boffy
 
2éme année transversal s3
2éme année transversal s32éme année transversal s3
2éme année transversal s3
Taha Can
 
Formation access
Formation accessFormation access
Formation access
bouyahia76
 
Création de tableaux HTML accessibles avec des fonctionnalités avancées
Création de tableaux HTML accessibles avec des fonctionnalités avancéesCréation de tableaux HTML accessibles avec des fonctionnalités avancées
Création de tableaux HTML accessibles avec des fonctionnalités avancées
Toufic Sbeiti
 
Réalisation d'un mashup de données avec DSS de Dataiku - Première partie
Réalisation d'un mashup de données avec DSS de Dataiku - Première partieRéalisation d'un mashup de données avec DSS de Dataiku - Première partie
Réalisation d'un mashup de données avec DSS de Dataiku - Première partie
Gautier Poupeau
 
A Brief History of Database Management (SQL, NoSQL, NewSQL)
A Brief History of Database Management (SQL, NoSQL, NewSQL)A Brief History of Database Management (SQL, NoSQL, NewSQL)
A Brief History of Database Management (SQL, NoSQL, NewSQL)
Abdelkader OUARED
 
Microsoft office access 1: pourquoi
Microsoft office access 1: pourquoiMicrosoft office access 1: pourquoi
Microsoft office access 1: pourquoi
Hicham ELGOUDALI
 
7. information modelling
7. information modelling7. information modelling
7. information modelling
sugogo
 
Cours de C++, en français, 2002 - Cours 3.4
Cours de C++, en français, 2002 - Cours 3.4Cours de C++, en français, 2002 - Cours 3.4
Cours de C++, en français, 2002 - Cours 3.4
Laurent BUNIET
 
coursaccess.pdf
coursaccess.pdfcoursaccess.pdf
coursaccess.pdf
AyoubElKhatib
 
Green System University - Development JDEdwards (French Version) - Tome1
Green System University - Development JDEdwards (French Version) - Tome1Green System University - Development JDEdwards (French Version) - Tome1
Green System University - Development JDEdwards (French Version) - Tome1
Minh-Tri Nguyen
 
Introduction aux bases de données
Introduction aux bases de donnéesIntroduction aux bases de données
Introduction aux bases de données
Abdoulaye Dieng
 
Ayoub's Cours of Excel
Ayoub's Cours of ExcelAyoub's Cours of Excel
Ayoub's Cours of Excel
Ayoub Ben Ali
 

Similaire à OpenData : quelques bonnes pratiques sur Excel (20)

Comment utiliser microsoft Excel ? Guide Complet et Conseils Pratiques ( Oui)
Comment utiliser microsoft Excel ? Guide Complet et Conseils Pratiques ( Oui)Comment utiliser microsoft Excel ? Guide Complet et Conseils Pratiques ( Oui)
Comment utiliser microsoft Excel ? Guide Complet et Conseils Pratiques ( Oui)
 
xml_bd_ouahdikrid.ppt
xml_bd_ouahdikrid.pptxml_bd_ouahdikrid.ppt
xml_bd_ouahdikrid.ppt
 
Data visualisations sur les données des représentants d’intérêts (lobbies) en...
Data visualisations sur les données des représentants d’intérêts (lobbies) en...Data visualisations sur les données des représentants d’intérêts (lobbies) en...
Data visualisations sur les données des représentants d’intérêts (lobbies) en...
 
COURS EXCEL Présentation EXCEL Création d’un document Sauvegarder le fichier
COURS EXCEL  Présentation EXCEL  Création d’un document Sauvegarder le fichierCOURS EXCEL  Présentation EXCEL  Création d’un document Sauvegarder le fichier
COURS EXCEL Présentation EXCEL Création d’un document Sauvegarder le fichier
 
Gathering Tools Presentation CXP
Gathering Tools Presentation CXPGathering Tools Presentation CXP
Gathering Tools Presentation CXP
 
Modèles de données et langages de description ouverts 2021-2022 - 3
Modèles de données et langages de description ouverts   2021-2022 - 3Modèles de données et langages de description ouverts   2021-2022 - 3
Modèles de données et langages de description ouverts 2021-2022 - 3
 
2éme année transversal s3
2éme année transversal s32éme année transversal s3
2éme année transversal s3
 
Formation access
Formation accessFormation access
Formation access
 
Création de tableaux HTML accessibles avec des fonctionnalités avancées
Création de tableaux HTML accessibles avec des fonctionnalités avancéesCréation de tableaux HTML accessibles avec des fonctionnalités avancées
Création de tableaux HTML accessibles avec des fonctionnalités avancées
 
Support de cours_excel
Support de cours_excelSupport de cours_excel
Support de cours_excel
 
Réalisation d'un mashup de données avec DSS de Dataiku - Première partie
Réalisation d'un mashup de données avec DSS de Dataiku - Première partieRéalisation d'un mashup de données avec DSS de Dataiku - Première partie
Réalisation d'un mashup de données avec DSS de Dataiku - Première partie
 
A Brief History of Database Management (SQL, NoSQL, NewSQL)
A Brief History of Database Management (SQL, NoSQL, NewSQL)A Brief History of Database Management (SQL, NoSQL, NewSQL)
A Brief History of Database Management (SQL, NoSQL, NewSQL)
 
Microsoft office access 1: pourquoi
Microsoft office access 1: pourquoiMicrosoft office access 1: pourquoi
Microsoft office access 1: pourquoi
 
7. information modelling
7. information modelling7. information modelling
7. information modelling
 
Cours de C++, en français, 2002 - Cours 3.4
Cours de C++, en français, 2002 - Cours 3.4Cours de C++, en français, 2002 - Cours 3.4
Cours de C++, en français, 2002 - Cours 3.4
 
coursaccess.pdf
coursaccess.pdfcoursaccess.pdf
coursaccess.pdf
 
Green System University - Development JDEdwards (French Version) - Tome1
Green System University - Development JDEdwards (French Version) - Tome1Green System University - Development JDEdwards (French Version) - Tome1
Green System University - Development JDEdwards (French Version) - Tome1
 
Introduction aux bases de données
Introduction aux bases de donnéesIntroduction aux bases de données
Introduction aux bases de données
 
Ayoub's Cours of Excel
Ayoub's Cours of ExcelAyoub's Cours of Excel
Ayoub's Cours of Excel
 
09coursaccess
09coursaccess09coursaccess
09coursaccess
 

OpenData : quelques bonnes pratiques sur Excel

  • 1. Open Data Quelques bonnes pratiques sur Excel Jeudi 27 juin 2013
  • 2. Page 2 - Bonnes pratiques sur Excel Sommaire  La qualité d’une donnée  Les étapes de publication  Bonnes pratiques sur Excel  Structure  Données  Présentation
  • 3. Page 3 - Bonnes pratiques sur Excel Contexte : la « qualité » d'une donnée 1. Données (non filtrées c'est-à-dire dégradées) en ligne quel que soit leur format 2. Données structurées (par exemple données tabulaires en CSV, XML, Excel, …) 3. Données libres d'être exploitées juridiquement et techniquement dans des formats non-propriétaires (notamment pas Excel) 4. Une URL par jeu de données, de sorte que l'on puisse pointer dessus 5. Lier les données à d'autres personnes ou infos pour fournir un contexte à ces données Échelle de qualité définie en 2010 par Tim Berners-Lee
  • 4. Page 4 - Bonnes pratiques sur Excel Les étapes de publication Fichier Excel Fichier(s) Excel « nettoyé(s) » (structure, données, présentation) Ajout ou reformatage des adresses Filtre sur l’IDF pour les données externes Géocodage via API OSM ou Google Map + corrections (environ 5% des données) Fichier CSV Contrôle, nettoyage des données pour géocoder, … Publication avec les métadonnées
  • 5. Page 5 - Bonnes pratiques sur Excel Bonnes pratiques sur Excel : structure  Une feuille = un jeu de données Un tableau par feuille  1 onglet = un jeu de données  Ou 1 jeu = fusion des onglets  Exemples  Recensement des équipement sportifs = 1 fichier redécoupé en 8 jeux de données (1 par département)  Domaines d’intérêt majeur (DIM) : équipements mi-lourds financés en 2012 = 1 jeu de données reprenant l’ensemble des onglets
  • 6. Page 6 - Bonnes pratiques sur Excel Bonnes pratiques sur Excel : structure  En-têtes sur la 1ère ligne (= titres de colonnes)  Pas de cellule vide dans les titres de colonnes
  • 7. Page 7 - Bonnes pratiques sur Excel Bonnes pratiques sur Excel : structure  Pas de cellule fusionnée (titres et contenu)  Attention aux lignes masquées !  elles s’affichent en CSV  Éviter les lignes ou colonnes vides  Attention aux données « orphelines » !
  • 8. Page 8 - Bonnes pratiques sur Excel Bonnes pratiques sur Excel : données  Indiquer des adresses quand cela est possible  Formater l'adresse en 3 champs mini (voie, cp, ville)  Indiquer les unités de mesures (dans le fichier ou dans les métadonnées)  Préciser les dates (mois, année)  Pas de totaux ou sous-totaux  Attention aux formules "cassées" qu’il est parfois difficile de corriger
  • 9. Page 9 - Bonnes pratiques sur Excel Bonnes pratiques sur Excel : présentation  Pas d’information transmise par la couleur  Dans le format CSV, ces données sont supprimées ! http://www.data.gouv.fr/DataSet/30382387?xtmc=frequentation+des+musees+de+france&xtcr=2 http://data.iledefrance.fr/explore/dataset/frequentation_des_musees_franciliens_entre_2006_et_2010#?tab=table
  • 10. Page 9 - Bonnes pratiques sur Excel Bonnes pratiques sur Excel : présentation  Pas d’information transmise par la couleur  Dans le format CSV, ces données sont supprimées ! http://www.data.gouv.fr/DataSet/30382387?xtmc=frequentation+des+musees+de+france&xtcr=2 http://data.iledefrance.fr/explore/dataset/frequentation_des_musees_franciliens_entre_2006_et_2010#?tab=table