SlideShare une entreprise Scribd logo
COMPRENDRE ET AFFINER LES DONNÉES
COMPRENDRE LES DONNÉES POUR MIEUX
LES EXPLOITER
COMPRENDRE LES DONNÉES
Les données à votre
disposition peuvent en
dire long sur le
phénomène que vous
étudiez.
COMPRENDRE LES DONNÉES
Afin de les faire « parler », essayez de bien les
comprendre.
Posez-vous les questions suivantes :
● Quel type d’informations définissent-elles ?
● Quelles sont leurs caractéristiques principales ?
● Quel est leur impact sur le contexte étudié ?
COMPRENDRE LES DONNÉES
Il est important :
● de bien comprendre la nature
des données
● de comprendre comment les
analyser à travers certaines
opérations simples
LES CARACTÉRISTIQUES DE VOS DONNÉES :
GÉOGRAPHIQUES, TEMPORELLES,
DESCRIPTIVES
DONNÉES GÉOGRAPHIQUES
Les données que vous utilisez
pour vos travaux pourraient
contenir des informations de
type géographique.
C’est-à-dire quelle est l’ampleur
d’un phénomène dans un
territoire donné.
DONNÉES GÉOGRAPHIQUES
○À quel territoire font-elles référence ? National,
régional, provincial ou municipal ?
○Quel est le lien entre ce territoire et le projet
que vous avez choisi sur OpenCoesione et que
vous approfondissez ?
○Quelles informations supplémentaires
pourriez-vous rassembler en analysant les
informations géographiques de vos données ?
SÉRIES HISTORIQUES
Les données peuvent permettre
d’analyser l’évolution d'un
phénomène dans le temps et de
mesurer sa variation (par exemple
d’un mois à l’autre ou d’une
année à l’autre).
SÉRIES HISTORIQUES : EXEMPLES
Le tri sélectif des déchets
a-t-il augmenté, diminué
ou stagné ?
Le nombre de touristes
dans un territoire est-il
constant d’une année
à l’autre où y a-t-il des
variations ?
Le phénomène
examiné augmente-
t-il ou diminue-t-il
(par exemple d’un
mois à l’autre) ?
DONNÉES QUALITATIVES
Il s’agit de données qui
définissent les qualités
et les caractéristiques
intrinsèques d’un ou
plusieurs objets.
Vous devez donc vous poser les
questions suivantes :
quelles sont les caractéristiques des
données que vous avez collectées ou
que vous collectez ?
Quelles sont les données susceptibles
de plus vous intéresser ?
NETTOYER LES DONNÉES
NETTOYER LES DONNÉES
Avant d’analyser les données il est
nécessaire de procéder à certaines
vérifications pour les rendre
cohérentes et exploiter au mieux leurs
caractéristiques.
Il existe des méthodes spécifiques pour
cela.
Découvrons-les ensemble...
NETTOYER LES DONNÉES
Le nettoyage des données est fondamental
pour s’assurer qu’elles sont correctement
structurées dans les lignes et les colonnes et
que les valeurs insérées sont cohérentes.
Analyser des données sans un nettoyage
minutieux peut provoquer de graves erreurs
ou des difficultés ingérables.
Il existe des outils pour nettoyer les données
comme Open Refine (http://openrefine.org)
NETTOYER LES DONNÉES
1
Contrôlez que les mêmes valeurs
sont inscrites de la même manière.
Par exemple, si la valeur
« Environnement » est également
écrite « environnement » et
« ENVIRONNEMENT » il s’agit d’une
erreur puisque les valeurs doivent
toutes être écrites de la même
manière.
NETTOYER LES DONNÉES
2
Contrôlez les dates (le cas échéant) : elles
doivent également être écrites de la même
manière.
Si certaines données sont écrites dans un
format numérique (exemple : « 01/03/2015 »)
et dans un autre format alphanumérique
(exemple : « 10 mars 2015 »), il s’agit d’une
erreur. Il est nécessaire que les dates soient
présentées dans un seul format : vérifiez-le
en cliquant sur « Format de cellule ».
NETTOYER LES DONNÉES
3
Vérifiez les chiffres.
Assurez-vous que les chiffres sont représentés
correctement.
Vérifiez le système de numérotation sur
« Paramètre de la feuille de calcul ».
ENRICHIR LES DONNÉES
DIVISER
Les données doivent être « granulaires », comme s’il s’agissait d’atomes.
Par exemple : si vos données ont une colonne consacrée aux lieux et une valeur
comme celle-ci à l’intérieur : « Marseille, Bouches-du-Rhône, Provence-Alpes-
Côte d'Azur », il convient de diviser la colonne en trois colonnes.
De cette manière, vous pourrez les analyser par Ville, Département ou Région.
AJOUTER
Il est possible que votre ensemble de
données ne vous fournisse pas toutes
les informations nécessaires. Dans
certains cas, vous devrez l’enrichir en
ajoutant de nouvelles colonnes avec
des informations spécifiques.
Vous l’avez peut-être déjà fait
partiellement, en suivant les
informations présentes, mais il peut
exister d’autres manières d’enrichir un
ensemble de données...
GÉOCODAGE
Latitude Longitude
En reprenant le même exemple, après avoir
divisé la colonne « Lieux » en trois colonnes
(Ville, Département, Région), il est utile
d’ajouter « Latitude » et « Longitude » pour
créer une carte.
Pour cela, vous devrez insérer deux
nouvelles colonnes (Latitude et Longitude)
et remonter les coordonnées
géographiques jusqu’au lieu de référence.
Longitude
Latitude
GÉOCODAGE
Vous pouvez obtenir les coordonnées géographiques en ligne.
Il y a tellement de sources en ligne : découvrez-les !
Assurez-vous systématiquement que les données sont
réutilisables (c’est possible avec OpenStreetMap et limité avec
GoogleMap).
COMPRENDRE ET AFFINER LES DONNÉES
Le projet est financé par
Avec la collaboration de
La traduction en français est financé par

Contenu connexe

Similaire à ASOCEU France - Lesson 2 - Data Refining

cours_4.pdf
cours_4.pdfcours_4.pdf
cours_4.pdf
nona298823
 
Introduction text mining
Introduction text miningIntroduction text mining
Introduction text mining
Wiem Trabelsi
 
ASOCEU FRANCE - Lesson 2 - Data Journalism (Part Two)
ASOCEU FRANCE - Lesson 2 - Data Journalism (Part Two)ASOCEU FRANCE - Lesson 2 - Data Journalism (Part Two)
ASOCEU FRANCE - Lesson 2 - Data Journalism (Part Two)
A Scuola di OpenCoesione
 
chapitre 3 Initiation au logiciel SPSS et traitement des données issues des ...
chapitre 3 Initiation au logiciel SPSS et traitement des données issues des  ...chapitre 3 Initiation au logiciel SPSS et traitement des données issues des  ...
chapitre 3 Initiation au logiciel SPSS et traitement des données issues des ...
Hamidou Leyo Idriss
 
Comment faire une base de données exploitable avec des moyens simples
Comment faire une base de données exploitable avec des moyens simples  Comment faire une base de données exploitable avec des moyens simples
Comment faire une base de données exploitable avec des moyens simples
Réseau Pro Santé
 
Diginova - Session sur le machine learning avec ML.NET
Diginova - Session sur le machine learning avec ML.NETDiginova - Session sur le machine learning avec ML.NET
Diginova - Session sur le machine learning avec ML.NET
Julien Chable
 
Equipe TATOO : Extraction de connaissances dans les bases de données : motifs...
Equipe TATOO : Extraction de connaissances dans les bases de données : motifs...Equipe TATOO : Extraction de connaissances dans les bases de données : motifs...
Equipe TATOO : Extraction de connaissances dans les bases de données : motifs...
Qualiméditerranée
 
Mettre en oeuvre sa veille informationnelle sur internet
Mettre en oeuvre sa veille informationnelle sur internetMettre en oeuvre sa veille informationnelle sur internet
Mettre en oeuvre sa veille informationnelle sur internet
Christian PIVIDORI
 
Visite guidée au pays de la donnée - Introduction et tour d'horizon
Visite guidée au pays de la donnée - Introduction et tour d'horizonVisite guidée au pays de la donnée - Introduction et tour d'horizon
Visite guidée au pays de la donnée - Introduction et tour d'horizon
Gautier Poupeau
 
#Exp utiliser ses connaissances pour expliquer un document
#Exp utiliser ses connaissances pour expliquer un document#Exp utiliser ses connaissances pour expliquer un document
#Exp utiliser ses connaissances pour expliquer un document
Serra14
 
Big data
Big dataBig data
Big data
Youssef CHOUNI
 
Salesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalkaSalesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalka
Ilan Malka
 
Aaf archivistes these
Aaf archivistes   theseAaf archivistes   these
Aaf archivistes these
AssociationAF
 
Access-2007
Access-2007Access-2007
Access-2007
Kadiro Abdelkader
 
Cours bd-access-2007
Cours bd-access-2007Cours bd-access-2007
Cours bd-access-2007
Honoris Haba
 
Diagnostic territorial
Diagnostic territorialDiagnostic territorial
Diagnostic territorial
Challenges Academia
 
Valtech - Big Data : Détails d’une mise en œuvre
Valtech - Big Data : Détails d’une mise en œuvreValtech - Big Data : Détails d’une mise en œuvre
Valtech - Big Data : Détails d’une mise en œuvre
Valtech
 
Data Science & Big Data, réalités et perspectives.
Data Science & Big Data, réalités et perspectives.Data Science & Big Data, réalités et perspectives.
Data Science & Big Data, réalités et perspectives.
Aleph Technologies
 
Sources D’Information Et MéThodologie De Recherche De L’Information
Sources D’Information Et MéThodologie De Recherche De L’InformationSources D’Information Et MéThodologie De Recherche De L’Information
Sources D’Information Et MéThodologie De Recherche De L’Information
Leghnimi Zouhair
 
Expérience informationnelle et exploitation analytique des données : comment ...
Expérience informationnelle et exploitation analytique des données : comment ...Expérience informationnelle et exploitation analytique des données : comment ...
Expérience informationnelle et exploitation analytique des données : comment ...
Le_GFII
 

Similaire à ASOCEU France - Lesson 2 - Data Refining (20)

cours_4.pdf
cours_4.pdfcours_4.pdf
cours_4.pdf
 
Introduction text mining
Introduction text miningIntroduction text mining
Introduction text mining
 
ASOCEU FRANCE - Lesson 2 - Data Journalism (Part Two)
ASOCEU FRANCE - Lesson 2 - Data Journalism (Part Two)ASOCEU FRANCE - Lesson 2 - Data Journalism (Part Two)
ASOCEU FRANCE - Lesson 2 - Data Journalism (Part Two)
 
chapitre 3 Initiation au logiciel SPSS et traitement des données issues des ...
chapitre 3 Initiation au logiciel SPSS et traitement des données issues des  ...chapitre 3 Initiation au logiciel SPSS et traitement des données issues des  ...
chapitre 3 Initiation au logiciel SPSS et traitement des données issues des ...
 
Comment faire une base de données exploitable avec des moyens simples
Comment faire une base de données exploitable avec des moyens simples  Comment faire une base de données exploitable avec des moyens simples
Comment faire une base de données exploitable avec des moyens simples
 
Diginova - Session sur le machine learning avec ML.NET
Diginova - Session sur le machine learning avec ML.NETDiginova - Session sur le machine learning avec ML.NET
Diginova - Session sur le machine learning avec ML.NET
 
Equipe TATOO : Extraction de connaissances dans les bases de données : motifs...
Equipe TATOO : Extraction de connaissances dans les bases de données : motifs...Equipe TATOO : Extraction de connaissances dans les bases de données : motifs...
Equipe TATOO : Extraction de connaissances dans les bases de données : motifs...
 
Mettre en oeuvre sa veille informationnelle sur internet
Mettre en oeuvre sa veille informationnelle sur internetMettre en oeuvre sa veille informationnelle sur internet
Mettre en oeuvre sa veille informationnelle sur internet
 
Visite guidée au pays de la donnée - Introduction et tour d'horizon
Visite guidée au pays de la donnée - Introduction et tour d'horizonVisite guidée au pays de la donnée - Introduction et tour d'horizon
Visite guidée au pays de la donnée - Introduction et tour d'horizon
 
#Exp utiliser ses connaissances pour expliquer un document
#Exp utiliser ses connaissances pour expliquer un document#Exp utiliser ses connaissances pour expliquer un document
#Exp utiliser ses connaissances pour expliquer un document
 
Big data
Big dataBig data
Big data
 
Salesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalkaSalesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalka
 
Aaf archivistes these
Aaf archivistes   theseAaf archivistes   these
Aaf archivistes these
 
Access-2007
Access-2007Access-2007
Access-2007
 
Cours bd-access-2007
Cours bd-access-2007Cours bd-access-2007
Cours bd-access-2007
 
Diagnostic territorial
Diagnostic territorialDiagnostic territorial
Diagnostic territorial
 
Valtech - Big Data : Détails d’une mise en œuvre
Valtech - Big Data : Détails d’une mise en œuvreValtech - Big Data : Détails d’une mise en œuvre
Valtech - Big Data : Détails d’une mise en œuvre
 
Data Science & Big Data, réalités et perspectives.
Data Science & Big Data, réalités et perspectives.Data Science & Big Data, réalités et perspectives.
Data Science & Big Data, réalités et perspectives.
 
Sources D’Information Et MéThodologie De Recherche De L’Information
Sources D’Information Et MéThodologie De Recherche De L’InformationSources D’Information Et MéThodologie De Recherche De L’Information
Sources D’Information Et MéThodologie De Recherche De L’Information
 
Expérience informationnelle et exploitation analytique des données : comment ...
Expérience informationnelle et exploitation analytique des données : comment ...Expérience informationnelle et exploitation analytique des données : comment ...
Expérience informationnelle et exploitation analytique des données : comment ...
 

Plus de A Scuola di OpenCoesione

ASOC2324_In-Class Exercise_Creative formats
ASOC2324_In-Class Exercise_Creative formatsASOC2324_In-Class Exercise_Creative formats
ASOC2324_In-Class Exercise_Creative formats
A Scuola di OpenCoesione
 
ASOC2324_Creative formats and presentation
ASOC2324_Creative formats and presentationASOC2324_Creative formats and presentation
ASOC2324_Creative formats and presentation
A Scuola di OpenCoesione
 
Esercitazione (LEZIONE 4) - I format creativi
Esercitazione (LEZIONE 4) - I format creativiEsercitazione (LEZIONE 4) - I format creativi
Esercitazione (LEZIONE 4) - I format creativi
A Scuola di OpenCoesione
 
ASOC2324_TUTORIAL PER L’UTILIZZO DELLA PIATTAFORMA MONITHON_MEDIE_
ASOC2324_TUTORIAL PER L’UTILIZZO  DELLA PIATTAFORMA MONITHON_MEDIE_ASOC2324_TUTORIAL PER L’UTILIZZO  DELLA PIATTAFORMA MONITHON_MEDIE_
ASOC2324_TUTORIAL PER L’UTILIZZO DELLA PIATTAFORMA MONITHON_MEDIE_
A Scuola di OpenCoesione
 
ASOC2324_TUTORIAL PER L’UTILIZZO DELLA PIATTAFORMA MONITHON
ASOC2324_TUTORIAL PER L’UTILIZZO  DELLA PIATTAFORMA MONITHONASOC2324_TUTORIAL PER L’UTILIZZO  DELLA PIATTAFORMA MONITHON
ASOC2324_TUTORIAL PER L’UTILIZZO DELLA PIATTAFORMA MONITHON
A Scuola di OpenCoesione
 
Tutorial for using the Monithon Platform - ASOC2324 EN
Tutorial for using the Monithon Platform  - ASOC2324 ENTutorial for using the Monithon Platform  - ASOC2324 EN
Tutorial for using the Monithon Platform - ASOC2324 EN
A Scuola di OpenCoesione
 
ASOC2324 EN - Planning the Monitoring Visit
ASOC2324 EN - Planning the Monitoring VisitASOC2324 EN - Planning the Monitoring Visit
ASOC2324 EN - Planning the Monitoring Visit
A Scuola di OpenCoesione
 
ASOC2324_TUTORIAL PER L’UTILIZZO DELLA PIATTAFORMA MONITHON
ASOC2324_TUTORIAL PER L’UTILIZZO  DELLA PIATTAFORMA MONITHONASOC2324_TUTORIAL PER L’UTILIZZO  DELLA PIATTAFORMA MONITHON
ASOC2324_TUTORIAL PER L’UTILIZZO DELLA PIATTAFORMA MONITHON
A Scuola di OpenCoesione
 
TUTORIAL PER L’UTILIZZO DELLA PIATTAFORMA MONITHON
TUTORIAL PER L’UTILIZZO DELLA PIATTAFORMA MONITHONTUTORIAL PER L’UTILIZZO DELLA PIATTAFORMA MONITHON
TUTORIAL PER L’UTILIZZO DELLA PIATTAFORMA MONITHON
A Scuola di OpenCoesione
 
Medie_Lezione 2_Esercitazione in classe con esperto/a
Medie_Lezione 2_Esercitazione in classe con esperto/aMedie_Lezione 2_Esercitazione in classe con esperto/a
Medie_Lezione 2_Esercitazione in classe con esperto/a
A Scuola di OpenCoesione
 
ASOC Medie_Guida agli Open Data di OpenCoesione
ASOC Medie_Guida agli Open Data di OpenCoesioneASOC Medie_Guida agli Open Data di OpenCoesione
ASOC Medie_Guida agli Open Data di OpenCoesione
A Scuola di OpenCoesione
 
Esercitazione in classe con l'esperto/a Istat
Esercitazione in classe con l'esperto/a IstatEsercitazione in classe con l'esperto/a Istat
Esercitazione in classe con l'esperto/a Istat
A Scuola di OpenCoesione
 
Comprendere i dati: strumenti principali
Comprendere i dati: strumenti principaliComprendere i dati: strumenti principali
Comprendere i dati: strumenti principali
A Scuola di OpenCoesione
 
Guida agli Open Data di OpenCoesione.pdf
Guida agli Open Data di OpenCoesione.pdfGuida agli Open Data di OpenCoesione.pdf
Guida agli Open Data di OpenCoesione.pdf
A Scuola di OpenCoesione
 
TIPS: How To Write An Article - ASOC2324 EN
TIPS: How To Write An Article - ASOC2324 ENTIPS: How To Write An Article - ASOC2324 EN
TIPS: How To Write An Article - ASOC2324 EN
A Scuola di OpenCoesione
 
Data expedition_Scuole medie
Data expedition_Scuole medieData expedition_Scuole medie
Data expedition_Scuole medie
A Scuola di OpenCoesione
 
Data expedition
Data expeditionData expedition
Data expedition
A Scuola di OpenCoesione
 
Le ricerche di ASOC
Le ricerche di ASOCLe ricerche di ASOC
Le ricerche di ASOC
A Scuola di OpenCoesione
 
Dossier di Ricerca - ASOC2324
Dossier di Ricerca - ASOC2324Dossier di Ricerca - ASOC2324
Dossier di Ricerca - ASOC2324
A Scuola di OpenCoesione
 
Data expedition - ASOC2324
Data expedition - ASOC2324Data expedition - ASOC2324
Data expedition - ASOC2324
A Scuola di OpenCoesione
 

Plus de A Scuola di OpenCoesione (20)

ASOC2324_In-Class Exercise_Creative formats
ASOC2324_In-Class Exercise_Creative formatsASOC2324_In-Class Exercise_Creative formats
ASOC2324_In-Class Exercise_Creative formats
 
ASOC2324_Creative formats and presentation
ASOC2324_Creative formats and presentationASOC2324_Creative formats and presentation
ASOC2324_Creative formats and presentation
 
Esercitazione (LEZIONE 4) - I format creativi
Esercitazione (LEZIONE 4) - I format creativiEsercitazione (LEZIONE 4) - I format creativi
Esercitazione (LEZIONE 4) - I format creativi
 
ASOC2324_TUTORIAL PER L’UTILIZZO DELLA PIATTAFORMA MONITHON_MEDIE_
ASOC2324_TUTORIAL PER L’UTILIZZO  DELLA PIATTAFORMA MONITHON_MEDIE_ASOC2324_TUTORIAL PER L’UTILIZZO  DELLA PIATTAFORMA MONITHON_MEDIE_
ASOC2324_TUTORIAL PER L’UTILIZZO DELLA PIATTAFORMA MONITHON_MEDIE_
 
ASOC2324_TUTORIAL PER L’UTILIZZO DELLA PIATTAFORMA MONITHON
ASOC2324_TUTORIAL PER L’UTILIZZO  DELLA PIATTAFORMA MONITHONASOC2324_TUTORIAL PER L’UTILIZZO  DELLA PIATTAFORMA MONITHON
ASOC2324_TUTORIAL PER L’UTILIZZO DELLA PIATTAFORMA MONITHON
 
Tutorial for using the Monithon Platform - ASOC2324 EN
Tutorial for using the Monithon Platform  - ASOC2324 ENTutorial for using the Monithon Platform  - ASOC2324 EN
Tutorial for using the Monithon Platform - ASOC2324 EN
 
ASOC2324 EN - Planning the Monitoring Visit
ASOC2324 EN - Planning the Monitoring VisitASOC2324 EN - Planning the Monitoring Visit
ASOC2324 EN - Planning the Monitoring Visit
 
ASOC2324_TUTORIAL PER L’UTILIZZO DELLA PIATTAFORMA MONITHON
ASOC2324_TUTORIAL PER L’UTILIZZO  DELLA PIATTAFORMA MONITHONASOC2324_TUTORIAL PER L’UTILIZZO  DELLA PIATTAFORMA MONITHON
ASOC2324_TUTORIAL PER L’UTILIZZO DELLA PIATTAFORMA MONITHON
 
TUTORIAL PER L’UTILIZZO DELLA PIATTAFORMA MONITHON
TUTORIAL PER L’UTILIZZO DELLA PIATTAFORMA MONITHONTUTORIAL PER L’UTILIZZO DELLA PIATTAFORMA MONITHON
TUTORIAL PER L’UTILIZZO DELLA PIATTAFORMA MONITHON
 
Medie_Lezione 2_Esercitazione in classe con esperto/a
Medie_Lezione 2_Esercitazione in classe con esperto/aMedie_Lezione 2_Esercitazione in classe con esperto/a
Medie_Lezione 2_Esercitazione in classe con esperto/a
 
ASOC Medie_Guida agli Open Data di OpenCoesione
ASOC Medie_Guida agli Open Data di OpenCoesioneASOC Medie_Guida agli Open Data di OpenCoesione
ASOC Medie_Guida agli Open Data di OpenCoesione
 
Esercitazione in classe con l'esperto/a Istat
Esercitazione in classe con l'esperto/a IstatEsercitazione in classe con l'esperto/a Istat
Esercitazione in classe con l'esperto/a Istat
 
Comprendere i dati: strumenti principali
Comprendere i dati: strumenti principaliComprendere i dati: strumenti principali
Comprendere i dati: strumenti principali
 
Guida agli Open Data di OpenCoesione.pdf
Guida agli Open Data di OpenCoesione.pdfGuida agli Open Data di OpenCoesione.pdf
Guida agli Open Data di OpenCoesione.pdf
 
TIPS: How To Write An Article - ASOC2324 EN
TIPS: How To Write An Article - ASOC2324 ENTIPS: How To Write An Article - ASOC2324 EN
TIPS: How To Write An Article - ASOC2324 EN
 
Data expedition_Scuole medie
Data expedition_Scuole medieData expedition_Scuole medie
Data expedition_Scuole medie
 
Data expedition
Data expeditionData expedition
Data expedition
 
Le ricerche di ASOC
Le ricerche di ASOCLe ricerche di ASOC
Le ricerche di ASOC
 
Dossier di Ricerca - ASOC2324
Dossier di Ricerca - ASOC2324Dossier di Ricerca - ASOC2324
Dossier di Ricerca - ASOC2324
 
Data expedition - ASOC2324
Data expedition - ASOC2324Data expedition - ASOC2324
Data expedition - ASOC2324
 

Dernier

Burkina Faso library newsletter May 2024
Burkina Faso library newsletter May 2024Burkina Faso library newsletter May 2024
Burkina Faso library newsletter May 2024
Friends of African Village Libraries
 
Cours de conjugaison des verbes du premier, deuxième et troisième groupe
Cours de conjugaison des verbes du premier, deuxième et troisième groupeCours de conjugaison des verbes du premier, deuxième et troisième groupe
Cours de conjugaison des verbes du premier, deuxième et troisième groupe
Yuma91
 
Mémoire de licence en finance comptabilité et audit
Mémoire de licence en finance comptabilité et auditMémoire de licence en finance comptabilité et audit
Mémoire de licence en finance comptabilité et audit
MelDjobo
 
Système de gestion des fichiers de amine
Système de gestion des fichiers de amineSystème de gestion des fichiers de amine
Système de gestion des fichiers de amine
sewawillis
 
Formation Intelligence Artificielle pour dirigeants- IT6-DIGITALIX 24_opt OK_...
Formation Intelligence Artificielle pour dirigeants- IT6-DIGITALIX 24_opt OK_...Formation Intelligence Artificielle pour dirigeants- IT6-DIGITALIX 24_opt OK_...
Formation Intelligence Artificielle pour dirigeants- IT6-DIGITALIX 24_opt OK_...
cristionobedi
 
Edito-B1-francais Manuel to learning.pdf
Edito-B1-francais Manuel to learning.pdfEdito-B1-francais Manuel to learning.pdf
Edito-B1-francais Manuel to learning.pdf
WarlockeTamagafk
 
Iris et les hommes.pptx
Iris      et         les      hommes.pptxIris      et         les      hommes.pptx
Iris et les hommes.pptx
Txaruka
 
Iris van Herpen. pptx
Iris            van        Herpen.     pptxIris            van        Herpen.     pptx
Iris van Herpen. pptx
Txaruka
 
Conseils pour Les Jeunes | Conseils de La Vie| Conseil de La Jeunesse
Conseils pour Les Jeunes | Conseils de La Vie| Conseil de La JeunesseConseils pour Les Jeunes | Conseils de La Vie| Conseil de La Jeunesse
Conseils pour Les Jeunes | Conseils de La Vie| Conseil de La Jeunesse
Oscar Smith
 
SYLLABUS DU COURS MARKETING DTS 1-2.pdf
SYLLABUS DU COURS  MARKETING DTS 1-2.pdfSYLLABUS DU COURS  MARKETING DTS 1-2.pdf
SYLLABUS DU COURS MARKETING DTS 1-2.pdf
Moukagni Evrard
 
Impact des Critères Environnementaux, Sociaux et de Gouvernance (ESG) sur les...
Impact des Critères Environnementaux, Sociaux et de Gouvernance (ESG) sur les...Impact des Critères Environnementaux, Sociaux et de Gouvernance (ESG) sur les...
Impact des Critères Environnementaux, Sociaux et de Gouvernance (ESG) sur les...
mrelmejri
 
M2i Webinar - « Participation Financière Obligatoire » et CPF : une opportuni...
M2i Webinar - « Participation Financière Obligatoire » et CPF : une opportuni...M2i Webinar - « Participation Financière Obligatoire » et CPF : une opportuni...
M2i Webinar - « Participation Financière Obligatoire » et CPF : une opportuni...
M2i Formation
 
Evaluación docentes "Un cielo, dos países: El camino de los descubrimientos"
Evaluación docentes "Un cielo, dos países: El camino de los descubrimientos"Evaluación docentes "Un cielo, dos países: El camino de los descubrimientos"
Evaluación docentes "Un cielo, dos países: El camino de los descubrimientos"
IES Turina/Rodrigo/Itaca/Palomeras
 

Dernier (13)

Burkina Faso library newsletter May 2024
Burkina Faso library newsletter May 2024Burkina Faso library newsletter May 2024
Burkina Faso library newsletter May 2024
 
Cours de conjugaison des verbes du premier, deuxième et troisième groupe
Cours de conjugaison des verbes du premier, deuxième et troisième groupeCours de conjugaison des verbes du premier, deuxième et troisième groupe
Cours de conjugaison des verbes du premier, deuxième et troisième groupe
 
Mémoire de licence en finance comptabilité et audit
Mémoire de licence en finance comptabilité et auditMémoire de licence en finance comptabilité et audit
Mémoire de licence en finance comptabilité et audit
 
Système de gestion des fichiers de amine
Système de gestion des fichiers de amineSystème de gestion des fichiers de amine
Système de gestion des fichiers de amine
 
Formation Intelligence Artificielle pour dirigeants- IT6-DIGITALIX 24_opt OK_...
Formation Intelligence Artificielle pour dirigeants- IT6-DIGITALIX 24_opt OK_...Formation Intelligence Artificielle pour dirigeants- IT6-DIGITALIX 24_opt OK_...
Formation Intelligence Artificielle pour dirigeants- IT6-DIGITALIX 24_opt OK_...
 
Edito-B1-francais Manuel to learning.pdf
Edito-B1-francais Manuel to learning.pdfEdito-B1-francais Manuel to learning.pdf
Edito-B1-francais Manuel to learning.pdf
 
Iris et les hommes.pptx
Iris      et         les      hommes.pptxIris      et         les      hommes.pptx
Iris et les hommes.pptx
 
Iris van Herpen. pptx
Iris            van        Herpen.     pptxIris            van        Herpen.     pptx
Iris van Herpen. pptx
 
Conseils pour Les Jeunes | Conseils de La Vie| Conseil de La Jeunesse
Conseils pour Les Jeunes | Conseils de La Vie| Conseil de La JeunesseConseils pour Les Jeunes | Conseils de La Vie| Conseil de La Jeunesse
Conseils pour Les Jeunes | Conseils de La Vie| Conseil de La Jeunesse
 
SYLLABUS DU COURS MARKETING DTS 1-2.pdf
SYLLABUS DU COURS  MARKETING DTS 1-2.pdfSYLLABUS DU COURS  MARKETING DTS 1-2.pdf
SYLLABUS DU COURS MARKETING DTS 1-2.pdf
 
Impact des Critères Environnementaux, Sociaux et de Gouvernance (ESG) sur les...
Impact des Critères Environnementaux, Sociaux et de Gouvernance (ESG) sur les...Impact des Critères Environnementaux, Sociaux et de Gouvernance (ESG) sur les...
Impact des Critères Environnementaux, Sociaux et de Gouvernance (ESG) sur les...
 
M2i Webinar - « Participation Financière Obligatoire » et CPF : une opportuni...
M2i Webinar - « Participation Financière Obligatoire » et CPF : une opportuni...M2i Webinar - « Participation Financière Obligatoire » et CPF : une opportuni...
M2i Webinar - « Participation Financière Obligatoire » et CPF : une opportuni...
 
Evaluación docentes "Un cielo, dos países: El camino de los descubrimientos"
Evaluación docentes "Un cielo, dos países: El camino de los descubrimientos"Evaluación docentes "Un cielo, dos países: El camino de los descubrimientos"
Evaluación docentes "Un cielo, dos países: El camino de los descubrimientos"
 

ASOCEU France - Lesson 2 - Data Refining

  • 1. COMPRENDRE ET AFFINER LES DONNÉES
  • 2. COMPRENDRE LES DONNÉES POUR MIEUX LES EXPLOITER
  • 3. COMPRENDRE LES DONNÉES Les données à votre disposition peuvent en dire long sur le phénomène que vous étudiez.
  • 4. COMPRENDRE LES DONNÉES Afin de les faire « parler », essayez de bien les comprendre. Posez-vous les questions suivantes : ● Quel type d’informations définissent-elles ? ● Quelles sont leurs caractéristiques principales ? ● Quel est leur impact sur le contexte étudié ?
  • 5. COMPRENDRE LES DONNÉES Il est important : ● de bien comprendre la nature des données ● de comprendre comment les analyser à travers certaines opérations simples
  • 6. LES CARACTÉRISTIQUES DE VOS DONNÉES : GÉOGRAPHIQUES, TEMPORELLES, DESCRIPTIVES
  • 7. DONNÉES GÉOGRAPHIQUES Les données que vous utilisez pour vos travaux pourraient contenir des informations de type géographique. C’est-à-dire quelle est l’ampleur d’un phénomène dans un territoire donné.
  • 8. DONNÉES GÉOGRAPHIQUES ○À quel territoire font-elles référence ? National, régional, provincial ou municipal ? ○Quel est le lien entre ce territoire et le projet que vous avez choisi sur OpenCoesione et que vous approfondissez ? ○Quelles informations supplémentaires pourriez-vous rassembler en analysant les informations géographiques de vos données ?
  • 9. SÉRIES HISTORIQUES Les données peuvent permettre d’analyser l’évolution d'un phénomène dans le temps et de mesurer sa variation (par exemple d’un mois à l’autre ou d’une année à l’autre).
  • 10. SÉRIES HISTORIQUES : EXEMPLES Le tri sélectif des déchets a-t-il augmenté, diminué ou stagné ? Le nombre de touristes dans un territoire est-il constant d’une année à l’autre où y a-t-il des variations ? Le phénomène examiné augmente- t-il ou diminue-t-il (par exemple d’un mois à l’autre) ?
  • 11. DONNÉES QUALITATIVES Il s’agit de données qui définissent les qualités et les caractéristiques intrinsèques d’un ou plusieurs objets.
  • 12. Vous devez donc vous poser les questions suivantes : quelles sont les caractéristiques des données que vous avez collectées ou que vous collectez ? Quelles sont les données susceptibles de plus vous intéresser ?
  • 14. NETTOYER LES DONNÉES Avant d’analyser les données il est nécessaire de procéder à certaines vérifications pour les rendre cohérentes et exploiter au mieux leurs caractéristiques. Il existe des méthodes spécifiques pour cela. Découvrons-les ensemble...
  • 15. NETTOYER LES DONNÉES Le nettoyage des données est fondamental pour s’assurer qu’elles sont correctement structurées dans les lignes et les colonnes et que les valeurs insérées sont cohérentes. Analyser des données sans un nettoyage minutieux peut provoquer de graves erreurs ou des difficultés ingérables. Il existe des outils pour nettoyer les données comme Open Refine (http://openrefine.org)
  • 16. NETTOYER LES DONNÉES 1 Contrôlez que les mêmes valeurs sont inscrites de la même manière. Par exemple, si la valeur « Environnement » est également écrite « environnement » et « ENVIRONNEMENT » il s’agit d’une erreur puisque les valeurs doivent toutes être écrites de la même manière.
  • 17. NETTOYER LES DONNÉES 2 Contrôlez les dates (le cas échéant) : elles doivent également être écrites de la même manière. Si certaines données sont écrites dans un format numérique (exemple : « 01/03/2015 ») et dans un autre format alphanumérique (exemple : « 10 mars 2015 »), il s’agit d’une erreur. Il est nécessaire que les dates soient présentées dans un seul format : vérifiez-le en cliquant sur « Format de cellule ».
  • 18. NETTOYER LES DONNÉES 3 Vérifiez les chiffres. Assurez-vous que les chiffres sont représentés correctement. Vérifiez le système de numérotation sur « Paramètre de la feuille de calcul ».
  • 20. DIVISER Les données doivent être « granulaires », comme s’il s’agissait d’atomes. Par exemple : si vos données ont une colonne consacrée aux lieux et une valeur comme celle-ci à l’intérieur : « Marseille, Bouches-du-Rhône, Provence-Alpes- Côte d'Azur », il convient de diviser la colonne en trois colonnes. De cette manière, vous pourrez les analyser par Ville, Département ou Région.
  • 21. AJOUTER Il est possible que votre ensemble de données ne vous fournisse pas toutes les informations nécessaires. Dans certains cas, vous devrez l’enrichir en ajoutant de nouvelles colonnes avec des informations spécifiques. Vous l’avez peut-être déjà fait partiellement, en suivant les informations présentes, mais il peut exister d’autres manières d’enrichir un ensemble de données...
  • 22. GÉOCODAGE Latitude Longitude En reprenant le même exemple, après avoir divisé la colonne « Lieux » en trois colonnes (Ville, Département, Région), il est utile d’ajouter « Latitude » et « Longitude » pour créer une carte. Pour cela, vous devrez insérer deux nouvelles colonnes (Latitude et Longitude) et remonter les coordonnées géographiques jusqu’au lieu de référence. Longitude Latitude
  • 23. GÉOCODAGE Vous pouvez obtenir les coordonnées géographiques en ligne. Il y a tellement de sources en ligne : découvrez-les ! Assurez-vous systématiquement que les données sont réutilisables (c’est possible avec OpenStreetMap et limité avec GoogleMap).
  • 24. COMPRENDRE ET AFFINER LES DONNÉES
  • 25. Le projet est financé par Avec la collaboration de La traduction en français est financé par