SlideShare une entreprise Scribd logo
1  sur  13
Télécharger pour lire hors ligne
Comment présenter vos
données pour une analyse
statistique
Dr Ali AIT-MOHAND
Maitre-Assistant en Épidémiologie
ali.aitmohand@ummto.dz
Université Mouloud MAMMERI de Tizi-Ouzou
Faculté de médecine
Département de médecine
Sommaire
Points essentiels à vérifier avant d'analyser vos données par un
logiciel statistique (tableur) :
1. Repérez l'unité statistique d'analyse
2. Donnez un numéro identifiant unique pour chaque ligne de
votre tableau
3. Mettez les données de votre tableur dans un format
rectangulaire
4. Donnez un nom simple à vos variables
5. Codez convenablement vos variables qualitatives
6. Saisissez soigneusement vos variables quantitatives
7. Vérifiez et revérifiez vos données avant toute analyse
8. Enregistrer le fichier
1. Repérez l’unité statistique d’analyse
 C'est l'unité élémentaire d'étude, le plus souvent le
patient, repérée par un numéro d'identification
unique et possédant un certain nombre d'attributs
ou variables la décrivant
2. Donnez un numéro identifiant unique
pour chaque patient
 Il doit être saisi dans la première colonne de la table
 Il permet d’anonymiser les données
 Il permet aussi de remonter aux données sources pour
vérification
 L’identifiant peut être de la forme « 3 premières
lettres du nom » et « 3 premières lettres du prénom »
 Ex : KAM_ALA pour Kamel ALAOUA)
3. Mettez les données de votre tableur
dans un format rectangulaire
 Chaque ligne correspond à un sujet (on dit aussi "unité statistique")
; chaque colonne correspond à une (et une seule) variable (on dit
aussi "valeur de l'attribut considéré de l'unité statistique")
 L'intersection de chaque ligne et colonne doit contenir la valeur
(unique) de la variable pour le sujet considéré
 Lors de la constitution de votre tableau de travail, raisonnez en
termes de sujets et de variables et non pas en termes de
présentation des résultats :
 Ex : Si un groupe de sujets a eu le traitement A et l'autre le
traitement B, il doit simplement y avoir une variable (colonne,
nommée par exemple "Groupe") qui contient A ou B pour
chaque sujet
 Vos tableaux doivent rester simples et sans fioritures
4. Donnez un nom simple à vos variables
 La première ligne (et UNIQUEMENT la première ligne) de votre tableau
(en-tête de colonne) doit contenir les noms de chaque variable
 Essayez d'être raisonnablement descriptif en évitant des noms comme
VAR1, VAR2 ..., et conservez soigneusement la signification et le contenu de
chaque variable
 Vérifiez surtout de ne pas avoir 2 fois le même nom de variable
 Chaque colonne doit avoir un en-tête unique
 D'autre part, certains logiciels statistiques imposent des contraintes assez
draconiennes qu'il est nécessaire de respecter (le nom de variable ne doit
pas dépasser 8 caractères)
 Vous pouvez utiliser des lettres et des chiffres, mais évitez les caractères
accentués et les caractères spéciaux (&, $, %, -) et l'espace
4. Donnez un nom simple à vos variables
 Vous pouvez utiliser l’underscore « _ »
 En général, les programmes ne font pas la différence entre majuscule et
minuscule
 Le premier caractère doit être alphabétique
 Être enfin capable de déterminer s'il s'agit d'une variable qualitative (C),
quantitative (M) ou un couple survie (S temps de participation et état aux
dernières nouvelles)
 Vous en aurez IMPERATIVEMENT besoin pour choisir la bonne présentation
des résultats et le bon test statistique
 Faire un listing des variables en annexe (sur WORD ou sur la feuille 2
d’EXCEL) avec la signification des variables, leurs unités et le codage des
réponses.
5. Codez convenablement vos variables
qualitatives
 Il faut que vous donniez un nom unique à chaque catégorie de
votre variable qualitative
 Les codes alphabétiques sont plus informatifs et plus faciles à
mémoriser
 Les codes numériques sont plus pratiques dans certaines sélections
et analyses statistiques et permettent d'imposer un ordre de
classement
 À vous de choisir, mais conservez précieusement la signification
de vos codes
 Il sera toujours possible, au moment de l'analyse, de regrouper
vos catégories
 Les variables non renseignées sont simplement vides
6. Saisissez soigneusement vos données
qualitatives
 Vos variables quantitatives ne doivent être que numériques : les
cellules de la colonne ne doivent comporter aucun texte en
particulier l’unité de mesure ne doit pas être saisie avec la
valeur
 Ne pas saisir des >, < ou ?
 Si vous ne connaissez pas la valeur, laissez la case vide.
 Attention aux O et 0, l et 1
 Attention au caractère séparateur décimal, c'est la virgule dans Excel
 Attention à la précision : elle doit être toujours la même (même nombre
de décimales) pour une même variable
 Soyez constant dans le format de saisie d'une date (le transfert d'une
date pose toujours problème !)
 Privilégiez toujours les variables quantitatives aux variables
qualitatives. Il sera toujours temps de les transformer après
coup
7. Vérifiez et revérifiez vos données avant
toute analyse
 Calculez les fréquences des catégories de chaque variable
qualitative pour repérer des codes inconnus ou mal saisis
 Tracez l'histogramme de vos variables quantitatives pour repérer les
données aberrantes ou non-numériques
 Il est préférable d’enregistrer votre feuille Excel sous un format pas
trop récent (Excel 95-2003 par exemple) afin d'être facilement relu
 Vérifiez encore une fois vos données
 Vérifiez les noms des variables
 Une fois que toutes vos données seront saisies et vérifiées, vous pourrez
alors voir votre biostatisticien favori
 Le temps gagné sur la correction des erreurs et la mise en forme des
données sera investi dans une meilleure analyse et explication des
résultats
7. Consignes pour l’élaboration du plan
d’analyse
 Indiquer dans le listing des variables celles qui ne
feront pas l’objet d’analyse
 Formaliser le plan d’analyse pour les analyses
comparatives :
 à quelles questions doit-on répondre?
 quelles variables doit-on comparer ?
 Cibler les demandes sur des analyses nécessaires, utiles
en termes d’interprétation, de compréhension et/ou de
comparaison d’après des données cliniques
consensuelles et d’après la littérature.
8. Enregistrer le fichier
 Le nom du fichier doit comporter :
 le sujet du travail
 les initiales de l’auteur
 ainsi que la date de modification ou le numéro de
version
Merci de votre attention

Contenu connexe

Similaire à Comment presenter vos données pour une analyse statistique.pdf

Similaire à Comment presenter vos données pour une analyse statistique.pdf (13)

analysez-des-donnees-avec-excel documen.pdf
analysez-des-donnees-avec-excel documen.pdfanalysez-des-donnees-avec-excel documen.pdf
analysez-des-donnees-avec-excel documen.pdf
 
Spss les premieres notions 1
Spss les premieres notions 1Spss les premieres notions 1
Spss les premieres notions 1
 
Support de cours ACCESS
Support de cours ACCESSSupport de cours ACCESS
Support de cours ACCESS
 
01 analyse items_partie1f_les compilations
01 analyse items_partie1f_les compilations01 analyse items_partie1f_les compilations
01 analyse items_partie1f_les compilations
 
La démo DAX, le langage de Power BI [webinaire]
La démo DAX, le langage de Power BI [webinaire]La démo DAX, le langage de Power BI [webinaire]
La démo DAX, le langage de Power BI [webinaire]
 
Excel ppt.ppt
Excel ppt.pptExcel ppt.ppt
Excel ppt.ppt
 
Cours doumi spss 2013 2014
Cours doumi spss 2013 2014Cours doumi spss 2013 2014
Cours doumi spss 2013 2014
 
Analyse descriptive en VBA Excel
Analyse descriptive en VBA Excel Analyse descriptive en VBA Excel
Analyse descriptive en VBA Excel
 
Spss 3 master comrce copy
Spss 3  master comrce   copySpss 3  master comrce   copy
Spss 3 master comrce copy
 
1 rappel d'excel
1 rappel d'excel1 rappel d'excel
1 rappel d'excel
 
Memo stad professionnel
Memo stad professionnelMemo stad professionnel
Memo stad professionnel
 
Herve aide-memoire-statistique r
Herve aide-memoire-statistique rHerve aide-memoire-statistique r
Herve aide-memoire-statistique r
 
Presentation du progiciel
Presentation du progicielPresentation du progiciel
Presentation du progiciel
 

Plus de AliAITMOHAND1

Épidémiologie des maladies transmissibles
Épidémiologie des maladies transmissiblesÉpidémiologie des maladies transmissibles
Épidémiologie des maladies transmissiblesAliAITMOHAND1
 
Surveillance des maladies transmissibles
Surveillance des maladies transmissiblesSurveillance des maladies transmissibles
Surveillance des maladies transmissiblesAliAITMOHAND1
 
Les maladies à déclaration obligatoire-Arrêté 179 et circulaire 1126 MDO 1990
Les maladies à déclaration obligatoire-Arrêté 179 et circulaire 1126 MDO 1990Les maladies à déclaration obligatoire-Arrêté 179 et circulaire 1126 MDO 1990
Les maladies à déclaration obligatoire-Arrêté 179 et circulaire 1126 MDO 1990AliAITMOHAND1
 
Les maladies à déclaration obligatoire_Décret_2022
Les maladies à déclaration obligatoire_Décret_2022Les maladies à déclaration obligatoire_Décret_2022
Les maladies à déclaration obligatoire_Décret_2022AliAITMOHAND1
 
Guide_dintroduction_au_logiciel_SPSS.pdf
Guide_dintroduction_au_logiciel_SPSS.pdfGuide_dintroduction_au_logiciel_SPSS.pdf
Guide_dintroduction_au_logiciel_SPSS.pdfAliAITMOHAND1
 
La rédaction du certificat médical de décès en Algérie.pdf
La rédaction du certificat médical de décès en Algérie.pdfLa rédaction du certificat médical de décès en Algérie.pdf
La rédaction du certificat médical de décès en Algérie.pdfAliAITMOHAND1
 

Plus de AliAITMOHAND1 (6)

Épidémiologie des maladies transmissibles
Épidémiologie des maladies transmissiblesÉpidémiologie des maladies transmissibles
Épidémiologie des maladies transmissibles
 
Surveillance des maladies transmissibles
Surveillance des maladies transmissiblesSurveillance des maladies transmissibles
Surveillance des maladies transmissibles
 
Les maladies à déclaration obligatoire-Arrêté 179 et circulaire 1126 MDO 1990
Les maladies à déclaration obligatoire-Arrêté 179 et circulaire 1126 MDO 1990Les maladies à déclaration obligatoire-Arrêté 179 et circulaire 1126 MDO 1990
Les maladies à déclaration obligatoire-Arrêté 179 et circulaire 1126 MDO 1990
 
Les maladies à déclaration obligatoire_Décret_2022
Les maladies à déclaration obligatoire_Décret_2022Les maladies à déclaration obligatoire_Décret_2022
Les maladies à déclaration obligatoire_Décret_2022
 
Guide_dintroduction_au_logiciel_SPSS.pdf
Guide_dintroduction_au_logiciel_SPSS.pdfGuide_dintroduction_au_logiciel_SPSS.pdf
Guide_dintroduction_au_logiciel_SPSS.pdf
 
La rédaction du certificat médical de décès en Algérie.pdf
La rédaction du certificat médical de décès en Algérie.pdfLa rédaction du certificat médical de décès en Algérie.pdf
La rédaction du certificat médical de décès en Algérie.pdf
 

Comment presenter vos données pour une analyse statistique.pdf

  • 1. Comment présenter vos données pour une analyse statistique Dr Ali AIT-MOHAND Maitre-Assistant en Épidémiologie ali.aitmohand@ummto.dz Université Mouloud MAMMERI de Tizi-Ouzou Faculté de médecine Département de médecine
  • 2. Sommaire Points essentiels à vérifier avant d'analyser vos données par un logiciel statistique (tableur) : 1. Repérez l'unité statistique d'analyse 2. Donnez un numéro identifiant unique pour chaque ligne de votre tableau 3. Mettez les données de votre tableur dans un format rectangulaire 4. Donnez un nom simple à vos variables 5. Codez convenablement vos variables qualitatives 6. Saisissez soigneusement vos variables quantitatives 7. Vérifiez et revérifiez vos données avant toute analyse 8. Enregistrer le fichier
  • 3. 1. Repérez l’unité statistique d’analyse  C'est l'unité élémentaire d'étude, le plus souvent le patient, repérée par un numéro d'identification unique et possédant un certain nombre d'attributs ou variables la décrivant
  • 4. 2. Donnez un numéro identifiant unique pour chaque patient  Il doit être saisi dans la première colonne de la table  Il permet d’anonymiser les données  Il permet aussi de remonter aux données sources pour vérification  L’identifiant peut être de la forme « 3 premières lettres du nom » et « 3 premières lettres du prénom »  Ex : KAM_ALA pour Kamel ALAOUA)
  • 5. 3. Mettez les données de votre tableur dans un format rectangulaire  Chaque ligne correspond à un sujet (on dit aussi "unité statistique") ; chaque colonne correspond à une (et une seule) variable (on dit aussi "valeur de l'attribut considéré de l'unité statistique")  L'intersection de chaque ligne et colonne doit contenir la valeur (unique) de la variable pour le sujet considéré  Lors de la constitution de votre tableau de travail, raisonnez en termes de sujets et de variables et non pas en termes de présentation des résultats :  Ex : Si un groupe de sujets a eu le traitement A et l'autre le traitement B, il doit simplement y avoir une variable (colonne, nommée par exemple "Groupe") qui contient A ou B pour chaque sujet  Vos tableaux doivent rester simples et sans fioritures
  • 6. 4. Donnez un nom simple à vos variables  La première ligne (et UNIQUEMENT la première ligne) de votre tableau (en-tête de colonne) doit contenir les noms de chaque variable  Essayez d'être raisonnablement descriptif en évitant des noms comme VAR1, VAR2 ..., et conservez soigneusement la signification et le contenu de chaque variable  Vérifiez surtout de ne pas avoir 2 fois le même nom de variable  Chaque colonne doit avoir un en-tête unique  D'autre part, certains logiciels statistiques imposent des contraintes assez draconiennes qu'il est nécessaire de respecter (le nom de variable ne doit pas dépasser 8 caractères)  Vous pouvez utiliser des lettres et des chiffres, mais évitez les caractères accentués et les caractères spéciaux (&, $, %, -) et l'espace
  • 7. 4. Donnez un nom simple à vos variables  Vous pouvez utiliser l’underscore « _ »  En général, les programmes ne font pas la différence entre majuscule et minuscule  Le premier caractère doit être alphabétique  Être enfin capable de déterminer s'il s'agit d'une variable qualitative (C), quantitative (M) ou un couple survie (S temps de participation et état aux dernières nouvelles)  Vous en aurez IMPERATIVEMENT besoin pour choisir la bonne présentation des résultats et le bon test statistique  Faire un listing des variables en annexe (sur WORD ou sur la feuille 2 d’EXCEL) avec la signification des variables, leurs unités et le codage des réponses.
  • 8. 5. Codez convenablement vos variables qualitatives  Il faut que vous donniez un nom unique à chaque catégorie de votre variable qualitative  Les codes alphabétiques sont plus informatifs et plus faciles à mémoriser  Les codes numériques sont plus pratiques dans certaines sélections et analyses statistiques et permettent d'imposer un ordre de classement  À vous de choisir, mais conservez précieusement la signification de vos codes  Il sera toujours possible, au moment de l'analyse, de regrouper vos catégories  Les variables non renseignées sont simplement vides
  • 9. 6. Saisissez soigneusement vos données qualitatives  Vos variables quantitatives ne doivent être que numériques : les cellules de la colonne ne doivent comporter aucun texte en particulier l’unité de mesure ne doit pas être saisie avec la valeur  Ne pas saisir des >, < ou ?  Si vous ne connaissez pas la valeur, laissez la case vide.  Attention aux O et 0, l et 1  Attention au caractère séparateur décimal, c'est la virgule dans Excel  Attention à la précision : elle doit être toujours la même (même nombre de décimales) pour une même variable  Soyez constant dans le format de saisie d'une date (le transfert d'une date pose toujours problème !)  Privilégiez toujours les variables quantitatives aux variables qualitatives. Il sera toujours temps de les transformer après coup
  • 10. 7. Vérifiez et revérifiez vos données avant toute analyse  Calculez les fréquences des catégories de chaque variable qualitative pour repérer des codes inconnus ou mal saisis  Tracez l'histogramme de vos variables quantitatives pour repérer les données aberrantes ou non-numériques  Il est préférable d’enregistrer votre feuille Excel sous un format pas trop récent (Excel 95-2003 par exemple) afin d'être facilement relu  Vérifiez encore une fois vos données  Vérifiez les noms des variables  Une fois que toutes vos données seront saisies et vérifiées, vous pourrez alors voir votre biostatisticien favori  Le temps gagné sur la correction des erreurs et la mise en forme des données sera investi dans une meilleure analyse et explication des résultats
  • 11. 7. Consignes pour l’élaboration du plan d’analyse  Indiquer dans le listing des variables celles qui ne feront pas l’objet d’analyse  Formaliser le plan d’analyse pour les analyses comparatives :  à quelles questions doit-on répondre?  quelles variables doit-on comparer ?  Cibler les demandes sur des analyses nécessaires, utiles en termes d’interprétation, de compréhension et/ou de comparaison d’après des données cliniques consensuelles et d’après la littérature.
  • 12. 8. Enregistrer le fichier  Le nom du fichier doit comporter :  le sujet du travail  les initiales de l’auteur  ainsi que la date de modification ou le numéro de version
  • 13. Merci de votre attention