La rédaction du certificat médical de décès en Algérie.pdf
Comment presenter vos données pour une analyse statistique.pdf
1. Comment présenter vos
données pour une analyse
statistique
Dr Ali AIT-MOHAND
Maitre-Assistant en Épidémiologie
ali.aitmohand@ummto.dz
Université Mouloud MAMMERI de Tizi-Ouzou
Faculté de médecine
Département de médecine
2. Sommaire
Points essentiels à vérifier avant d'analyser vos données par un
logiciel statistique (tableur) :
1. Repérez l'unité statistique d'analyse
2. Donnez un numéro identifiant unique pour chaque ligne de
votre tableau
3. Mettez les données de votre tableur dans un format
rectangulaire
4. Donnez un nom simple à vos variables
5. Codez convenablement vos variables qualitatives
6. Saisissez soigneusement vos variables quantitatives
7. Vérifiez et revérifiez vos données avant toute analyse
8. Enregistrer le fichier
3. 1. Repérez l’unité statistique d’analyse
C'est l'unité élémentaire d'étude, le plus souvent le
patient, repérée par un numéro d'identification
unique et possédant un certain nombre d'attributs
ou variables la décrivant
4. 2. Donnez un numéro identifiant unique
pour chaque patient
Il doit être saisi dans la première colonne de la table
Il permet d’anonymiser les données
Il permet aussi de remonter aux données sources pour
vérification
L’identifiant peut être de la forme « 3 premières
lettres du nom » et « 3 premières lettres du prénom »
Ex : KAM_ALA pour Kamel ALAOUA)
5. 3. Mettez les données de votre tableur
dans un format rectangulaire
Chaque ligne correspond à un sujet (on dit aussi "unité statistique")
; chaque colonne correspond à une (et une seule) variable (on dit
aussi "valeur de l'attribut considéré de l'unité statistique")
L'intersection de chaque ligne et colonne doit contenir la valeur
(unique) de la variable pour le sujet considéré
Lors de la constitution de votre tableau de travail, raisonnez en
termes de sujets et de variables et non pas en termes de
présentation des résultats :
Ex : Si un groupe de sujets a eu le traitement A et l'autre le
traitement B, il doit simplement y avoir une variable (colonne,
nommée par exemple "Groupe") qui contient A ou B pour
chaque sujet
Vos tableaux doivent rester simples et sans fioritures
6. 4. Donnez un nom simple à vos variables
La première ligne (et UNIQUEMENT la première ligne) de votre tableau
(en-tête de colonne) doit contenir les noms de chaque variable
Essayez d'être raisonnablement descriptif en évitant des noms comme
VAR1, VAR2 ..., et conservez soigneusement la signification et le contenu de
chaque variable
Vérifiez surtout de ne pas avoir 2 fois le même nom de variable
Chaque colonne doit avoir un en-tête unique
D'autre part, certains logiciels statistiques imposent des contraintes assez
draconiennes qu'il est nécessaire de respecter (le nom de variable ne doit
pas dépasser 8 caractères)
Vous pouvez utiliser des lettres et des chiffres, mais évitez les caractères
accentués et les caractères spéciaux (&, $, %, -) et l'espace
7. 4. Donnez un nom simple à vos variables
Vous pouvez utiliser l’underscore « _ »
En général, les programmes ne font pas la différence entre majuscule et
minuscule
Le premier caractère doit être alphabétique
Être enfin capable de déterminer s'il s'agit d'une variable qualitative (C),
quantitative (M) ou un couple survie (S temps de participation et état aux
dernières nouvelles)
Vous en aurez IMPERATIVEMENT besoin pour choisir la bonne présentation
des résultats et le bon test statistique
Faire un listing des variables en annexe (sur WORD ou sur la feuille 2
d’EXCEL) avec la signification des variables, leurs unités et le codage des
réponses.
8. 5. Codez convenablement vos variables
qualitatives
Il faut que vous donniez un nom unique à chaque catégorie de
votre variable qualitative
Les codes alphabétiques sont plus informatifs et plus faciles à
mémoriser
Les codes numériques sont plus pratiques dans certaines sélections
et analyses statistiques et permettent d'imposer un ordre de
classement
À vous de choisir, mais conservez précieusement la signification
de vos codes
Il sera toujours possible, au moment de l'analyse, de regrouper
vos catégories
Les variables non renseignées sont simplement vides
9. 6. Saisissez soigneusement vos données
qualitatives
Vos variables quantitatives ne doivent être que numériques : les
cellules de la colonne ne doivent comporter aucun texte en
particulier l’unité de mesure ne doit pas être saisie avec la
valeur
Ne pas saisir des >, < ou ?
Si vous ne connaissez pas la valeur, laissez la case vide.
Attention aux O et 0, l et 1
Attention au caractère séparateur décimal, c'est la virgule dans Excel
Attention à la précision : elle doit être toujours la même (même nombre
de décimales) pour une même variable
Soyez constant dans le format de saisie d'une date (le transfert d'une
date pose toujours problème !)
Privilégiez toujours les variables quantitatives aux variables
qualitatives. Il sera toujours temps de les transformer après
coup
10. 7. Vérifiez et revérifiez vos données avant
toute analyse
Calculez les fréquences des catégories de chaque variable
qualitative pour repérer des codes inconnus ou mal saisis
Tracez l'histogramme de vos variables quantitatives pour repérer les
données aberrantes ou non-numériques
Il est préférable d’enregistrer votre feuille Excel sous un format pas
trop récent (Excel 95-2003 par exemple) afin d'être facilement relu
Vérifiez encore une fois vos données
Vérifiez les noms des variables
Une fois que toutes vos données seront saisies et vérifiées, vous pourrez
alors voir votre biostatisticien favori
Le temps gagné sur la correction des erreurs et la mise en forme des
données sera investi dans une meilleure analyse et explication des
résultats
11. 7. Consignes pour l’élaboration du plan
d’analyse
Indiquer dans le listing des variables celles qui ne
feront pas l’objet d’analyse
Formaliser le plan d’analyse pour les analyses
comparatives :
à quelles questions doit-on répondre?
quelles variables doit-on comparer ?
Cibler les demandes sur des analyses nécessaires, utiles
en termes d’interprétation, de compréhension et/ou de
comparaison d’après des données cliniques
consensuelles et d’après la littérature.
12. 8. Enregistrer le fichier
Le nom du fichier doit comporter :
le sujet du travail
les initiales de l’auteur
ainsi que la date de modification ou le numéro de
version