8 -  Comparaison de plusieurs moyennes à l’aide de l’analyse de variance Kinésithérapie et Biostatistiques avec Excel ® Jean-Louis Estrade Enseignant IFMK Orléans La Source  Enkre
Ces diaporamas ne sauraient remplacer un cours de biostatistiques. Ils n’ont pour but que de permettre à des étudiants K1 de faire un premier abord objectif de l’évaluation de la posture et du mouvement, en application des connaissances biostatistiques théoriques acquises lors de l’année universitaire d’orientation. Des notions abordées dans l’un des chapitres sont parfois utiles à la compréhension des chapitres suivants. En conséquence, ils sont à consulter  dans l’ordre, avec le fichier Excel STAT.XLS joint qui reprend les illustrations du diaporama. Il faut avoir à leur lecture la seule attitude compatible avec l’esprit du domaine étudié, à savoir le fait que  nous ne pouvons pas rejeter l’hypothèse d’erreurs multiples, diverses et variées   dans ces diaporamas. Je suis à l’écoute de toutes vos remarques, annotations, critiques. N’hésitez pas à me les faire parvenir. Nécessaires préambules…
Analyse de variance
Principe  Comme son nom ne l’indique pas, une analyse de variance sert à comparer plusieurs moyennes… La variance cumulée des variances de plusieurs moyennes dépend de la variabilité à l’intérieur de chaque population ET de celle entre chaque population. L’analyse de variance consistera à faire la part de ces deux variabilités dans la variabilité totale et de comparer les écarts à la moyenne effectivement liés au facteur étudié avec la totalité des écarts à la moyenne. Somme totale des carrés des écarts = somme des carrés des écarts liée au facteur étudié + somme des carrés des écarts résiduelle
Principe  Variance totale différente de la variance de chacune des populations   Moyennes différentes Variance totale égale à la variance de chacune des populations   Moyennes égales * µ1 * µ2 * µ3 * µ4 * µ * µ1 * µ2 * µ3 * µ4 * µ
Réalisation pratique  Nous voulons savoir si les tailles des élèves en kinésithérapie sont différentes au fil du temps. Hypothèse nulle   Les tailles des élèves ne changent pas au cours du temps  Hypothèse alternative   Au moins une des tailles des populations mesurées est différente des autres. Conditions d’application du test   Il faut que la variable ait une distribution normale  La variance doit  être identique dans chaque population
Conditions d’application du test 1°- Il faut que la variable ait une distribution normale Il faut juste éviter d’employer ce test   lorsque les distributions sont très dyssymétriques 2°- La variance doit  être identique dans chaque population Ceci est d’importance secondaire lorsque les échantillons ont des effectifs égaux ou de m ême ordre de grandeur. Deux variances sont considérées comme égales si l’une n’est pas plus de 3 fois plus grande que l’autre. Le test de Fisher (dans Excel, la fonction TEST.F) permet de voir si deux variances sont égales.
Le test  On montre que : Si le facteur taille a une distribution normale de m ême variance dans chaque population, la somme résiduels des carrés des écarts suit une loi de chideux à (n-k) degrés de liberté, n étant le nombre de sujets dans les trois groupes, k le nombre de groupes  Si l’hypothèse nulle est vraie, la somme des carrés des écarts liés au facteur taille suit une loi de chideux à k-1 degrés de liberté. Cela se réduit au calcul du rapport entre : Et sa comparaison avec une valeur seuil, selon une loi énoncée par Fisher.
Tableau d’analyse de la variance  L’outil d’analyse « analyse de variance : un facteur » de l’utilitaire d’analyse réalise le tableau d’analyse de la variance. La valeur F est le rapport entre les moyennes des carrés. Elle est à comparer à la valeur critique pour F, indiquée par Excel La probabilité indique que nous ne pouvons pas rejeter l’hypothèse nulle d’égalité des moyennes, puisqu’elle est supérieure à 0,05. Les tailles des élèves de kinésithérapie n’ont pas varié en 2005, 2007 et 2009
Lorsque les moyennes sont appariées  Problème posé : Un même examinateur a mesuré de trois façons différentes les rotations de hanche de sujets sains :  à l’aide d’un inclinomètre sujet assis jambes pendantes en bord de table,  à l’aide d’un inclinomètre sujet couché jambes pendantes en bord de table, à l’aide d’une boussole, sujet en décubitus cuisse et jambe à 90°.  Est-ce que ces mesures donnent les mêmes résultats ? Il est possible, selon Alain Mouchès, d’utiliser l’outil « analyse de variance: deux facteurs sans répétition d’expérience », mais l’auteur est peu explicatif et les autres auteurs sont discrets sur ce cas de figure…
Lorsque les moyennes sont appariées  Solution intermédiaire : Lorsque le nombre de mesures sur un même sujet n’est pas très important, il est possible de les ramener 2 à 2 à l’aide d’un test de Student sur sujets appariés. Précaution nécessaire : Il est   concevable qu’une prise de mesure (ou l’administration d’un traitement dans une autre cas de figure) influe sur la ou les prises de mesure suivantes (assouplissement préalable, échauffement, …). Il est donc  obligatoire  de réaliser les tests dans un ordre  aléatoire , déterminé par tirage au sort. N.B. conditions non réalisées dans l’illustration sous Excel sur le sujet, qui ne doit pas être prise pour argent comptant, au motif que c’est écrit.
Bibliographie  Livres : Bouyer J. Méthodes statistiques.  Médecine – Biologie. Estem. Editions Inserm. 2004 Georgin JP.  Gouet M. Statistiques avec Excel. Presses Universitaires de Rennes. 2005 Huguier M. Flahault A. Biostatistiques au quotidien. Elsevier. 2003 Sites : Cours de Denis Poinsot, maître de conférence à la Faculté de Rennes : «  Une introduction au monde des tests statistiques à l’intention des étudiants qui n’y entravent que pouic et qui détestent les maths par dessus le marché  »  http://perso.univ-rennes1.fr/denis.poinsot/Statistiques%20pour%20statophobes/ Biostatistique clinique - épidemiologie et essais cliniques de la Faculté de Médecine Necker-Enfants Malades (Dr Landais & Jais) :  http://www.educ.necker.fr/cours/poly/biostatistique/biostat.htm# Alain Mouchès. L’utilisation pratique des traitements statistiques sous « Excel »  http://australie.uco.fr/~amouches/public_html/Excel%20et%20tests%20statistiques.doc Association Vies Animales  http://www.viesanimales.org/stats/Telechargement.htm#anova1dim Cours : Méthodologie de Base en Statistique et Epidémiologie. École d’été de santé publique et d’épidémiologie. Faculté de Médecine Paris-Sud, 63 rue Gabriel Péri, 94276 Le Kremlin Bicêtre.  http://u569.kb.inserm.fr/ecolete/index.htm Centre d’Enseignement de la Statistique Appliquée à la Médecine et à la Biologie Médicale (CESAM)  http://cesam.vjf.inserm.fr/

Stat8 Anova

  • 1.
    8 - Comparaison de plusieurs moyennes à l’aide de l’analyse de variance Kinésithérapie et Biostatistiques avec Excel ® Jean-Louis Estrade Enseignant IFMK Orléans La Source Enkre
  • 2.
    Ces diaporamas nesauraient remplacer un cours de biostatistiques. Ils n’ont pour but que de permettre à des étudiants K1 de faire un premier abord objectif de l’évaluation de la posture et du mouvement, en application des connaissances biostatistiques théoriques acquises lors de l’année universitaire d’orientation. Des notions abordées dans l’un des chapitres sont parfois utiles à la compréhension des chapitres suivants. En conséquence, ils sont à consulter dans l’ordre, avec le fichier Excel STAT.XLS joint qui reprend les illustrations du diaporama. Il faut avoir à leur lecture la seule attitude compatible avec l’esprit du domaine étudié, à savoir le fait que nous ne pouvons pas rejeter l’hypothèse d’erreurs multiples, diverses et variées dans ces diaporamas. Je suis à l’écoute de toutes vos remarques, annotations, critiques. N’hésitez pas à me les faire parvenir. Nécessaires préambules…
  • 3.
  • 4.
    Principe Commeson nom ne l’indique pas, une analyse de variance sert à comparer plusieurs moyennes… La variance cumulée des variances de plusieurs moyennes dépend de la variabilité à l’intérieur de chaque population ET de celle entre chaque population. L’analyse de variance consistera à faire la part de ces deux variabilités dans la variabilité totale et de comparer les écarts à la moyenne effectivement liés au facteur étudié avec la totalité des écarts à la moyenne. Somme totale des carrés des écarts = somme des carrés des écarts liée au facteur étudié + somme des carrés des écarts résiduelle
  • 5.
    Principe Variancetotale différente de la variance de chacune des populations Moyennes différentes Variance totale égale à la variance de chacune des populations Moyennes égales * µ1 * µ2 * µ3 * µ4 * µ * µ1 * µ2 * µ3 * µ4 * µ
  • 6.
    Réalisation pratique Nous voulons savoir si les tailles des élèves en kinésithérapie sont différentes au fil du temps. Hypothèse nulle Les tailles des élèves ne changent pas au cours du temps Hypothèse alternative Au moins une des tailles des populations mesurées est différente des autres. Conditions d’application du test Il faut que la variable ait une distribution normale La variance doit être identique dans chaque population
  • 7.
    Conditions d’application dutest 1°- Il faut que la variable ait une distribution normale Il faut juste éviter d’employer ce test lorsque les distributions sont très dyssymétriques 2°- La variance doit être identique dans chaque population Ceci est d’importance secondaire lorsque les échantillons ont des effectifs égaux ou de m ême ordre de grandeur. Deux variances sont considérées comme égales si l’une n’est pas plus de 3 fois plus grande que l’autre. Le test de Fisher (dans Excel, la fonction TEST.F) permet de voir si deux variances sont égales.
  • 8.
    Le test On montre que : Si le facteur taille a une distribution normale de m ême variance dans chaque population, la somme résiduels des carrés des écarts suit une loi de chideux à (n-k) degrés de liberté, n étant le nombre de sujets dans les trois groupes, k le nombre de groupes Si l’hypothèse nulle est vraie, la somme des carrés des écarts liés au facteur taille suit une loi de chideux à k-1 degrés de liberté. Cela se réduit au calcul du rapport entre : Et sa comparaison avec une valeur seuil, selon une loi énoncée par Fisher.
  • 9.
    Tableau d’analyse dela variance L’outil d’analyse « analyse de variance : un facteur » de l’utilitaire d’analyse réalise le tableau d’analyse de la variance. La valeur F est le rapport entre les moyennes des carrés. Elle est à comparer à la valeur critique pour F, indiquée par Excel La probabilité indique que nous ne pouvons pas rejeter l’hypothèse nulle d’égalité des moyennes, puisqu’elle est supérieure à 0,05. Les tailles des élèves de kinésithérapie n’ont pas varié en 2005, 2007 et 2009
  • 10.
    Lorsque les moyennessont appariées Problème posé : Un même examinateur a mesuré de trois façons différentes les rotations de hanche de sujets sains : à l’aide d’un inclinomètre sujet assis jambes pendantes en bord de table, à l’aide d’un inclinomètre sujet couché jambes pendantes en bord de table, à l’aide d’une boussole, sujet en décubitus cuisse et jambe à 90°. Est-ce que ces mesures donnent les mêmes résultats ? Il est possible, selon Alain Mouchès, d’utiliser l’outil « analyse de variance: deux facteurs sans répétition d’expérience », mais l’auteur est peu explicatif et les autres auteurs sont discrets sur ce cas de figure…
  • 11.
    Lorsque les moyennessont appariées Solution intermédiaire : Lorsque le nombre de mesures sur un même sujet n’est pas très important, il est possible de les ramener 2 à 2 à l’aide d’un test de Student sur sujets appariés. Précaution nécessaire : Il est concevable qu’une prise de mesure (ou l’administration d’un traitement dans une autre cas de figure) influe sur la ou les prises de mesure suivantes (assouplissement préalable, échauffement, …). Il est donc obligatoire de réaliser les tests dans un ordre aléatoire , déterminé par tirage au sort. N.B. conditions non réalisées dans l’illustration sous Excel sur le sujet, qui ne doit pas être prise pour argent comptant, au motif que c’est écrit.
  • 12.
    Bibliographie Livres: Bouyer J. Méthodes statistiques. Médecine – Biologie. Estem. Editions Inserm. 2004 Georgin JP. Gouet M. Statistiques avec Excel. Presses Universitaires de Rennes. 2005 Huguier M. Flahault A. Biostatistiques au quotidien. Elsevier. 2003 Sites : Cours de Denis Poinsot, maître de conférence à la Faculté de Rennes : «  Une introduction au monde des tests statistiques à l’intention des étudiants qui n’y entravent que pouic et qui détestent les maths par dessus le marché  » http://perso.univ-rennes1.fr/denis.poinsot/Statistiques%20pour%20statophobes/ Biostatistique clinique - épidemiologie et essais cliniques de la Faculté de Médecine Necker-Enfants Malades (Dr Landais & Jais) : http://www.educ.necker.fr/cours/poly/biostatistique/biostat.htm# Alain Mouchès. L’utilisation pratique des traitements statistiques sous « Excel » http://australie.uco.fr/~amouches/public_html/Excel%20et%20tests%20statistiques.doc Association Vies Animales http://www.viesanimales.org/stats/Telechargement.htm#anova1dim Cours : Méthodologie de Base en Statistique et Epidémiologie. École d’été de santé publique et d’épidémiologie. Faculté de Médecine Paris-Sud, 63 rue Gabriel Péri, 94276 Le Kremlin Bicêtre. http://u569.kb.inserm.fr/ecolete/index.htm Centre d’Enseignement de la Statistique Appliquée à la Médecine et à la Biologie Médicale (CESAM) http://cesam.vjf.inserm.fr/