6- Comparaison de pourcentages à l’aide du  test du   2   Kinésithérapie et Biostatistiques avec Excel ® Jean-Louis Estra...
<ul><li>Ces diaporamas ne sauraient remplacer un cours de biostatistiques. </li></ul><ul><li>Ils n’ont pour but que de per...
Présentation du  test du   2   <ul><li>Il permet de déterminer s’il y a  liaison  entre plusieurs pourcentages, ou entre ...
Représentation et signification <ul><li>Représentation  </li></ul><ul><li>Sous forme de tableau : </li></ul><ul><li>Signif...
Liaison & causalité <ul><li>Différence entre liaison et causalité  </li></ul><ul><li>Si le test ne démontre pas de liaison...
Conditions de causalité <ul><li>Quelques conditions nécessaires pour établir la causalité  d’une exposition à un facteur d...
Trier les données sous Excel <ul><li>Est-ce que les filles sont plus sportives que les garçons ? Test de comparaison de 2 ...
Réaliser le tableau de   2 <ul><li>Un tableau permet de distinguer les sportifs en fonction du genre, à l’aide de la form...
Réaliser le tableau de   2 <ul><li>Sont ensuite sommés les valeurs des sportifs, non-sportifs, F, M et les totaux.   </li...
Illustration du test Pour mieux matérialiser les pourcentages respectifs de chaque catégorie, surligner les valeurs du tab...
Analyse du graphique <ul><li>On obtient la répartition des valeurs  observées  de la variable. Le graphique semble indique...
Analyse du graphique <ul><li>Cet histogramme illustre le principe du test du   2  : si les deux échantillons étaient semb...
Principes du test de   2 <ul><li>Il  permet de se prononcer sur l’égalité entre les deux échantillons. Son principe est r...
Calcul des valeurs théoriques <ul><li>Il y a 28 non-sportifs parmi 45 sujets masculins dans les valeurs observées. Si la r...
Calcul des valeurs théoriques <ul><li>4°- Calcul des valeurs théoriques  </li></ul><ul><li>Il y a 28 non-sportifs parmi 45...
Calcul à l’aide d’Excel <ul><li>6°- Calcul à l’aide d’Excel de la valeur du   2 </li></ul><ul><li>Ca se complique chez Bi...
Fonction « test.khideux » <ul><li>Sélectionner les plages observées (réelles) et les plages théoriques (attendues).  </li>...
Fonction « khideux.inverse » <ul><li>Sélectionner la cellule où est indiqué le résultat du test précédent. </li></ul><ul><...
Fonction « loi.khideux » <ul><li>A l’aide de la valeur du   2   vous pouvez obtenir la probabilité d’apparition de la var...
Conditions d’application <ul><li>Avant d’appliquer un test, il faut savoir s’il est licite de l’utiliser. Ici, il faut d’a...
Conclure  <ul><li>On montre que, si l’hypothèse d’égalité entre les catégories H 0  est vraie et si la taille de l’échanti...
Conclure  <ul><li>Cette valeur seuil de 3,84 correspond à un degré de signification de 0,05  pour une loi de   2  à 1 deg...
La correction de Yates <ul><li>Le test du   2  pour de petits échantillons </li></ul><ul><li>Lorsque les effectifs sont t...
Conditions d’application <ul><li>Conditions d’application de la correction de Yates </li></ul><ul><li>Elle n’est utilisabl...
Exemples  <ul><li>Est-ce que les latéralités du membre supérieur et de l’œil de visée sont liés au genre du sujet ? </li><...
Sinon ?  <ul><li>Si les conditions de la correction de Yates ne sont pas présentes ? </li></ul><ul><li>La meilleure soluti...
Bibliographie  <ul><li>Livres : </li></ul><ul><li>Bouyer J. Méthodes statistiques.  Médecine – Biologie. Estem. Editions I...
Prochain SlideShare
Chargement dans…5
×

Stat6 Chideux

3 656 vues

Publié le

La comparaison de pourcentages avec le test du chideux sous Excel, à l'aide d'exemples empruntés à la kinesitherapie.

Publié dans : Formation, Santé & Médecine
0 commentaire
1 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
3 656
Sur SlideShare
0
Issues des intégrations
0
Intégrations
371
Actions
Partages
0
Téléchargements
0
Commentaires
0
J’aime
1
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Stat6 Chideux

  1. 1. 6- Comparaison de pourcentages à l’aide du test du  2 Kinésithérapie et Biostatistiques avec Excel ® Jean-Louis Estrade Enseignant IFMK Orléans La Source Enkre
  2. 2. <ul><li>Ces diaporamas ne sauraient remplacer un cours de biostatistiques. </li></ul><ul><li>Ils n’ont pour but que de permettre à des étudiants K1 de faire un premier abord objectif de l’évaluation de la posture et du mouvement, en application des connaissances biostatistiques théoriques acquises lors de l’année universitaire d’orientation. </li></ul><ul><li>Ils sont à consulter dans l’ordre, des notions abordées dans l’un des chapitres sont parfois utiles à la compréhension des chapitres suivants. </li></ul><ul><li>Il faut avoir à leur lecture la seule attitude compatible avec l’esprit du domaine étudié, à savoir le fait que nous ne pouvons pas rejeter l’hypothèse d’erreurs multiples, diverses et variées dans ces diaporamas. </li></ul><ul><li>Je suis à l’écoute de toutes vos remarques, annotations, critiques. N’hésitez pas à me les faire parvenir. </li></ul>Nécessaires préambules…
  3. 3. Présentation du test du  2 <ul><li>Il permet de déterminer s’il y a liaison entre plusieurs pourcentages, ou entre un pourcentage et un pourcentage théorique. </li></ul><ul><li>Il est couramment utilisé en médecine, parce qu’il y est souvent nécessaire de déterminer s’il existe une liaison entre un facteur et une catégorie de patients </li></ul><ul><li>Exemples : mettre en évidence une liaison entre le cancer du poumon chez les fumeurs ou les non-fumeurs, voir si la lombalgie est liée à l’exposition aux vibrations, si la cervicalgie est liée à l’arthrose cervicale, s’il y a une liaison entre dyslexie et posture,… </li></ul><ul><li>Il est aussi appelé test d’indépendance parce qu’il permet de tester l’absence de liaison entre les lignes et les colonnes de ce tableau. </li></ul>
  4. 4. Représentation et signification <ul><li>Représentation </li></ul><ul><li>Sous forme de tableau : </li></ul><ul><li>Signification du test d’indépendance </li></ul><ul><li>Même positif, le test ne permet pas de déterminer une causalité  : il ne peut pas dire ici que la lombalgie est provoquée par l’exposition aux vibrations. </li></ul><ul><li>Il peut uniquement dire qu’il y a ou non une liaison entre les deux facteurs. </li></ul>
  5. 5. Liaison & causalité <ul><li>Différence entre liaison et causalité </li></ul><ul><li>Si le test ne démontre pas de liaison, les études peuvent s’arrêter là. </li></ul><ul><li>S’il montre une liaison, il peut y avoir un facteur de confusion (ex. le vieillissement est un facteur de confusion entre cervicalgie et cervicarthrose : arthrose cervicale et cervicalgie se rencontrent plus fréquemment chez les sujets prenant de l’âge). </li></ul><ul><li>il n’y a pas de test statistique déterminant la causalité d’une variable sur une autre. </li></ul>
  6. 6. Conditions de causalité <ul><li>Quelques conditions nécessaires pour établir la causalité d’une exposition à un facteur dans la survenue d’un trouble : </li></ul><ul><li>Reproductibilité des études, </li></ul><ul><li>Lien biologique et médical démontré entre les deux facteurs, </li></ul><ul><li>Amélioration de la santé des patients par la suppression de l’exposition, </li></ul><ul><li>Exposition préalable à ses effets, </li></ul><ul><li>Spécificité de l’exposition, </li></ul><ul><li>Relation dose-effet…. </li></ul>
  7. 7. Trier les données sous Excel <ul><li>Est-ce que les filles sont plus sportives que les garçons ? Test de comparaison de 2 pourcentages sur de grands échantillons </li></ul><ul><li>Trier les données </li></ul><ul><li>Utiliser le menu « Données », « trier », à partir de la colonne « sexe ». Il faut placer en surbrillance toutes les colonnes à trier et non une seule (ce qu’Excel ne manquera pas de rappeler dans le cas contraire). </li></ul>
  8. 8. Réaliser le tableau de  2 <ul><li>Un tableau permet de distinguer les sportifs en fonction du genre, à l’aide de la formule NB.SI , (majuscules ou minuscules), en indiquant au logiciel la plage de données dans laquelle rechercher cette dernière. Cette forme de tableau est nécessaire à l’utilisation du test de comparaison de deux distributions. </li></ul>
  9. 9. Réaliser le tableau de  2 <ul><li>Sont ensuite sommés les valeurs des sportifs, non-sportifs, F, M et les totaux. </li></ul>
  10. 10. Illustration du test Pour mieux matérialiser les pourcentages respectifs de chaque catégorie, surligner les valeurs du tableau et leurs intitulés et utiliser la fonction «  histogramme empilé à 100%  » dans le menu «  insérer un graphique  », «  histogramme  »
  11. 11. Analyse du graphique <ul><li>On obtient la répartition des valeurs observées de la variable. Le graphique semble indiquer que les garçons sont plus sportifs que les filles, ces dernières ayant une proportion de sportives équivalente à celle de la somme totale des sujets. Qu’en est-il réellement ? </li></ul>
  12. 12. Analyse du graphique <ul><li>Cet histogramme illustre le principe du test du  2  : si les deux échantillons étaient semblables pour la variable étudiée, chaque pourcentage aurait une valeur proche de celle du pourcentage total. Dans le cas contraire, nous pourrions conclure à une différence entre les deux variables pour les deux échantillons. </li></ul><ul><li>Prenons l’hypothèse que la répartition des sportifs soit identique quel que soit le sexe du patient. Appelons cela l’hypothèse nulle. On s’attend à ce que, pondérée par le nombre de sujets, la répartition soit la même. </li></ul>
  13. 13. Principes du test de  2 <ul><li>Il permet de se prononcer sur l’égalité entre les deux échantillons. Son principe est relativement simple. </li></ul><ul><li>Il consiste à comparer les valeurs observées à des valeurs calculées , nommées aussi théoriques ou attendues , ou espérées . </li></ul><ul><li>Formulation des hypothèses </li></ul><ul><li>Hypothèse nulle : « nous ne pouvons pas exclure l’hypothèse que la répartition des sportifs soit identique quel que soit le sexe du patient » </li></ul><ul><li>Hypothèse alternative : « il y a une liaison entre le genre et la pratique sportive dans la population dont est issu l’échantillon mesuré » </li></ul><ul><li>N.B. Le test du  2 est toujours un test unilatéral. </li></ul>
  14. 14. Calcul des valeurs théoriques <ul><li>Il y a 28 non-sportifs parmi 45 sujets masculins dans les valeurs observées. Si la répartition des non-sportifs est équivalente quel que soit le sexe, alors la valeur théorique de la répartition des non-sportifs est de 45*88/132 (nombre total de sujets masculins multiplié par le rapport entre nombre de sujets non-sportifs et le nombre total de sujets) soit 30,00*. </li></ul>* Les valeurs théoriques sont fortuitement des nombres entiers dans cet exemple
  15. 15. Calcul des valeurs théoriques <ul><li>4°- Calcul des valeurs théoriques </li></ul><ul><li>Il y a 28 non-sportifs parmi 45 sujets masculins dans les valeurs observées. Si la répartition des non-sportifs est équivalente quel que soit le sexe, alors la valeur théorique de la répartition des non-sportifs est de 45*88/132 (nombre total de sujets masculins multiplié par le rapport entre nombre de sujets non-sportifs et le nombre total de sujets) soit 30,00*. </li></ul><ul><li>5°- Calcul manuel de la valeur du  2 </li></ul><ul><li>Elle est la somme du carré de la différence entre valeur observée et valeur théorique, divisée par la valeur théorique, pour chaque catégorie. Elle s’écrit : </li></ul><ul><li>Son calcul sur papier nous donne une valeur du  2 égale à : </li></ul><ul><li>(27-29) 2 /29 + (60-58) 2 /58 + (17-15) 2 /15 + (28-30) 2 /30 = 4(1/29 + 1/58 + 1/15 + 1/30) = 0,607 </li></ul>
  16. 16. Calcul à l’aide d’Excel <ul><li>6°- Calcul à l’aide d’Excel de la valeur du  2 </li></ul><ul><li>Ca se complique chez Bill Gates… </li></ul><ul><li>Excel utilise plusieurs fonctions ( TEST.KHIDEUX, KHIDEUX.INVERSE, LOI.KHIDEUX ) pour un même test statistique. </li></ul><ul><li>Il faut donc paradoxalement rechercher en premier la valeur du degré de signification (le petit p) à l’aide de la fonction « TEST.KHIDEUX », puis la valeur du  2 à l’aide de la fonction « KHIDEUX.INVERSE ». </li></ul><ul><li>La fonction « LOI.KHIDEUX », semblable à la fonction « TEST.KHIDEUX », donne le degré de signification à partir de la valeur du  2 et de l’indication des degrés de liberté. </li></ul>
  17. 17. Fonction « test.khideux » <ul><li>Sélectionner les plages observées (réelles) et les plages théoriques (attendues). </li></ul><ul><li>Excel vous donne la valeur du degré de signification (le petit p) à l’aide duquel vous allez pouvoir calculer la valeur du  2 </li></ul>
  18. 18. Fonction « khideux.inverse » <ul><li>Sélectionner la cellule où est indiqué le résultat du test précédent. </li></ul><ul><li>Indiquer « 1 » dans la rubrique « degrés de liberté »* </li></ul><ul><li>Vous obtenez 0,6 comme valeur du  2 </li></ul>* La comparaison de n pourcentages se fait avec n-1 degrés de liberté, puisque l’on peut, à l’aide de la valeur de n-1 cases déterminer la valeur des autres n cases
  19. 19. Fonction « loi.khideux » <ul><li>A l’aide de la valeur du  2 vous pouvez obtenir la probabilité d’apparition de la variable. </li></ul><ul><li>Intér êt après les 2 tests précédents ? </li></ul>
  20. 20. Conditions d’application <ul><li>Avant d’appliquer un test, il faut savoir s’il est licite de l’utiliser. Ici, il faut d’abord calculer les valeurs théoriques avant de savoir s’il peut être utilisé. </li></ul><ul><li>Le test du  2 n’est pas à proprement parler un test paramétrique, à deux conditions près : </li></ul><ul><li>Il ne peut s’appliquer tel quel qu’en présence d’effectifs théoriques inférieurs à 5, dans une des quatre cases du tableau. </li></ul><ul><li>Les échantillons doivent être indépendants ; il est nécessaire qu’une donnée ne puisse pas être placée indifféremment dans les deux catégories. </li></ul>
  21. 21. Conclure <ul><li>On montre que, si l’hypothèse d’égalité entre les catégories H 0 est vraie et si la taille de l’échantillon est assez grande, la valeur [(O 1 -T 1 )²/T 1 ] + [(O 2 -T 2 )²/T 2 ] + [(O 3 -T 3 )²/T 3 ] + [(O 4 -T 4 )²/T 4 ] suit une loi de  ² à 1 degré de liberté. </li></ul><ul><li>Si les valeurs observées étaient égales aux valeurs théoriques, la valeur du  ² serait 0. Plus on s’éloigne de 0, plus il y a un écart entre la valeur observée et la valeur pouvant correspondre à l’hypothèse nulle. </li></ul><ul><li>Nous retrouverions dans 95 expériences identiques sur 100 (risque  de première espèce à 0,05) une différence entre les deux proportions pour une valeur seuil du  2 supérieure à 3,84 . </li></ul>
  22. 22. Conclure <ul><li>Cette valeur seuil de 3,84 correspond à un degré de signification de 0,05 pour une loi de  2 à 1 degré de liberté . </li></ul><ul><li>Le fait que 3,84 corresponde à 1,96 2 n’est pas fortuit : une loi de  2 à 1 degré de liberté correspond au carré d’une loi normale centrée réduite Z 2 . </li></ul><ul><li>Donc : </li></ul><ul><li>Notre valeur du  2 est ici de 0,607 : nous ne pouvons donc pas rejeter l’hypothèse nulle d’égalité entre la proportion de sportifs et de sportives ; chez les étudiants en kinésithérapie, les filles sont aussi sportives que les garçons . </li></ul>
  23. 23. La correction de Yates <ul><li>Le test du  2 pour de petits échantillons </li></ul><ul><li>Lorsque les effectifs sont trop petits, il peut arriver qu’un ou plusieurs effectifs théoriques soient inférieurs à 5. Les conditions d’application du test ne sont pas respectées. </li></ul><ul><li>On ne peut alors pas l’utiliser sans réaliser un correctif, appelé correctif de Yates, du nom de l’inventeur. </li></ul><ul><li>Elle suit encore, si H 0 est vraie, une loi de  ² à 1 degré de liberté. </li></ul><ul><li>C’est une pondération : on retire 0.5 à la différence entre les observés et les calculés. Elle s’écrit : </li></ul>
  24. 24. Conditions d’application <ul><li>Conditions d’application de la correction de Yates </li></ul><ul><li>Elle n’est utilisable que : </li></ul><ul><li>Si n (au moins) des effectifs théoriques est inférieur à 5 ET </li></ul><ul><li>Si tous les effectifs théoriques sont supérieurs à 3. </li></ul><ul><li>Remarque </li></ul><ul><li>Elle n’est applicable que pour la comparaison de deux pourcentages. </li></ul>
  25. 25. Exemples <ul><li>Est-ce que les latéralités du membre supérieur et de l’œil de visée sont liés au genre du sujet ? </li></ul><ul><li>Pour la latéralité du MS, l’un des effectifs théoriques est à 1,42. Il n’est pas possible d’utiliser la correction de Yates. Nous ne pouvons pas conclure. </li></ul><ul><li>Pour l’œil de visée, l’un des effectifs théoriques est inférieur à 5 mais supérieur à 3 : il est licite d’utiliser le test du  2 avec la correction de Yates. N.B. Excel ® ne tient pas compte de cette condition d’application. Il faut donc calculer le  2 manuellement. </li></ul>
  26. 26. Sinon ? <ul><li>Si les conditions de la correction de Yates ne sont pas présentes ? </li></ul><ul><li>La meilleure solution consiste à augmenter le nombre de sujets, ce qui ne donnera que plus de poids aux conclusions. C’est souvent le problème de l’analyse des latéralités : peu de gaucher à comparer avec beaucoup de droitiers. Sinon, il existe un test ( test exact de Fisher ) qui permet de le faire. </li></ul><ul><li>Peut-on comparer 3, 4, n pourcentages ? </li></ul><ul><li>Oui. Le degré de liberté est de n-1 pourcentages à comparer, mais l’utilisation d’Excel est identique (plus de plages à sélectionner) et le principe est le m ême. </li></ul><ul><li>Pas de correction de Yates possible. </li></ul>
  27. 27. Bibliographie <ul><li>Livres : </li></ul><ul><li>Bouyer J. Méthodes statistiques. Médecine – Biologie. Estem. Editions Inserm. 2004 </li></ul><ul><li>Georgin JP. Gouet M. Statistiques avec Excel. Presses Universitaires de Rennes. 2005 </li></ul><ul><li>Huguier M. Flahault A. Biostatistiques au quotidien. Elsevier. 2003 </li></ul><ul><li>Sites : </li></ul><ul><li>Cours de Denis Poinsot, maître de conférence à la Faculté de Rennes : http://perso.univ-rennes1.fr/denis.poinsot/Statistiques%20pour%20statophobes/ </li></ul><ul><li>Biostatistique clinique - épidemiologie et essais cliniques de la Faculté de Médecine Necker-Enfants Malades (Dr Landais & Jais) : http://www.educ.necker.fr/cours/poly/biostatistique/biostat.htm# </li></ul><ul><li>Cours : </li></ul><ul><li>Méthodologie de Base en Statistique et Epidémiologie. École d’été de santé publique et d’épidémiologie. Faculté de Médecine Paris-Sud, 63 rue Gabriel Péri, 94276 Le Kremlin Bicêtre. http://u569.kb.inserm.fr/ecolete/index.htm </li></ul><ul><li>Centre d’Enseignement de la Statistique Appliquée à la Médecine et à la Biologie Médicale (CESAM) http://cesam.vjf.inserm.fr/ </li></ul>

×