Analyse de T test sur des échantillons apparié. L'échantillon aléatoire de la population. Deux échelles de mesure pour chaque individu. La distribution des diverses mesures (Avant et après) est assez normale ( pas parfaitement normale) avec homogénéité des variances
T test sur des échantillons appariés avec test de normalité
1. T TEST SUR DES
ÉCHANTILLONS APPARIES
AVEC
TEST DE NORMALITÉ
Pr . Adad M. Cherif
Université d’Oum El Bouaghi, Algérie
Faculté des sciences de la terre et de
l’architecture
Deux séries de mesures quantitatives sur les
mêmes individus (avant-après)
2. Le choix d’un test
statistique approprié ( tel
que analyse de correlation,
Khi deux, ANOVA, T test) est
fonction de la problématique
et des données du
problème.
3. DANS NOTRE CAS, ON A OPTÉ
POUR LE TEST T APPARIÉ
• Test t apparié se réfère à des mesures
répétées à deux dates différentes
pour le même groupe de personnes
ou le même effectif.
4. LES CONDITIONS D’APPLICATION DU TEST T À
ÉCHANTILLON APPARIÉ
Echantillon aléatoire de la population , objet d’étude, pour
pouvoir ensuite généraliser
Deux échelles de mesure pour chaque individu
La distribution des diverses mesures (Avant et après) est assez
normale ( pas parfaitement normale)
Homogénéité des variances
5. Dans cette exercice, nous allons voir comment on peut
appliquer
« LE TEST T POUR ÉCHANTILLON APPARIÉE EN
UTILISANT LE LOGICIEL SPSS » sur un échantillon de 30
élèves choisis au hasard.
Avant d’entamer le test proprement dit , d’abord
commençant par établir la question de recherche:
« Y a t-il une amélioration significative du niveau des élèves
en langue française après qu’ils aient suivi des cours
de soutien ? »
6. En conséquence l’hypothèse nulle (H₀) à tester est la
suivante:
« Il n’ y a aucune amélioration significative du
niveau des étudiants en langue française
même après qu’ils aient suivi des cours de
soutien»
Cela signifie en termes plus clairs :
La moyenne (ẋ1) des Notes initiales (NI)= la moyenne (ẋ2) des Notes
Finales (NF)
ou encore
La moyenne des Notes initiales (NI) - la moyenne des Notes finales (NF) =0
(H₀) ẋ1- ẋ2=0
7. Hypothèse alternative (HA) ou hypothèse de
recherche
« Il y a une amélioration significative du
niveau des élèves en langue française
après qu’ils aient suivi des cours de
soutien»
Pour cette l’hypothèse (HA) :
Moyenne de NI ≠ NF (HA) ẋ1≠
ẋ2
8. En référence à la question principale et l’hypothèse nulle, il
ressort deux variables (une variable est une information dont
on recueille les données en observant ou en mesurant)
Variable 1
Notes Initiales (NI) (les résultats sans les cours de
soutien )
Variable 2
Notes Finales (NF) (les résultats après les cours de
soutien )
9. Test t apparié se réfère à des mesures
répétées à deux dates différentes pour le
même groupe de personnes ou le
même effectif)
Donc, dans notre exemple, ce test
tente de déterminer s’il y a une
différence entre les moyennes des
deux tests NI et NF.
10. AFFICHAGE DES VARIABLES
On écrit dans la ligne 2 NI et la ligne 3 NF , faite attention, dans la
colonne « Nom » , l’espace et certains caractères ne sont pas
acceptés
• La colonne « Largeur » : on laisse 8 , le nombre de caractères
• La colonne « Décimales »: les notes saisies ont 2 chiffres après la
virgules
• Dans la colonne « Etiquette » on écrit l’appellation exactes de NI
« Notes initiales » et NF « Notes finales »
• La colonne « Mesure » : on choisit échelle , car il s’agit de
valeurs quantitatives , c’est-à-dire des nombres réels.
13. TESTONS LA NORMALITÉ DE LA DIFFÉRENCE ENTRE NI ET NF
Différence = NI - NF
Cette différence doit être assez normale
Deux questions de sondage ou de questionnaire (ou 2 variables)
Notes initiales
Notes finales après les cours de soutien
La procédure de l’Analyse de la normalité de la différence NI-NF ou
total_sous
Analyse
Statistiques descriptives
Explorer
14.
15. Dans cette fenêtre , on transfert totat_sous qui est la
différence entre NI – NF , dans « liste variables
dépendantes » par le biais de la flèche
Flèche
Cliquer sur
diagramme
17. Le test Kolmogorov KS
(p=0,200) et Shapiro SW
(p=0,910) montent clairement
que total_soust est assez
normale étant donné que les p>
0.05
Ce histogramme est presque
symétrique et a la forme d’une
cloche ,
Ainsi, il es possible d’utiliser les
tests paramétriques, tel que Test
t
Le diagramme montre
clairement que la
différence
« Total_sous » est assez
normale
18. Dans le graphique QQ, les points suivent la ligne de tendance, cela signifie
qu'ils sont liés à la ligne droite. Donc, tota_sous (NI - NF) est
normalement distribuée,
20. En appuyant sur test t à échantillon apparié, une fenêtre
apparait , à gauche NI et NF sont transférées, à l’aide la
flèche, dans « variables appariées »en vue de les analyser :
variable 1 pour NI et variable 2 pour NF.
Flèche
La position de NI et NI n’a aucune importance , leur
position est interchangeable grâce au bouton
21. On clique sur « OPTION » et on choisit 95% l’intervalle
de confiance puis « POURSUIVRE » et enfin « OK »
22. On obtient le résultat suivant sous forme de trois
tableaux
- Statistiques pour échantillons appariés
- Corrélation pour échantillons appariés
- Test échantillons appariés
23. Dans le 1er tableau (Statistiques pour échantillon appariés ) le nombre de notes pour
chaque type de test est de 30 , l’écart type pour chaque test 3,48296 pour NI et
2,66821 pour NF a moyenne des notes saisies du NI est de 9,9500 et celle des
notes du NF est de 11,6417. On constate déjà qu’il y a une amélioration des
résultats après les cours de soutien la moyenne du NF est supérieure à celle du
NI.
Passant maintenant au 3ème tableau mais oublions pour le moment le 2ème tableau
.
24. LE TABLEAU TEST T À ÉCHANTILLON APPARIÉ
Une lecture des résultats mentionnés sur le tableau , nous révèle que l’hypothèse nulle est
rejeté.
Nous pouvons conclure « Qu’il a une amélioration significative du niveau des
étudiants en langue française après qu’ils aient suivi des cours de soutien » et
l’hypothèse de recherche est acceptée
Pour les raisons suivantes :
La paire NI- NF = -1,69167
11,6477 - 9,9500= - 1,69167
Donc NI ≠ NF
t(29)= - 2,367 , ddl (degré de liberté= 29 )
la valeur p=0,025 p < 0,05 (5%) (très significative
statistiquement)
Remarque importante : "significativité statistique" « Sig » (niveau p)
La significativité statistique d'un résultat est une mesure estimée du
degré auquel ce résultat est "vrai" ,
Plus le niveau p est abaissé par rapport à 0,05 , et plus ,il y a de
chances pour que la relation observée entre les variables de l'échantillon soit un
bon indicateur de la relation entre les variables respectives dans la population.