TP Pratiqque sur Regression lineaire avec le logiciel R
Le fichier DataHeight.txt contient respectivement l’âge et la taille de 50 enfants. L’objectif de ce travail est de montrer qu’il existe une relation linéaire entre l’âge et la taille des enfants. Pour y parvenir, il est vous ai demandé de procéder aux étapes suivantes :
1- Donner la distribution de y en fonction de x (graphiquement).
2- Peut-on dire qu’il y a une corrélation entre les deux variables. Justifiez.
3- Prouvez d’une manière statistique (rigoureuse) que x et y sont soit corrélées soit non ?
4- Quelles sont les valeurs des paramètres (Tita0 et Tita1)
5- Quelle est la valeur de l’erreur résiduelle.
6- Donnez l’équation de la droite de régression.
7- Dessiner la droite de régression.
8- Selon le modèle trouvé prédire les poids de 4 enfants ayant respectivement 3, 7, 9 et 12 ans.
9- Prédire la taille d’un enfant de 10 ans avec un intervalle de confiance de 95%.
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Compte rendu data mining Regression Linéaire avec R - Soumia HERMA-
1. République Algérienne Démocratique et Populaire
Ministère de l’Enseignement Supérieur et de la Recherche scientifique
Université de Ghardaïa
Faculté des Sciences et Technologie
Département des Mathématiques et Informatique
Domaine : Mathématiques et Informatique
Spécialité : Master II SIEC
Module : Data Mining et Apprentissage Automatique
PAR :
Soumia Elyakote HERMA
Enseignant :
Pr. Abdelouahab Moussaoui
ANNEE UNIVERSITAIRE : 2015/2016
Compte rendu
Régression linéaire
Avec le logiciel R
3. 1
Introduction
Dans ce TP nous allons voir un des algorithmes d’apprentissage simple c’est
bien la Régression, nous allons travailler avec le logiciel R qui offre des
commandes facile à manipuler. Dans mon TP ; V1et V2 désigne l’âge et la taille
d’enfant respectivement.
Étapes de TP
Tout d’abord il faut que nous importons le DataSet DataHeight.txt qui
contient nos donnés à traités ;
> mydata=read.table("TPsDataHeight.txt")
> mydata
> attach(mydata)
4. 2
1- la distribution de y en fonction de x (graphiquement) :
> plot(V1,V2)
2- Oui, il y a une corrélation entre les deux variables tel que nous remarquons
que les tailles des enfants augmentent avec leurs âges.
3- La corrélation linéaire peut être calculée grâce à la fonction cor(), elle est la
manière statistique qui prouve que x et y sont corrélés :
> cor(V1,V2)
[1] 0.926317
Nous rappelons que la corrélation linéaire varie entre -1 et 1. Lorsque cette
corrélation vaut 1, elle indique une corrélation positive parfaite entre les données ; les
données sont alors parfaitement alignées le long d’une droite dont le coefficient
directeur est positif.
5. 3
4- les valeurs des paramètres θ0 et θ1: à partir de la commande summary() nous
pouvons estimer les deux paramètres ;
θ0= 0.06388 et θ1= 0.75016
5- la valeur de l’erreur résiduelle : la commande summary(modele) ;
Residual standard error: 0.6576
6- l’équation de la droite de régression : nous avons les valeurs de θ0 et θ1 ; Y=
0.06388X + 0.75016
Eq ; Taille = 0.06388Age + 0.75016
7- la droite de régression :
6. 4
8- Prédiction des tailles des enfants ayant respectivement 3, 7, 9 et 12 ans :
La commande qui permet de donner la prédiction des tailles est :
>predict(modele, newdata=data.frame(V1=12))
3 : 0.941806
7 : 1.197331
9 : 1.325093
12 : 1.516737
9- la taille d’un enfant de 10 ans avec un intervalle de confiance de 95% :
> predict(modele, newdata = data.frame(V1 = 10), interval = "confidence")
fit lwr upr
1 1.388974 1.348584 1.429364
Conclusion
À partir de ce que précède nous maitrisons les commandes en R qui aide à faire une
Régression linéaire et en plus prédire de sa part où nous voir l’importance qui nous donne
cet algorithme.