SlideShare une entreprise Scribd logo
1  sur  5
ANALYSE DE
DONNEES AVEC R
PRÉSENTÉ PAR :
MR ABDOULAYE WAKHAB DIOP
TEL : +221776175420 / EMAIL : WAKHABDIOP@YAHOO.FR
1
Chapitre III : Les Dataframes en R
Qu’est ce qu’un dataframe en R ?
Les dataframes sont des listes particulières dont les composantes sont de même longueur, mais les modes
peuvent être différents. C’est l’objet privilégié en analyse des données statistiques.
Pour créer un dataframe , on utilise les fonctions :
 data.frame qui permet de concaténer des vecteurs de même taille et éventuellement de modes différents;
 read.table qui permet d’importer un tableau de données provenant d’un fichier externe(csv, txt, etc.)
 as.data.frame pour la conversion explicite d’un objet à deux dimensions(comme une matrice)
 Comment accéder aux éléments d’un dataframe?
En plus des techniques vues précédemment , nous pouvons utiliser ici une fonction très pratique appelée
subst ()
 Comment ajouter ou transformer des colonnes ?
En plus des techniques vues précédemment , nous pouvons utiliser ici une fonction très pratique appelée
transform ()
2
Chapitre III : Les Dataframes en R
 Quelques fonctions utiles pour la manipulation
 head () pour obtenir un aperçu/résumé(il affiche les six premières lignes)
 tail () affiche les six dernières lignes
 summary () qui donne les éléments statistiques de base
 aggregate () qui permet de calculer des statistiques descriptives tels que le minimum , la moyenne et la médiane d’une
variable pour un sous ensemble (regroupement )d’individu d’un de données. On écrit :
aggregate(formula, data, FUN, ...)
Ou formula est une formule de type y~x , ou y est la variable d'intérêt x le facteur de découpage , data est le jeu de données
auquel appartient x et y et Fun le nom de la fonction à utiliser pour les calculs.
 Pour faire du comptage , on peut utiliser la fonction table ()
 Pour renommer des lignes et des colonnes , on peut utiliser la fonction names ()
 Pour ordonner les lignes , on utilise : order ()
 Pour empiler les données , on utilise : stack () , fréquemment utiliser dans R pour préparer les données avant de les fournir à
d’autres fonctions (graphiques)
3
Chapitre III : Les Dataframes en R
 Sources de données
 Importer
•Les tableaux de données peuvent être stockés dans un fichier texte délimité.
•Vous pouvez importer ces fichiers sous la forme d’un dataframe via la fonction read.table.
•Il faut être vigilant dans le choix des arguments lors de l’importation pour ne pas se retrouver avec un résultat non souhaité ou pire,
une erreur.
•La fonction summary nous permet d’avoir un aperçu global d’un dataframe et des différents types de chaque colonne, après
importation.
•Pour un fichier texte , on utilise :
data1 <- read.table(" fichier1.txt", sep=";", row.names=1, header=TRUE)
data1
 Pour un fichier csv , on a :
data2 <- read.table("fichier2.csv", sep=";", header=TRUE, dec="," , row.names=1)
data2
ou bien
data3 = read.csv(file.choose() , header=T, sep=‘;’ )
Attention dans tous ces deux cas , on suppose que le fichier se trouve dans le répertoire courant sous R. Dans le cas on va soit:
 Redéfinir le répertoire courant
 Definir le chemin brut d'accès au fichier
4
Chapitre III : Les Dataframes en R
 Sources de données
 Exporter
Le format texte est le format recommandé pour communiquer les résultats après l analyse, mais il est tout a fait possible de
sauvegarder le tout dans un format propre à R .
Un résultat se présente la plupart du temps sous la forme d’un tableau et nous allons donc exporter celui-ci. L’exportation du
tableau est très simple :
write.table(tableau,"monfichier.csv",sep=";",row.names=FALSE)
Ainsi, pour exporter sans nom de lignes ou de colonnes ni guillemets et avec un séparateur tabulation, nous utilisons :
write.table (ozoneR,"montableau.txt",row.names=F,col.names=F,quote=F,sep='t’)
5

Contenu connexe

Similaire à R FOR DATA ANALYSIS_DATAFRAMES1.pptx

Salesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalkaSalesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalkaIlan Malka
 
Intégration des données avec Talend ETL
Intégration des données avec Talend ETLIntégration des données avec Talend ETL
Intégration des données avec Talend ETLLilia Sfaxi
 
DATABASE_DATA_STRUCTURE_DEVOXXFRANCE2024.pdf
DATABASE_DATA_STRUCTURE_DEVOXXFRANCE2024.pdfDATABASE_DATA_STRUCTURE_DEVOXXFRANCE2024.pdf
DATABASE_DATA_STRUCTURE_DEVOXXFRANCE2024.pdfHéla Ben Khalfallah
 
.php1 : les fondamentaux du PHP
.php1 : les fondamentaux du PHP.php1 : les fondamentaux du PHP
.php1 : les fondamentaux du PHPAbdoulaye Dieng
 
Généralités sur la notion d’Algorithme
Généralités sur la notion d’AlgorithmeGénéralités sur la notion d’Algorithme
Généralités sur la notion d’AlgorithmeInforMatica34
 
Tableur
TableurTableur
TableurADDNB
 
DataDrill EXPRESS: Les équations dans DataDrill
DataDrill EXPRESS: Les équations dans DataDrill DataDrill EXPRESS: Les équations dans DataDrill
DataDrill EXPRESS: Les équations dans DataDrill Olivier Pinette
 
Cours Big Data Chap6
Cours Big Data Chap6Cours Big Data Chap6
Cours Big Data Chap6Amal Abid
 
D3 js-last
D3 js-lastD3 js-last
D3 js-lastTECOS
 
analysez-des-donnees-avec-excel documen.pdf
analysez-des-donnees-avec-excel documen.pdfanalysez-des-donnees-avec-excel documen.pdf
analysez-des-donnees-avec-excel documen.pdfLeonLovensky
 
Introduction à l'analyse de réseaux avec R
Introduction à l'analyse de réseaux avec RIntroduction à l'analyse de réseaux avec R
Introduction à l'analyse de réseaux avec RLaurent Beauguitte
 
Nosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -intro
Nosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -introNosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -intro
Nosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -introOlivier Mallassi
 
ALT.NET Modéliser Parallèle avec C# 4.0
ALT.NET Modéliser Parallèle avec C# 4.0ALT.NET Modéliser Parallèle avec C# 4.0
ALT.NET Modéliser Parallèle avec C# 4.0Bruno Boucard
 

Similaire à R FOR DATA ANALYSIS_DATAFRAMES1.pptx (20)

Hive ppt (1)
Hive ppt (1)Hive ppt (1)
Hive ppt (1)
 
Salesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalkaSalesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalka
 
Cours 01.pptx
Cours 01.pptxCours 01.pptx
Cours 01.pptx
 
Intégration des données avec Talend ETL
Intégration des données avec Talend ETLIntégration des données avec Talend ETL
Intégration des données avec Talend ETL
 
Cours3 gdm sql
Cours3 gdm sqlCours3 gdm sql
Cours3 gdm sql
 
DATABASE_DATA_STRUCTURE_DEVOXXFRANCE2024.pdf
DATABASE_DATA_STRUCTURE_DEVOXXFRANCE2024.pdfDATABASE_DATA_STRUCTURE_DEVOXXFRANCE2024.pdf
DATABASE_DATA_STRUCTURE_DEVOXXFRANCE2024.pdf
 
.php1 : les fondamentaux du PHP
.php1 : les fondamentaux du PHP.php1 : les fondamentaux du PHP
.php1 : les fondamentaux du PHP
 
Généralités sur la notion d’Algorithme
Généralités sur la notion d’AlgorithmeGénéralités sur la notion d’Algorithme
Généralités sur la notion d’Algorithme
 
Tableur
TableurTableur
Tableur
 
DataDrill EXPRESS: Les équations dans DataDrill
DataDrill EXPRESS: Les équations dans DataDrill DataDrill EXPRESS: Les équations dans DataDrill
DataDrill EXPRESS: Les équations dans DataDrill
 
Cours Big Data Chap6
Cours Big Data Chap6Cours Big Data Chap6
Cours Big Data Chap6
 
Une Introduction à R
Une Introduction à RUne Introduction à R
Une Introduction à R
 
D3 js-last
D3 js-lastD3 js-last
D3 js-last
 
analysez-des-donnees-avec-excel documen.pdf
analysez-des-donnees-avec-excel documen.pdfanalysez-des-donnees-avec-excel documen.pdf
analysez-des-donnees-avec-excel documen.pdf
 
Rapport Projet Module Complexité
Rapport Projet Module ComplexitéRapport Projet Module Complexité
Rapport Projet Module Complexité
 
Introduction à Python
Introduction à PythonIntroduction à Python
Introduction à Python
 
Chapitre 1 rappel
Chapitre 1 rappelChapitre 1 rappel
Chapitre 1 rappel
 
Introduction à l'analyse de réseaux avec R
Introduction à l'analyse de réseaux avec RIntroduction à l'analyse de réseaux avec R
Introduction à l'analyse de réseaux avec R
 
Nosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -intro
Nosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -introNosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -intro
Nosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -intro
 
ALT.NET Modéliser Parallèle avec C# 4.0
ALT.NET Modéliser Parallèle avec C# 4.0ALT.NET Modéliser Parallèle avec C# 4.0
ALT.NET Modéliser Parallèle avec C# 4.0
 

Dernier

ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel AttalELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attalcontact Elabe
 
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...France Travail
 
Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023France Travail
 
Les Français, l'Europe et Emmanuel Macron
Les Français, l'Europe et Emmanuel MacronLes Français, l'Europe et Emmanuel Macron
Les Français, l'Europe et Emmanuel Macroncontact Elabe
 
Recurrent neural network_PresentationRNN.pptx
Recurrent neural network_PresentationRNN.pptxRecurrent neural network_PresentationRNN.pptx
Recurrent neural network_PresentationRNN.pptxbahija babzine
 
To_understand_transformers_together presentation
To_understand_transformers_together presentationTo_understand_transformers_together presentation
To_understand_transformers_together presentationbahija babzine
 
Bidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from TransformersBidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from Transformersbahija babzine
 

Dernier (7)

ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel AttalELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
 
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
 
Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023
 
Les Français, l'Europe et Emmanuel Macron
Les Français, l'Europe et Emmanuel MacronLes Français, l'Europe et Emmanuel Macron
Les Français, l'Europe et Emmanuel Macron
 
Recurrent neural network_PresentationRNN.pptx
Recurrent neural network_PresentationRNN.pptxRecurrent neural network_PresentationRNN.pptx
Recurrent neural network_PresentationRNN.pptx
 
To_understand_transformers_together presentation
To_understand_transformers_together presentationTo_understand_transformers_together presentation
To_understand_transformers_together presentation
 
Bidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from TransformersBidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from Transformers
 

R FOR DATA ANALYSIS_DATAFRAMES1.pptx

  • 1. ANALYSE DE DONNEES AVEC R PRÉSENTÉ PAR : MR ABDOULAYE WAKHAB DIOP TEL : +221776175420 / EMAIL : WAKHABDIOP@YAHOO.FR 1
  • 2. Chapitre III : Les Dataframes en R Qu’est ce qu’un dataframe en R ? Les dataframes sont des listes particulières dont les composantes sont de même longueur, mais les modes peuvent être différents. C’est l’objet privilégié en analyse des données statistiques. Pour créer un dataframe , on utilise les fonctions :  data.frame qui permet de concaténer des vecteurs de même taille et éventuellement de modes différents;  read.table qui permet d’importer un tableau de données provenant d’un fichier externe(csv, txt, etc.)  as.data.frame pour la conversion explicite d’un objet à deux dimensions(comme une matrice)  Comment accéder aux éléments d’un dataframe? En plus des techniques vues précédemment , nous pouvons utiliser ici une fonction très pratique appelée subst ()  Comment ajouter ou transformer des colonnes ? En plus des techniques vues précédemment , nous pouvons utiliser ici une fonction très pratique appelée transform () 2
  • 3. Chapitre III : Les Dataframes en R  Quelques fonctions utiles pour la manipulation  head () pour obtenir un aperçu/résumé(il affiche les six premières lignes)  tail () affiche les six dernières lignes  summary () qui donne les éléments statistiques de base  aggregate () qui permet de calculer des statistiques descriptives tels que le minimum , la moyenne et la médiane d’une variable pour un sous ensemble (regroupement )d’individu d’un de données. On écrit : aggregate(formula, data, FUN, ...) Ou formula est une formule de type y~x , ou y est la variable d'intérêt x le facteur de découpage , data est le jeu de données auquel appartient x et y et Fun le nom de la fonction à utiliser pour les calculs.  Pour faire du comptage , on peut utiliser la fonction table ()  Pour renommer des lignes et des colonnes , on peut utiliser la fonction names ()  Pour ordonner les lignes , on utilise : order ()  Pour empiler les données , on utilise : stack () , fréquemment utiliser dans R pour préparer les données avant de les fournir à d’autres fonctions (graphiques) 3
  • 4. Chapitre III : Les Dataframes en R  Sources de données  Importer •Les tableaux de données peuvent être stockés dans un fichier texte délimité. •Vous pouvez importer ces fichiers sous la forme d’un dataframe via la fonction read.table. •Il faut être vigilant dans le choix des arguments lors de l’importation pour ne pas se retrouver avec un résultat non souhaité ou pire, une erreur. •La fonction summary nous permet d’avoir un aperçu global d’un dataframe et des différents types de chaque colonne, après importation. •Pour un fichier texte , on utilise : data1 <- read.table(" fichier1.txt", sep=";", row.names=1, header=TRUE) data1  Pour un fichier csv , on a : data2 <- read.table("fichier2.csv", sep=";", header=TRUE, dec="," , row.names=1) data2 ou bien data3 = read.csv(file.choose() , header=T, sep=‘;’ ) Attention dans tous ces deux cas , on suppose que le fichier se trouve dans le répertoire courant sous R. Dans le cas on va soit:  Redéfinir le répertoire courant  Definir le chemin brut d'accès au fichier 4
  • 5. Chapitre III : Les Dataframes en R  Sources de données  Exporter Le format texte est le format recommandé pour communiquer les résultats après l analyse, mais il est tout a fait possible de sauvegarder le tout dans un format propre à R . Un résultat se présente la plupart du temps sous la forme d’un tableau et nous allons donc exporter celui-ci. L’exportation du tableau est très simple : write.table(tableau,"monfichier.csv",sep=";",row.names=FALSE) Ainsi, pour exporter sans nom de lignes ou de colonnes ni guillemets et avec un séparateur tabulation, nous utilisons : write.table (ozoneR,"montableau.txt",row.names=F,col.names=F,quote=F,sep='t’) 5