1
2
Il est essentiel d’utiliser un bonoutil d’analyse de données !3
UneIntroduction àFrançois GuillemAnalyste de données @
Qu’est-ce que ?• Logiciel de statistique• Langage de programmation dédié à l’analysestatistique• Open source (gratuit !)• ...
Où obtenir ?• Le logiciel de base est disponible ici :http://cran.r-project.org• Pour les utilisateurs windows, installer ...
Démarrer
Pourquoi et quandutiliser ?
« Philosophie » de• Le matériel n’est pas une limite• En particulier, beaucoup plus de RAM que dedonnées à traiter• La vra...
Les avantages deSimplicité• Langagerelativementsimple• Conçu pour desnon-développeurs• Maisapprentissageinitial difficileF...
Les inconvénients de• Gestion peu efficace de la mémoire :o Les données sont souvent copiées plusieurs foiso Limité par la...
Obtenir de l’aide• "Short-refcard"• Dans Rstudio : recherche dans l’onglet aide.Ne cherche que les fonctions dans lespacka...
Manuels en français• R pour les débutants : se concentre plutôt surles aspects techniques de R• Introduction à R : plus pr...
Démonstration
Hello Worldprint("Hello world")"Hello world"# Plus subtilmessage <- "Hello world"message
Types de données• numeric• logical (TRUE, FALSE, 1 > 0, 1 == 0, TRUE& FALSE, TRUE | FALSE)• character => texte• factor => ...
Types de données• En cas de doute: class(x)• conversion: as.nom_de_classe(x)• ex:as.character(1), as.numeric(«1»), as.Date...
Travailler avec des vecteurs# Dans R la plupart des fonctions sont vectorisées, ie. elles prennent# un vecteur et renvoien...
Travailler avec des vecteurs# SélectionsV1[1] # Sélectionne le premier élémentV1[c(1,2)] # Sélectionne les deux premiers é...
Travailler avec des « data.frame »# Importer données : read.csv, read.xls, sqlQuery, load, etc.data <- read.csv(«fichier.c...
Boucles, conditions, fonctionsa <- 1if (a == 1) {# code à évaluer si la condition est vraie}a <- TRUEif (a) {# ...}for (i ...
Boucles, conditions, fonctionsf <- function(x) {x <- x^2return(x)}f <- function(x) {x <- x^2x # Le return est implicite}f ...
Les packages# Un package est un ensemble de fonctions et de classes# supplémentaires# A faire une seule foisinstall.packag...
Prochain SlideShare
Chargement dans…5
×

Une Introduction à R

591 vues

Publié le

Slides présentés à l'occasion du premier meetup Paris R Addicts.
La présentation est destiné à ceux qui ne connaissent pas ou très peu. Elle montre les intérêts et les inconvénients du logiciel ainsi que des éléments de syntaxe et des liens qui aideront l'apprentissage.

Publié dans : Technologie
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
591
Sur SlideShare
0
Issues des intégrations
0
Intégrations
2
Actions
Partages
0
Téléchargements
12
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Une Introduction à R

  1. 1. 1
  2. 2. 2
  3. 3. Il est essentiel d’utiliser un bonoutil d’analyse de données !3
  4. 4. UneIntroduction àFrançois GuillemAnalyste de données @
  5. 5. Qu’est-ce que ?• Logiciel de statistique• Langage de programmation dédié à l’analysestatistique• Open source (gratuit !)• Pas de GUI : tout se fait en ligne decommande !
  6. 6. Où obtenir ?• Le logiciel de base est disponible ici :http://cran.r-project.org• Pour les utilisateurs windows, installer enplus Rtools :http://cran.r-project.org/bin/windows/Rtools/• Pour faciliter votre vie, installer l’IDE Rstudio :http://www.rstudio.com/ide/download/desktop
  7. 7. Démarrer
  8. 8. Pourquoi et quandutiliser ?
  9. 9. « Philosophie » de• Le matériel n’est pas une limite• En particulier, beaucoup plus de RAM que dedonnées à traiter• La vraie contrainte, c’est votre temps !
  10. 10. Les avantages deSimplicité• Langagerelativementsimple• Conçu pour desnon-développeurs• Maisapprentissageinitial difficileFlexibilité• Langage trèspermissif• Systèmed’extensions(packages)• Interface avecd’autreslangages(Java, C, C++)• Appelerd’autresprogrammesInteractivité• Commandesexécutées à lavolée• Permet dedécider au fur età mesure quoifaire• Tous lesrésultatspeuvent êtrestockés etréutilisésPartage• Open source• Réplicabilitédes travaux• Génération derapports• Systèmed’extension• Communautédynamique etsympatique
  11. 11. Les inconvénients de• Gestion peu efficace de la mémoire :o Les données sont souvent copiées plusieurs foiso Limité par la RAM disponibleo Volume de données max ≈ RAM / 4• R peut être très lent lorsqu’il s’agit de réaliserun très grand nombre d’opérations simples(Evitez les boucles !)• Limites atténuées par certains packagesmais temps d’apprentissage long
  12. 12. Obtenir de l’aide• "Short-refcard"• Dans Rstudio : recherche dans l’onglet aide.Ne cherche que les fonctions dans lespackages installés• Les vignettes : taper « vignette() » dans laconsole R• Sur le site du CRAN (taskviews, search)• Forum du cirad• Nous !
  13. 13. Manuels en français• R pour les débutants : se concentre plutôt surles aspects techniques de R• Introduction à R : plus pragmatique, apprendà réaliser des analyses simples avec R
  14. 14. Démonstration
  15. 15. Hello Worldprint("Hello world")"Hello world"# Plus subtilmessage <- "Hello world"message
  16. 16. Types de données• numeric• logical (TRUE, FALSE, 1 > 0, 1 == 0, TRUE& FALSE, TRUE | FALSE)• character => texte• factor => variables catégorielles• data.frame => tableau dans lequel lescolonnes peuvent avoir des types différents• list => données non-tabulaires• ... et bien d’autres
  17. 17. Types de données• En cas de doute: class(x)• conversion: as.nom_de_classe(x)• ex:as.character(1), as.numeric(«1»), as.Date(«2012-12-21»)
  18. 18. Travailler avec des vecteurs# Dans R la plupart des fonctions sont vectorisées, ie. elles prennent# un vecteur et renvoient un vecteur de la même taille => Les boucles# sont rarement nécessaires# Créer un vecteur : c (comme «concaténation»)V1 <- c(1, 2, 3) # ou V1 <- 1:3V2 <- c(0, 3.5, 5)V3 <- c("a", "b", "c")# OpérationsV1 + 1V1 + V2V1 > 1V1 > V2 # Comparaison élément par élémentexp(V1); log(V1) # Renvoient un vecteur taille 32 * V1V1 * V2 # multiplication élément par élémentt(V1) %*% V2 # produit matricielV1 %*% t(V2)
  19. 19. Travailler avec des vecteurs# SélectionsV1[1] # Sélectionne le premier élémentV1[c(1,2)] # Sélectionne les deux premiers élémentsV1[c(TRUE, TRUE, FALSE)] # IdemV1[V1 < V2] # Que va-t-il se passer ?V2[V1] # Et là ?# Chaque élément d’un vecteur peut avoir un nom:V3 <- c(a = 1, b = 2, c = 3)V3V3["a"]V3[c("a", "b")]
  20. 20. Travailler avec des « data.frame »# Importer données : read.csv, read.xls, sqlQuery, load, etc.data <- read.csv(«fichier.csv»)# Afficher une variabledata$nom_de_variable#Supprimer une variable:data$var <- NULL# Créer une variabledata$nouvelle_var <- data$var1 + 3# Sélections : comme pour les vecteurs sauf qu’on a deux dimensionsdata[c(1, 2, 3), ] # 3 premières lignesdata[, 1] # 1ère colonnedata[c(1, 2, 3), 1] # trois premiers éléments de la 1ère colonnehead(data, 3) # trois premières lignes du tableautail(data, 3) # trois dernières lignes du tableau
  21. 21. Boucles, conditions, fonctionsa <- 1if (a == 1) {# code à évaluer si la condition est vraie}a <- TRUEif (a) {# ...}for (i in 1:5) {print(i)}v <- c("a", "b", "c")for (letter in v) {print(letter)}
  22. 22. Boucles, conditions, fonctionsf <- function(x) {x <- x^2return(x)}f <- function(x) {x <- x^2x # Le return est implicite}f <- function(x) {x^2}f <- function(x, y = 0) { # valeur par défautx + y}
  23. 23. Les packages# Un package est un ensemble de fonctions et de classes# supplémentaires# A faire une seule foisinstall.packages("nom_du_package")# A faire à chaque nouvelle sessionlibrary(nom_du_package) # pas besoin de guillemets

×