SlideShare une entreprise Scribd logo
1  sur  14
Télécharger pour lire hors ligne
Pourquoi et comment utiliser R
Sébastien Brodeur
Conseiller en Web analytique (Cybermétrie) et recherche
Qui suis-je?
● Programmeur depuis l’âge de 8 ans
● Autodidacte principalement
● Chez Desjardins depuis 2003
○ 2003-2004 Intégrateur Web
○ 2004-2008 Développeur Web
○ 2008-2017 Conseiller en cybermétrie
○ 2017- Scientifique de données
Pourquoi et comment utiliser R
Mon parcours avec R
● 2013 - Coursera - Computing for Data Analysis
● 2014 - Coursera - Data Analysis and Statistical Inference
● 2015 - Coursera - Text Mining and Analytics
● 2015 - Coursera - Data Visualization
● 2016 - Coursera - Practical Machine Learning
Pourquoi et comment utiliser R
R vs Python
Pourquoi et comment utiliser R
Pourquoi j’aimes R
● Gratuit (parfait pour un autodidacte)
● Très grande communauté, donc facile de trouver des exemples ou des solutions en ligne
● Facile d’importer des données depuis diverses sources (CSV, Excel, SAS, BD, etc)
● Manipulation de données facile via les packages : dplyr, reshape2, data.table, lubridate
● BEAUCOUP de packages puissants disponibles
○ Dès qu’une nouvelle méthode statistique ou de machine learning est publiée, peu de temps après, un package
la rend disponible dans R
○ Plusieurs API disponibles via des packages (Google Analytics, Adobe Omniture, BigQuery, TensorFlow)
Pourquoi et comment utiliser R
Outil de visualisation puissant
Pourquoi et comment utiliser R
RStudio
Pourquoi et comment utiliser R
Structure de base
● List (vecteurs)
○ Création
○ Sélection
○ Opération
● Data frame (tableaux)
○ Création
○ Sélection
○ Opération
Pourquoi et comment utiliser R
Démos R
● Analyse de série temporelle (time series)
○ https://vpa-r.shinyapps.io/plotpredictionvsactual_v2/
● Analyse de texte (text mining)
● Mesurer le lift d’une campagne en utilisant le package R causalImpact de Google
● Attribution par Chaîne de Markov
● Exemple de création de modèles prédictifs (Caret package)
Pourquoi et comment utiliser R
Analyse de texte
Pourquoi et comment utiliser R
Attribution par chaîne de Markov
Pourquoi et comment utiliser R
Ressources
● RStudio
● Coursera - R Programming
● Data Camp - Start learning R
● Digital Analytics: R and staTISTICS
● Livre - R for Marketing Research and Analytics
● Package R pour faire de l'analyse de texte (speech-to-text, sentiment, entités)
● Best packages for data manipulation in R
Pourquoi et comment utiliser R
Ressources - suite
● Anomaly Detection with Twitter in R
● Package CausalImpact by Google
● Mark Edmondson - An Englishman in Copenhagen writing about digital, music and anything else
● Forecast double seasonal time series with multiple linear regression in R
● Comprehensive guide for Data Exploration in R
● DataExplorer: Fast Data Exploration With Minimum Code
Pourquoi et comment utiliser R
Questions ?
Merci
Pourquoi et comment utiliser R

Contenu connexe

Similaire à Pourquoi et comment utiliser r - Sébastien Brodeur

29/06/17 Matinale Python
29/06/17 Matinale Python29/06/17 Matinale Python
29/06/17 Matinale PythonSoft Computing
 
SEO et données structurées / Sébastien Monnier
SEO et données structurées / Sébastien MonnierSEO et données structurées / Sébastien Monnier
SEO et données structurées / Sébastien Monnierpwod
 
La data science au service du consultant SEO | SEO Campus 2023
La data science au service du consultant SEO | SEO Campus 2023La data science au service du consultant SEO | SEO Campus 2023
La data science au service du consultant SEO | SEO Campus 2023Grégory Florin
 
Apprentissage automatique avec RapidMiner
Apprentissage automatique avec RapidMinerApprentissage automatique avec RapidMiner
Apprentissage automatique avec RapidMinerMajdi Hannachi
 
Matinale "Data Science et Machine Learning"
Matinale "Data Science et Machine Learning"Matinale "Data Science et Machine Learning"
Matinale "Data Science et Machine Learning"Aline Deschamps
 
XebiCon'17 : Comment réussir son projet data à la BNPP en étant agile - Tom...
XebiCon'17 : Comment réussir son projet data à la BNPP en étant agile - Tom...XebiCon'17 : Comment réussir son projet data à la BNPP en étant agile - Tom...
XebiCon'17 : Comment réussir son projet data à la BNPP en étant agile - Tom...Publicis Sapient Engineering
 
SQLSaturday Paris 2014 - Bien choisir sa plate-forme de données
SQLSaturday Paris 2014 - Bien choisir sa plate-forme de donnéesSQLSaturday Paris 2014 - Bien choisir sa plate-forme de données
SQLSaturday Paris 2014 - Bien choisir sa plate-forme de donnéesGUSS
 
Atelier du web - Analyser sa présence sur le web
Atelier du web - Analyser sa présence sur le webAtelier du web - Analyser sa présence sur le web
Atelier du web - Analyser sa présence sur le webAtlantic 2.0
 
Oxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataOxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataLudovic Piot
 
Introduction à CakePHP
Introduction à CakePHPIntroduction à CakePHP
Introduction à CakePHPPierre MARTIN
 
Mise en place d’un moteur de recherche et de recommandation de documents text...
Mise en place d’un moteur de recherche et de recommandation de documents text...Mise en place d’un moteur de recherche et de recommandation de documents text...
Mise en place d’un moteur de recherche et de recommandation de documents text...AbdeslamAMRANE3
 
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...OCTO Technology
 
Publier vos données sur le Web - Forum TIC de l'ATEN 2014
Publier vos données sur le Web -  Forum TIC de l'ATEN 2014Publier vos données sur le Web -  Forum TIC de l'ATEN 2014
Publier vos données sur le Web - Forum TIC de l'ATEN 2014Makina Corpus
 
BID CE Workshop 1 - Activity X.01 - Wrap-up and Evaluation
BID CE Workshop 1 - Activity X.01 - Wrap-up and EvaluationBID CE Workshop 1 - Activity X.01 - Wrap-up and Evaluation
BID CE Workshop 1 - Activity X.01 - Wrap-up and EvaluationAlberto González-Talaván
 
Comment passer de SEO à SEO + data
Comment passer de SEO à SEO + dataComment passer de SEO à SEO + data
Comment passer de SEO à SEO + dataSEO CAMP
 
Spark-adabra, Comment Construire un DATALAKE ! (Devoxx 2017)
Spark-adabra, Comment Construire un DATALAKE ! (Devoxx 2017) Spark-adabra, Comment Construire un DATALAKE ! (Devoxx 2017)
Spark-adabra, Comment Construire un DATALAKE ! (Devoxx 2017) univalence
 
Les Z'ApéroTech Toulouse #2 - Présentation de l'agilité à l'échelle
Les Z'ApéroTech Toulouse #2 - Présentation de l'agilité à l'échelleLes Z'ApéroTech Toulouse #2 - Présentation de l'agilité à l'échelle
Les Z'ApéroTech Toulouse #2 - Présentation de l'agilité à l'échelleDocDoku
 
Comment devenir Data Scientist - Nicolas Garcia, Data Scientist @ Le Kiosk
Comment devenir Data Scientist - Nicolas Garcia, Data Scientist @ Le KioskComment devenir Data Scientist - Nicolas Garcia, Data Scientist @ Le Kiosk
Comment devenir Data Scientist - Nicolas Garcia, Data Scientist @ Le KioskJedha Bootcamp
 
Construire un data lake managé - GDG Paris - Juin 2019
Construire un data lake managé - GDG Paris - Juin 2019Construire un data lake managé - GDG Paris - Juin 2019
Construire un data lake managé - GDG Paris - Juin 2019Jean-Baptiste Claramonte
 
Le visiteur Utile - De la data à la connaissance
Le visiteur Utile - De la data à la connaissance Le visiteur Utile - De la data à la connaissance
Le visiteur Utile - De la data à la connaissance Thomas LEONETTI
 

Similaire à Pourquoi et comment utiliser r - Sébastien Brodeur (20)

29/06/17 Matinale Python
29/06/17 Matinale Python29/06/17 Matinale Python
29/06/17 Matinale Python
 
SEO et données structurées / Sébastien Monnier
SEO et données structurées / Sébastien MonnierSEO et données structurées / Sébastien Monnier
SEO et données structurées / Sébastien Monnier
 
La data science au service du consultant SEO | SEO Campus 2023
La data science au service du consultant SEO | SEO Campus 2023La data science au service du consultant SEO | SEO Campus 2023
La data science au service du consultant SEO | SEO Campus 2023
 
Apprentissage automatique avec RapidMiner
Apprentissage automatique avec RapidMinerApprentissage automatique avec RapidMiner
Apprentissage automatique avec RapidMiner
 
Matinale "Data Science et Machine Learning"
Matinale "Data Science et Machine Learning"Matinale "Data Science et Machine Learning"
Matinale "Data Science et Machine Learning"
 
XebiCon'17 : Comment réussir son projet data à la BNPP en étant agile - Tom...
XebiCon'17 : Comment réussir son projet data à la BNPP en étant agile - Tom...XebiCon'17 : Comment réussir son projet data à la BNPP en étant agile - Tom...
XebiCon'17 : Comment réussir son projet data à la BNPP en étant agile - Tom...
 
SQLSaturday Paris 2014 - Bien choisir sa plate-forme de données
SQLSaturday Paris 2014 - Bien choisir sa plate-forme de donnéesSQLSaturday Paris 2014 - Bien choisir sa plate-forme de données
SQLSaturday Paris 2014 - Bien choisir sa plate-forme de données
 
Atelier du web - Analyser sa présence sur le web
Atelier du web - Analyser sa présence sur le webAtelier du web - Analyser sa présence sur le web
Atelier du web - Analyser sa présence sur le web
 
Oxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataOxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigData
 
Introduction à CakePHP
Introduction à CakePHPIntroduction à CakePHP
Introduction à CakePHP
 
Mise en place d’un moteur de recherche et de recommandation de documents text...
Mise en place d’un moteur de recherche et de recommandation de documents text...Mise en place d’un moteur de recherche et de recommandation de documents text...
Mise en place d’un moteur de recherche et de recommandation de documents text...
 
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...
 
Publier vos données sur le Web - Forum TIC de l'ATEN 2014
Publier vos données sur le Web -  Forum TIC de l'ATEN 2014Publier vos données sur le Web -  Forum TIC de l'ATEN 2014
Publier vos données sur le Web - Forum TIC de l'ATEN 2014
 
BID CE Workshop 1 - Activity X.01 - Wrap-up and Evaluation
BID CE Workshop 1 - Activity X.01 - Wrap-up and EvaluationBID CE Workshop 1 - Activity X.01 - Wrap-up and Evaluation
BID CE Workshop 1 - Activity X.01 - Wrap-up and Evaluation
 
Comment passer de SEO à SEO + data
Comment passer de SEO à SEO + dataComment passer de SEO à SEO + data
Comment passer de SEO à SEO + data
 
Spark-adabra, Comment Construire un DATALAKE ! (Devoxx 2017)
Spark-adabra, Comment Construire un DATALAKE ! (Devoxx 2017) Spark-adabra, Comment Construire un DATALAKE ! (Devoxx 2017)
Spark-adabra, Comment Construire un DATALAKE ! (Devoxx 2017)
 
Les Z'ApéroTech Toulouse #2 - Présentation de l'agilité à l'échelle
Les Z'ApéroTech Toulouse #2 - Présentation de l'agilité à l'échelleLes Z'ApéroTech Toulouse #2 - Présentation de l'agilité à l'échelle
Les Z'ApéroTech Toulouse #2 - Présentation de l'agilité à l'échelle
 
Comment devenir Data Scientist - Nicolas Garcia, Data Scientist @ Le Kiosk
Comment devenir Data Scientist - Nicolas Garcia, Data Scientist @ Le KioskComment devenir Data Scientist - Nicolas Garcia, Data Scientist @ Le Kiosk
Comment devenir Data Scientist - Nicolas Garcia, Data Scientist @ Le Kiosk
 
Construire un data lake managé - GDG Paris - Juin 2019
Construire un data lake managé - GDG Paris - Juin 2019Construire un data lake managé - GDG Paris - Juin 2019
Construire un data lake managé - GDG Paris - Juin 2019
 
Le visiteur Utile - De la data à la connaissance
Le visiteur Utile - De la data à la connaissance Le visiteur Utile - De la data à la connaissance
Le visiteur Utile - De la data à la connaissance
 

Plus de Web à Québec

Guillaume Labbé-Morissette
Guillaume Labbé-MorissetteGuillaume Labbé-Morissette
Guillaume Labbé-MorissetteWeb à Québec
 
Frédérick Capovilla
Frédérick CapovillaFrédérick Capovilla
Frédérick CapovillaWeb à Québec
 
Cynthia Thibault-Larouche
Cynthia Thibault-LaroucheCynthia Thibault-Larouche
Cynthia Thibault-LaroucheWeb à Québec
 
Intelligence artificielle, Données massives et Internet des objets: Quels son...
Intelligence artificielle, Données massives et Internet des objets: Quels son...Intelligence artificielle, Données massives et Internet des objets: Quels son...
Intelligence artificielle, Données massives et Internet des objets: Quels son...Web à Québec
 
So you want to be a service designer - Jamin Hegeman
So you want to be a service designer - Jamin HegemanSo you want to be a service designer - Jamin Hegeman
So you want to be a service designer - Jamin HegemanWeb à Québec
 
AI & the future of the political party - Colin Megill
AI & the future of the political party - Colin MegillAI & the future of the political party - Colin Megill
AI & the future of the political party - Colin MegillWeb à Québec
 
comment le Canada peut Gagner dans le secteur du numérique - Alex Benay
comment le Canada peut Gagner dans le secteur du numérique - Alex Benay comment le Canada peut Gagner dans le secteur du numérique - Alex Benay
comment le Canada peut Gagner dans le secteur du numérique - Alex Benay Web à Québec
 
Rendre son équipe performante : plus simple qu'on le pense - Louis-Philippe C...
Rendre son équipe performante : plus simple qu'on le pense - Louis-Philippe C...Rendre son équipe performante : plus simple qu'on le pense - Louis-Philippe C...
Rendre son équipe performante : plus simple qu'on le pense - Louis-Philippe C...Web à Québec
 
Turning Research Ripples Into Waves: Growing UX Research Capacity Through Col...
Turning Research Ripples Into Waves: Growing UX Research Capacity Through Col...Turning Research Ripples Into Waves: Growing UX Research Capacity Through Col...
Turning Research Ripples Into Waves: Growing UX Research Capacity Through Col...Web à Québec
 
Complexité et systèmes opérables - Fred Hébert
Complexité et systèmes opérables - Fred HébertComplexité et systèmes opérables - Fred Hébert
Complexité et systèmes opérables - Fred HébertWeb à Québec
 

Plus de Web à Québec (20)

Kevin Bélanger
Kevin BélangerKevin Bélanger
Kevin Bélanger
 
Gabriel LeBreton
Gabriel LeBretonGabriel LeBreton
Gabriel LeBreton
 
Rémi Prévost
Rémi PrévostRémi Prévost
Rémi Prévost
 
Ludivine Durand
Ludivine DurandLudivine Durand
Ludivine Durand
 
Julie Simard
Julie SimardJulie Simard
Julie Simard
 
Guillaume Labbé-Morissette
Guillaume Labbé-MorissetteGuillaume Labbé-Morissette
Guillaume Labbé-Morissette
 
Katherine Mailloux
Katherine MaillouxKatherine Mailloux
Katherine Mailloux
 
Denis Martel
Denis MartelDenis Martel
Denis Martel
 
Charles Davignon
Charles DavignonCharles Davignon
Charles Davignon
 
Frédérick Capovilla
Frédérick CapovillaFrédérick Capovilla
Frédérick Capovilla
 
Cynthia Thibault-Larouche
Cynthia Thibault-LaroucheCynthia Thibault-Larouche
Cynthia Thibault-Larouche
 
Louis-André Labadie
Louis-André LabadieLouis-André Labadie
Louis-André Labadie
 
Christophe Clouzeau
Christophe ClouzeauChristophe Clouzeau
Christophe Clouzeau
 
Intelligence artificielle, Données massives et Internet des objets: Quels son...
Intelligence artificielle, Données massives et Internet des objets: Quels son...Intelligence artificielle, Données massives et Internet des objets: Quels son...
Intelligence artificielle, Données massives et Internet des objets: Quels son...
 
So you want to be a service designer - Jamin Hegeman
So you want to be a service designer - Jamin HegemanSo you want to be a service designer - Jamin Hegeman
So you want to be a service designer - Jamin Hegeman
 
AI & the future of the political party - Colin Megill
AI & the future of the political party - Colin MegillAI & the future of the political party - Colin Megill
AI & the future of the political party - Colin Megill
 
comment le Canada peut Gagner dans le secteur du numérique - Alex Benay
comment le Canada peut Gagner dans le secteur du numérique - Alex Benay comment le Canada peut Gagner dans le secteur du numérique - Alex Benay
comment le Canada peut Gagner dans le secteur du numérique - Alex Benay
 
Rendre son équipe performante : plus simple qu'on le pense - Louis-Philippe C...
Rendre son équipe performante : plus simple qu'on le pense - Louis-Philippe C...Rendre son équipe performante : plus simple qu'on le pense - Louis-Philippe C...
Rendre son équipe performante : plus simple qu'on le pense - Louis-Philippe C...
 
Turning Research Ripples Into Waves: Growing UX Research Capacity Through Col...
Turning Research Ripples Into Waves: Growing UX Research Capacity Through Col...Turning Research Ripples Into Waves: Growing UX Research Capacity Through Col...
Turning Research Ripples Into Waves: Growing UX Research Capacity Through Col...
 
Complexité et systèmes opérables - Fred Hébert
Complexité et systèmes opérables - Fred HébertComplexité et systèmes opérables - Fred Hébert
Complexité et systèmes opérables - Fred Hébert
 

Pourquoi et comment utiliser r - Sébastien Brodeur

  • 1. Pourquoi et comment utiliser R Sébastien Brodeur Conseiller en Web analytique (Cybermétrie) et recherche
  • 2. Qui suis-je? ● Programmeur depuis l’âge de 8 ans ● Autodidacte principalement ● Chez Desjardins depuis 2003 ○ 2003-2004 Intégrateur Web ○ 2004-2008 Développeur Web ○ 2008-2017 Conseiller en cybermétrie ○ 2017- Scientifique de données Pourquoi et comment utiliser R
  • 3. Mon parcours avec R ● 2013 - Coursera - Computing for Data Analysis ● 2014 - Coursera - Data Analysis and Statistical Inference ● 2015 - Coursera - Text Mining and Analytics ● 2015 - Coursera - Data Visualization ● 2016 - Coursera - Practical Machine Learning Pourquoi et comment utiliser R
  • 4. R vs Python Pourquoi et comment utiliser R
  • 5. Pourquoi j’aimes R ● Gratuit (parfait pour un autodidacte) ● Très grande communauté, donc facile de trouver des exemples ou des solutions en ligne ● Facile d’importer des données depuis diverses sources (CSV, Excel, SAS, BD, etc) ● Manipulation de données facile via les packages : dplyr, reshape2, data.table, lubridate ● BEAUCOUP de packages puissants disponibles ○ Dès qu’une nouvelle méthode statistique ou de machine learning est publiée, peu de temps après, un package la rend disponible dans R ○ Plusieurs API disponibles via des packages (Google Analytics, Adobe Omniture, BigQuery, TensorFlow) Pourquoi et comment utiliser R
  • 6. Outil de visualisation puissant Pourquoi et comment utiliser R
  • 8. Structure de base ● List (vecteurs) ○ Création ○ Sélection ○ Opération ● Data frame (tableaux) ○ Création ○ Sélection ○ Opération Pourquoi et comment utiliser R
  • 9. Démos R ● Analyse de série temporelle (time series) ○ https://vpa-r.shinyapps.io/plotpredictionvsactual_v2/ ● Analyse de texte (text mining) ● Mesurer le lift d’une campagne en utilisant le package R causalImpact de Google ● Attribution par Chaîne de Markov ● Exemple de création de modèles prédictifs (Caret package) Pourquoi et comment utiliser R
  • 10. Analyse de texte Pourquoi et comment utiliser R
  • 11. Attribution par chaîne de Markov Pourquoi et comment utiliser R
  • 12. Ressources ● RStudio ● Coursera - R Programming ● Data Camp - Start learning R ● Digital Analytics: R and staTISTICS ● Livre - R for Marketing Research and Analytics ● Package R pour faire de l'analyse de texte (speech-to-text, sentiment, entités) ● Best packages for data manipulation in R Pourquoi et comment utiliser R
  • 13. Ressources - suite ● Anomaly Detection with Twitter in R ● Package CausalImpact by Google ● Mark Edmondson - An Englishman in Copenhagen writing about digital, music and anything else ● Forecast double seasonal time series with multiple linear regression in R ● Comprehensive guide for Data Exploration in R ● DataExplorer: Fast Data Exploration With Minimum Code Pourquoi et comment utiliser R
  • 14. Questions ? Merci Pourquoi et comment utiliser R