Pourquoi et comment utiliser r - Sébastien Brodeur
1. Pourquoi et comment utiliser R
Sébastien Brodeur
Conseiller en Web analytique (Cybermétrie) et recherche
2. Qui suis-je?
● Programmeur depuis l’âge de 8 ans
● Autodidacte principalement
● Chez Desjardins depuis 2003
○ 2003-2004 Intégrateur Web
○ 2004-2008 Développeur Web
○ 2008-2017 Conseiller en cybermétrie
○ 2017- Scientifique de données
Pourquoi et comment utiliser R
3. Mon parcours avec R
● 2013 - Coursera - Computing for Data Analysis
● 2014 - Coursera - Data Analysis and Statistical Inference
● 2015 - Coursera - Text Mining and Analytics
● 2015 - Coursera - Data Visualization
● 2016 - Coursera - Practical Machine Learning
Pourquoi et comment utiliser R
5. Pourquoi j’aimes R
● Gratuit (parfait pour un autodidacte)
● Très grande communauté, donc facile de trouver des exemples ou des solutions en ligne
● Facile d’importer des données depuis diverses sources (CSV, Excel, SAS, BD, etc)
● Manipulation de données facile via les packages : dplyr, reshape2, data.table, lubridate
● BEAUCOUP de packages puissants disponibles
○ Dès qu’une nouvelle méthode statistique ou de machine learning est publiée, peu de temps après, un package
la rend disponible dans R
○ Plusieurs API disponibles via des packages (Google Analytics, Adobe Omniture, BigQuery, TensorFlow)
Pourquoi et comment utiliser R
8. Structure de base
● List (vecteurs)
○ Création
○ Sélection
○ Opération
● Data frame (tableaux)
○ Création
○ Sélection
○ Opération
Pourquoi et comment utiliser R
9. Démos R
● Analyse de série temporelle (time series)
○ https://vpa-r.shinyapps.io/plotpredictionvsactual_v2/
● Analyse de texte (text mining)
● Mesurer le lift d’une campagne en utilisant le package R causalImpact de Google
● Attribution par Chaîne de Markov
● Exemple de création de modèles prédictifs (Caret package)
Pourquoi et comment utiliser R
12. Ressources
● RStudio
● Coursera - R Programming
● Data Camp - Start learning R
● Digital Analytics: R and staTISTICS
● Livre - R for Marketing Research and Analytics
● Package R pour faire de l'analyse de texte (speech-to-text, sentiment, entités)
● Best packages for data manipulation in R
Pourquoi et comment utiliser R
13. Ressources - suite
● Anomaly Detection with Twitter in R
● Package CausalImpact by Google
● Mark Edmondson - An Englishman in Copenhagen writing about digital, music and anything else
● Forecast double seasonal time series with multiple linear regression in R
● Comprehensive guide for Data Exploration in R
● DataExplorer: Fast Data Exploration With Minimum Code
Pourquoi et comment utiliser R