2. AGENDA
1. Introduction à R – 10 minutes
2. Étude de cas – 5 minutes
3. Démo avec RStudio – 30 minutes
4. Visualisations R dans PowerBI – 10 minutes
5. Autres visualisations, rapports et
applications web avec R – 5 minutes
2
3. 33
INTRODUCTION À R
• Langage de programmation développé
dans les années 90 par Ross Ihaka et
Robert Gentleman
• À la base spécialisé pour l’analyse de
données statistiques et l’analyse
graphique, mais permet aujourd’hui une
multitude de tâches (modélisation
d’affaires, analyse de séries temporelles,
machine learning, applications web, etc )
• Très utilisé dans le domaine de la
recherche, mais de plus en plus dans les
entreprises
4. 44
INTRODUCTION À R
Langage de
programmation
(syntaxe, fonctions,
librairies)
+ =
Interface utilisateur
(logiciel) permettant de
faire du développement
en langage R
5. 55
AVANTAGES DE R
• Syntaxe de programmation simple
• Plus de 15 000 librairies disponibles permettant une
panoplie de fonctionnalités
• Fonctionne sur toutes les grandes plateformes
(Windows, Mac OS, Linux)
• Grande communauté sur le web
• Intégration dans la majorité des suites BI
(Microsoft, Oracle, SAP…)
• Logiciel libre (open source) = complètement gratuit !
6. 66
R ET PYTHON
Ce sont les 2 langages les plus populaires dans le domaine de la science des données.
Intégration et transformation des données X X
Machine learning X X
Intégration avec d’autres suites BI X X
Grande communauté X X
Visualisation de données X (ggplot)
Versatilité du langage X (développement logiciel,
automatisation de tâches, …)
Bref, les 2 langages sont très performants, mais je donne l’avantage à R concernant la
visualisation de données en raison de ggplot. En général, les gens d’affaires sont plus
confortables avec R alors que les spécialistes TI sont plus confortables avec Python.
7. ÉTUDE DE CAS
7
Données sur les ventes de propriétés à New-York
pour la période de 2016-17-18
Analyse concernant 6 arrondissements en particulier, soit :
• Chinatown
• Financial
• Harlem-Central
• Brooklyn
• Downtown Fulton
• Manhattan Beach
https://opendata.cityofnewyork.us/
8. ÉTUDE DE CAS
8
Question :
Quelle est la tendance des ventes de propriétés en nombre et en $, pour
l’année 2017, concernant ces 6 arrondissements ?
Étapes à réaliser :
1. Importer les données
2. Sélectionner les données
3. Nettoyer les données
4. Transformer les données
5. Visualiser les résultats
10. QUELQUES LIENS UTILES
1. Installation de R et Rstudio:
https://www.lecfomasque.com/installe
r-le-logiciel-r/
2. https://www.r-graph-gallery.com/
3. https://rmarkdown.rstudio.com/
4. https://shiny.rstudio.com/
10