2. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
3 communautés pour partager,
échanger et apprendre
Power BI, Data, IA, Power Platform, Office 365, SharePoint, etc.
5. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
▪ Référent technique Data & BI
▪ Practice Leader Data Platform & Analytics
▪ Microsoft MVP Data Platfom
▪ Owner Club Power BI Sud-Est
Joël Crest
https://bonjourjoel.com/@JoelCrest https://www.youtube.com/joelcrest
http://clubpowerbi.com/
6. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
❖Principes du Machine Learning
❖Démonstration AutoML
❖Derrière l’algorithme
❖Rapport de performances
❖Quelques réflexions pour conclure
Agenda
8. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
▪ Le Machine Learning est un champ d’étude de l’Intelligence
Artificielle qui se fonde sur des approches statistiques pour
donner aux ordinateurs la capacité d’ “apprendre” à partir de
données
▪ https://fr.wikipedia.org/wiki/Machine_learning
Définition du Machine Learning
9. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
▪ Un être humain apprend à marcher
▪ Un être humain apprend à parler
▪ Un être humain apprend à raisonner
▪ Et le tout à partir de l’expérience
Qu’est-ce que le Machine Learning ?
Apprentissage humain
▪ La machine va apprendre à raisonner par
expérience
▪ L’expérience consiste à disposer de données
d’entrée de trois sortes
➢ Données descriptives de l’objet ou de
l’événement à analyser
➢ Valeurs cibles attendues pour caractériser la
situation
➢ Algorithme d’apprentissage
Apprentissage machine
La machine ajuste son
modèle d’apprentissage
La machine continue à
« raisonner »
12. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
▪ On dispose d’un ensemble d’exemples,
caractérisés par des variables prédictives,
pour lesquels on connait les valeurs de la
variable cible
▪ Exemples étiquetés
▪ Phase d’apprentissage : généraliser
l’association observée entre variable
explicative et variable cible pour construire
une function de prédiction
Apprentissage supervisé
13. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
▪ Aucune étiquetage préalable de données
d’apprentissage
▪ Le système doit parvenir de lui-même à
regrouper en categories les exemples fournis
Apprentissage non supervisé
14. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
Comment choisir ?
Machine
Learning
Apprentissage
supervisé
Classification
Régression
Apprentissage
non supervisé
Clustering
▪ La variable cible est une donnée qualitative et
en nombre défini (nom de pays, niveau de
risqué, seuil max/min)
▪ La variable cible est une donnée quantitative
(prix, nombre de commandes)
15. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
Principe général Jeu de données
Préparer les données
« Splitter » les données
Algorithmes de
Machine Learning
Entraîner le modèle
« Scorer » le modèle
16. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
Entraînement du modèle
Il n’existe pas de choix objectif
pour un modèle statistique
« Tous les modèles sont faux, mais
certains sont utiles ! »
George Box, 1919-2013
17. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
Les services de ML chez Microsoft
▪ Environnement de développement
dédié aux Data Scientists
➢ Espace collaboratif
➢ Possibilité d’executer ses propres
scripts (Python, R, …)
➢ Contrôle de code source
▪ Environnement de développement dédié aux
Citizen Data Scientists
➢ Interface graphique de développement
➢ Palette de modules prêts à l’employ
➢ Possibilité d’intégrer ses propres scripts
(modules spécifiques)
➢ Construction guidée du processus
d’entraînement d’un algorithme de ML
Azure Machine Learning Services Machine Learning Studio
18. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
▪ Azure ML Studio (intégré désormais à Azure ML Services) offer des
outils d’aide au choix du meilleur algorithme pour les non Data
Scientists
▪ AutoML va plus loin en choisissant lui-même le meilleur algorithme
pour le problème concerné et en expliquant son choix
▪ AutoML est disponible dans Power BI, sous deux conditions
➢Disposer d’une capacité Power BI Premium
➢Utiliser les dataflows Power BI pour accéder à la fonctionnalité
Du ML as a Service au Self Service ML
19. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
❖ Un dataflow est un ensemble d’entités (sources de données)
indépendante d’un rapport spécifique
❖ Disponible dans Power BI Service exclusivement, les dataflows sont
basés sur le moteur Power Query (Mashup Engine)
❖ Rappel : Power Query est l’environnement permettant de preparer
la donnée (filtrer, transformer, réduire, …) avant son chargement
définitif en mémoire
Qu’est-ce qu’un dataflow ?
20. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
Le ML appliqué au naufrage du Titanic
❖ Le Titanic c’est …
▪ 889 membres d’équipage
▪ 1316 passagers
▪ Entre 1490 et 1520 disparus
22. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
❖3 types de modèles
▪ Prédiction binaire
▪ Classification
▪ Régression
❖Modèles supervisés
❖Pas besoin de souscription Azure
Entraîner l’algoritme de ML dans Power BI
25. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
❖ Durant l’entraînement du modèle
▪ Génération de plusieurs entités
❖ Une fois le modèle entraîné
▪ Génération d’un rapport
de performance
▪ Rapport Power BI
Entraîner l’algoritme de ML dans Power BI
27. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
❖ … Source
❖ … Training Data
❖ … Testing Data
Les entités du dataflow
❖ Il s’agit de la source et des deux
échantillons produits
❖ Plusieurs autres entités/fonctions sont
produites également
35. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
❖Précision
▪ Sur l’ensemble des identifications positives
▪ Quel est le nombre d’identifications effectivement correctes ?
❖Précision = VP / (VP+FP)
Rapport de performances
36. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
❖Rappel
▪ Sur l’ensemble des identifications devant être positives
▪ Quel est le nombre d’identifications effectivement correctes ?
❖Rappel = VP / (VP+FN)
Rapport de performances
39. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
❖ Segmentation de l’influence
d’un attribut sur le résultat
Top influencers + AI insights
❖ Fonctions de scoring ML
disponibles dans Power
Query pour les dataflows
41. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
❖fonctionnalité jeune (preview avril)
❖il lui manque quelques éléments pour une
utilisation “industrialisée”
▪ Les erreurs de traitement nécessitent une bonne connaissance
technique de Power Query
▪ Les temps de traitement peuvent être longs et l’interface ne permet
pas de garantir que les traitements aboutissent
❖AutoML est prometteur et laisse présager une
nouvelle façon de “consommer” l’IA en l’integrant
au processus ETL de Power Query
Quelques réflexions pour conclure