SlideShare une entreprise Scribd logo
1  sur  43
Télécharger pour lire hors ligne
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
14 et 15 juin 2019, Paris
Power
Saturday
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
3 communautés pour partager,
échanger et apprendre
Power BI, Data, IA, Power Platform, Office 365, SharePoint, etc.
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
Power
Saturday
Power BI + Machine Learning = AutoML
Joël Crest
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
Merci à nos sponsors
http:// PowerSaturday.com
Silver
Bronze
Gold
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
▪ Référent technique Data & BI
▪ Practice Leader Data Platform & Analytics
▪ Microsoft MVP Data Platfom
▪ Owner Club Power BI Sud-Est
Joël Crest
https://bonjourjoel.com/@JoelCrest https://www.youtube.com/joelcrest
http://clubpowerbi.com/
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
❖Principes du Machine Learning
❖Démonstration AutoML
❖Derrière l’algorithme
❖Rapport de performances
❖Quelques réflexions pour conclure
Agenda
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
Power
Saturday
Principes du Machine Learning
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
▪ Le Machine Learning est un champ d’étude de l’Intelligence
Artificielle qui se fonde sur des approches statistiques pour
donner aux ordinateurs la capacité d’ “apprendre” à partir de
données
▪ https://fr.wikipedia.org/wiki/Machine_learning
Définition du Machine Learning
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
▪ Un être humain apprend à marcher
▪ Un être humain apprend à parler
▪ Un être humain apprend à raisonner
▪ Et le tout à partir de l’expérience
Qu’est-ce que le Machine Learning ?
Apprentissage humain
▪ La machine va apprendre à raisonner par
expérience
▪ L’expérience consiste à disposer de données
d’entrée de trois sortes
➢ Données descriptives de l’objet ou de
l’événement à analyser
➢ Valeurs cibles attendues pour caractériser la
situation
➢ Algorithme d’apprentissage
Apprentissage machine
La machine ajuste son
modèle d’apprentissage
La machine continue à
« raisonner »
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
Evaluation du prix d’une maison
Surface (m2)
Prix (K€)
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
Types d’apprentissage
Machine Learning
Apprentissage
supervisé
Apprentissage non
supervisé
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
▪ On dispose d’un ensemble d’exemples,
caractérisés par des variables prédictives,
pour lesquels on connait les valeurs de la
variable cible
▪ Exemples étiquetés
▪ Phase d’apprentissage : généraliser
l’association observée entre variable
explicative et variable cible pour construire
une function de prédiction
Apprentissage supervisé
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
▪ Aucune étiquetage préalable de données
d’apprentissage
▪ Le système doit parvenir de lui-même à
regrouper en categories les exemples fournis
Apprentissage non supervisé
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
Comment choisir ?
Machine
Learning
Apprentissage
supervisé
Classification
Régression
Apprentissage
non supervisé
Clustering
▪ La variable cible est une donnée qualitative et
en nombre défini (nom de pays, niveau de
risqué, seuil max/min)
▪ La variable cible est une donnée quantitative
(prix, nombre de commandes)
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
Principe général Jeu de données
Préparer les données
« Splitter » les données
Algorithmes de
Machine Learning
Entraîner le modèle
« Scorer » le modèle
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
Entraînement du modèle
Il n’existe pas de choix objectif
pour un modèle statistique
« Tous les modèles sont faux, mais
certains sont utiles ! »
George Box, 1919-2013
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
Les services de ML chez Microsoft
▪ Environnement de développement
dédié aux Data Scientists
➢ Espace collaboratif
➢ Possibilité d’executer ses propres
scripts (Python, R, …)
➢ Contrôle de code source
▪ Environnement de développement dédié aux
Citizen Data Scientists
➢ Interface graphique de développement
➢ Palette de modules prêts à l’employ
➢ Possibilité d’intégrer ses propres scripts
(modules spécifiques)
➢ Construction guidée du processus
d’entraînement d’un algorithme de ML
Azure Machine Learning Services Machine Learning Studio
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
▪ Azure ML Studio (intégré désormais à Azure ML Services) offer des
outils d’aide au choix du meilleur algorithme pour les non Data
Scientists
▪ AutoML va plus loin en choisissant lui-même le meilleur algorithme
pour le problème concerné et en expliquant son choix
▪ AutoML est disponible dans Power BI, sous deux conditions
➢Disposer d’une capacité Power BI Premium
➢Utiliser les dataflows Power BI pour accéder à la fonctionnalité
Du ML as a Service au Self Service ML
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
❖ Un dataflow est un ensemble d’entités (sources de données)
indépendante d’un rapport spécifique
❖ Disponible dans Power BI Service exclusivement, les dataflows sont
basés sur le moteur Power Query (Mashup Engine)
❖ Rappel : Power Query est l’environnement permettant de preparer
la donnée (filtrer, transformer, réduire, …) avant son chargement
définitif en mémoire
Qu’est-ce qu’un dataflow ?
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
Le ML appliqué au naufrage du Titanic
❖ Le Titanic c’est …
▪ 889 membres d’équipage
▪ 1316 passagers
▪ Entre 1490 et 1520 disparus
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
❖3 types de modèles
▪ Prédiction binaire
▪ Classification
▪ Régression
❖Modèles supervisés
❖Pas besoin de souscription Azure
Entraîner l’algoritme de ML dans Power BI
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
Sélection de l’échantillon d’entraînement
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
Sélection des attributs en entrée
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
❖ Durant l’entraînement du modèle
▪ Génération de plusieurs entités
❖ Une fois le modèle entraîné
▪ Génération d’un rapport
de performance
▪ Rapport Power BI
Entraîner l’algoritme de ML dans Power BI
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
Power
Saturday
Derrière l’algorithme
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
❖ … Source
❖ … Training Data
❖ … Testing Data
Les entités du dataflow
❖ Il s’agit de la source et des deux
échantillons produits
❖ Plusieurs autres entités/fonctions sont
produites également
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
Entité Source / Training Data / Testing Data
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
Entité Training Data
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
Entité Testing Data
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
Entité Testing Preview
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
Modèle Machine Learning
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
Entité Modele Preview
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
Power
Saturday
Rapport de performances
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
❖Précision
▪ Sur l’ensemble des identifications positives
▪ Quel est le nombre d’identifications effectivement correctes ?
❖Précision = VP / (VP+FP)
Rapport de performances
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
❖Rappel
▪ Sur l’ensemble des identifications devant être positives
▪ Quel est le nombre d’identifications effectivement correctes ?
❖Rappel = VP / (VP+FN)
Rapport de performances
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
Comment le modèle a été évalué
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
Analyse du modèle
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
❖ Segmentation de l’influence
d’un attribut sur le résultat
Top influencers + AI insights
❖ Fonctions de scoring ML
disponibles dans Power
Query pour les dataflows
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
Power
Saturday
Quelques réflexions pour conclure
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
❖fonctionnalité jeune (preview avril)
❖il lui manque quelques éléments pour une
utilisation “industrialisée”
▪ Les erreurs de traitement nécessitent une bonne connaissance
technique de Power Query
▪ Les temps de traitement peuvent être longs et l’interface ne permet
pas de garantir que les traitements aboutissent
❖AutoML est prometteur et laisse présager une
nouvelle façon de “consommer” l’IA en l’integrant
au processus ETL de Power Query
Quelques réflexions pour conclure
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
Evaluations
@ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
Merci!

Contenu connexe

Similaire à Power saturday 2019 - Power BI + IA = AutoML

Power Saturday 2019 C1 - Power BI embedded
Power Saturday 2019 C1 - Power BI embeddedPower Saturday 2019 C1 - Power BI embedded
Power Saturday 2019 C1 - Power BI embeddedPowerSaturdayParis
 
Power Saturday 2019 F2 - La combinaison de Dynamics 365 avec la Power Platform
Power Saturday 2019 F2 - La combinaison de Dynamics 365 avec la Power PlatformPower Saturday 2019 F2 - La combinaison de Dynamics 365 avec la Power Platform
Power Saturday 2019 F2 - La combinaison de Dynamics 365 avec la Power PlatformPowerSaturdayParis
 
Power Saturday 2019 S2 - Version avancée de création de Teams en libre service
Power Saturday 2019 S2 - Version avancée de création de Teams en libre servicePower Saturday 2019 S2 - Version avancée de création de Teams en libre service
Power Saturday 2019 S2 - Version avancée de création de Teams en libre servicePowerSaturdayParis
 
Power Saturday 2018 - Actionnable BI
Power Saturday 2018 - Actionnable BIPower Saturday 2018 - Actionnable BI
Power Saturday 2018 - Actionnable BIJoël Crest
 
Meetup Club Power BI - Power BI Embedded, mai 2023
Meetup Club Power BI - Power BI Embedded, mai 2023Meetup Club Power BI - Power BI Embedded, mai 2023
Meetup Club Power BI - Power BI Embedded, mai 2023Philippe Geiger
 
2019-06-12 aOS Aix Marseille - Integrer la Power Platform avec SharePoint
2019-06-12 aOS Aix Marseille - Integrer la Power Platform avec SharePoint2019-06-12 aOS Aix Marseille - Integrer la Power Platform avec SharePoint
2019-06-12 aOS Aix Marseille - Integrer la Power Platform avec SharePointPatrick Guimonet
 
2019-06-12 aOS Aix Marseille Integrer la Power Platform avec SharePoint
2019-06-12 aOS Aix Marseille Integrer la Power Platform avec SharePoint2019-06-12 aOS Aix Marseille Integrer la Power Platform avec SharePoint
2019-06-12 aOS Aix Marseille Integrer la Power Platform avec SharePointPatrick Guimonet
 
2019-06-12 aOS Aix Marseille - A1 integrer la Power Platform avec SharePoint ...
2019-06-12 aOS Aix Marseille - A1 integrer la Power Platform avec SharePoint ...2019-06-12 aOS Aix Marseille - A1 integrer la Power Platform avec SharePoint ...
2019-06-12 aOS Aix Marseille - A1 integrer la Power Platform avec SharePoint ...aOS Community
 
Power Saturday 2019 B5 - Mise en place d'une architecture data dans Azure, re...
Power Saturday 2019 B5 - Mise en place d'une architecture data dans Azure, re...Power Saturday 2019 B5 - Mise en place d'une architecture data dans Azure, re...
Power Saturday 2019 B5 - Mise en place d'une architecture data dans Azure, re...PowerSaturdayParis
 
Power Saturday 2019 D3 - Contruisons une solution de OnBoarding avec Graph et...
Power Saturday 2019 D3 - Contruisons une solution de OnBoarding avec Graph et...Power Saturday 2019 D3 - Contruisons une solution de OnBoarding avec Graph et...
Power Saturday 2019 D3 - Contruisons une solution de OnBoarding avec Graph et...PowerSaturdayParis
 
Meetup Club Power BI Strasbourg - Power BI Goals
Meetup Club Power BI Strasbourg - Power BI GoalsMeetup Club Power BI Strasbourg - Power BI Goals
Meetup Club Power BI Strasbourg - Power BI GoalsPhilippe Geiger
 
Comment la Dataviz peut vous aider à améliorer vos campagnes Google Ads ?
Comment la Dataviz peut vous aider à améliorer vos campagnes Google Ads ?Comment la Dataviz peut vous aider à améliorer vos campagnes Google Ads ?
Comment la Dataviz peut vous aider à améliorer vos campagnes Google Ads ?Thomas BART
 
La Data levier de différenciation pour Aramis Auto
La Data levier de différenciation pour Aramis AutoLa Data levier de différenciation pour Aramis Auto
La Data levier de différenciation pour Aramis AutoAnne-Claire BASCHET
 
HUBREPORT - Future of Data & CRM [EXTRAIT]
HUBREPORT - Future of Data & CRM [EXTRAIT]HUBREPORT - Future of Data & CRM [EXTRAIT]
HUBREPORT - Future of Data & CRM [EXTRAIT]HUB INSTITUTE
 
Meetup Club Power BI Strasbourg - introduction Power BI Report Builder
Meetup Club Power BI Strasbourg - introduction Power BI Report BuilderMeetup Club Power BI Strasbourg - introduction Power BI Report Builder
Meetup Club Power BI Strasbourg - introduction Power BI Report BuilderPhilippe Geiger
 
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...OCTO Technology
 
Des monolithes aux microservices
Des monolithes aux microservicesDes monolithes aux microservices
Des monolithes aux microservicesAmazon Web Services
 

Similaire à Power saturday 2019 - Power BI + IA = AutoML (20)

Power Saturday 2019 C1 - Power BI embedded
Power Saturday 2019 C1 - Power BI embeddedPower Saturday 2019 C1 - Power BI embedded
Power Saturday 2019 C1 - Power BI embedded
 
Power Saturday 2019 F2 - La combinaison de Dynamics 365 avec la Power Platform
Power Saturday 2019 F2 - La combinaison de Dynamics 365 avec la Power PlatformPower Saturday 2019 F2 - La combinaison de Dynamics 365 avec la Power Platform
Power Saturday 2019 F2 - La combinaison de Dynamics 365 avec la Power Platform
 
Power Saturday 2019 S2 - Version avancée de création de Teams en libre service
Power Saturday 2019 S2 - Version avancée de création de Teams en libre servicePower Saturday 2019 S2 - Version avancée de création de Teams en libre service
Power Saturday 2019 S2 - Version avancée de création de Teams en libre service
 
Power Saturday 2018 - Actionnable BI
Power Saturday 2018 - Actionnable BIPower Saturday 2018 - Actionnable BI
Power Saturday 2018 - Actionnable BI
 
Meetup Club Power BI - Power BI Embedded, mai 2023
Meetup Club Power BI - Power BI Embedded, mai 2023Meetup Club Power BI - Power BI Embedded, mai 2023
Meetup Club Power BI - Power BI Embedded, mai 2023
 
Meetup #2
Meetup #2Meetup #2
Meetup #2
 
2019-06-12 aOS Aix Marseille - Integrer la Power Platform avec SharePoint
2019-06-12 aOS Aix Marseille - Integrer la Power Platform avec SharePoint2019-06-12 aOS Aix Marseille - Integrer la Power Platform avec SharePoint
2019-06-12 aOS Aix Marseille - Integrer la Power Platform avec SharePoint
 
2019-06-12 aOS Aix Marseille Integrer la Power Platform avec SharePoint
2019-06-12 aOS Aix Marseille Integrer la Power Platform avec SharePoint2019-06-12 aOS Aix Marseille Integrer la Power Platform avec SharePoint
2019-06-12 aOS Aix Marseille Integrer la Power Platform avec SharePoint
 
2019-06-12 aOS Aix Marseille - A1 integrer la Power Platform avec SharePoint ...
2019-06-12 aOS Aix Marseille - A1 integrer la Power Platform avec SharePoint ...2019-06-12 aOS Aix Marseille - A1 integrer la Power Platform avec SharePoint ...
2019-06-12 aOS Aix Marseille - A1 integrer la Power Platform avec SharePoint ...
 
Power Saturday 2019 B5 - Mise en place d'une architecture data dans Azure, re...
Power Saturday 2019 B5 - Mise en place d'une architecture data dans Azure, re...Power Saturday 2019 B5 - Mise en place d'une architecture data dans Azure, re...
Power Saturday 2019 B5 - Mise en place d'une architecture data dans Azure, re...
 
Power Saturday 2019 D3 - Contruisons une solution de OnBoarding avec Graph et...
Power Saturday 2019 D3 - Contruisons une solution de OnBoarding avec Graph et...Power Saturday 2019 D3 - Contruisons une solution de OnBoarding avec Graph et...
Power Saturday 2019 D3 - Contruisons une solution de OnBoarding avec Graph et...
 
Meetup Club Power BI Strasbourg - Power BI Goals
Meetup Club Power BI Strasbourg - Power BI GoalsMeetup Club Power BI Strasbourg - Power BI Goals
Meetup Club Power BI Strasbourg - Power BI Goals
 
Comment la Dataviz peut vous aider à améliorer vos campagnes Google Ads ?
Comment la Dataviz peut vous aider à améliorer vos campagnes Google Ads ?Comment la Dataviz peut vous aider à améliorer vos campagnes Google Ads ?
Comment la Dataviz peut vous aider à améliorer vos campagnes Google Ads ?
 
Powerbi 365
Powerbi 365Powerbi 365
Powerbi 365
 
Power BI 365
Power BI 365Power BI 365
Power BI 365
 
La Data levier de différenciation pour Aramis Auto
La Data levier de différenciation pour Aramis AutoLa Data levier de différenciation pour Aramis Auto
La Data levier de différenciation pour Aramis Auto
 
HUBREPORT - Future of Data & CRM [EXTRAIT]
HUBREPORT - Future of Data & CRM [EXTRAIT]HUBREPORT - Future of Data & CRM [EXTRAIT]
HUBREPORT - Future of Data & CRM [EXTRAIT]
 
Meetup Club Power BI Strasbourg - introduction Power BI Report Builder
Meetup Club Power BI Strasbourg - introduction Power BI Report BuilderMeetup Club Power BI Strasbourg - introduction Power BI Report Builder
Meetup Club Power BI Strasbourg - introduction Power BI Report Builder
 
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...
 
Des monolithes aux microservices
Des monolithes aux microservicesDes monolithes aux microservices
Des monolithes aux microservices
 

Plus de Joël Crest

Data Modeling Power BI [SqlSat '18]
Data Modeling Power BI [SqlSat '18]Data Modeling Power BI [SqlSat '18]
Data Modeling Power BI [SqlSat '18]Joël Crest
 
aOS Aix Marseille 2017 IoT
aOS Aix Marseille 2017 IoTaOS Aix Marseille 2017 IoT
aOS Aix Marseille 2017 IoTJoël Crest
 
Global Azure Bootcamp 2018 Power BI + MS Graph API
Global Azure Bootcamp 2018 Power BI + MS Graph APIGlobal Azure Bootcamp 2018 Power BI + MS Graph API
Global Azure Bootcamp 2018 Power BI + MS Graph APIJoël Crest
 
VivaTech 2018 Power BI
VivaTech 2018 Power BIVivaTech 2018 Power BI
VivaTech 2018 Power BIJoël Crest
 
aOS Aix Marseille 2018 Power BI
aOS Aix Marseille 2018 Power BIaOS Aix Marseille 2018 Power BI
aOS Aix Marseille 2018 Power BIJoël Crest
 
Power BI Premium : pour quels usages ?
Power BI Premium : pour quels usages ?Power BI Premium : pour quels usages ?
Power BI Premium : pour quels usages ?Joël Crest
 
Monitorez votre solution IoT avec Stream Analytics et Power BI
Monitorez votre solution IoT avec Stream Analytics et Power BIMonitorez votre solution IoT avec Stream Analytics et Power BI
Monitorez votre solution IoT avec Stream Analytics et Power BIJoël Crest
 

Plus de Joël Crest (7)

Data Modeling Power BI [SqlSat '18]
Data Modeling Power BI [SqlSat '18]Data Modeling Power BI [SqlSat '18]
Data Modeling Power BI [SqlSat '18]
 
aOS Aix Marseille 2017 IoT
aOS Aix Marseille 2017 IoTaOS Aix Marseille 2017 IoT
aOS Aix Marseille 2017 IoT
 
Global Azure Bootcamp 2018 Power BI + MS Graph API
Global Azure Bootcamp 2018 Power BI + MS Graph APIGlobal Azure Bootcamp 2018 Power BI + MS Graph API
Global Azure Bootcamp 2018 Power BI + MS Graph API
 
VivaTech 2018 Power BI
VivaTech 2018 Power BIVivaTech 2018 Power BI
VivaTech 2018 Power BI
 
aOS Aix Marseille 2018 Power BI
aOS Aix Marseille 2018 Power BIaOS Aix Marseille 2018 Power BI
aOS Aix Marseille 2018 Power BI
 
Power BI Premium : pour quels usages ?
Power BI Premium : pour quels usages ?Power BI Premium : pour quels usages ?
Power BI Premium : pour quels usages ?
 
Monitorez votre solution IoT avec Stream Analytics et Power BI
Monitorez votre solution IoT avec Stream Analytics et Power BIMonitorez votre solution IoT avec Stream Analytics et Power BI
Monitorez votre solution IoT avec Stream Analytics et Power BI
 

Power saturday 2019 - Power BI + IA = AutoML

  • 1. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 14 et 15 juin 2019, Paris Power Saturday
  • 2. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 3 communautés pour partager, échanger et apprendre Power BI, Data, IA, Power Platform, Office 365, SharePoint, etc.
  • 3. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 Power Saturday Power BI + Machine Learning = AutoML Joël Crest
  • 4. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 Merci à nos sponsors http:// PowerSaturday.com Silver Bronze Gold
  • 5. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 ▪ Référent technique Data & BI ▪ Practice Leader Data Platform & Analytics ▪ Microsoft MVP Data Platfom ▪ Owner Club Power BI Sud-Est Joël Crest https://bonjourjoel.com/@JoelCrest https://www.youtube.com/joelcrest http://clubpowerbi.com/
  • 6. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 ❖Principes du Machine Learning ❖Démonstration AutoML ❖Derrière l’algorithme ❖Rapport de performances ❖Quelques réflexions pour conclure Agenda
  • 7. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 Power Saturday Principes du Machine Learning
  • 8. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 ▪ Le Machine Learning est un champ d’étude de l’Intelligence Artificielle qui se fonde sur des approches statistiques pour donner aux ordinateurs la capacité d’ “apprendre” à partir de données ▪ https://fr.wikipedia.org/wiki/Machine_learning Définition du Machine Learning
  • 9. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 ▪ Un être humain apprend à marcher ▪ Un être humain apprend à parler ▪ Un être humain apprend à raisonner ▪ Et le tout à partir de l’expérience Qu’est-ce que le Machine Learning ? Apprentissage humain ▪ La machine va apprendre à raisonner par expérience ▪ L’expérience consiste à disposer de données d’entrée de trois sortes ➢ Données descriptives de l’objet ou de l’événement à analyser ➢ Valeurs cibles attendues pour caractériser la situation ➢ Algorithme d’apprentissage Apprentissage machine La machine ajuste son modèle d’apprentissage La machine continue à « raisonner »
  • 10. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 Evaluation du prix d’une maison Surface (m2) Prix (K€)
  • 11. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 Types d’apprentissage Machine Learning Apprentissage supervisé Apprentissage non supervisé
  • 12. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 ▪ On dispose d’un ensemble d’exemples, caractérisés par des variables prédictives, pour lesquels on connait les valeurs de la variable cible ▪ Exemples étiquetés ▪ Phase d’apprentissage : généraliser l’association observée entre variable explicative et variable cible pour construire une function de prédiction Apprentissage supervisé
  • 13. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 ▪ Aucune étiquetage préalable de données d’apprentissage ▪ Le système doit parvenir de lui-même à regrouper en categories les exemples fournis Apprentissage non supervisé
  • 14. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 Comment choisir ? Machine Learning Apprentissage supervisé Classification Régression Apprentissage non supervisé Clustering ▪ La variable cible est une donnée qualitative et en nombre défini (nom de pays, niveau de risqué, seuil max/min) ▪ La variable cible est une donnée quantitative (prix, nombre de commandes)
  • 15. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 Principe général Jeu de données Préparer les données « Splitter » les données Algorithmes de Machine Learning Entraîner le modèle « Scorer » le modèle
  • 16. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 Entraînement du modèle Il n’existe pas de choix objectif pour un modèle statistique « Tous les modèles sont faux, mais certains sont utiles ! » George Box, 1919-2013
  • 17. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 Les services de ML chez Microsoft ▪ Environnement de développement dédié aux Data Scientists ➢ Espace collaboratif ➢ Possibilité d’executer ses propres scripts (Python, R, …) ➢ Contrôle de code source ▪ Environnement de développement dédié aux Citizen Data Scientists ➢ Interface graphique de développement ➢ Palette de modules prêts à l’employ ➢ Possibilité d’intégrer ses propres scripts (modules spécifiques) ➢ Construction guidée du processus d’entraînement d’un algorithme de ML Azure Machine Learning Services Machine Learning Studio
  • 18. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 ▪ Azure ML Studio (intégré désormais à Azure ML Services) offer des outils d’aide au choix du meilleur algorithme pour les non Data Scientists ▪ AutoML va plus loin en choisissant lui-même le meilleur algorithme pour le problème concerné et en expliquant son choix ▪ AutoML est disponible dans Power BI, sous deux conditions ➢Disposer d’une capacité Power BI Premium ➢Utiliser les dataflows Power BI pour accéder à la fonctionnalité Du ML as a Service au Self Service ML
  • 19. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 ❖ Un dataflow est un ensemble d’entités (sources de données) indépendante d’un rapport spécifique ❖ Disponible dans Power BI Service exclusivement, les dataflows sont basés sur le moteur Power Query (Mashup Engine) ❖ Rappel : Power Query est l’environnement permettant de preparer la donnée (filtrer, transformer, réduire, …) avant son chargement définitif en mémoire Qu’est-ce qu’un dataflow ?
  • 20. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 Le ML appliqué au naufrage du Titanic ❖ Le Titanic c’est … ▪ 889 membres d’équipage ▪ 1316 passagers ▪ Entre 1490 et 1520 disparus
  • 22. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 ❖3 types de modèles ▪ Prédiction binaire ▪ Classification ▪ Régression ❖Modèles supervisés ❖Pas besoin de souscription Azure Entraîner l’algoritme de ML dans Power BI
  • 23. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 Sélection de l’échantillon d’entraînement
  • 24. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 Sélection des attributs en entrée
  • 25. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 ❖ Durant l’entraînement du modèle ▪ Génération de plusieurs entités ❖ Une fois le modèle entraîné ▪ Génération d’un rapport de performance ▪ Rapport Power BI Entraîner l’algoritme de ML dans Power BI
  • 26. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 Power Saturday Derrière l’algorithme
  • 27. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 ❖ … Source ❖ … Training Data ❖ … Testing Data Les entités du dataflow ❖ Il s’agit de la source et des deux échantillons produits ❖ Plusieurs autres entités/fonctions sont produites également
  • 28. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 Entité Source / Training Data / Testing Data
  • 29. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 Entité Training Data
  • 30. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 Entité Testing Data
  • 31. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 Entité Testing Preview
  • 32. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 Modèle Machine Learning
  • 33. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 Entité Modele Preview
  • 34. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 Power Saturday Rapport de performances
  • 35. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 ❖Précision ▪ Sur l’ensemble des identifications positives ▪ Quel est le nombre d’identifications effectivement correctes ? ❖Précision = VP / (VP+FP) Rapport de performances
  • 36. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 ❖Rappel ▪ Sur l’ensemble des identifications devant être positives ▪ Quel est le nombre d’identifications effectivement correctes ? ❖Rappel = VP / (VP+FN) Rapport de performances
  • 37. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 Comment le modèle a été évalué
  • 38. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 Analyse du modèle
  • 39. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 ❖ Segmentation de l’influence d’un attribut sur le résultat Top influencers + AI insights ❖ Fonctions de scoring ML disponibles dans Power Query pour les dataflows
  • 40. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 Power Saturday Quelques réflexions pour conclure
  • 41. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 ❖fonctionnalité jeune (preview avril) ❖il lui manque quelques éléments pour une utilisation “industrialisée” ▪ Les erreurs de traitement nécessitent une bonne connaissance technique de Power Query ▪ Les temps de traitement peuvent être longs et l’interface ne permet pas de garantir que les traitements aboutissent ❖AutoML est prometteur et laisse présager une nouvelle façon de “consommer” l’IA en l’integrant au processus ETL de Power Query Quelques réflexions pour conclure
  • 42. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019 Evaluations