2. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
3 communautés pour partager,
échanger et apprendre
Power BI, Data, IA, Power Platform, Office 365, SharePoint, etc.
5. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
The European SharePoint, Office 365 & Azure Conference
4 Days 2,500 Delegates 150+ Sessions 120 Speakers
Use code ESPC19SPSP for 10% discount on all tickets
www.sharepointeurope.com
7. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
Commençons par les bases
https://fr.wikipedia.org/wiki/Machine_à_vecteurs_de_support
Azure Machine Learning Studio
10. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
Oui. Nous prêtons de
l’argent à certains clients
trop risqués, ils ne
remboursent pas le crédit
que nous leurs avons
accordé !
12. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
Nous pouvons peut être
utiliser la liste de nos
dossiers de crédit actuels
pour en apprendre plus
sur nos clients…
14. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
J’ai entendu dire que
l’intelligence artificielle et
plus particulièrement le
machine learning pouvait être
notre solution ?
Il faut que j’en
sache plus…
17. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
❖ Description of the German credit dataset.
▪ Title: German Credit data
▪ Source Information
➢ Professor Dr. Hans Hofmann Institut f"ur Statistik und "Okonometrie
➢ Universit"at Hamburg FB Wirtschaftswissenschaften
➢ Von-Melle-Park 5 2000 Hamburg 13
▪ Number of Instances: 1000
▪ Two datasets are provided
➢ The original dataset, in the form provided by Prof. Hofmann, contains categorical/symbolic
attributes and is in the file "german.data".
➢ For algorithms that need numerical attributes, Strathclyde University produced the file
"german.data-numeric". This file has been edited and several indicator variables added to
make it suitable for algorithms which cannot cope with categorical variables. Several attributes
that are ordered categorical (such as attribute 17) have been coded as integer. This was the
form used by StatLog.
▪ Number of Attributes german: 20 (7 numerical, 13 categorical)
▪ Number of Attributes german.numer: 24 (24 numerical)
Les données
18. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
This dataset requires use of a cost matrix (see below)
(1 = Good, 2 = Bad)
The rows represent the actual classification and the columns the predicted
classification.
It is worse to class a customer as good when they are bad (5), than it is to class
a customer as bad when they are good (1).
Les données
1 2
1 0 1
2 5 0
20. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
❖ Attribute description for german
▪ Attribute 1: (qualitative) : Status of existing checking account
➢ A11 : ... < 0 DM
➢ A12 : 0 <= ... < 200 DM
➢ A13 : ... >= 200 DM / salary assignments for at least 1 year
➢ A14 : no checking account
▪ Attribute 2: (numerical) : Duration in month
▪ Attribute 3: (qualitative) : Credit history
➢ A30 : no credits taken / all credits paid back duly
➢ A31 : all credits at this bank paid back duly
➢ A32 : existing credits paid back duly till now
➢ A33 : delay in paying off in the past
➢ A34 : critical account / other credits existing (not at this bank)
▪ …
Les données
38. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
❖ Wikipédia dit
▪ L'apprentissage automatique (en anglais
machine learning) est un champ d'étude de
l'intelligence artificielle qui se fonde sur des
approches statistiques pour donner aux
ordinateurs la capacité d' « apprendre » à partir
de données, c'est-à-dire d'améliorer leurs
performances à résoudre des tâches sans être
explicitement programmés pour chacune
Si nous tentions une définition
39. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
❖Algorithmes
❖Puissance de calcul
❖Entrainement pour obtenir un modèle
❖Supervisé (classification, régression)
❖Non supervisé (clustering, détection d’anomalie)
❖Recherche de corrélations entre plusieurs
grandeurs
❖Le point d’entrée est un jeu de données plat
Si nous tentions une définition
40. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
❖ Nécessite la présence d’un big data
▪ Mais peut-être un plus
❖ Nécessite beaucoup de données
▪ Quelques centaines de lignes peuvent suffire, c’est l’existante de corrélation qui
est importante
❖ Permet de trouver la ou les quelques grandeurs pivots
▪ Non, l’objet du machine learning est justement de mettre en corrélation de
nombreuses grandeurs
❖ Tout problème donnera lieu à une solution de machine
learning
▪ Si les données ne sont pas corrélables, aucune solution ne pourra être trouvée
❖ Attention aux biais cognitifs
▪ https://fr.wikipedia.org/wiki/Biais_cognitif
Quelques idées fausses
41. @ClubPowerBI @aosComm @GUSS_FRANCEPower Saturday 2019
❖Traitement de textes
❖Traitement d’images
❖Appels aux services cognitifs de Microsoft
❖Azure Machine Learning Service
❖Automated Machine Learning
❖…
Le temps nous manque pour parler de