SlideShare une entreprise Scribd logo
1  sur  27
Data Science Bootcamp
8 semaines de formation à temps
partiel
Notre Speaker
—
Frédéric Enard,
Data Scientist chez TF1 Le Groupe
Introduction au Machine
Learning
Qu’est-ce que le Machine Learning ?
Intelligence artificielle
Machine
Learning
Systèmes
experts
Analyses
statistiques
Automatisation Dataviz
Analyses
métiers
Data science
Les bases du Machine Learning
Comprendre avec des idées simples comment fonctionne le Machine Learning
Maisons Chambres Surface Prix
Maison 1 1 6 324 68 500
Maison 2 2 7 420 118 000
Maison 3 2 6 120 132 000
Maison 4 2 12 968 144 000
Maison 5 2 10 920 157 000
Maison 6 1 21 453 180 000
Maison 7 3 8 450 208 500
Maison 8 4 11 924 345 000
L’apprentissage par l’exemple
Ce que l’on connait
Ce que l’on souhaite
prédire
Un modèle pour trouver le juste prix
Ce que l’on connait PrédictionModèle
Chambres Surface
1 6 324
2 7 420
2 6 120
2 12 968
2 10 920
1 21 453
3 8 450
4 11 924
Prix
68 500
118 000
132 000
144 000
157 000
180 000
208 500
345 000
???
Ca ressemble à quoi un modèle ?
Chambres Surface
1 6 324
2 7 420
2 6 120
2 12 968
2 10 920
1 21 453
3 8 450
4 11 924
Prédiction
63 240
74 200
61 200
129 680
109 200
214 530
84 500
119 240
Prix
=
p
*
Surface
Prix
68 500
118 000
132 000
144 000
157 000
180 000
208 500
345 000
Erreur
5 260
43 800
70 800
14 320
47 800
- 34 530
124 000
225 760
Erreur moyenne du modèle : 70 783
p = 10
Et si on faisait varier le paramètre p ?
Chambres Surface
1 6 324
2 7 420
2 6 120
2 12 968
2 10 920
1 21 453
3 8 450
4 11 924
Prédiction
94 860
111 300
91 800
194 520
163 800
321 795
126 750
178 860
Prix
=
p
*
Surface
Prix
68 500
118 000
132 000
144 000
157 000
180 000
208 500
345 000
Erreur moyenne du modèle : 65 033
p = 15
Erreur
- 26 360
6 700
40 200
- 50 520
- 6 800
- 141 795
81 750
166 140
Et si on faisait varier le paramètre p ?
Chambres Surface
1 6 324
2 7 420
2 6 120
2 12 968
2 10 920
1 21 453
3 8 450
4 11 924
Prédiction
63 240
74 200
61 200
129 680
109 200
214 530
84 500
119 240
Prix
=
p
*
Surface
Prix
68 500
118 000
132 000
144 000
157 000
180 000
208 500
345 000
Erreur
- 20 036
14 120
46 320
- 37 552
4 120
- 120 342
90 200
178 064
Erreur moyenne du modèle : 63 844
p = 14
Comment produire un modèle ?
Prix =
p
*
Surface
Prix =
14
*
Surface
Données d’entrainement Meilleur modèle
Algorithme de machine Learning
Recherche de la meilleure valeur de p
Maisons Surface Prix
Maison 1 6 324 68 500
Maison 2 7 420 118 000
Maison 3 6 120 132 000
Maison 4 12 968 144 000
Maison 5 10 920 157 000
Maison 6 21 453 180 000
Maison 7 8 450 208 500
Maison 8 11 924 345 000
Erreur moyenne du modèle : 63 844
Maisons Surface
Maison 6 6 324
Maison 7 7 420
Maison 8 6 120
Maisons Surface Prix
Maison 1 6 324 68 500
Maison 2 7 420 118 000
Maison 3 6 120 132 000
Maison 4 12 968 144 000
Maison 5 10 920 157 000
Prix
180 000
208 500
345 000
Comment produire un modèle ?
Prédiction
300 342
118 300
166 936
Erreur
- 120 342
90 200
178 064
Prix =
p
*
Surface
Prix =
14
*
Surface
Prix =
14
*
Surface
Erreur moyenne du meilleur modèle: 24 429
Données d’entrainement Meilleur modèle
Algorithme de machine Learning
Recherche de la meilleure valeur de p
Données de test Prédiction
EntrainementTest
Erreur moyenne du meilleur modèle: 129 535
Un algorithme simple : La régression linéaire
-
50,000
100,000
150,000
200,000
250,000
300,000
350,000
400,000
- 5,000 10,000 15,000 20,000 25,000
p = 10
p = 15
p = 14
Surface
Prix
Trouver le meilleur p pour un modèle du type : Prix = p * Surface
Comment optimiser le paramètre p ?
Erreurs(p) = (68 500 - p * 6 324) + (118 000 - p * 7420) + …
Erreur maison 1 Erreur maison 2
Différents types de Machine Learning
Machine Learning
Apprentissage
non supervisé
Apprentissage
supervisé
Apprentissage
par renforcement
• Classification
• Régression
• …
• Clustering
• …
La classification avec un arbre de décision
Clustering avec un regroupement hiérarchique
Machine Learning avancé
Découvrir les algorithmes plus complexes utilisés dans l’industrie
Les Random Forest pour la classification
Les Random Forest pour la régression
Comment traiter des images ?
112 239 90
14 56 143
201 189 112
119 45 34
237 101 230
90 200 45
145 98 245
167 130 103
201 87 67
Image Pixel 1 R Pixel 1 V Pixel 1 B Pixel 2 R Pixel 2 V Pixel 2 B
…
Image n°1 112 14 201 239 56 189
Image n°2 15 189 27 14 31 145
Image n°3 90 56 159 34 189 98
…
Image n°1
Une image de 9 pixels
La reconnaissance de formes avec le Deep Learning
Pixel 1 R 112
Pixel 1 V 14
Pixel 1 B 201
Une image de 1 pixel
Input layer Output layerHidden layers
𝑽 𝟐,𝟒 =
f( 𝒑 𝟏* 𝑽 𝟏,𝟏 + 𝒑 𝟐* 𝑽 𝟏,𝟐 + 𝒑 𝟑* 𝑽 𝟏,𝟑 + 𝒑 𝟒* 𝑽 𝟏,𝟒 )
𝑽 𝟐,𝟑 =
f( 𝒑 𝟏* 𝑽 𝟏,𝟏 + 𝒑 𝟐* 𝑽 𝟏,𝟐 + 𝒑 𝟑* 𝑽 𝟏,𝟑 + 𝒑 𝟒* 𝑽 𝟏,𝟒 )
𝑽 𝟐,𝟐 =
f( 𝒑 𝟏* 𝑽 𝟏,𝟏 + 𝒑 𝟐* 𝑽 𝟏,𝟐 + 𝒑 𝟑* 𝑽 𝟏,𝟑 + 𝒑 𝟒* 𝑽 𝟏,𝟒 )
𝑽 𝟐,𝟏 =
f( 𝒑 𝟏* 𝑽 𝟏,𝟏 + 𝒑 𝟐* 𝑽 𝟏,𝟐 + 𝒑 𝟑* 𝑽 𝟏,𝟑 + 𝒑 𝟒* 𝑽 𝟏,𝟒 )
y
𝑽 𝟏,𝟒 =
f( 𝒑 𝟏*112 + 𝒑 𝟐*14 + 𝒑 𝟑*201 )
𝑽 𝟏,𝟑 =
f( 𝒑 𝟏*112 + 𝒑 𝟐*14 + 𝒑 𝟑*201 )
𝑽 𝟏,𝟐 =
f( 𝒑 𝟏*112 + 𝒑 𝟐*14 + 𝒑 𝟑*201 )
𝑽 𝟏,𝟏 =
f( 𝒑 𝟏*112 + 𝒑 𝟐*14 + 𝒑 𝟑*201 )
Fonctionnement d’un réseau de neurones
112
14
201
𝑽 𝟏,𝟒
𝑽 𝟏,𝟑
𝑽 𝟏,𝟐
𝑽 𝟏,𝟏
𝑽 𝟐,𝟒
𝑽 𝟐,𝟑
𝑽 𝟐,𝟐
𝑽 𝟐,𝟏
Probabilité qu’il
s’agisse d’autre chose
Probabilité qu’il
s’agisse d’un chat
Nos Prochains Workshops
—
2 MAI
—
Victoria Galano, Data Scientist chez Air
France
Nos Prochaines Sessions
—
5 Juin - 26 Juillet
Mardis / Jeudis
18h30 - 21h00
Semaine
—
1 Septembre - 25 Octobre
Samedis
9h30 - 15h30
Weekend
—
Nos Prochaines Sessions
—
6 Août - 17 Août
Tous les jours
9h30 - 15h30
Intensives
—
Data Science Bootcamp
Merci ! A la prochaine :)

Contenu connexe

Tendances

Habilemt - Exercice placement
Habilemt - Exercice placementHabilemt - Exercice placement
Habilemt - Exercice placementCriš Jazouli
 
Notes de cours nb entier
Notes de cours   nb entierNotes de cours   nb entier
Notes de cours nb entierSteve Roy
 

Tendances (7)

Habilemt - Exercice placement
Habilemt - Exercice placementHabilemt - Exercice placement
Habilemt - Exercice placement
 
3-Cm8 2013-2014
3-Cm8 2013-20143-Cm8 2013-2014
3-Cm8 2013-2014
 
Ch04 25
Ch04 25Ch04 25
Ch04 25
 
Notes de cours nb entier
Notes de cours   nb entierNotes de cours   nb entier
Notes de cours nb entier
 
Ch04 33
Ch04 33Ch04 33
Ch04 33
 
Ch04 27
Ch04 27Ch04 27
Ch04 27
 
Ch31 23
Ch31 23Ch31 23
Ch31 23
 

Similaire à Introduction au Machine Learning - Frédéric Enard, Data Scientist chez TF1 Le Groupe

NightClazz Spark / Machine Learning
NightClazz Spark / Machine LearningNightClazz Spark / Machine Learning
NightClazz Spark / Machine LearningZenika
 
ALF 11 - Diagrame de flux de controlle
ALF 11 - Diagrame de flux de controlleALF 11 - Diagrame de flux de controlle
ALF 11 - Diagrame de flux de controlleAlexandru Radovici
 
ALF 11 - Diagramme de flux de contrôle et WebAssembly
ALF 11 - Diagramme de flux de contrôle et WebAssemblyALF 11 - Diagramme de flux de contrôle et WebAssembly
ALF 11 - Diagramme de flux de contrôle et WebAssemblyAlexandru Radovici
 
Ch8 correction exercices (1)
Ch8 correction exercices (1)Ch8 correction exercices (1)
Ch8 correction exercices (1)abdellah12
 
JSS2014 – Ma première analyse Machine Learning avec Azure ML
JSS2014 – Ma première analyse Machine Learning avec Azure MLJSS2014 – Ma première analyse Machine Learning avec Azure ML
JSS2014 – Ma première analyse Machine Learning avec Azure MLGUSS
 
Les Fonctions de référence.pptx
Les Fonctions de référence.pptxLes Fonctions de référence.pptx
Les Fonctions de référence.pptxrezgui10
 
Electronique-Numérique-TD-7.pdf
Electronique-Numérique-TD-7.pdfElectronique-Numérique-TD-7.pdf
Electronique-Numérique-TD-7.pdfYassine Sabri
 
Transformation & Ruptures Numériques - Alex Benoehr
Transformation & Ruptures Numériques - Alex BenoehrTransformation & Ruptures Numériques - Alex Benoehr
Transformation & Ruptures Numériques - Alex BenoehrAlex Benoehr
 

Similaire à Introduction au Machine Learning - Frédéric Enard, Data Scientist chez TF1 Le Groupe (10)

NightClazz Spark / Machine Learning
NightClazz Spark / Machine LearningNightClazz Spark / Machine Learning
NightClazz Spark / Machine Learning
 
ALF 11 - WebAssembly
ALF 11 - WebAssemblyALF 11 - WebAssembly
ALF 11 - WebAssembly
 
ALF 11 - Diagrame de flux de controlle
ALF 11 - Diagrame de flux de controlleALF 11 - Diagrame de flux de controlle
ALF 11 - Diagrame de flux de controlle
 
ALF 11 - Diagramme de flux de contrôle et WebAssembly
ALF 11 - Diagramme de flux de contrôle et WebAssemblyALF 11 - Diagramme de flux de contrôle et WebAssembly
ALF 11 - Diagramme de flux de contrôle et WebAssembly
 
Ch8 correction exercices (1)
Ch8 correction exercices (1)Ch8 correction exercices (1)
Ch8 correction exercices (1)
 
PROCESS & ALEA
PROCESS & ALEAPROCESS & ALEA
PROCESS & ALEA
 
JSS2014 – Ma première analyse Machine Learning avec Azure ML
JSS2014 – Ma première analyse Machine Learning avec Azure MLJSS2014 – Ma première analyse Machine Learning avec Azure ML
JSS2014 – Ma première analyse Machine Learning avec Azure ML
 
Les Fonctions de référence.pptx
Les Fonctions de référence.pptxLes Fonctions de référence.pptx
Les Fonctions de référence.pptx
 
Electronique-Numérique-TD-7.pdf
Electronique-Numérique-TD-7.pdfElectronique-Numérique-TD-7.pdf
Electronique-Numérique-TD-7.pdf
 
Transformation & Ruptures Numériques - Alex Benoehr
Transformation & Ruptures Numériques - Alex BenoehrTransformation & Ruptures Numériques - Alex Benoehr
Transformation & Ruptures Numériques - Alex Benoehr
 

Plus de Jedha Bootcamp

DataScientist Job : Between Myths and Reality.pdf
DataScientist Job : Between Myths and Reality.pdfDataScientist Job : Between Myths and Reality.pdf
DataScientist Job : Between Myths and Reality.pdfJedha Bootcamp
 
L'IA face à l'épreuve du covid-19 - Jedha x Kardinal
L'IA face à l'épreuve du covid-19 - Jedha x KardinalL'IA face à l'épreuve du covid-19 - Jedha x Kardinal
L'IA face à l'épreuve du covid-19 - Jedha x KardinalJedha Bootcamp
 
Générer une image à partir d'un texte - Fullstack Paris #5
Générer une image à partir d'un texte - Fullstack Paris #5Générer une image à partir d'un texte - Fullstack Paris #5
Générer une image à partir d'un texte - Fullstack Paris #5Jedha Bootcamp
 
Recommander des films - Andreea - Fullstack Lyon #1
Recommander des films - Andreea - Fullstack Lyon #1Recommander des films - Andreea - Fullstack Lyon #1
Recommander des films - Andreea - Fullstack Lyon #1Jedha Bootcamp
 
Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1
Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1
Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1Jedha Bootcamp
 
Construction d'une voiture autonome - Adrien Dodinet, alumni Fullstack
Construction d'une voiture autonome - Adrien Dodinet, alumni FullstackConstruction d'une voiture autonome - Adrien Dodinet, alumni Fullstack
Construction d'une voiture autonome - Adrien Dodinet, alumni FullstackJedha Bootcamp
 
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...Jedha Bootcamp
 
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De ForzanzEstimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De ForzanzJedha Bootcamp
 
Trouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli
Trouver des offres d'emploi grâce au traitement de texte - Mohamed ZebliTrouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli
Trouver des offres d'emploi grâce au traitement de texte - Mohamed ZebliJedha Bootcamp
 
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed ZebliOptimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed ZebliJedha Bootcamp
 
Reconnaître du mobilier design sur une photographie - Emmanuelle Guyot
Reconnaître du mobilier design sur une photographie - Emmanuelle GuyotReconnaître du mobilier design sur une photographie - Emmanuelle Guyot
Reconnaître du mobilier design sur une photographie - Emmanuelle GuyotJedha Bootcamp
 
Estimer le prix de bijou lors d'une vente aux enchères - Katie Ross
Estimer le prix de bijou lors d'une vente aux enchères - Katie RossEstimer le prix de bijou lors d'une vente aux enchères - Katie Ross
Estimer le prix de bijou lors d'une vente aux enchères - Katie RossJedha Bootcamp
 
Workshop Data Visualisation - Jedha Paris
Workshop Data Visualisation - Jedha ParisWorkshop Data Visualisation - Jedha Paris
Workshop Data Visualisation - Jedha ParisJedha Bootcamp
 
Les applications du Deep Learning - Jedha Lyon
Les applications du Deep Learning - Jedha LyonLes applications du Deep Learning - Jedha Lyon
Les applications du Deep Learning - Jedha LyonJedha Bootcamp
 
Optimiser ses publicités grâce à la Data Science
Optimiser ses publicités grâce à la Data ScienceOptimiser ses publicités grâce à la Data Science
Optimiser ses publicités grâce à la Data ScienceJedha Bootcamp
 
Connaître son audience grâce à la Data - Parisa MAjlessi
Connaître son audience grâce à la Data - Parisa MAjlessiConnaître son audience grâce à la Data - Parisa MAjlessi
Connaître son audience grâce à la Data - Parisa MAjlessiJedha Bootcamp
 
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...Jedha Bootcamp
 
Automatiser la classification d'un jeu vidéo
Automatiser la classification d'un jeu vidéoAutomatiser la classification d'un jeu vidéo
Automatiser la classification d'un jeu vidéoJedha Bootcamp
 
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...Jedha Bootcamp
 

Plus de Jedha Bootcamp (20)

DataScientist Job : Between Myths and Reality.pdf
DataScientist Job : Between Myths and Reality.pdfDataScientist Job : Between Myths and Reality.pdf
DataScientist Job : Between Myths and Reality.pdf
 
L'IA face à l'épreuve du covid-19 - Jedha x Kardinal
L'IA face à l'épreuve du covid-19 - Jedha x KardinalL'IA face à l'épreuve du covid-19 - Jedha x Kardinal
L'IA face à l'épreuve du covid-19 - Jedha x Kardinal
 
Générer une image à partir d'un texte - Fullstack Paris #5
Générer une image à partir d'un texte - Fullstack Paris #5Générer une image à partir d'un texte - Fullstack Paris #5
Générer une image à partir d'un texte - Fullstack Paris #5
 
Recommander des films - Andreea - Fullstack Lyon #1
Recommander des films - Andreea - Fullstack Lyon #1Recommander des films - Andreea - Fullstack Lyon #1
Recommander des films - Andreea - Fullstack Lyon #1
 
Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1
Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1
Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1
 
Construction d'une voiture autonome - Adrien Dodinet, alumni Fullstack
Construction d'une voiture autonome - Adrien Dodinet, alumni FullstackConstruction d'une voiture autonome - Adrien Dodinet, alumni Fullstack
Construction d'une voiture autonome - Adrien Dodinet, alumni Fullstack
 
Slide portes ouvertes
Slide portes ouvertesSlide portes ouvertes
Slide portes ouvertes
 
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...
 
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De ForzanzEstimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
 
Trouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli
Trouver des offres d'emploi grâce au traitement de texte - Mohamed ZebliTrouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli
Trouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli
 
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed ZebliOptimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli
 
Reconnaître du mobilier design sur une photographie - Emmanuelle Guyot
Reconnaître du mobilier design sur une photographie - Emmanuelle GuyotReconnaître du mobilier design sur une photographie - Emmanuelle Guyot
Reconnaître du mobilier design sur une photographie - Emmanuelle Guyot
 
Estimer le prix de bijou lors d'une vente aux enchères - Katie Ross
Estimer le prix de bijou lors d'une vente aux enchères - Katie RossEstimer le prix de bijou lors d'une vente aux enchères - Katie Ross
Estimer le prix de bijou lors d'une vente aux enchères - Katie Ross
 
Workshop Data Visualisation - Jedha Paris
Workshop Data Visualisation - Jedha ParisWorkshop Data Visualisation - Jedha Paris
Workshop Data Visualisation - Jedha Paris
 
Les applications du Deep Learning - Jedha Lyon
Les applications du Deep Learning - Jedha LyonLes applications du Deep Learning - Jedha Lyon
Les applications du Deep Learning - Jedha Lyon
 
Optimiser ses publicités grâce à la Data Science
Optimiser ses publicités grâce à la Data ScienceOptimiser ses publicités grâce à la Data Science
Optimiser ses publicités grâce à la Data Science
 
Connaître son audience grâce à la Data - Parisa MAjlessi
Connaître son audience grâce à la Data - Parisa MAjlessiConnaître son audience grâce à la Data - Parisa MAjlessi
Connaître son audience grâce à la Data - Parisa MAjlessi
 
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
 
Automatiser la classification d'un jeu vidéo
Automatiser la classification d'un jeu vidéoAutomatiser la classification d'un jeu vidéo
Automatiser la classification d'un jeu vidéo
 
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
 

Introduction au Machine Learning - Frédéric Enard, Data Scientist chez TF1 Le Groupe

  • 1. Data Science Bootcamp 8 semaines de formation à temps partiel
  • 2. Notre Speaker — Frédéric Enard, Data Scientist chez TF1 Le Groupe
  • 4. Qu’est-ce que le Machine Learning ? Intelligence artificielle Machine Learning Systèmes experts Analyses statistiques Automatisation Dataviz Analyses métiers Data science
  • 5. Les bases du Machine Learning Comprendre avec des idées simples comment fonctionne le Machine Learning
  • 6. Maisons Chambres Surface Prix Maison 1 1 6 324 68 500 Maison 2 2 7 420 118 000 Maison 3 2 6 120 132 000 Maison 4 2 12 968 144 000 Maison 5 2 10 920 157 000 Maison 6 1 21 453 180 000 Maison 7 3 8 450 208 500 Maison 8 4 11 924 345 000 L’apprentissage par l’exemple Ce que l’on connait Ce que l’on souhaite prédire
  • 7. Un modèle pour trouver le juste prix Ce que l’on connait PrédictionModèle Chambres Surface 1 6 324 2 7 420 2 6 120 2 12 968 2 10 920 1 21 453 3 8 450 4 11 924 Prix 68 500 118 000 132 000 144 000 157 000 180 000 208 500 345 000 ???
  • 8. Ca ressemble à quoi un modèle ? Chambres Surface 1 6 324 2 7 420 2 6 120 2 12 968 2 10 920 1 21 453 3 8 450 4 11 924 Prédiction 63 240 74 200 61 200 129 680 109 200 214 530 84 500 119 240 Prix = p * Surface Prix 68 500 118 000 132 000 144 000 157 000 180 000 208 500 345 000 Erreur 5 260 43 800 70 800 14 320 47 800 - 34 530 124 000 225 760 Erreur moyenne du modèle : 70 783 p = 10
  • 9. Et si on faisait varier le paramètre p ? Chambres Surface 1 6 324 2 7 420 2 6 120 2 12 968 2 10 920 1 21 453 3 8 450 4 11 924 Prédiction 94 860 111 300 91 800 194 520 163 800 321 795 126 750 178 860 Prix = p * Surface Prix 68 500 118 000 132 000 144 000 157 000 180 000 208 500 345 000 Erreur moyenne du modèle : 65 033 p = 15 Erreur - 26 360 6 700 40 200 - 50 520 - 6 800 - 141 795 81 750 166 140
  • 10. Et si on faisait varier le paramètre p ? Chambres Surface 1 6 324 2 7 420 2 6 120 2 12 968 2 10 920 1 21 453 3 8 450 4 11 924 Prédiction 63 240 74 200 61 200 129 680 109 200 214 530 84 500 119 240 Prix = p * Surface Prix 68 500 118 000 132 000 144 000 157 000 180 000 208 500 345 000 Erreur - 20 036 14 120 46 320 - 37 552 4 120 - 120 342 90 200 178 064 Erreur moyenne du modèle : 63 844 p = 14
  • 11. Comment produire un modèle ? Prix = p * Surface Prix = 14 * Surface Données d’entrainement Meilleur modèle Algorithme de machine Learning Recherche de la meilleure valeur de p Maisons Surface Prix Maison 1 6 324 68 500 Maison 2 7 420 118 000 Maison 3 6 120 132 000 Maison 4 12 968 144 000 Maison 5 10 920 157 000 Maison 6 21 453 180 000 Maison 7 8 450 208 500 Maison 8 11 924 345 000 Erreur moyenne du modèle : 63 844
  • 12. Maisons Surface Maison 6 6 324 Maison 7 7 420 Maison 8 6 120 Maisons Surface Prix Maison 1 6 324 68 500 Maison 2 7 420 118 000 Maison 3 6 120 132 000 Maison 4 12 968 144 000 Maison 5 10 920 157 000 Prix 180 000 208 500 345 000 Comment produire un modèle ? Prédiction 300 342 118 300 166 936 Erreur - 120 342 90 200 178 064 Prix = p * Surface Prix = 14 * Surface Prix = 14 * Surface Erreur moyenne du meilleur modèle: 24 429 Données d’entrainement Meilleur modèle Algorithme de machine Learning Recherche de la meilleure valeur de p Données de test Prédiction EntrainementTest Erreur moyenne du meilleur modèle: 129 535
  • 13. Un algorithme simple : La régression linéaire - 50,000 100,000 150,000 200,000 250,000 300,000 350,000 400,000 - 5,000 10,000 15,000 20,000 25,000 p = 10 p = 15 p = 14 Surface Prix Trouver le meilleur p pour un modèle du type : Prix = p * Surface
  • 14. Comment optimiser le paramètre p ? Erreurs(p) = (68 500 - p * 6 324) + (118 000 - p * 7420) + … Erreur maison 1 Erreur maison 2
  • 15. Différents types de Machine Learning Machine Learning Apprentissage non supervisé Apprentissage supervisé Apprentissage par renforcement • Classification • Régression • … • Clustering • …
  • 16. La classification avec un arbre de décision
  • 17. Clustering avec un regroupement hiérarchique
  • 18. Machine Learning avancé Découvrir les algorithmes plus complexes utilisés dans l’industrie
  • 19. Les Random Forest pour la classification
  • 20. Les Random Forest pour la régression
  • 21. Comment traiter des images ? 112 239 90 14 56 143 201 189 112 119 45 34 237 101 230 90 200 45 145 98 245 167 130 103 201 87 67 Image Pixel 1 R Pixel 1 V Pixel 1 B Pixel 2 R Pixel 2 V Pixel 2 B … Image n°1 112 14 201 239 56 189 Image n°2 15 189 27 14 31 145 Image n°3 90 56 159 34 189 98 … Image n°1 Une image de 9 pixels
  • 22. La reconnaissance de formes avec le Deep Learning Pixel 1 R 112 Pixel 1 V 14 Pixel 1 B 201 Une image de 1 pixel Input layer Output layerHidden layers
  • 23. 𝑽 𝟐,𝟒 = f( 𝒑 𝟏* 𝑽 𝟏,𝟏 + 𝒑 𝟐* 𝑽 𝟏,𝟐 + 𝒑 𝟑* 𝑽 𝟏,𝟑 + 𝒑 𝟒* 𝑽 𝟏,𝟒 ) 𝑽 𝟐,𝟑 = f( 𝒑 𝟏* 𝑽 𝟏,𝟏 + 𝒑 𝟐* 𝑽 𝟏,𝟐 + 𝒑 𝟑* 𝑽 𝟏,𝟑 + 𝒑 𝟒* 𝑽 𝟏,𝟒 ) 𝑽 𝟐,𝟐 = f( 𝒑 𝟏* 𝑽 𝟏,𝟏 + 𝒑 𝟐* 𝑽 𝟏,𝟐 + 𝒑 𝟑* 𝑽 𝟏,𝟑 + 𝒑 𝟒* 𝑽 𝟏,𝟒 ) 𝑽 𝟐,𝟏 = f( 𝒑 𝟏* 𝑽 𝟏,𝟏 + 𝒑 𝟐* 𝑽 𝟏,𝟐 + 𝒑 𝟑* 𝑽 𝟏,𝟑 + 𝒑 𝟒* 𝑽 𝟏,𝟒 ) y 𝑽 𝟏,𝟒 = f( 𝒑 𝟏*112 + 𝒑 𝟐*14 + 𝒑 𝟑*201 ) 𝑽 𝟏,𝟑 = f( 𝒑 𝟏*112 + 𝒑 𝟐*14 + 𝒑 𝟑*201 ) 𝑽 𝟏,𝟐 = f( 𝒑 𝟏*112 + 𝒑 𝟐*14 + 𝒑 𝟑*201 ) 𝑽 𝟏,𝟏 = f( 𝒑 𝟏*112 + 𝒑 𝟐*14 + 𝒑 𝟑*201 ) Fonctionnement d’un réseau de neurones 112 14 201 𝑽 𝟏,𝟒 𝑽 𝟏,𝟑 𝑽 𝟏,𝟐 𝑽 𝟏,𝟏 𝑽 𝟐,𝟒 𝑽 𝟐,𝟑 𝑽 𝟐,𝟐 𝑽 𝟐,𝟏 Probabilité qu’il s’agisse d’autre chose Probabilité qu’il s’agisse d’un chat
  • 24. Nos Prochains Workshops — 2 MAI — Victoria Galano, Data Scientist chez Air France
  • 25. Nos Prochaines Sessions — 5 Juin - 26 Juillet Mardis / Jeudis 18h30 - 21h00 Semaine — 1 Septembre - 25 Octobre Samedis 9h30 - 15h30 Weekend —
  • 26. Nos Prochaines Sessions — 6 Août - 17 Août Tous les jours 9h30 - 15h30 Intensives —
  • 27. Data Science Bootcamp Merci ! A la prochaine :)