SlideShare une entreprise Scribd logo
1  sur  16
EXPOSÉ DANS LE CADRE DU MODULE
MACHINE LEARNING
 Réalisé par : GHILAS Billal
REZKELLAH Bilal 2017-2018
Train/Test Split Cross Validation
Underfitting
Vs
Overfitting
Grid search
Vs
Random search
Sélection de modèles et régularisation
1
Cross validationSur-apprentissage et Sous-apprentissage
Grid Search vs Random Search
MACHINE LEARNING
Qu’est ce que un bon modèle ? Régularisation
En machine Learning un bon modèle est un modèle qui généralise !
La généralisation, c’est la capacité d’un modèle à faire
des prédictions non seulement sur les données que
utilisées pour le construire (données d’entrainement et de
test), mais surtout sur de nouvelles données.
Cross validationSur-apprentissage et Sous-apprentissageQu’est ce que un bon modèle ? RégularisationSélection du modèle
Sélection de modèles et régularisation
2
Train/Test split
Cross validationSur-apprentissage et Sous-apprentissage
Grid Search vs Random Search
MACHINE LEARNING
Qu’est ce que un bon modèle ? Régularisation
Un modèle qui sur-apprend est un modèle qui est trop complexe par rapport à la réalité qu’il
essaie de représenter.
Un tel phénomène ce produit lorsqu'un modèle apprend le détail et le bruit dans les données
d’entrainement dans la mesure où cela a un impact négatif sur la performance du modèle
sur de nouvelles données
Cela signifie que le bruit ou les fluctuations aléatoires dans les données d'entraînement sont
ramassés et acquis comme concepts par le modèle. Le problème est que ces concepts ne
s'appliquent pas aux nouvelles données et ont un impact négatif sur la capacité des
modèles à se généraliser.
le modèle (la ligne violette) qui sépare les
points bleus des points oranges colle bien
aux données, ce qui peut poser problème Ce modèle fait des erreurs sur le jeu
d’apprentissage, mais il va probablement
mieux généraliser
Sur-apprentissage
Cross validationSur-apprentissage et Sous-apprentissageQu’est ce que un bon modèle ? RégularisationSélection du modèle
Sélection de modèles et régularisation Grid Search vs Random Search
MACHINE LEARNING
Sélection de modèles et régularisation
3
Train/Test split
Cross validationSur-apprentissage et Sous-apprentissage
Grid Search vs Random Search.
MACHINE LEARNING
Qu’est ce que un bon modèle ? Régularisation
Le sous-apprentissage se réfère à un modèle qui ne peut ni modéliser les données
d’entrainement ni généraliser sur de nouvelles données.
Un modèle d'apprentissage machine inadéquat n'est pas un modèle approprié et sera
évident car il aura de mauvaises performances sur les données de test.
L'inadéquation n'est souvent pas discutée car elle est facile à détecter.
Le solution est de passer à autre chose et d'essayer d'autres
algorithmes d'apprentissage machine..
Ce modèle, trop simple, représente trop mal
les données pour prédire
Sous-apprentissage
Cross validationSur-apprentissage et Sous-apprentissageQu’est ce que un bon modèle ? RégularisationSélection du modèle
Sélection de modèles et régularisation Grid Search vs Random Search
MACHINE LEARNING
Sélection de modèles et régularisation
4
Train/Test split
Cross validationSur-apprentissage et Sous-apprentissage
Grid Search vs Random Search
MACHINE LEARNING
Qu’est ce que un bon modèle ? Régularisation
Un modèle simple (variance faible) risque le sous-
apprentissage (biais élevé y compris sur les données
d’entraînement).
Un modèle complexe (variance élevée) risque le sur-
apprentissage (biais faible sur les données
d’entraînement mais élevé sur de nouvelles données).
On souhaite trouver un modèle intermédiaire, vers le
creux de la courbe orange, là où le biais de prédiction
est le plus faible et la généralisation la meilleure.
Compromis biais-variance
Cross validationSur-apprentissage et Sous-apprentissageQu’est ce que un bon modèle ? RégularisationSélection du modèle
Sélection de modèles et régularisation Grid Search vs Random Search
MACHINE LEARNING
Sélection de modèles et régularisation
5
Train/Test split
Cross validationSur-apprentissage et Sous-apprentissage
Grid Search vs Random Search
MACHINE LEARNING
Qu’est ce que un bon modèle ? Régularisation
Première idée
On sépare le jeu de données en un jeu d’entraînement et un jeu de test. Le
jeu de test n’est pas utilisé pour entraîner le modèle, mais uniquement pour
l’évaluer.
jeu de test vraiment difficile ou vraiment facile à prédire
L’estimation de la performance serait biaisée
Sélection du modèle
Sélection de modèles et régularisation Grid Search vs Random Search
MACHINE LEARNING
Sélection de modèles et régularisation
6
Train/Test split
Cross validationSur-apprentissage et Sous-apprentissage
Grid Search vs Random Search
MACHINE LEARNING
Qu’est ce que un bon modèle ? RégularisationSélection du modèle
La validation croisée va nous permettre d’utiliser l'intégralité de notre jeu de
données pour l’entraînement et pour la validation.
Sélection de modèles et régularisation Grid Search vs Random Search
MACHINE LEARNING
3 Types :
Holdout cross validation
K-fold cross validation
Leave-one-out cross validation
Sélection de modèles et régularisation
7
Train/Test split
Cross validationSur-apprentissage et Sous-apprentissage
Grid Search vs Random Search
MACHINE LEARNING
Qu’est ce que un bon modèle ? RégularisationSélection du modèle
Validation croisée ( K-Fold)
On découpe le jeu de données en k parties (folds en anglais) à peu près égales.
Tour à tour, chacune des k parties est utilisée comme jeu de test. Le reste (autrement dit, l’union des k-1 autres
parties) est utilisé pour l'entraînement.
À la fin, chaque point (ou observation) a servi 1 fois dans un jeu de test, (k-1) fois dans un jeu d'entraînement.
Sélection de modèles et régularisation Grid Search vs Random Search
MACHINE LEARNING
Sélection de modèles et régularisation
8
Train/Test split
Cross validationSur-apprentissage et Sous-apprentissage
Grid Search vs Random Search
MACHINE LEARNING
Qu’est ce que un bon modèle ? RégularisationSélection du modèle
Constat : généralement, dans les problèmes de machine Learning nous voulons
essayer plusieurs modèles pour choisir le plus performant, et ensuite donner sa
performance.
Première idée : faire une validation croisée sur l’ensemble des données, pour chaque
modèle, puis de donner la meilleure performance obtenue.
Attention ! ce n’est pas une bonne estimation de l’erreur en généralisation. En effet,
en faisant ça, nous utilisons les données de test pour choisir le modèle… Il y a un
risque de sur-apprentissage.
Sélection de modèles et régularisation Grid Search vs Random Search
MACHINE LEARNING
Sélection de modèles et régularisation
9
Train/Test split
Cross validationSur-apprentissage et Sous-apprentissage
Grid Search vs Random Search
MACHINE LEARNING
Qu’est ce que un bon modèle ? RégularisationSélection du modèle
Solution : On sépare le jeu de données
en un jeu d’entraînement et un jeu de
test. On évalue chaque modèle en
validation croisée sur le jeu
d’entraînement pour choisir le meilleur,
que l’on applique ensuite au jeu de test.
Sélection de modèles et régularisation Grid Search vs Random Search
MACHINE LEARNING
Sélection de modèles et régularisation
10
Train/Test split
Cross validationSur-apprentissage et Sous-apprentissage
Grid Search vs Random Search
MACHINE LEARNING
Qu’est ce que un bon modèle ? RégularisationSélection du modèle
La régularisation dans les mathématiques et les statistiques est
le processus d'introduire de nouvelle information pour résoudre
les problèmes mal-posés et de prévenir le sur-apprentissage.
Dans la regression, la régularisation consiste à ajouter une
fonction R(f) à la fonction erreur.
V : fonction d’erreur.
λ : paramètre de contrôle de l’importance de terme de
régularisation R(f) .
Sélection de modèles et régularisation Grid Search vs Random Search
MACHINE LEARNING
Sélection de modèles et régularisation
11
Train/Test split Grid Search vs Random Search
MACHINE LEARNING
Grid Search Random Search Grid Search vs Random Search
La manière traditionnelle d'effectuer une optimisation hyperparamétrique a
été la recherche de grille ou un balayage de paramètres, qui est simplement
une recherche exhaustive à travers un sous-ensemble spécifié
manuellement de l'espace hyperparamètre d'un algorithme d'apprentissage.
Un algorithme de recherche de grille doit être guidé par une métrique de
performance, généralement mesurée par validation croisée sur l'ensemble
de formation ou évaluation sur un ensemble de validation retenu.
Sélection de modèles et régularisation Grid Search vs Random Search
MACHINE LEARNING
Sélection de modèles et régularisation
12
Train/Test split Grid Search vs Random Search
MACHINE LEARNING
Grid Search Random Search Grid Search vs Random Search
Étant donné que la recherche par grille est une méthode exhaustive et donc
potentiellement coûteuse, plusieurs alternatives ont été proposées. En
particulier, la recherche aléatoire qui tente des combinaisons aléatoires d'une
gamme de valeurs (nous devons définir le nombre d’itérations).
Il est bon de tester un large éventail de valeurs et, normalement, il atteint une
très bonne combinaison très rapidement.
Sélection de modèles et régularisation Grid Search vs Random Search
MACHINE LEARNING
Sélection de modèles et régularisation
13
Train/Test split Grid Search vs Random Search
MACHINE LEARNING
Grid Search Random Search Grid Search vs Random Search
Grid search
 Recherche exhaustive
 Meilleur combinaison obtenu
 Couteux en terme de temps d’exécution
 Non adapté lorsque le nombre
d’hyperparamètre est élevé
Random search
 Recherche dans une gamme de valeurs
 Meilleur combinaison non garantit
 Moins couteux en terme de temps d’exécution
 Plus adapté lorsque le nombre d’hyperparamètre est
élevé
Sélection de modèles et régularisation Grid Search vs Random Search
MACHINE LEARNING
Références
Chloé-Aguathe Azencott (publication 28 juil 2017). «Évaluez et améliorez les performances d'un
modèle de machine learning », sur le site openclassrooms.
https://openclassrooms.com/courses/evaluez-et-ameliorez-les-performances-d-un-modele-de-
machine-learning/comprenez-ce-qui-fait-un-bon-modele-d-apprentissage
Sebastian Raschka (publication 2 oct 2016). «Model evaluation, model selection,
and algorithm selection in machine learning»,sur le blog SebastianRaschka.
https://sebastianraschka.com/blog/2016/model-evaluation-selection-part3.html

Contenu connexe

En vedette

How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
 

En vedette (20)

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 

Maching Learning

  • 1. EXPOSÉ DANS LE CADRE DU MODULE MACHINE LEARNING  Réalisé par : GHILAS Billal REZKELLAH Bilal 2017-2018 Train/Test Split Cross Validation Underfitting Vs Overfitting Grid search Vs Random search
  • 2. Sélection de modèles et régularisation 1 Cross validationSur-apprentissage et Sous-apprentissage Grid Search vs Random Search MACHINE LEARNING Qu’est ce que un bon modèle ? Régularisation En machine Learning un bon modèle est un modèle qui généralise ! La généralisation, c’est la capacité d’un modèle à faire des prédictions non seulement sur les données que utilisées pour le construire (données d’entrainement et de test), mais surtout sur de nouvelles données. Cross validationSur-apprentissage et Sous-apprentissageQu’est ce que un bon modèle ? RégularisationSélection du modèle
  • 3. Sélection de modèles et régularisation 2 Train/Test split Cross validationSur-apprentissage et Sous-apprentissage Grid Search vs Random Search MACHINE LEARNING Qu’est ce que un bon modèle ? Régularisation Un modèle qui sur-apprend est un modèle qui est trop complexe par rapport à la réalité qu’il essaie de représenter. Un tel phénomène ce produit lorsqu'un modèle apprend le détail et le bruit dans les données d’entrainement dans la mesure où cela a un impact négatif sur la performance du modèle sur de nouvelles données Cela signifie que le bruit ou les fluctuations aléatoires dans les données d'entraînement sont ramassés et acquis comme concepts par le modèle. Le problème est que ces concepts ne s'appliquent pas aux nouvelles données et ont un impact négatif sur la capacité des modèles à se généraliser. le modèle (la ligne violette) qui sépare les points bleus des points oranges colle bien aux données, ce qui peut poser problème Ce modèle fait des erreurs sur le jeu d’apprentissage, mais il va probablement mieux généraliser Sur-apprentissage Cross validationSur-apprentissage et Sous-apprentissageQu’est ce que un bon modèle ? RégularisationSélection du modèle Sélection de modèles et régularisation Grid Search vs Random Search MACHINE LEARNING
  • 4. Sélection de modèles et régularisation 3 Train/Test split Cross validationSur-apprentissage et Sous-apprentissage Grid Search vs Random Search. MACHINE LEARNING Qu’est ce que un bon modèle ? Régularisation Le sous-apprentissage se réfère à un modèle qui ne peut ni modéliser les données d’entrainement ni généraliser sur de nouvelles données. Un modèle d'apprentissage machine inadéquat n'est pas un modèle approprié et sera évident car il aura de mauvaises performances sur les données de test. L'inadéquation n'est souvent pas discutée car elle est facile à détecter. Le solution est de passer à autre chose et d'essayer d'autres algorithmes d'apprentissage machine.. Ce modèle, trop simple, représente trop mal les données pour prédire Sous-apprentissage Cross validationSur-apprentissage et Sous-apprentissageQu’est ce que un bon modèle ? RégularisationSélection du modèle Sélection de modèles et régularisation Grid Search vs Random Search MACHINE LEARNING
  • 5. Sélection de modèles et régularisation 4 Train/Test split Cross validationSur-apprentissage et Sous-apprentissage Grid Search vs Random Search MACHINE LEARNING Qu’est ce que un bon modèle ? Régularisation Un modèle simple (variance faible) risque le sous- apprentissage (biais élevé y compris sur les données d’entraînement). Un modèle complexe (variance élevée) risque le sur- apprentissage (biais faible sur les données d’entraînement mais élevé sur de nouvelles données). On souhaite trouver un modèle intermédiaire, vers le creux de la courbe orange, là où le biais de prédiction est le plus faible et la généralisation la meilleure. Compromis biais-variance Cross validationSur-apprentissage et Sous-apprentissageQu’est ce que un bon modèle ? RégularisationSélection du modèle Sélection de modèles et régularisation Grid Search vs Random Search MACHINE LEARNING
  • 6. Sélection de modèles et régularisation 5 Train/Test split Cross validationSur-apprentissage et Sous-apprentissage Grid Search vs Random Search MACHINE LEARNING Qu’est ce que un bon modèle ? Régularisation Première idée On sépare le jeu de données en un jeu d’entraînement et un jeu de test. Le jeu de test n’est pas utilisé pour entraîner le modèle, mais uniquement pour l’évaluer. jeu de test vraiment difficile ou vraiment facile à prédire L’estimation de la performance serait biaisée Sélection du modèle Sélection de modèles et régularisation Grid Search vs Random Search MACHINE LEARNING
  • 7. Sélection de modèles et régularisation 6 Train/Test split Cross validationSur-apprentissage et Sous-apprentissage Grid Search vs Random Search MACHINE LEARNING Qu’est ce que un bon modèle ? RégularisationSélection du modèle La validation croisée va nous permettre d’utiliser l'intégralité de notre jeu de données pour l’entraînement et pour la validation. Sélection de modèles et régularisation Grid Search vs Random Search MACHINE LEARNING 3 Types : Holdout cross validation K-fold cross validation Leave-one-out cross validation
  • 8. Sélection de modèles et régularisation 7 Train/Test split Cross validationSur-apprentissage et Sous-apprentissage Grid Search vs Random Search MACHINE LEARNING Qu’est ce que un bon modèle ? RégularisationSélection du modèle Validation croisée ( K-Fold) On découpe le jeu de données en k parties (folds en anglais) à peu près égales. Tour à tour, chacune des k parties est utilisée comme jeu de test. Le reste (autrement dit, l’union des k-1 autres parties) est utilisé pour l'entraînement. À la fin, chaque point (ou observation) a servi 1 fois dans un jeu de test, (k-1) fois dans un jeu d'entraînement. Sélection de modèles et régularisation Grid Search vs Random Search MACHINE LEARNING
  • 9. Sélection de modèles et régularisation 8 Train/Test split Cross validationSur-apprentissage et Sous-apprentissage Grid Search vs Random Search MACHINE LEARNING Qu’est ce que un bon modèle ? RégularisationSélection du modèle Constat : généralement, dans les problèmes de machine Learning nous voulons essayer plusieurs modèles pour choisir le plus performant, et ensuite donner sa performance. Première idée : faire une validation croisée sur l’ensemble des données, pour chaque modèle, puis de donner la meilleure performance obtenue. Attention ! ce n’est pas une bonne estimation de l’erreur en généralisation. En effet, en faisant ça, nous utilisons les données de test pour choisir le modèle… Il y a un risque de sur-apprentissage. Sélection de modèles et régularisation Grid Search vs Random Search MACHINE LEARNING
  • 10. Sélection de modèles et régularisation 9 Train/Test split Cross validationSur-apprentissage et Sous-apprentissage Grid Search vs Random Search MACHINE LEARNING Qu’est ce que un bon modèle ? RégularisationSélection du modèle Solution : On sépare le jeu de données en un jeu d’entraînement et un jeu de test. On évalue chaque modèle en validation croisée sur le jeu d’entraînement pour choisir le meilleur, que l’on applique ensuite au jeu de test. Sélection de modèles et régularisation Grid Search vs Random Search MACHINE LEARNING
  • 11. Sélection de modèles et régularisation 10 Train/Test split Cross validationSur-apprentissage et Sous-apprentissage Grid Search vs Random Search MACHINE LEARNING Qu’est ce que un bon modèle ? RégularisationSélection du modèle La régularisation dans les mathématiques et les statistiques est le processus d'introduire de nouvelle information pour résoudre les problèmes mal-posés et de prévenir le sur-apprentissage. Dans la regression, la régularisation consiste à ajouter une fonction R(f) à la fonction erreur. V : fonction d’erreur. λ : paramètre de contrôle de l’importance de terme de régularisation R(f) . Sélection de modèles et régularisation Grid Search vs Random Search MACHINE LEARNING
  • 12. Sélection de modèles et régularisation 11 Train/Test split Grid Search vs Random Search MACHINE LEARNING Grid Search Random Search Grid Search vs Random Search La manière traditionnelle d'effectuer une optimisation hyperparamétrique a été la recherche de grille ou un balayage de paramètres, qui est simplement une recherche exhaustive à travers un sous-ensemble spécifié manuellement de l'espace hyperparamètre d'un algorithme d'apprentissage. Un algorithme de recherche de grille doit être guidé par une métrique de performance, généralement mesurée par validation croisée sur l'ensemble de formation ou évaluation sur un ensemble de validation retenu. Sélection de modèles et régularisation Grid Search vs Random Search MACHINE LEARNING
  • 13. Sélection de modèles et régularisation 12 Train/Test split Grid Search vs Random Search MACHINE LEARNING Grid Search Random Search Grid Search vs Random Search Étant donné que la recherche par grille est une méthode exhaustive et donc potentiellement coûteuse, plusieurs alternatives ont été proposées. En particulier, la recherche aléatoire qui tente des combinaisons aléatoires d'une gamme de valeurs (nous devons définir le nombre d’itérations). Il est bon de tester un large éventail de valeurs et, normalement, il atteint une très bonne combinaison très rapidement. Sélection de modèles et régularisation Grid Search vs Random Search MACHINE LEARNING
  • 14. Sélection de modèles et régularisation 13 Train/Test split Grid Search vs Random Search MACHINE LEARNING Grid Search Random Search Grid Search vs Random Search Grid search  Recherche exhaustive  Meilleur combinaison obtenu  Couteux en terme de temps d’exécution  Non adapté lorsque le nombre d’hyperparamètre est élevé Random search  Recherche dans une gamme de valeurs  Meilleur combinaison non garantit  Moins couteux en terme de temps d’exécution  Plus adapté lorsque le nombre d’hyperparamètre est élevé Sélection de modèles et régularisation Grid Search vs Random Search MACHINE LEARNING
  • 15.
  • 16. Références Chloé-Aguathe Azencott (publication 28 juil 2017). «Évaluez et améliorez les performances d'un modèle de machine learning », sur le site openclassrooms. https://openclassrooms.com/courses/evaluez-et-ameliorez-les-performances-d-un-modele-de- machine-learning/comprenez-ce-qui-fait-un-bon-modele-d-apprentissage Sebastian Raschka (publication 2 oct 2016). «Model evaluation, model selection, and algorithm selection in machine learning»,sur le blog SebastianRaschka. https://sebastianraschka.com/blog/2016/model-evaluation-selection-part3.html

Notes de l'éditeur

  1. Le concept de compromis biais-variance nous permet de bien résumer la situation : Repartition stratifiée
  2. Comment peut-on mesurer la performance d’un modèle? Repartition stratifiée(equitable)
  3. Comment peut-on mesurer la performance d’un modèle? Holdout K-fold Leave-one-out
  4. Comment peut-on mesurer la performance d’un modèle? Holdout K-fold Leave-one-out