SlideShare une entreprise Scribd logo
1  sur  13
Développer
un modèle de
Machine
Learning
Hebert Brian Whannou
05/01/2021
Sommaire
Mon Parcours Prêts bancaires Data science Machine Learning
Valeur ajoutée du
Data scientist
Développement de
modèle
Points à retenir Incitation à l’action A vos agendas!
Brian
° Je suis statisticien spécialisé
en risques financiers
° Je développe des modèles de
machine learning pour des
institutions financières
° J’élabore des
recommendations sur des
modèles déjà développés
Enseignement
secondaire
• Bac C au collège catholique Notre Dame
de Lourdes
• Bourse scolaire de la Fondation Vallet
Enseignement
supérieur
• Classes préparatoires en Mathématiques,
Physique
• ENSAE: école d’ingénieurs spécialisée en
statistiques, économie, programmation
• Université Paris VII: ingénierie financière,
diffusion probabiliste
• Institut des Actuaires
Monparcours
“千里之行、始
于足下”.
“Un voyage de
milliers de
kilomètres
commence par un
seul pas”
- 老子
Prêts bancaires
Les prêts sont caractérisés par un
montant financé, une maturité, un
échéancier de remboursement
La banque est ici l’intermédiaire entre
les emprunteurs et les prêteurs
Quels sont les emprunteurs risqués?
Quelles variables il faut contrôler chez
l’emprunteur avant de lui prêter?
Quelles sont les catégories de
prêts/d’emprunteurs/de prêteurs?
Data Science
La data science est la science de traitement
des données pour en retirer une
information, une structure ou un plan
d’action
Il existe deux types de données: soit elles sont
structurelles soit elles sont non-structurelles
L’objectif est d’extraire les relations entre les
différentes variables (cf. prêts bancaires)
Quelle sont les compétences/connaissances
nécessaires ?
Les composantes
de la Data Science
Programmation –
gestion de base de
données
Statistique -
Mathématiques
Machine Learning Connaissance du
domaine
Communication –
data visualisation
L'apprentissage automatique (Machine Learning)
estunedisciplinedelaDataSciencequipermet
aux systèmes conçus pour réaliser une tâche,
d'apprendreetdes'améliorerautomatiquement
à partir de l'expérience sans être explicitement
programmés
Machine Learning
Apprentissage
Supervisé
Régression
Classification
Apprentissage
Non-Supervisé
Clustering
Réduction de
dimension
Apprentissage
renforcé
La valeur ajoutée du data scientist
° Analyse descriptive
• Quel est l’état des lieux actuels?
• Le statisticien apporte une compréhension quantitative de la base de données avec des techniques simples (moyenne,
quantile, distribution empirique)
° Automatisation des reporting
• Comment réduire les erreurs dans les rapports reproductibles?
° Analyse predictive
• Quel sera la situation dans un horizon de temps donnés?
° Analyse prescriptive
• Quel est le meilleur plan d’action à mener?
Processus de
développement de modèle
Collecte des
données
Calibration du
modèle (ou des
modèles)
EvaluationInterprétation
Déploiement
1. Collecte des données:
• Identification des sources
• Collecte des variables d’intérêt en cohérence avec la problématique
• Exploration et nettoyage de la base
2. Calibration du modèle (ou des modèles)
• Construction de la base d’apprentissage
• Création de nouvelles variables
• Sélection des variables
• Calcul des paramètres
• Sélection du modèle
• Définition des indicateurs de performance
3. Evaluation
• Construction de la base de test
• Estimation de l’erreur de généralisation
4. Interprétation
• Compréhension du modèle et des interactions des variables
5. Déploiement
• Pour une nouvelle observation, quelle est la prédiction du modèle?
• Création d’outils pour permettre utilisation du modèle
• Monitoring des performances du modèles en continu
Points à retenir
UN:
Garbage in, Garbage out
DEUX:
La maîtrise d’un langage de
programmation est
primordiale
TROIS:
il faut maîtriser les
hypothèses sous-jacentes
des modèles
QUATRE:
Contrôler le sur-
apprentissage
CINQ:
Garder un œil sur
l’interprétation du modèle
et la cohérence avec le
domaine d’activité
Incitation à
l’action
Restez curieux et continuez à
lire…
•
Boot Camp organisé par Bénin
Excellence pour l’été 2021
Thank You
LinkedIn
linkedin.com/in/bwhannou/
Email
ml.benin.excellence@outlook.fr
Facebook
facebook.com/BeninExcellence

Contenu connexe

Tendances

5.Mini cas & Exercices cours marketing de base
5.Mini cas & Exercices   cours marketing de base5.Mini cas & Exercices   cours marketing de base
5.Mini cas & Exercices cours marketing de baseNebil MRABET
 
Negociation commerciale
Negociation commercialeNegociation commerciale
Negociation commercialeKoffi KONAN
 
Jeu résolution de problèmes_ outils qualité.pdf
Jeu résolution de problèmes_ outils qualité.pdfJeu résolution de problèmes_ outils qualité.pdf
Jeu résolution de problèmes_ outils qualité.pdfCIPE
 
Qcm marketing approfondi s5 de bien[learneconomie.blogspot.com]
Qcm marketing approfondi s5  de bien[learneconomie.blogspot.com]Qcm marketing approfondi s5  de bien[learneconomie.blogspot.com]
Qcm marketing approfondi s5 de bien[learneconomie.blogspot.com]Jamal Yasser
 
Plan d'action pour le management de la qualite
Plan d'action pour le management de la qualitePlan d'action pour le management de la qualite
Plan d'action pour le management de la qualitePaul Henri KOUAKOU
 
Contrôle de gestion et gestion budgétaire cours
Contrôle de gestion et gestion budgétaire coursContrôle de gestion et gestion budgétaire cours
Contrôle de gestion et gestion budgétaire coursMohamed Amine Sansar
 
Techniques de vente sur powerpoint
Techniques de vente sur powerpointTechniques de vente sur powerpoint
Techniques de vente sur powerpointPédro Ndiaye
 
Système national de santé 2023.pdf
Système national de santé 2023.pdfSystème national de santé 2023.pdf
Système national de santé 2023.pdfELBACHIRBANIAISSA
 
Le business plan pour une entreprise de vente de jus de fruits naturels
Le business plan pour une entreprise de vente de jus de fruits naturelsLe business plan pour une entreprise de vente de jus de fruits naturels
Le business plan pour une entreprise de vente de jus de fruits naturelsWinnie NDJOCK
 
C4020 : Stratégie Commerciale
C4020 : Stratégie CommercialeC4020 : Stratégie Commerciale
C4020 : Stratégie CommercialeAlexandru Panican
 
Gestion du temps et des priorités
Gestion du temps et des prioritésGestion du temps et des priorités
Gestion du temps et des prioritésMathieu Laferrière
 
Plan marketing: Definir la strategie marketing
Plan marketing: Definir la strategie marketingPlan marketing: Definir la strategie marketing
Plan marketing: Definir la strategie marketingVincent KADIO
 
Jeu norme iso 9001
Jeu norme iso 9001Jeu norme iso 9001
Jeu norme iso 9001CIPE
 
Plan de communication d'un produit
Plan de communication d'un produitPlan de communication d'un produit
Plan de communication d'un produitbayoudh amina
 
Les outils de Management de qualité
Les outils de Management de qualitéLes outils de Management de qualité
Les outils de Management de qualitéYassine BAKMOU
 

Tendances (20)

5.Mini cas & Exercices cours marketing de base
5.Mini cas & Exercices   cours marketing de base5.Mini cas & Exercices   cours marketing de base
5.Mini cas & Exercices cours marketing de base
 
Negociation commerciale
Negociation commercialeNegociation commerciale
Negociation commerciale
 
Tableau de bord prospectif
Tableau de bord prospectifTableau de bord prospectif
Tableau de bord prospectif
 
Jeu résolution de problèmes_ outils qualité.pdf
Jeu résolution de problèmes_ outils qualité.pdfJeu résolution de problèmes_ outils qualité.pdf
Jeu résolution de problèmes_ outils qualité.pdf
 
Qcm marketing approfondi s5 de bien[learneconomie.blogspot.com]
Qcm marketing approfondi s5  de bien[learneconomie.blogspot.com]Qcm marketing approfondi s5  de bien[learneconomie.blogspot.com]
Qcm marketing approfondi s5 de bien[learneconomie.blogspot.com]
 
Plan d'action pour le management de la qualite
Plan d'action pour le management de la qualitePlan d'action pour le management de la qualite
Plan d'action pour le management de la qualite
 
brainstorming
brainstormingbrainstorming
brainstorming
 
Contrôle de gestion et gestion budgétaire cours
Contrôle de gestion et gestion budgétaire coursContrôle de gestion et gestion budgétaire cours
Contrôle de gestion et gestion budgétaire cours
 
Techniques de vente sur powerpoint
Techniques de vente sur powerpointTechniques de vente sur powerpoint
Techniques de vente sur powerpoint
 
Système national de santé 2023.pdf
Système national de santé 2023.pdfSystème national de santé 2023.pdf
Système national de santé 2023.pdf
 
Le business plan pour une entreprise de vente de jus de fruits naturels
Le business plan pour une entreprise de vente de jus de fruits naturelsLe business plan pour une entreprise de vente de jus de fruits naturels
Le business plan pour une entreprise de vente de jus de fruits naturels
 
C4020 : Stratégie Commerciale
C4020 : Stratégie CommercialeC4020 : Stratégie Commerciale
C4020 : Stratégie Commerciale
 
Gestion du temps et des priorités
Gestion du temps et des prioritésGestion du temps et des priorités
Gestion du temps et des priorités
 
Cours techniques de vente - complet
Cours techniques de vente - completCours techniques de vente - complet
Cours techniques de vente - complet
 
Principes Qualité.ppt
Principes Qualité.pptPrincipes Qualité.ppt
Principes Qualité.ppt
 
Plan marketing: Definir la strategie marketing
Plan marketing: Definir la strategie marketingPlan marketing: Definir la strategie marketing
Plan marketing: Definir la strategie marketing
 
Gestion d'équipe
Gestion d'équipeGestion d'équipe
Gestion d'équipe
 
Jeu norme iso 9001
Jeu norme iso 9001Jeu norme iso 9001
Jeu norme iso 9001
 
Plan de communication d'un produit
Plan de communication d'un produitPlan de communication d'un produit
Plan de communication d'un produit
 
Les outils de Management de qualité
Les outils de Management de qualitéLes outils de Management de qualité
Les outils de Management de qualité
 

Similaire à développer un modèle de Machine learning

Présentation sur l'expérimentation (bilan intermédiaire au 1er juin 2010) men...
Présentation sur l'expérimentation (bilan intermédiaire au 1er juin 2010) men...Présentation sur l'expérimentation (bilan intermédiaire au 1er juin 2010) men...
Présentation sur l'expérimentation (bilan intermédiaire au 1er juin 2010) men...Morgan Magnin
 
Parkour3- L’importance de la collecte et de l’analyse de données pour votre e...
Parkour3- L’importance de la collecte et de l’analyse de données pour votre e...Parkour3- L’importance de la collecte et de l’analyse de données pour votre e...
Parkour3- L’importance de la collecte et de l’analyse de données pour votre e...Parkour3
 
Un nouvel outil pour l’évaluation des compétences des étudiants : les tests d...
Un nouvel outil pour l’évaluation des compétences des étudiants : les tests d...Un nouvel outil pour l’évaluation des compétences des étudiants : les tests d...
Un nouvel outil pour l’évaluation des compétences des étudiants : les tests d...Morgan Magnin
 
Herve balloux analyses risk and investment
Herve balloux analyses risk and investmentHerve balloux analyses risk and investment
Herve balloux analyses risk and investmentHerveBalloux
 
Socio Data Management présente son outil de simulation prédictive au Printemp...
Socio Data Management présente son outil de simulation prédictive au Printemp...Socio Data Management présente son outil de simulation prédictive au Printemp...
Socio Data Management présente son outil de simulation prédictive au Printemp...Socio Data Management
 
Forêts uniformément aléatoires - Saïp CISS
Forêts uniformément aléatoires - Saïp CISSForêts uniformément aléatoires - Saïp CISS
Forêts uniformément aléatoires - Saïp CISSKezhan SHI
 
EIG Promo 2 - Présentation du défi Signaux Faibles
EIG Promo 2 - Présentation du défi Signaux FaiblesEIG Promo 2 - Présentation du défi Signaux Faibles
EIG Promo 2 - Présentation du défi Signaux FaiblesEtalab
 
La puissance du machine learning et des algorithmes cart au service des métiers
La puissance du machine learning et des algorithmes cart au service des métiersLa puissance du machine learning et des algorithmes cart au service des métiers
La puissance du machine learning et des algorithmes cart au service des métiersMinitab, LLC
 
Benoit Varin TicEthic Brest TIC et DD
Benoit Varin TicEthic Brest TIC et DDBenoit Varin TicEthic Brest TIC et DD
Benoit Varin TicEthic Brest TIC et DDAFEIT
 
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...Web Analytics : L’importance de la collecte et de l’analyse de données pour v...
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...AQT-presentations
 
Herve balloux applied data science
Herve balloux  applied data scienceHerve balloux  applied data science
Herve balloux applied data scienceHerveBalloux
 
Presentation du-dcg salon-etudiant
Presentation du-dcg salon-etudiantPresentation du-dcg salon-etudiant
Presentation du-dcg salon-etudiantEquipeDCG
 
(6 cycle amélqté [récupéré])
(6 cycle amélqté [récupéré])(6 cycle amélqté [récupéré])
(6 cycle amélqté [récupéré])elmahoti
 
Vers une plateforme intelligente pour la prévision des maladies végétales
Vers une plateforme intelligente pour la prévision des maladies végétalesVers une plateforme intelligente pour la prévision des maladies végétales
Vers une plateforme intelligente pour la prévision des maladies végétalesSarra BOUHENNI
 
20140508 cartographie des_modalités_de_mise_en_œuv re (1)
20140508 cartographie des_modalités_de_mise_en_œuv re (1)20140508 cartographie des_modalités_de_mise_en_œuv re (1)
20140508 cartographie des_modalités_de_mise_en_œuv re (1)clac.cab
 
La méthode DMAIC et ses secrets
La méthode DMAIC et ses secretsLa méthode DMAIC et ses secrets
La méthode DMAIC et ses secretsXL Groupe
 
Management des risques
Management des risquesManagement des risques
Management des risquesyounes elhaiba
 
Image et détection des avis exprimés dans le web 2.0
Image et détection des avis exprimés dans le web 2.0Image et détection des avis exprimés dans le web 2.0
Image et détection des avis exprimés dans le web 2.0Aref Jdey
 

Similaire à développer un modèle de Machine learning (20)

Présentation sur l'expérimentation (bilan intermédiaire au 1er juin 2010) men...
Présentation sur l'expérimentation (bilan intermédiaire au 1er juin 2010) men...Présentation sur l'expérimentation (bilan intermédiaire au 1er juin 2010) men...
Présentation sur l'expérimentation (bilan intermédiaire au 1er juin 2010) men...
 
Parkour3- L’importance de la collecte et de l’analyse de données pour votre e...
Parkour3- L’importance de la collecte et de l’analyse de données pour votre e...Parkour3- L’importance de la collecte et de l’analyse de données pour votre e...
Parkour3- L’importance de la collecte et de l’analyse de données pour votre e...
 
Un nouvel outil pour l’évaluation des compétences des étudiants : les tests d...
Un nouvel outil pour l’évaluation des compétences des étudiants : les tests d...Un nouvel outil pour l’évaluation des compétences des étudiants : les tests d...
Un nouvel outil pour l’évaluation des compétences des étudiants : les tests d...
 
Herve balloux analyses risk and investment
Herve balloux analyses risk and investmentHerve balloux analyses risk and investment
Herve balloux analyses risk and investment
 
Socio Data Management présente son outil de simulation prédictive au Printemp...
Socio Data Management présente son outil de simulation prédictive au Printemp...Socio Data Management présente son outil de simulation prédictive au Printemp...
Socio Data Management présente son outil de simulation prédictive au Printemp...
 
Forêts uniformément aléatoires - Saïp CISS
Forêts uniformément aléatoires - Saïp CISSForêts uniformément aléatoires - Saïp CISS
Forêts uniformément aléatoires - Saïp CISS
 
A11-Comment manager ma destination numérique
A11-Comment manager ma destination numériqueA11-Comment manager ma destination numérique
A11-Comment manager ma destination numérique
 
EIG Promo 2 - Présentation du défi Signaux Faibles
EIG Promo 2 - Présentation du défi Signaux FaiblesEIG Promo 2 - Présentation du défi Signaux Faibles
EIG Promo 2 - Présentation du défi Signaux Faibles
 
La puissance du machine learning et des algorithmes cart au service des métiers
La puissance du machine learning et des algorithmes cart au service des métiersLa puissance du machine learning et des algorithmes cart au service des métiers
La puissance du machine learning et des algorithmes cart au service des métiers
 
Benoit Varin TicEthic Brest TIC et DD
Benoit Varin TicEthic Brest TIC et DDBenoit Varin TicEthic Brest TIC et DD
Benoit Varin TicEthic Brest TIC et DD
 
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...Web Analytics : L’importance de la collecte et de l’analyse de données pour v...
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...
 
Herve balloux applied data science
Herve balloux  applied data scienceHerve balloux  applied data science
Herve balloux applied data science
 
Presentation du-dcg salon-etudiant
Presentation du-dcg salon-etudiantPresentation du-dcg salon-etudiant
Presentation du-dcg salon-etudiant
 
(6 cycle amélqté [récupéré])
(6 cycle amélqté [récupéré])(6 cycle amélqté [récupéré])
(6 cycle amélqté [récupéré])
 
Vers une plateforme intelligente pour la prévision des maladies végétales
Vers une plateforme intelligente pour la prévision des maladies végétalesVers une plateforme intelligente pour la prévision des maladies végétales
Vers une plateforme intelligente pour la prévision des maladies végétales
 
20140508 cartographie des_modalités_de_mise_en_œuv re (1)
20140508 cartographie des_modalités_de_mise_en_œuv re (1)20140508 cartographie des_modalités_de_mise_en_œuv re (1)
20140508 cartographie des_modalités_de_mise_en_œuv re (1)
 
Webinaire du CCNMO: Méthodes et outils axés sur la prévention des blessures p...
Webinaire du CCNMO: Méthodes et outils axés sur la prévention des blessures p...Webinaire du CCNMO: Méthodes et outils axés sur la prévention des blessures p...
Webinaire du CCNMO: Méthodes et outils axés sur la prévention des blessures p...
 
La méthode DMAIC et ses secrets
La méthode DMAIC et ses secretsLa méthode DMAIC et ses secrets
La méthode DMAIC et ses secrets
 
Management des risques
Management des risquesManagement des risques
Management des risques
 
Image et détection des avis exprimés dans le web 2.0
Image et détection des avis exprimés dans le web 2.0Image et détection des avis exprimés dans le web 2.0
Image et détection des avis exprimés dans le web 2.0
 

développer un modèle de Machine learning

  • 2. Sommaire Mon Parcours Prêts bancaires Data science Machine Learning Valeur ajoutée du Data scientist Développement de modèle Points à retenir Incitation à l’action A vos agendas!
  • 3. Brian ° Je suis statisticien spécialisé en risques financiers ° Je développe des modèles de machine learning pour des institutions financières ° J’élabore des recommendations sur des modèles déjà développés Enseignement secondaire • Bac C au collège catholique Notre Dame de Lourdes • Bourse scolaire de la Fondation Vallet Enseignement supérieur • Classes préparatoires en Mathématiques, Physique • ENSAE: école d’ingénieurs spécialisée en statistiques, économie, programmation • Université Paris VII: ingénierie financière, diffusion probabiliste • Institut des Actuaires Monparcours
  • 4. “千里之行、始 于足下”. “Un voyage de milliers de kilomètres commence par un seul pas” - 老子
  • 5. Prêts bancaires Les prêts sont caractérisés par un montant financé, une maturité, un échéancier de remboursement La banque est ici l’intermédiaire entre les emprunteurs et les prêteurs Quels sont les emprunteurs risqués? Quelles variables il faut contrôler chez l’emprunteur avant de lui prêter? Quelles sont les catégories de prêts/d’emprunteurs/de prêteurs?
  • 6. Data Science La data science est la science de traitement des données pour en retirer une information, une structure ou un plan d’action Il existe deux types de données: soit elles sont structurelles soit elles sont non-structurelles L’objectif est d’extraire les relations entre les différentes variables (cf. prêts bancaires) Quelle sont les compétences/connaissances nécessaires ?
  • 7. Les composantes de la Data Science Programmation – gestion de base de données Statistique - Mathématiques Machine Learning Connaissance du domaine Communication – data visualisation
  • 8. L'apprentissage automatique (Machine Learning) estunedisciplinedelaDataSciencequipermet aux systèmes conçus pour réaliser une tâche, d'apprendreetdes'améliorerautomatiquement à partir de l'expérience sans être explicitement programmés Machine Learning Apprentissage Supervisé Régression Classification Apprentissage Non-Supervisé Clustering Réduction de dimension Apprentissage renforcé
  • 9. La valeur ajoutée du data scientist ° Analyse descriptive • Quel est l’état des lieux actuels? • Le statisticien apporte une compréhension quantitative de la base de données avec des techniques simples (moyenne, quantile, distribution empirique) ° Automatisation des reporting • Comment réduire les erreurs dans les rapports reproductibles? ° Analyse predictive • Quel sera la situation dans un horizon de temps donnés? ° Analyse prescriptive • Quel est le meilleur plan d’action à mener?
  • 10. Processus de développement de modèle Collecte des données Calibration du modèle (ou des modèles) EvaluationInterprétation Déploiement 1. Collecte des données: • Identification des sources • Collecte des variables d’intérêt en cohérence avec la problématique • Exploration et nettoyage de la base 2. Calibration du modèle (ou des modèles) • Construction de la base d’apprentissage • Création de nouvelles variables • Sélection des variables • Calcul des paramètres • Sélection du modèle • Définition des indicateurs de performance 3. Evaluation • Construction de la base de test • Estimation de l’erreur de généralisation 4. Interprétation • Compréhension du modèle et des interactions des variables 5. Déploiement • Pour une nouvelle observation, quelle est la prédiction du modèle? • Création d’outils pour permettre utilisation du modèle • Monitoring des performances du modèles en continu
  • 11. Points à retenir UN: Garbage in, Garbage out DEUX: La maîtrise d’un langage de programmation est primordiale TROIS: il faut maîtriser les hypothèses sous-jacentes des modèles QUATRE: Contrôler le sur- apprentissage CINQ: Garder un œil sur l’interprétation du modèle et la cohérence avec le domaine d’activité
  • 12. Incitation à l’action Restez curieux et continuez à lire… • Boot Camp organisé par Bénin Excellence pour l’été 2021