SlideShare une entreprise Scribd logo
1  sur  13
Développer
un modèle de
Machine
Learning
Hebert Brian Whannou
05/01/2021
Sommaire
Mon Parcours Prêts bancaires Data science Machine Learning
Valeur ajoutée du
Data scientist
Développement de
modèle
Points à retenir Incitation à l’action A vos agendas!
Brian
° Je suis statisticien spécialisé
en risques financiers
° Je développe des modèles de
machine learning pour des
institutions financières
° J’élabore des
recommendations sur des
modèles déjà développés
Enseignement
secondaire
• Bac C au collège catholique Notre Dame
de Lourdes
• Bourse scolaire de la Fondation Vallet
Enseignement
supérieur
• Classes préparatoires en Mathématiques,
Physique
• ENSAE: école d’ingénieurs spécialisée en
statistiques, économie, programmation
• Université Paris VII: ingénierie financière,
diffusion probabiliste
• Institut des Actuaires
Monparcours
“千里之行、始
于足下”.
“Un voyage de
milliers de
kilomètres
commence par un
seul pas”
- 老子
Prêts bancaires
Les prêts sont caractérisés par un
montant financé, une maturité, un
échéancier de remboursement
La banque est ici l’intermédiaire entre
les emprunteurs et les prêteurs
Quels sont les emprunteurs risqués?
Quelles variables il faut contrôler chez
l’emprunteur avant de lui prêter?
Quelles sont les catégories de
prêts/d’emprunteurs/de prêteurs?
Data Science
La data science est la science de traitement
des données pour en retirer une
information, une structure ou un plan
d’action
Il existe deux types de données: soit elles sont
structurelles soit elles sont non-structurelles
L’objectif est d’extraire les relations entre les
différentes variables (cf. prêts bancaires)
Quelle sont les compétences/connaissances
nécessaires ?
Les composantes
de la Data Science
Programmation –
gestion de base de
données
Statistique -
Mathématiques
Machine Learning Connaissance du
domaine
Communication –
data visualisation
L'apprentissage automatique (Machine Learning)
estunedisciplinedelaDataSciencequipermet
aux systèmes conçus pour réaliser une tâche,
d'apprendreetdes'améliorerautomatiquement
à partir de l'expérience sans être explicitement
programmés
Machine Learning
Apprentissage
Supervisé
Régression
Classification
Apprentissage
Non-Supervisé
Clustering
Réduction de
dimension
Apprentissage
renforcé
La valeur ajoutée du data scientist
° Analyse descriptive
• Quel est l’état des lieux actuels?
• Le statisticien apporte une compréhension quantitative de la base de données avec des techniques simples (moyenne,
quantile, distribution empirique)
° Automatisation des reporting
• Comment réduire les erreurs dans les rapports reproductibles?
° Analyse predictive
• Quel sera la situation dans un horizon de temps donnés?
° Analyse prescriptive
• Quel est le meilleur plan d’action à mener?
Processus de
développement de modèle
Collecte des
données
Calibration du
modèle (ou des
modèles)
EvaluationInterprétation
Déploiement
1. Collecte des données:
• Identification des sources
• Collecte des variables d’intérêt en cohérence avec la problématique
• Exploration et nettoyage de la base
2. Calibration du modèle (ou des modèles)
• Construction de la base d’apprentissage
• Création de nouvelles variables
• Sélection des variables
• Calcul des paramètres
• Sélection du modèle
• Définition des indicateurs de performance
3. Evaluation
• Construction de la base de test
• Estimation de l’erreur de généralisation
4. Interprétation
• Compréhension du modèle et des interactions des variables
5. Déploiement
• Pour une nouvelle observation, quelle est la prédiction du modèle?
• Création d’outils pour permettre utilisation du modèle
• Monitoring des performances du modèles en continu
Points à retenir
UN:
Garbage in, Garbage out
DEUX:
La maîtrise d’un langage de
programmation est
primordiale
TROIS:
il faut maîtriser les
hypothèses sous-jacentes
des modèles
QUATRE:
Contrôler le sur-
apprentissage
CINQ:
Garder un œil sur
l’interprétation du modèle
et la cohérence avec le
domaine d’activité
Incitation à
l’action
Restez curieux et continuez à
lire…
•
Boot Camp organisé par Bénin
Excellence pour l’été 2021
Thank You
LinkedIn
linkedin.com/in/bwhannou/
Email
ml.benin.excellence@outlook.fr
Facebook
facebook.com/BeninExcellence

Contenu connexe

Tendances

Uml : Diagrammes de Cas dutilisation -- Modele preliminaire -- 23
Uml : Diagrammes de Cas dutilisation -- Modele preliminaire -- 23Uml : Diagrammes de Cas dutilisation -- Modele preliminaire -- 23
Uml : Diagrammes de Cas dutilisation -- Modele preliminaire -- 23megaplanet20
 
Présentation soutenance
Présentation soutenancePrésentation soutenance
Présentation soutenanceshurongliu
 
Introduction au datamining, concepts et techniques
Introduction au datamining, concepts et techniquesIntroduction au datamining, concepts et techniques
Introduction au datamining, concepts et techniquesIsmail CHAIB
 
alphorm.com - Formation SQL Server 2012 (70-462)
alphorm.com - Formation SQL Server 2012 (70-462)alphorm.com - Formation SQL Server 2012 (70-462)
alphorm.com - Formation SQL Server 2012 (70-462)Alphorm
 
Systèmes d'Exploitation - chp1-introduction
Systèmes d'Exploitation - chp1-introductionSystèmes d'Exploitation - chp1-introduction
Systèmes d'Exploitation - chp1-introductionLilia Sfaxi
 
IPSO Mgmt Présentation 6 Sigma
IPSO Mgmt Présentation 6 SigmaIPSO Mgmt Présentation 6 Sigma
IPSO Mgmt Présentation 6 SigmaD_Dahmane
 
Chap I : Cours de Modélisation & Simulation des processus
Chap I : Cours de Modélisation & Simulation des processusChap I : Cours de Modélisation & Simulation des processus
Chap I : Cours de Modélisation & Simulation des processusMohammed TAMALI
 
Support du cours : Programmation Web 2
Support du cours : Programmation Web 2Support du cours : Programmation Web 2
Support du cours : Programmation Web 2Faycel Chaoua
 
DataWarehouse
DataWarehouseDataWarehouse
DataWarehousenzuguem
 
Introduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesIntroduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesGiorgio Pauletto
 
Une semaine dans ma peau de Scrum Master
Une semaine dans ma peau de Scrum MasterUne semaine dans ma peau de Scrum Master
Une semaine dans ma peau de Scrum MasterJean-Pierre Lambert
 
Mini projet power bi
Mini projet power bi Mini projet power bi
Mini projet power bi AfnouchAhmed
 
Correction Examen 2016-2017 POO .pdf
Correction Examen 2016-2017 POO .pdfCorrection Examen 2016-2017 POO .pdf
Correction Examen 2016-2017 POO .pdfslimyaich3
 
Gestion des threads
Gestion des threadsGestion des threads
Gestion des threadsSana Aroussi
 
Crédit card Fraud Detection
Crédit card Fraud Detection Crédit card Fraud Detection
Crédit card Fraud Detection OussamaBelarbi2
 

Tendances (20)

Uml : Diagrammes de Cas dutilisation -- Modele preliminaire -- 23
Uml : Diagrammes de Cas dutilisation -- Modele preliminaire -- 23Uml : Diagrammes de Cas dutilisation -- Modele preliminaire -- 23
Uml : Diagrammes de Cas dutilisation -- Modele preliminaire -- 23
 
Présentation soutenance
Présentation soutenancePrésentation soutenance
Présentation soutenance
 
Introduction au datamining, concepts et techniques
Introduction au datamining, concepts et techniquesIntroduction au datamining, concepts et techniques
Introduction au datamining, concepts et techniques
 
Igl cours 3 - introduction à uml
Igl   cours 3 - introduction à umlIgl   cours 3 - introduction à uml
Igl cours 3 - introduction à uml
 
alphorm.com - Formation SQL Server 2012 (70-462)
alphorm.com - Formation SQL Server 2012 (70-462)alphorm.com - Formation SQL Server 2012 (70-462)
alphorm.com - Formation SQL Server 2012 (70-462)
 
Systèmes d'Exploitation - chp1-introduction
Systèmes d'Exploitation - chp1-introductionSystèmes d'Exploitation - chp1-introduction
Systèmes d'Exploitation - chp1-introduction
 
IPSO Mgmt Présentation 6 Sigma
IPSO Mgmt Présentation 6 SigmaIPSO Mgmt Présentation 6 Sigma
IPSO Mgmt Présentation 6 Sigma
 
Chap I : Cours de Modélisation & Simulation des processus
Chap I : Cours de Modélisation & Simulation des processusChap I : Cours de Modélisation & Simulation des processus
Chap I : Cours de Modélisation & Simulation des processus
 
Mise en oeuvre des framework de machines et deep learning v1
Mise en oeuvre des framework de machines et deep learning v1 Mise en oeuvre des framework de machines et deep learning v1
Mise en oeuvre des framework de machines et deep learning v1
 
Support du cours : Programmation Web 2
Support du cours : Programmation Web 2Support du cours : Programmation Web 2
Support du cours : Programmation Web 2
 
DataWarehouse
DataWarehouseDataWarehouse
DataWarehouse
 
(protocoles)
(protocoles)(protocoles)
(protocoles)
 
Introduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesIntroduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes Statistiques
 
Une semaine dans ma peau de Scrum Master
Une semaine dans ma peau de Scrum MasterUne semaine dans ma peau de Scrum Master
Une semaine dans ma peau de Scrum Master
 
Mini projet power bi
Mini projet power bi Mini projet power bi
Mini projet power bi
 
Correction Examen 2016-2017 POO .pdf
Correction Examen 2016-2017 POO .pdfCorrection Examen 2016-2017 POO .pdf
Correction Examen 2016-2017 POO .pdf
 
Cours design pattern m youssfi partie 2 observer
Cours design pattern m youssfi partie 2 observerCours design pattern m youssfi partie 2 observer
Cours design pattern m youssfi partie 2 observer
 
Gestion des threads
Gestion des threadsGestion des threads
Gestion des threads
 
Partie1BI-DW2019
Partie1BI-DW2019Partie1BI-DW2019
Partie1BI-DW2019
 
Crédit card Fraud Detection
Crédit card Fraud Detection Crédit card Fraud Detection
Crédit card Fraud Detection
 

Similaire à développer un modèle de Machine learning

Présentation sur l'expérimentation (bilan intermédiaire au 1er juin 2010) men...
Présentation sur l'expérimentation (bilan intermédiaire au 1er juin 2010) men...Présentation sur l'expérimentation (bilan intermédiaire au 1er juin 2010) men...
Présentation sur l'expérimentation (bilan intermédiaire au 1er juin 2010) men...Morgan Magnin
 
Parkour3- L’importance de la collecte et de l’analyse de données pour votre e...
Parkour3- L’importance de la collecte et de l’analyse de données pour votre e...Parkour3- L’importance de la collecte et de l’analyse de données pour votre e...
Parkour3- L’importance de la collecte et de l’analyse de données pour votre e...Parkour3
 
Un nouvel outil pour l’évaluation des compétences des étudiants : les tests d...
Un nouvel outil pour l’évaluation des compétences des étudiants : les tests d...Un nouvel outil pour l’évaluation des compétences des étudiants : les tests d...
Un nouvel outil pour l’évaluation des compétences des étudiants : les tests d...Morgan Magnin
 
Herve balloux analyses risk and investment
Herve balloux analyses risk and investmentHerve balloux analyses risk and investment
Herve balloux analyses risk and investmentHerveBalloux
 
Socio Data Management présente son outil de simulation prédictive au Printemp...
Socio Data Management présente son outil de simulation prédictive au Printemp...Socio Data Management présente son outil de simulation prédictive au Printemp...
Socio Data Management présente son outil de simulation prédictive au Printemp...Socio Data Management
 
Forêts uniformément aléatoires - Saïp CISS
Forêts uniformément aléatoires - Saïp CISSForêts uniformément aléatoires - Saïp CISS
Forêts uniformément aléatoires - Saïp CISSKezhan SHI
 
EIG Promo 2 - Présentation du défi Signaux Faibles
EIG Promo 2 - Présentation du défi Signaux FaiblesEIG Promo 2 - Présentation du défi Signaux Faibles
EIG Promo 2 - Présentation du défi Signaux FaiblesEtalab
 
La puissance du machine learning et des algorithmes cart au service des métiers
La puissance du machine learning et des algorithmes cart au service des métiersLa puissance du machine learning et des algorithmes cart au service des métiers
La puissance du machine learning et des algorithmes cart au service des métiersMinitab, LLC
 
Benoit Varin TicEthic Brest TIC et DD
Benoit Varin TicEthic Brest TIC et DDBenoit Varin TicEthic Brest TIC et DD
Benoit Varin TicEthic Brest TIC et DDAFEIT
 
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...Web Analytics : L’importance de la collecte et de l’analyse de données pour v...
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...AQT-presentations
 
Herve balloux applied data science
Herve balloux  applied data scienceHerve balloux  applied data science
Herve balloux applied data scienceHerveBalloux
 
Presentation du-dcg salon-etudiant
Presentation du-dcg salon-etudiantPresentation du-dcg salon-etudiant
Presentation du-dcg salon-etudiantEquipeDCG
 
(6 cycle amélqté [récupéré])
(6 cycle amélqté [récupéré])(6 cycle amélqté [récupéré])
(6 cycle amélqté [récupéré])elmahoti
 
Vers une plateforme intelligente pour la prévision des maladies végétales
Vers une plateforme intelligente pour la prévision des maladies végétalesVers une plateforme intelligente pour la prévision des maladies végétales
Vers une plateforme intelligente pour la prévision des maladies végétalesSarra BOUHENNI
 
20140508 cartographie des_modalités_de_mise_en_œuv re (1)
20140508 cartographie des_modalités_de_mise_en_œuv re (1)20140508 cartographie des_modalités_de_mise_en_œuv re (1)
20140508 cartographie des_modalités_de_mise_en_œuv re (1)clac.cab
 
La méthode DMAIC et ses secrets
La méthode DMAIC et ses secretsLa méthode DMAIC et ses secrets
La méthode DMAIC et ses secretsXL Groupe
 
Management des risques
Management des risquesManagement des risques
Management des risquesyounes elhaiba
 
Image et détection des avis exprimés dans le web 2.0
Image et détection des avis exprimés dans le web 2.0Image et détection des avis exprimés dans le web 2.0
Image et détection des avis exprimés dans le web 2.0Aref Jdey
 

Similaire à développer un modèle de Machine learning (20)

Présentation sur l'expérimentation (bilan intermédiaire au 1er juin 2010) men...
Présentation sur l'expérimentation (bilan intermédiaire au 1er juin 2010) men...Présentation sur l'expérimentation (bilan intermédiaire au 1er juin 2010) men...
Présentation sur l'expérimentation (bilan intermédiaire au 1er juin 2010) men...
 
Parkour3- L’importance de la collecte et de l’analyse de données pour votre e...
Parkour3- L’importance de la collecte et de l’analyse de données pour votre e...Parkour3- L’importance de la collecte et de l’analyse de données pour votre e...
Parkour3- L’importance de la collecte et de l’analyse de données pour votre e...
 
Un nouvel outil pour l’évaluation des compétences des étudiants : les tests d...
Un nouvel outil pour l’évaluation des compétences des étudiants : les tests d...Un nouvel outil pour l’évaluation des compétences des étudiants : les tests d...
Un nouvel outil pour l’évaluation des compétences des étudiants : les tests d...
 
Herve balloux analyses risk and investment
Herve balloux analyses risk and investmentHerve balloux analyses risk and investment
Herve balloux analyses risk and investment
 
Socio Data Management présente son outil de simulation prédictive au Printemp...
Socio Data Management présente son outil de simulation prédictive au Printemp...Socio Data Management présente son outil de simulation prédictive au Printemp...
Socio Data Management présente son outil de simulation prédictive au Printemp...
 
Forêts uniformément aléatoires - Saïp CISS
Forêts uniformément aléatoires - Saïp CISSForêts uniformément aléatoires - Saïp CISS
Forêts uniformément aléatoires - Saïp CISS
 
A11-Comment manager ma destination numérique
A11-Comment manager ma destination numériqueA11-Comment manager ma destination numérique
A11-Comment manager ma destination numérique
 
EIG Promo 2 - Présentation du défi Signaux Faibles
EIG Promo 2 - Présentation du défi Signaux FaiblesEIG Promo 2 - Présentation du défi Signaux Faibles
EIG Promo 2 - Présentation du défi Signaux Faibles
 
La puissance du machine learning et des algorithmes cart au service des métiers
La puissance du machine learning et des algorithmes cart au service des métiersLa puissance du machine learning et des algorithmes cart au service des métiers
La puissance du machine learning et des algorithmes cart au service des métiers
 
Benoit Varin TicEthic Brest TIC et DD
Benoit Varin TicEthic Brest TIC et DDBenoit Varin TicEthic Brest TIC et DD
Benoit Varin TicEthic Brest TIC et DD
 
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...Web Analytics : L’importance de la collecte et de l’analyse de données pour v...
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...
 
Herve balloux applied data science
Herve balloux  applied data scienceHerve balloux  applied data science
Herve balloux applied data science
 
Presentation du-dcg salon-etudiant
Presentation du-dcg salon-etudiantPresentation du-dcg salon-etudiant
Presentation du-dcg salon-etudiant
 
(6 cycle amélqté [récupéré])
(6 cycle amélqté [récupéré])(6 cycle amélqté [récupéré])
(6 cycle amélqté [récupéré])
 
Vers une plateforme intelligente pour la prévision des maladies végétales
Vers une plateforme intelligente pour la prévision des maladies végétalesVers une plateforme intelligente pour la prévision des maladies végétales
Vers une plateforme intelligente pour la prévision des maladies végétales
 
20140508 cartographie des_modalités_de_mise_en_œuv re (1)
20140508 cartographie des_modalités_de_mise_en_œuv re (1)20140508 cartographie des_modalités_de_mise_en_œuv re (1)
20140508 cartographie des_modalités_de_mise_en_œuv re (1)
 
Webinaire du CCNMO: Méthodes et outils axés sur la prévention des blessures p...
Webinaire du CCNMO: Méthodes et outils axés sur la prévention des blessures p...Webinaire du CCNMO: Méthodes et outils axés sur la prévention des blessures p...
Webinaire du CCNMO: Méthodes et outils axés sur la prévention des blessures p...
 
La méthode DMAIC et ses secrets
La méthode DMAIC et ses secretsLa méthode DMAIC et ses secrets
La méthode DMAIC et ses secrets
 
Management des risques
Management des risquesManagement des risques
Management des risques
 
Image et détection des avis exprimés dans le web 2.0
Image et détection des avis exprimés dans le web 2.0Image et détection des avis exprimés dans le web 2.0
Image et détection des avis exprimés dans le web 2.0
 

Dernier

SciencesPo_Aix_InnovationPédagogique_Atelier_APC.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_APC.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_APC.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_APC.pdfSKennel
 
JTC 2024 - Réglementation européenne BEA et Transport.pdf
JTC 2024 - Réglementation européenne BEA et Transport.pdfJTC 2024 - Réglementation européenne BEA et Transport.pdf
JTC 2024 - Réglementation européenne BEA et Transport.pdfInstitut de l'Elevage - Idele
 
JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...
JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...
JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...Institut de l'Elevage - Idele
 
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdf
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdfJTC 2024 - SMARTER Retour sur les indicateurs de santé .pdf
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdfInstitut de l'Elevage - Idele
 
Cours-de-Ponts Cours de Ponts Principes généraux - Conception Méthodes de con...
Cours-de-Ponts Cours de Ponts Principes généraux - Conception Méthodes de con...Cours-de-Ponts Cours de Ponts Principes généraux - Conception Méthodes de con...
Cours-de-Ponts Cours de Ponts Principes généraux - Conception Méthodes de con...maach1
 
Algo II : les piles ( cours + exercices)
Algo II :  les piles ( cours + exercices)Algo II :  les piles ( cours + exercices)
Algo II : les piles ( cours + exercices)Sana REFAI
 
présentation sur la logistique (4).
présentation     sur la  logistique (4).présentation     sur la  logistique (4).
présentation sur la logistique (4).FatimaEzzahra753100
 
JTC 2024 La relance de la filière de la viande de chevreau.pdf
JTC 2024 La relance de la filière de la viande de chevreau.pdfJTC 2024 La relance de la filière de la viande de chevreau.pdf
JTC 2024 La relance de la filière de la viande de chevreau.pdfInstitut de l'Elevage - Idele
 
Câblage, installation et paramétrage d’un réseau informatique.pdf
Câblage, installation et paramétrage d’un réseau informatique.pdfCâblage, installation et paramétrage d’un réseau informatique.pdf
Câblage, installation et paramétrage d’un réseau informatique.pdfmia884611
 

Dernier (11)

SciencesPo_Aix_InnovationPédagogique_Atelier_APC.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_APC.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_APC.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_APC.pdf
 
JTC 2024 - DeCremoux_Anomalies_génétiques.pdf
JTC 2024 - DeCremoux_Anomalies_génétiques.pdfJTC 2024 - DeCremoux_Anomalies_génétiques.pdf
JTC 2024 - DeCremoux_Anomalies_génétiques.pdf
 
CAP2ER_GC_Presentation_Outil_20240422.pptx
CAP2ER_GC_Presentation_Outil_20240422.pptxCAP2ER_GC_Presentation_Outil_20240422.pptx
CAP2ER_GC_Presentation_Outil_20240422.pptx
 
JTC 2024 - Réglementation européenne BEA et Transport.pdf
JTC 2024 - Réglementation européenne BEA et Transport.pdfJTC 2024 - Réglementation européenne BEA et Transport.pdf
JTC 2024 - Réglementation européenne BEA et Transport.pdf
 
JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...
JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...
JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...
 
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdf
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdfJTC 2024 - SMARTER Retour sur les indicateurs de santé .pdf
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdf
 
Cours-de-Ponts Cours de Ponts Principes généraux - Conception Méthodes de con...
Cours-de-Ponts Cours de Ponts Principes généraux - Conception Méthodes de con...Cours-de-Ponts Cours de Ponts Principes généraux - Conception Méthodes de con...
Cours-de-Ponts Cours de Ponts Principes généraux - Conception Méthodes de con...
 
Algo II : les piles ( cours + exercices)
Algo II :  les piles ( cours + exercices)Algo II :  les piles ( cours + exercices)
Algo II : les piles ( cours + exercices)
 
présentation sur la logistique (4).
présentation     sur la  logistique (4).présentation     sur la  logistique (4).
présentation sur la logistique (4).
 
JTC 2024 La relance de la filière de la viande de chevreau.pdf
JTC 2024 La relance de la filière de la viande de chevreau.pdfJTC 2024 La relance de la filière de la viande de chevreau.pdf
JTC 2024 La relance de la filière de la viande de chevreau.pdf
 
Câblage, installation et paramétrage d’un réseau informatique.pdf
Câblage, installation et paramétrage d’un réseau informatique.pdfCâblage, installation et paramétrage d’un réseau informatique.pdf
Câblage, installation et paramétrage d’un réseau informatique.pdf
 

développer un modèle de Machine learning

  • 2. Sommaire Mon Parcours Prêts bancaires Data science Machine Learning Valeur ajoutée du Data scientist Développement de modèle Points à retenir Incitation à l’action A vos agendas!
  • 3. Brian ° Je suis statisticien spécialisé en risques financiers ° Je développe des modèles de machine learning pour des institutions financières ° J’élabore des recommendations sur des modèles déjà développés Enseignement secondaire • Bac C au collège catholique Notre Dame de Lourdes • Bourse scolaire de la Fondation Vallet Enseignement supérieur • Classes préparatoires en Mathématiques, Physique • ENSAE: école d’ingénieurs spécialisée en statistiques, économie, programmation • Université Paris VII: ingénierie financière, diffusion probabiliste • Institut des Actuaires Monparcours
  • 4. “千里之行、始 于足下”. “Un voyage de milliers de kilomètres commence par un seul pas” - 老子
  • 5. Prêts bancaires Les prêts sont caractérisés par un montant financé, une maturité, un échéancier de remboursement La banque est ici l’intermédiaire entre les emprunteurs et les prêteurs Quels sont les emprunteurs risqués? Quelles variables il faut contrôler chez l’emprunteur avant de lui prêter? Quelles sont les catégories de prêts/d’emprunteurs/de prêteurs?
  • 6. Data Science La data science est la science de traitement des données pour en retirer une information, une structure ou un plan d’action Il existe deux types de données: soit elles sont structurelles soit elles sont non-structurelles L’objectif est d’extraire les relations entre les différentes variables (cf. prêts bancaires) Quelle sont les compétences/connaissances nécessaires ?
  • 7. Les composantes de la Data Science Programmation – gestion de base de données Statistique - Mathématiques Machine Learning Connaissance du domaine Communication – data visualisation
  • 8. L'apprentissage automatique (Machine Learning) estunedisciplinedelaDataSciencequipermet aux systèmes conçus pour réaliser une tâche, d'apprendreetdes'améliorerautomatiquement à partir de l'expérience sans être explicitement programmés Machine Learning Apprentissage Supervisé Régression Classification Apprentissage Non-Supervisé Clustering Réduction de dimension Apprentissage renforcé
  • 9. La valeur ajoutée du data scientist ° Analyse descriptive • Quel est l’état des lieux actuels? • Le statisticien apporte une compréhension quantitative de la base de données avec des techniques simples (moyenne, quantile, distribution empirique) ° Automatisation des reporting • Comment réduire les erreurs dans les rapports reproductibles? ° Analyse predictive • Quel sera la situation dans un horizon de temps donnés? ° Analyse prescriptive • Quel est le meilleur plan d’action à mener?
  • 10. Processus de développement de modèle Collecte des données Calibration du modèle (ou des modèles) EvaluationInterprétation Déploiement 1. Collecte des données: • Identification des sources • Collecte des variables d’intérêt en cohérence avec la problématique • Exploration et nettoyage de la base 2. Calibration du modèle (ou des modèles) • Construction de la base d’apprentissage • Création de nouvelles variables • Sélection des variables • Calcul des paramètres • Sélection du modèle • Définition des indicateurs de performance 3. Evaluation • Construction de la base de test • Estimation de l’erreur de généralisation 4. Interprétation • Compréhension du modèle et des interactions des variables 5. Déploiement • Pour une nouvelle observation, quelle est la prédiction du modèle? • Création d’outils pour permettre utilisation du modèle • Monitoring des performances du modèles en continu
  • 11. Points à retenir UN: Garbage in, Garbage out DEUX: La maîtrise d’un langage de programmation est primordiale TROIS: il faut maîtriser les hypothèses sous-jacentes des modèles QUATRE: Contrôler le sur- apprentissage CINQ: Garder un œil sur l’interprétation du modèle et la cohérence avec le domaine d’activité
  • 12. Incitation à l’action Restez curieux et continuez à lire… • Boot Camp organisé par Bénin Excellence pour l’été 2021