SlideShare une entreprise Scribd logo
1  sur  18
Présenté par :
GNABRO Mathy Aristide
KONAN Kouassi Trésor
Elèves Ingénieurs Statisticiens Economistes 3ème année
A la demande de :
M. Alassane KONE, ISE 2019
Sr Data Scientist, Endeavor Mining
Enseignant de ML Optimization
Février 2024
Union-Discipline-Travail Ecole Nationale Supérieure de
Statistique et d’Economie Appliquée
Ministère du plan et du développement
REPUBLIQUE DE COTE D’IVOIRE
PLAN DE LA PRESENTATION
01
Introduction
02
Importance de GitHub pour
le ML Optimization
03
GitHub pour les Projets
de Machine Learning
04
Cas Pratique
GitHub, fondée en 2008 par Chris Wanstrath, PJ Hyett et Tom Preston-Werner, est une plateforme
majeure de développement collaboratif reposant sur Git, un système de contrôle de version
distribué.
GitHub est très utiliser de nos jours, favorisant la collaboration et l'innovation à grande échelle tout
en préservant son caractère ouvert et communautaire. Son histoire illustre son rôle central dans le
paysage technologique actuel.
Dans le domaine du machine learning optimisé, GitHub joue un rôle crucial en facilitant la
collaboration, la gestion des versions et la transparence des projets. En offrant des fonctionnalités
avancées telles que la gestion des dépôts, le suivi des problèmes et l'intégration continue
1. Introduction
 Facilite le partage et la collaboration sur les projets de machine learning (optimise les ressources)
 Permet le suivi et la gestion des versions des modèles de machine learning
 Favorise la reproductibilité des expériences et la transparence dans le développement des modèles
02. Importance de Git Hub
 Gestion des dépôts : création, clonage, forking
 Suivi des problèmes (issues) : signalement, attribution, suivi
 Gestion des branches : développement parallèle, fusion (merge), résolution des conflits
 Intégration continue (CI) et Déploiement continu (CD) : automatisation des tests, déploiement
 Utilisation des actions GitHub pour automatiser les tâches récurrentes
03. Fonctionnalités clés de GitHub
 Créer un « repository »
C’est un dossier virtuel en ligne ou vous pouvez stocker des fichiers et des dossiers
 Comment faire des « commit »
C’est une confirmation dans un dépôt git
 Comment faire des « push »
"Push" se réfère à l'action d'envoyer les modifications locales d'une branche vers un référentiel distant,
comme un dépôt sur une plateforme d'hébergement comme GitHub, GitLab.
 Comment cloné un projet ?
04. Cas Pratique
$ git init [nom-du-projet]: Crée un dépôt local à partir du nom spécifié
$ git clone [url]: Télécharge un projet et tout son historique de versions
$ git status: Liste tous les nouveaux fichiers et les fichiers modifiés à commiter
$ git add [fichier]: Ajoute un instantané du fichier, en préparation pour le suivi de version
$ git commit -m "[message descriptif]": Enregistre des instantanés de fichiers de façon permanente
dans l'historique des versions
$ git pull Récupère tout l'historique du dépôt nommé et incorpore les modifications
04. Cas Pratique
Montrons comment faire par la pratique
https://github.com/Mathy27/DemoMathyKT/blob/main/TP%20Synth%C3%A8se%20ML%20Avanc%
C3%A9%202024.ipynb
04. Cas Pratique
Pourquoi utiliser Git Hub ?
 Optimiser les ressources lors d’une collaboration sur un projet de machine learning ;
 Permettre le suivi ainsi que la gestion des versions des modèles de machine learning ;
 Favoriser la reproductibilité des expériences et la transparence dans le développement des modèles
CONCLUSION
Pourquoi utiliser Git Hub ?
 Optimiser les ressources lors d’une collaboration sur un projet de machine learning ;
 Permettre le suivi ainsi que la gestion des versions des modèles de machine learning ;
 Favoriser la reproductibilité des expériences et la transparence dans le développement des modèles
CONCLUSION
Merci pour votre attention !
Bibliographie :
- Git Hub ;
- YouTube.
 Avènement d’Internet
 Mouvement open data
Rendre les données officielles
publiques
 Mais, problème de divulgation des données individuelles
 (2006). L’entreprise américaine AOL a publier une base de
donnée contenant :
o 20millions de recherche/650milles utilisateurs/3mois
o La base exclut les informations directement identifiantes
o Elle inclut les liens entre les recherches dâ€
’un utilisateur
o Les journalistes ont identifié F. Thelma Arnold, 62 ans,
habitant Lilburn, Georgie
o Dégat d’image démission des deux responsables
 Nombreuses Juridictions
 1ère conférence (CODASPY) en 2001 :
Loi sur la diffusion Suppression des identifiants directs
 6 -ème conférence (CODASPY) en 2006 :
Loi sur la diffusion Suppression des identifiants directs
et de toutes les informations secondaires dont leur combinaison
Identifie un individu
 Loi sur la protection des donnée de 2013 en Cote d’Ivoire
 Nécessité d’anonymiser les données avant publication
 Enquête sur les filets sociaux en Cote d’Ivoire (2019)
 Allocation monétaire aux ménages fragiles
 Sensibilité des données
 Attention particulière à la protection des données des répondants
 Mettre en œuvres des mesures de protection de ces données
 Enquête sur les filets sociaux en Cote d’Ivoire (2019)
 Allocation monétaire aux ménages fragiles
 Donnée conservées dans une base de donnée
 Risque de divulgation des données personnelles sensibles
 Nécessité de mettre en place une procédure d’anonymisation
 Utilisation de la base par des personnes tiers
 Difficulté de choix d’une procédure d’anonymisation
 Divers et chacune s’adapte à un type d’attaque
 Plusieurs peuvent être combinés pour contrer divers attaques
Quelle est la procédure d’anonymisation adaptée dans le contexte
de l’enquête des filets sociaux ?
 Difficulté de choix d’une procédure d’anonymisation
 Divers et chacune s’adapte à un type d’attaque
 Plusieurs peuvent être combinés pour contrer divers attaques
Quelle est la procédure d’anonymisation adaptée dans le contexte
de l’enquête des filets sociaux ?

Contenu connexe

Similaire à Machine Learning Optimization and Github.pptx

Compte rendu event_icc2010
Compte rendu event_icc2010Compte rendu event_icc2010
Compte rendu event_icc2010Arnaud Ducommun
 
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...M2i Formation
 
Infrastructure Géomatique Ouverte (IGO) au gouvernement du Québec
Infrastructure Géomatique Ouverte (IGO)  au gouvernement du QuébecInfrastructure Géomatique Ouverte (IGO)  au gouvernement du Québec
Infrastructure Géomatique Ouverte (IGO) au gouvernement du Québecigouverte
 
Infrastructure Géomatique Ouverte (IGO) au gouvernement du Québec
Infrastructure Géomatique Ouverte (IGO)  au gouvernement du QuébecInfrastructure Géomatique Ouverte (IGO)  au gouvernement du Québec
Infrastructure Géomatique Ouverte (IGO) au gouvernement du Québecigouverte
 
Démarche de déploiement des solutions 2.0
Démarche de déploiement des solutions 2.0Démarche de déploiement des solutions 2.0
Démarche de déploiement des solutions 2.0Core-Techs
 
Place et impact de l'Open Source sur les 10 tendances IT de 2014
Place et impact de l'Open Source sur les 10 tendances IT de 2014Place et impact de l'Open Source sur les 10 tendances IT de 2014
Place et impact de l'Open Source sur les 10 tendances IT de 2014Michel-Marie Maudet
 
Le Cloud Computing avec Google Apps
Le Cloud Computing avec Google AppsLe Cloud Computing avec Google Apps
Le Cloud Computing avec Google AppsAisne Numérique
 
Gestion de projet avec GitHub
Gestion de projet avec GitHubGestion de projet avec GitHub
Gestion de projet avec GitHubNicolas Bats
 
2010.11.26 - DSI - Comment surfer le Tsunami du Cloud - JF Pietri - Forum Saa...
2010.11.26 - DSI - Comment surfer le Tsunami du Cloud - JF Pietri - Forum Saa...2010.11.26 - DSI - Comment surfer le Tsunami du Cloud - JF Pietri - Forum Saa...
2010.11.26 - DSI - Comment surfer le Tsunami du Cloud - JF Pietri - Forum Saa...Club Alliances
 
meetup devops aix-marseille 27/10/2022
meetup devops aix-marseille 27/10/2022meetup devops aix-marseille 27/10/2022
meetup devops aix-marseille 27/10/2022Frederic Leger
 
#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...
#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...
#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...Paris Open Source Summit
 
Pourquoi le big data open source ?
Pourquoi le big data open source ?Pourquoi le big data open source ?
Pourquoi le big data open source ?Stefane Fermigier
 
1 Systhematic - Data Tuesday 26 fev 2013
1  Systhematic - Data Tuesday 26 fev 20131  Systhematic - Data Tuesday 26 fev 2013
1 Systhematic - Data Tuesday 26 fev 2013Data Tuesday
 
1 fermigierdatatuesdaygtllfev2013-130228083856-phpapp02
1 fermigierdatatuesdaygtllfev2013-130228083856-phpapp021 fermigierdatatuesdaygtllfev2013-130228083856-phpapp02
1 fermigierdatatuesdaygtllfev2013-130228083856-phpapp02gtll_systematic
 
Introduction au Cloud computing
Introduction au Cloud computingIntroduction au Cloud computing
Introduction au Cloud computingPhilippe Scoffoni
 
Livret bleu qualitelogicielle_gt-logiciellibre_systematic
Livret bleu qualitelogicielle_gt-logiciellibre_systematicLivret bleu qualitelogicielle_gt-logiciellibre_systematic
Livret bleu qualitelogicielle_gt-logiciellibre_systematicPascal Flamand
 
VISEO Shake the Microsoft business - comment rapidement batir une solution IoT
VISEO Shake the Microsoft business - comment rapidement batir une solution IoTVISEO Shake the Microsoft business - comment rapidement batir une solution IoT
VISEO Shake the Microsoft business - comment rapidement batir une solution IoTFactoVia
 
Enjeux de la donnee 21 novembre18
Enjeux de la donnee 21 novembre18Enjeux de la donnee 21 novembre18
Enjeux de la donnee 21 novembre18Laetitia Lycke
 

Similaire à Machine Learning Optimization and Github.pptx (20)

Compte rendu event_icc2010
Compte rendu event_icc2010Compte rendu event_icc2010
Compte rendu event_icc2010
 
Webinar cloud connect 2013 26 mars publication
Webinar cloud connect 2013   26 mars publicationWebinar cloud connect 2013   26 mars publication
Webinar cloud connect 2013 26 mars publication
 
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
 
Infrastructure Géomatique Ouverte (IGO) au gouvernement du Québec
Infrastructure Géomatique Ouverte (IGO)  au gouvernement du QuébecInfrastructure Géomatique Ouverte (IGO)  au gouvernement du Québec
Infrastructure Géomatique Ouverte (IGO) au gouvernement du Québec
 
Infrastructure Géomatique Ouverte (IGO) au gouvernement du Québec
Infrastructure Géomatique Ouverte (IGO)  au gouvernement du QuébecInfrastructure Géomatique Ouverte (IGO)  au gouvernement du Québec
Infrastructure Géomatique Ouverte (IGO) au gouvernement du Québec
 
Démarche de déploiement des solutions 2.0
Démarche de déploiement des solutions 2.0Démarche de déploiement des solutions 2.0
Démarche de déploiement des solutions 2.0
 
Place et impact de l'Open Source sur les 10 tendances IT de 2014
Place et impact de l'Open Source sur les 10 tendances IT de 2014Place et impact de l'Open Source sur les 10 tendances IT de 2014
Place et impact de l'Open Source sur les 10 tendances IT de 2014
 
Le Cloud Computing avec Google Apps
Le Cloud Computing avec Google AppsLe Cloud Computing avec Google Apps
Le Cloud Computing avec Google Apps
 
Gestion de projet avec GitHub
Gestion de projet avec GitHubGestion de projet avec GitHub
Gestion de projet avec GitHub
 
2010.11.26 - DSI - Comment surfer le Tsunami du Cloud - JF Pietri - Forum Saa...
2010.11.26 - DSI - Comment surfer le Tsunami du Cloud - JF Pietri - Forum Saa...2010.11.26 - DSI - Comment surfer le Tsunami du Cloud - JF Pietri - Forum Saa...
2010.11.26 - DSI - Comment surfer le Tsunami du Cloud - JF Pietri - Forum Saa...
 
meetup devops aix-marseille 27/10/2022
meetup devops aix-marseille 27/10/2022meetup devops aix-marseille 27/10/2022
meetup devops aix-marseille 27/10/2022
 
#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...
#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...
#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...
 
Pourquoi le big data open source ?
Pourquoi le big data open source ?Pourquoi le big data open source ?
Pourquoi le big data open source ?
 
1 Systhematic - Data Tuesday 26 fev 2013
1  Systhematic - Data Tuesday 26 fev 20131  Systhematic - Data Tuesday 26 fev 2013
1 Systhematic - Data Tuesday 26 fev 2013
 
1 fermigierdatatuesdaygtllfev2013-130228083856-phpapp02
1 fermigierdatatuesdaygtllfev2013-130228083856-phpapp021 fermigierdatatuesdaygtllfev2013-130228083856-phpapp02
1 fermigierdatatuesdaygtllfev2013-130228083856-phpapp02
 
Seminaire Google Apps 02 2010
Seminaire Google Apps 02 2010Seminaire Google Apps 02 2010
Seminaire Google Apps 02 2010
 
Introduction au Cloud computing
Introduction au Cloud computingIntroduction au Cloud computing
Introduction au Cloud computing
 
Livret bleu qualitelogicielle_gt-logiciellibre_systematic
Livret bleu qualitelogicielle_gt-logiciellibre_systematicLivret bleu qualitelogicielle_gt-logiciellibre_systematic
Livret bleu qualitelogicielle_gt-logiciellibre_systematic
 
VISEO Shake the Microsoft business - comment rapidement batir une solution IoT
VISEO Shake the Microsoft business - comment rapidement batir une solution IoTVISEO Shake the Microsoft business - comment rapidement batir une solution IoT
VISEO Shake the Microsoft business - comment rapidement batir une solution IoT
 
Enjeux de la donnee 21 novembre18
Enjeux de la donnee 21 novembre18Enjeux de la donnee 21 novembre18
Enjeux de la donnee 21 novembre18
 

Machine Learning Optimization and Github.pptx

  • 1. Présenté par : GNABRO Mathy Aristide KONAN Kouassi Trésor Elèves Ingénieurs Statisticiens Economistes 3ème année A la demande de : M. Alassane KONE, ISE 2019 Sr Data Scientist, Endeavor Mining Enseignant de ML Optimization Février 2024 Union-Discipline-Travail Ecole Nationale Supérieure de Statistique et d’Economie Appliquée Ministère du plan et du développement REPUBLIQUE DE COTE D’IVOIRE
  • 2. PLAN DE LA PRESENTATION 01 Introduction 02 Importance de GitHub pour le ML Optimization 03 GitHub pour les Projets de Machine Learning 04 Cas Pratique
  • 3. GitHub, fondée en 2008 par Chris Wanstrath, PJ Hyett et Tom Preston-Werner, est une plateforme majeure de développement collaboratif reposant sur Git, un système de contrôle de version distribué. GitHub est très utiliser de nos jours, favorisant la collaboration et l'innovation à grande échelle tout en préservant son caractère ouvert et communautaire. Son histoire illustre son rôle central dans le paysage technologique actuel. Dans le domaine du machine learning optimisé, GitHub joue un rôle crucial en facilitant la collaboration, la gestion des versions et la transparence des projets. En offrant des fonctionnalités avancées telles que la gestion des dépôts, le suivi des problèmes et l'intégration continue 1. Introduction
  • 4.  Facilite le partage et la collaboration sur les projets de machine learning (optimise les ressources)  Permet le suivi et la gestion des versions des modèles de machine learning  Favorise la reproductibilité des expériences et la transparence dans le développement des modèles 02. Importance de Git Hub
  • 5.  Gestion des dépôts : création, clonage, forking  Suivi des problèmes (issues) : signalement, attribution, suivi  Gestion des branches : développement parallèle, fusion (merge), résolution des conflits  Intégration continue (CI) et Déploiement continu (CD) : automatisation des tests, déploiement  Utilisation des actions GitHub pour automatiser les tâches récurrentes 03. Fonctionnalités clés de GitHub
  • 6.  Créer un « repository » C’est un dossier virtuel en ligne ou vous pouvez stocker des fichiers et des dossiers  Comment faire des « commit » C’est une confirmation dans un dépôt git  Comment faire des « push » "Push" se réfère à l'action d'envoyer les modifications locales d'une branche vers un référentiel distant, comme un dépôt sur une plateforme d'hébergement comme GitHub, GitLab.  Comment cloné un projet ? 04. Cas Pratique
  • 7. $ git init [nom-du-projet]: Crée un dépôt local à partir du nom spécifié $ git clone [url]: Télécharge un projet et tout son historique de versions $ git status: Liste tous les nouveaux fichiers et les fichiers modifiés à commiter $ git add [fichier]: Ajoute un instantané du fichier, en préparation pour le suivi de version $ git commit -m "[message descriptif]": Enregistre des instantanés de fichiers de façon permanente dans l'historique des versions $ git pull Récupère tout l'historique du dépôt nommé et incorpore les modifications 04. Cas Pratique
  • 8.
  • 9. Montrons comment faire par la pratique https://github.com/Mathy27/DemoMathyKT/blob/main/TP%20Synth%C3%A8se%20ML%20Avanc% C3%A9%202024.ipynb 04. Cas Pratique
  • 10. Pourquoi utiliser Git Hub ?  Optimiser les ressources lors d’une collaboration sur un projet de machine learning ;  Permettre le suivi ainsi que la gestion des versions des modèles de machine learning ;  Favoriser la reproductibilité des expériences et la transparence dans le développement des modèles CONCLUSION
  • 11. Pourquoi utiliser Git Hub ?  Optimiser les ressources lors d’une collaboration sur un projet de machine learning ;  Permettre le suivi ainsi que la gestion des versions des modèles de machine learning ;  Favoriser la reproductibilité des expériences et la transparence dans le développement des modèles CONCLUSION
  • 12. Merci pour votre attention ! Bibliographie : - Git Hub ; - YouTube.
  • 13.  Avènement d’Internet  Mouvement open data Rendre les données officielles publiques  Mais, problème de divulgation des données individuelles  (2006). L’entreprise américaine AOL a publier une base de donnée contenant : o 20millions de recherche/650milles utilisateurs/3mois o La base exclut les informations directement identifiantes o Elle inclut les liens entre les recherches d†’un utilisateur o Les journalistes ont identifié F. Thelma Arnold, 62 ans, habitant Lilburn, Georgie o Dégat d’image démission des deux responsables
  • 14.  Nombreuses Juridictions  1ère conférence (CODASPY) en 2001 : Loi sur la diffusion Suppression des identifiants directs  6 -ème conférence (CODASPY) en 2006 : Loi sur la diffusion Suppression des identifiants directs et de toutes les informations secondaires dont leur combinaison Identifie un individu  Loi sur la protection des donnée de 2013 en Cote d’Ivoire  Nécessité d’anonymiser les données avant publication
  • 15.  Enquête sur les filets sociaux en Cote d’Ivoire (2019)  Allocation monétaire aux ménages fragiles  Sensibilité des données  Attention particulière à la protection des données des répondants  Mettre en œuvres des mesures de protection de ces données
  • 16.  Enquête sur les filets sociaux en Cote d’Ivoire (2019)  Allocation monétaire aux ménages fragiles  Donnée conservées dans une base de donnée  Risque de divulgation des données personnelles sensibles  Nécessité de mettre en place une procédure d’anonymisation  Utilisation de la base par des personnes tiers
  • 17.  Difficulté de choix d’une procédure d’anonymisation  Divers et chacune s’adapte à un type d’attaque  Plusieurs peuvent être combinés pour contrer divers attaques Quelle est la procédure d’anonymisation adaptée dans le contexte de l’enquête des filets sociaux ?
  • 18.  Difficulté de choix d’une procédure d’anonymisation  Divers et chacune s’adapte à un type d’attaque  Plusieurs peuvent être combinés pour contrer divers attaques Quelle est la procédure d’anonymisation adaptée dans le contexte de l’enquête des filets sociaux ?