SlideShare une entreprise Scribd logo
1  sur  32
Télécharger pour lire hors ligne
Data Science
Bootcamp
Démarrez votre carrière dans
la Data
Notre Speaker
—
Nicolas Garcia
Data Scientist
Sommaire
Mon Parcours :
•Scolaire
•Pro
•Projets scolaire
•Projets pro
La Data Science :
•Définition comme intersection
de domaines
•Formation continue - R&D
•Mode projet
Les compétences :
•Depuis la définition
•Vers les contextes réels
Mon parcours
Parcours scolaire
Prépa École d’ingé
Lycée Montaigne /
Université de Bordeaux
ENSIIE d’Évry – associée
à Mines-Télécom / Paris
Saclay (Master IMSD)
• Maths théoriques
• Sciences expérimentales
• Philo
Modélisation
Déterminisme / Probabilisme
• Informatique
• Maths appliquées
• Monde professionnel
Outils
Utilité – Mode projet
Parcours pro
CEVIPOF de SciencesPo SFR LeKiosk
• La Recherche
• Données socio-économiques
• Marketing électoral
• R
• L’Entreprise
• Data Analyse Marketing
• SQL, R
• La Start-Up
• Data Science
• Python, SQL
• Plus de prédictif
Parcours pro
CEVIPOF de SciencesPo SFR LeKiosk
• La Recherche
• Données socio-économiques
• Marketing électoral
• R
• L’Entreprise
• Data Analyse Marketing
• SQL, R
• La Start-Up
• Data Science
• Python, SQL
• Plus de prédictif
Collaboration
Autonomie
Encadrement
CEVIPOF
SFR
LeKiosk
Les projets scolaires
Modélisation non-supervisée : Web Scraping de données
économiques de pays, classification et mapping du
développement en 3D (Analyse en Composantes Principales, Classification
Ascendante Hiérarchique, K-Means, Gaussian Mixtures)
Modélisation supervisée : Études des résultats d’une étude
sociologique de speed dating. Sélection des variables. Développement
de modèles de prédiction du match entre deux participants. Validation
croisée avec observations par paires (x rencontre y, y rencontre x).
Optimisation de paramètres. Mise à l’épreuve de modèles linéaires :
Classifieur naïf bayésien, Analyse discriminante, Machines à vecteurs support.
Modèles non-linéaires : Arbres de décision, Réseaux de Neurones.
Scoring : Octroi de crédit pour une banque d’investissement.
Imputation de valeurs manquantes, mise en classe de variables continues,
AIC/BIC, Ridge/Lasso, odd ratio, tableau de scores.
Les projets scolaires
Inconvénients :
Données déjà rassemblées ou manipulées, Hors contexte métier ...
Avantages :
Open Data, Jouer avec les notions, Tester les performances
machines, Analyser/Coder/Synthétiser …
Projets actuels chez LeKiosk
NLP : Extraction automatisé de mots-clés à partir d’articles, création de data pour applications produit
Marketing : Calcul et prévision de KPI (Durée de vie) / Segmentation / Personnalisation
Automatisation de la chaîne de production : Découpe de magazine en lecture smart
Détection de fraude : Patterns d’inscription et de consommation des fraudeurs
La Data Science
Domaines
d’apprentissage
Machine Learning
Data
Science
Computer Science / IT
Machine Learning
Data
Science
Data Engineering
Domaines
d’apprentissage
Computer Science / IT
Machine Learning
Data communication,
Domain/Business knowledge
Data
Science
Data Analysis /
Recherche
Traditionnelle
Software
Development
Data Engineering
Domaines
d’apprentissage
Programmation système – objet,
API,
Web (Scraping),
Cloud computing
…
Algèbre Multilinéaire, Optimisation linéaire
et combinatoire, Recherche opérationnelle
…
Apprentissage du champ d’application,
Documentation,
Datavizualisation,
Présentations powerpoint
Data
Science
Data Analysis /
Recherche
Traditionnelle
Software
Development
Data Engineering
Domaines
d’apprentissage
Formation continue - R&D
Tutos PapersCoursVeille
Medium, Data Elixir, Data Science Weekly, MIT
Tech Review, O’Reilly …
MOOCs (Edx, Data Camp…)
Livres
Challenges
Bootcamps
Portfolio Publications
GitHub Blogs, Revues…
Méthodologie – Mode projet
CRISP-DM : Cross Industry
Standard Process for Data Mining
Confronter,
Documenter
Mise en
production
Besoins,
Règles
Hypothèses,
Plan, Sources
Analyse, feature
engineering
Modélisation
Itérer
Interprétabilité
Complexité
1D
2D
3D
Une règle générale en Machine Learning
Les compétences
Les compétences
et appétences
du DS
Machine Learning
Rigueur
Scientifique
Analyse/
Synthèse
Bon sensExpérimentation
Technologie
Les compétences
et appétences
du DS
Computer Science /
IT
Machine Learning
Rigueur
Scientifique
Bon sensExpérimentation
Technologie
Agilité,
Réactivité
Conception
Production
Analyse/
Synthèse
Les compétences
et appétences
du DS
Computer Science /
IT
Machine Learning
Data
communication,
Domain/Business
knowledge
Rigueur
Scientifique
Bon sensExpérimentation
Technologie
Vulgarisation
Communication,
Relationnel
Agilité,
Réactivité
Conception
Production
Analyse/
Synthèse
Les compétences
et appétences
du DS
Computer Science /
IT
Machine Learning
Data
communication,
Domain/Business
knowledge
Rigueur
Scientifique
Bon sensExpérimentation
Technologie
Vulgarisation
Communication,
Relationnel
Agilité,
Réactivité
Formation continue
- R&D
Méthodologie -
Gestion de projet
Conception
Production
Analyse/
Synthèse
Les compétences
et appétences
du DS
Computer Science /
IT
Machine Learning
Data
communication,
Domain/Business
knowledge
Rigueur
Scientifique
Bon sensExpérimentation
Technologie
Conception
Vulgarisation
Communication,
Relationnel
Agilité,
Réactivité
Opérationnel Fonctionnel
Production
Analyse/
Synthèse
Pour résumer …
Computer Science / IT
Machine Learning
Data communication,
Domain/Business
knowledge
Rigueur
Scientifique
Bon sensExpérimentation
Technologie
Conception
Vulgarisation
Communication,
Relationnel
Agilité,
Réactivité
Opérationnel
Fonctionnel
Production
Analyse/
Synthèse
Méthodologie -
Gestion de projet
Formation
continue- R&D
… Mais ça ouvre le
champ des possibles
d’un point de vu pro
et perso
Merci !
Merci !
Nos Prochains Événements
13 MARS
—
WORKSHOP
3 Avril
—
CONFÉRENCE
Nos Prochaines Sessions
—
40 HEURES
5 Mars - 25 Avril
Mardis & Jeudis
18h30 - 21h
Semaine
—
9 Mars - 27 Avril
Samedis
9h30 - 15h30
Weekend
—
1 Avril - 12 Avril
Lundi au Vendredi
9h30 - 15h30
Intensive
—
Nos Prochaines Sessions
—
FULLSTACK : DEVENEZ DATA SCIENTIST
4 Mars - 28 Septembre
Lundi 18h30 - 21h
Samedi 9h30 -15h30
TEMPS PARTIEL
—
25 Février - 17 Mai
Lundi au Vendredi
9h30 à 15h30
TEMPS COMPLET
—
Data Science
Bootcamp
Merci ! A la prochaine :)

Contenu connexe

Similaire à Comment devenir Data Scientist - Nicolas Garcia, Data Scientist @ Le Kiosk

IA C'EST MON DADA : Conference introduction machine learning et IA
IA C'EST MON DADA : Conference introduction machine learning et IAIA C'EST MON DADA : Conference introduction machine learning et IA
IA C'EST MON DADA : Conference introduction machine learning et IAHalszka de Breza
 
Intelligence artificielle et réalité mixte pour les établissements scolaires
Intelligence artificielle et réalité mixte pour les établissements scolaires Intelligence artificielle et réalité mixte pour les établissements scolaires
Intelligence artificielle et réalité mixte pour les établissements scolaires Clara Feuillet
 
Parcours de formations DATA ACADEMY
Parcours de formations DATA ACADEMYParcours de formations DATA ACADEMY
Parcours de formations DATA ACADEMYTechnofutur TIC
 
Oxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataOxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataLudovic Piot
 
Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013ADBS
 
HDe services and skills
HDe services and skillsHDe services and skills
HDe services and skillshdeducation
 
EXTRA-Présentation generale 180923.pptx
EXTRA-Présentation generale 180923.pptxEXTRA-Présentation generale 180923.pptx
EXTRA-Présentation generale 180923.pptxInfopole1
 
La datascience comme outil de valorisation de la donnée
La datascience comme outil de valorisation de la donnéeLa datascience comme outil de valorisation de la donnée
La datascience comme outil de valorisation de la donnéeSEBASTIEN QUINAULT
 
Cours intro ia_2015_2016
Cours intro ia_2015_2016Cours intro ia_2015_2016
Cours intro ia_2015_2016Serge Garlatti
 
Projet sur les carrières informatiques
Projet sur les carrières informatiquesProjet sur les carrières informatiques
Projet sur les carrières informatiquesvicdem
 
Déjeuner-débat EIM360 | Machine Learning et Transformation Digitale, un duo g...
Déjeuner-débat EIM360 | Machine Learning et Transformation Digitale, un duo g...Déjeuner-débat EIM360 | Machine Learning et Transformation Digitale, un duo g...
Déjeuner-débat EIM360 | Machine Learning et Transformation Digitale, un duo g...SOLLAN FRANCE
 
Analytics & Machine Learning avec la Data Virtualization
Analytics & Machine Learning avec la Data VirtualizationAnalytics & Machine Learning avec la Data Virtualization
Analytics & Machine Learning avec la Data VirtualizationDenodo
 
Présentation synthétique DUT 2015-2016
Présentation synthétique DUT 2015-2016Présentation synthétique DUT 2015-2016
Présentation synthétique DUT 2015-2016Riwal Le Faou
 
Présentation synthétique DUT 2016-2017
Présentation synthétique DUT 2016-2017Présentation synthétique DUT 2016-2017
Présentation synthétique DUT 2016-2017Maxime Poriel
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel businessMouhsine LAKHDISSI
 
#Fiche Produit : Diagnostic & Feuille de Route (Big) Data Marketing !
#Fiche Produit : Diagnostic & Feuille de Route (Big) Data Marketing !#Fiche Produit : Diagnostic & Feuille de Route (Big) Data Marketing !
#Fiche Produit : Diagnostic & Feuille de Route (Big) Data Marketing !Camp de Bases (Webedia Data Services)
 
Projet carrières-Aissata.Bâ
Projet carrières-Aissata.BâProjet carrières-Aissata.Bâ
Projet carrières-Aissata.Bâaissataba
 
Les métiers d’avenir de l’industrie
Les métiers d’avenir de l’industrieLes métiers d’avenir de l’industrie
Les métiers d’avenir de l’industrieDataPerformanceSummit
 

Similaire à Comment devenir Data Scientist - Nicolas Garcia, Data Scientist @ Le Kiosk (20)

IA C'EST MON DADA : Conference introduction machine learning et IA
IA C'EST MON DADA : Conference introduction machine learning et IAIA C'EST MON DADA : Conference introduction machine learning et IA
IA C'EST MON DADA : Conference introduction machine learning et IA
 
Intelligence artificielle et réalité mixte pour les établissements scolaires
Intelligence artificielle et réalité mixte pour les établissements scolaires Intelligence artificielle et réalité mixte pour les établissements scolaires
Intelligence artificielle et réalité mixte pour les établissements scolaires
 
Parcours de formations DATA ACADEMY
Parcours de formations DATA ACADEMYParcours de formations DATA ACADEMY
Parcours de formations DATA ACADEMY
 
Oxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataOxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigData
 
Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013
 
HDe services and skills
HDe services and skillsHDe services and skills
HDe services and skills
 
EXTRA-Présentation generale 180923.pptx
EXTRA-Présentation generale 180923.pptxEXTRA-Présentation generale 180923.pptx
EXTRA-Présentation generale 180923.pptx
 
La datascience comme outil de valorisation de la donnée
La datascience comme outil de valorisation de la donnéeLa datascience comme outil de valorisation de la donnée
La datascience comme outil de valorisation de la donnée
 
Cours intro ia_2015_2016
Cours intro ia_2015_2016Cours intro ia_2015_2016
Cours intro ia_2015_2016
 
Projet sur les carrières informatiques
Projet sur les carrières informatiquesProjet sur les carrières informatiques
Projet sur les carrières informatiques
 
Déjeuner-débat EIM360 | Machine Learning et Transformation Digitale, un duo g...
Déjeuner-débat EIM360 | Machine Learning et Transformation Digitale, un duo g...Déjeuner-débat EIM360 | Machine Learning et Transformation Digitale, un duo g...
Déjeuner-débat EIM360 | Machine Learning et Transformation Digitale, un duo g...
 
Analytics & Machine Learning avec la Data Virtualization
Analytics & Machine Learning avec la Data VirtualizationAnalytics & Machine Learning avec la Data Virtualization
Analytics & Machine Learning avec la Data Virtualization
 
Présentation synthétique DUT 2015-2016
Présentation synthétique DUT 2015-2016Présentation synthétique DUT 2015-2016
Présentation synthétique DUT 2015-2016
 
Présentation synthétique DUT 2016-2017
Présentation synthétique DUT 2016-2017Présentation synthétique DUT 2016-2017
Présentation synthétique DUT 2016-2017
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel business
 
#Fiche Produit : Diagnostic & Feuille de Route (Big) Data Marketing !
#Fiche Produit : Diagnostic & Feuille de Route (Big) Data Marketing !#Fiche Produit : Diagnostic & Feuille de Route (Big) Data Marketing !
#Fiche Produit : Diagnostic & Feuille de Route (Big) Data Marketing !
 
Projet carrières-Aissata.Bâ
Projet carrières-Aissata.BâProjet carrières-Aissata.Bâ
Projet carrières-Aissata.Bâ
 
Plaquette mastère sciences des données
Plaquette mastère sciences des donnéesPlaquette mastère sciences des données
Plaquette mastère sciences des données
 
Plaquette mastère sciences des données
Plaquette mastère sciences des donnéesPlaquette mastère sciences des données
Plaquette mastère sciences des données
 
Les métiers d’avenir de l’industrie
Les métiers d’avenir de l’industrieLes métiers d’avenir de l’industrie
Les métiers d’avenir de l’industrie
 

Plus de Jedha Bootcamp

DataScientist Job : Between Myths and Reality.pdf
DataScientist Job : Between Myths and Reality.pdfDataScientist Job : Between Myths and Reality.pdf
DataScientist Job : Between Myths and Reality.pdfJedha Bootcamp
 
L'IA face à l'épreuve du covid-19 - Jedha x Kardinal
L'IA face à l'épreuve du covid-19 - Jedha x KardinalL'IA face à l'épreuve du covid-19 - Jedha x Kardinal
L'IA face à l'épreuve du covid-19 - Jedha x KardinalJedha Bootcamp
 
Générer une image à partir d'un texte - Fullstack Paris #5
Générer une image à partir d'un texte - Fullstack Paris #5Générer une image à partir d'un texte - Fullstack Paris #5
Générer une image à partir d'un texte - Fullstack Paris #5Jedha Bootcamp
 
Recommander des films - Andreea - Fullstack Lyon #1
Recommander des films - Andreea - Fullstack Lyon #1Recommander des films - Andreea - Fullstack Lyon #1
Recommander des films - Andreea - Fullstack Lyon #1Jedha Bootcamp
 
Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1
Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1
Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1Jedha Bootcamp
 
Construction d'une voiture autonome - Adrien Dodinet, alumni Fullstack
Construction d'une voiture autonome - Adrien Dodinet, alumni FullstackConstruction d'une voiture autonome - Adrien Dodinet, alumni Fullstack
Construction d'une voiture autonome - Adrien Dodinet, alumni FullstackJedha Bootcamp
 
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...Jedha Bootcamp
 
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De ForzanzEstimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De ForzanzJedha Bootcamp
 
Trouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli
Trouver des offres d'emploi grâce au traitement de texte - Mohamed ZebliTrouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli
Trouver des offres d'emploi grâce au traitement de texte - Mohamed ZebliJedha Bootcamp
 
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed ZebliOptimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed ZebliJedha Bootcamp
 
Reconnaître du mobilier design sur une photographie - Emmanuelle Guyot
Reconnaître du mobilier design sur une photographie - Emmanuelle GuyotReconnaître du mobilier design sur une photographie - Emmanuelle Guyot
Reconnaître du mobilier design sur une photographie - Emmanuelle GuyotJedha Bootcamp
 
Estimer le prix de bijou lors d'une vente aux enchères - Katie Ross
Estimer le prix de bijou lors d'une vente aux enchères - Katie RossEstimer le prix de bijou lors d'une vente aux enchères - Katie Ross
Estimer le prix de bijou lors d'une vente aux enchères - Katie RossJedha Bootcamp
 
Workshop Data Visualisation - Jedha Paris
Workshop Data Visualisation - Jedha ParisWorkshop Data Visualisation - Jedha Paris
Workshop Data Visualisation - Jedha ParisJedha Bootcamp
 
Les applications du Deep Learning - Jedha Lyon
Les applications du Deep Learning - Jedha LyonLes applications du Deep Learning - Jedha Lyon
Les applications du Deep Learning - Jedha LyonJedha Bootcamp
 
Optimiser ses publicités grâce à la Data Science
Optimiser ses publicités grâce à la Data ScienceOptimiser ses publicités grâce à la Data Science
Optimiser ses publicités grâce à la Data ScienceJedha Bootcamp
 
Connaître son audience grâce à la Data - Parisa MAjlessi
Connaître son audience grâce à la Data - Parisa MAjlessiConnaître son audience grâce à la Data - Parisa MAjlessi
Connaître son audience grâce à la Data - Parisa MAjlessiJedha Bootcamp
 
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...Jedha Bootcamp
 
Automatiser la classification d'un jeu vidéo
Automatiser la classification d'un jeu vidéoAutomatiser la classification d'un jeu vidéo
Automatiser la classification d'un jeu vidéoJedha Bootcamp
 
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...Jedha Bootcamp
 

Plus de Jedha Bootcamp (20)

DataScientist Job : Between Myths and Reality.pdf
DataScientist Job : Between Myths and Reality.pdfDataScientist Job : Between Myths and Reality.pdf
DataScientist Job : Between Myths and Reality.pdf
 
L'IA face à l'épreuve du covid-19 - Jedha x Kardinal
L'IA face à l'épreuve du covid-19 - Jedha x KardinalL'IA face à l'épreuve du covid-19 - Jedha x Kardinal
L'IA face à l'épreuve du covid-19 - Jedha x Kardinal
 
Générer une image à partir d'un texte - Fullstack Paris #5
Générer une image à partir d'un texte - Fullstack Paris #5Générer une image à partir d'un texte - Fullstack Paris #5
Générer une image à partir d'un texte - Fullstack Paris #5
 
Recommander des films - Andreea - Fullstack Lyon #1
Recommander des films - Andreea - Fullstack Lyon #1Recommander des films - Andreea - Fullstack Lyon #1
Recommander des films - Andreea - Fullstack Lyon #1
 
Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1
Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1
Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1
 
Construction d'une voiture autonome - Adrien Dodinet, alumni Fullstack
Construction d'une voiture autonome - Adrien Dodinet, alumni FullstackConstruction d'une voiture autonome - Adrien Dodinet, alumni Fullstack
Construction d'une voiture autonome - Adrien Dodinet, alumni Fullstack
 
Slide portes ouvertes
Slide portes ouvertesSlide portes ouvertes
Slide portes ouvertes
 
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...
 
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De ForzanzEstimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
 
Trouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli
Trouver des offres d'emploi grâce au traitement de texte - Mohamed ZebliTrouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli
Trouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli
 
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed ZebliOptimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli
 
Reconnaître du mobilier design sur une photographie - Emmanuelle Guyot
Reconnaître du mobilier design sur une photographie - Emmanuelle GuyotReconnaître du mobilier design sur une photographie - Emmanuelle Guyot
Reconnaître du mobilier design sur une photographie - Emmanuelle Guyot
 
Estimer le prix de bijou lors d'une vente aux enchères - Katie Ross
Estimer le prix de bijou lors d'une vente aux enchères - Katie RossEstimer le prix de bijou lors d'une vente aux enchères - Katie Ross
Estimer le prix de bijou lors d'une vente aux enchères - Katie Ross
 
Workshop Data Visualisation - Jedha Paris
Workshop Data Visualisation - Jedha ParisWorkshop Data Visualisation - Jedha Paris
Workshop Data Visualisation - Jedha Paris
 
Les applications du Deep Learning - Jedha Lyon
Les applications du Deep Learning - Jedha LyonLes applications du Deep Learning - Jedha Lyon
Les applications du Deep Learning - Jedha Lyon
 
Optimiser ses publicités grâce à la Data Science
Optimiser ses publicités grâce à la Data ScienceOptimiser ses publicités grâce à la Data Science
Optimiser ses publicités grâce à la Data Science
 
Connaître son audience grâce à la Data - Parisa MAjlessi
Connaître son audience grâce à la Data - Parisa MAjlessiConnaître son audience grâce à la Data - Parisa MAjlessi
Connaître son audience grâce à la Data - Parisa MAjlessi
 
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
 
Automatiser la classification d'un jeu vidéo
Automatiser la classification d'un jeu vidéoAutomatiser la classification d'un jeu vidéo
Automatiser la classification d'un jeu vidéo
 
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
 

Comment devenir Data Scientist - Nicolas Garcia, Data Scientist @ Le Kiosk

  • 1. Data Science Bootcamp Démarrez votre carrière dans la Data
  • 3. Sommaire Mon Parcours : •Scolaire •Pro •Projets scolaire •Projets pro La Data Science : •Définition comme intersection de domaines •Formation continue - R&D •Mode projet Les compétences : •Depuis la définition •Vers les contextes réels
  • 5. Parcours scolaire Prépa École d’ingé Lycée Montaigne / Université de Bordeaux ENSIIE d’Évry – associée à Mines-Télécom / Paris Saclay (Master IMSD) • Maths théoriques • Sciences expérimentales • Philo Modélisation Déterminisme / Probabilisme • Informatique • Maths appliquées • Monde professionnel Outils Utilité – Mode projet
  • 6. Parcours pro CEVIPOF de SciencesPo SFR LeKiosk • La Recherche • Données socio-économiques • Marketing électoral • R • L’Entreprise • Data Analyse Marketing • SQL, R • La Start-Up • Data Science • Python, SQL • Plus de prédictif
  • 7. Parcours pro CEVIPOF de SciencesPo SFR LeKiosk • La Recherche • Données socio-économiques • Marketing électoral • R • L’Entreprise • Data Analyse Marketing • SQL, R • La Start-Up • Data Science • Python, SQL • Plus de prédictif Collaboration Autonomie Encadrement CEVIPOF SFR LeKiosk
  • 8. Les projets scolaires Modélisation non-supervisée : Web Scraping de données économiques de pays, classification et mapping du développement en 3D (Analyse en Composantes Principales, Classification Ascendante Hiérarchique, K-Means, Gaussian Mixtures) Modélisation supervisée : Études des résultats d’une étude sociologique de speed dating. Sélection des variables. Développement de modèles de prédiction du match entre deux participants. Validation croisée avec observations par paires (x rencontre y, y rencontre x). Optimisation de paramètres. Mise à l’épreuve de modèles linéaires : Classifieur naïf bayésien, Analyse discriminante, Machines à vecteurs support. Modèles non-linéaires : Arbres de décision, Réseaux de Neurones. Scoring : Octroi de crédit pour une banque d’investissement. Imputation de valeurs manquantes, mise en classe de variables continues, AIC/BIC, Ridge/Lasso, odd ratio, tableau de scores.
  • 9. Les projets scolaires Inconvénients : Données déjà rassemblées ou manipulées, Hors contexte métier ... Avantages : Open Data, Jouer avec les notions, Tester les performances machines, Analyser/Coder/Synthétiser …
  • 10. Projets actuels chez LeKiosk NLP : Extraction automatisé de mots-clés à partir d’articles, création de data pour applications produit Marketing : Calcul et prévision de KPI (Durée de vie) / Segmentation / Personnalisation Automatisation de la chaîne de production : Découpe de magazine en lecture smart Détection de fraude : Patterns d’inscription et de consommation des fraudeurs
  • 13. Computer Science / IT Machine Learning Data Science Data Engineering Domaines d’apprentissage
  • 14. Computer Science / IT Machine Learning Data communication, Domain/Business knowledge Data Science Data Analysis / Recherche Traditionnelle Software Development Data Engineering Domaines d’apprentissage
  • 15. Programmation système – objet, API, Web (Scraping), Cloud computing … Algèbre Multilinéaire, Optimisation linéaire et combinatoire, Recherche opérationnelle … Apprentissage du champ d’application, Documentation, Datavizualisation, Présentations powerpoint Data Science Data Analysis / Recherche Traditionnelle Software Development Data Engineering Domaines d’apprentissage
  • 16. Formation continue - R&D Tutos PapersCoursVeille Medium, Data Elixir, Data Science Weekly, MIT Tech Review, O’Reilly … MOOCs (Edx, Data Camp…) Livres Challenges Bootcamps Portfolio Publications GitHub Blogs, Revues…
  • 17. Méthodologie – Mode projet CRISP-DM : Cross Industry Standard Process for Data Mining Confronter, Documenter Mise en production Besoins, Règles Hypothèses, Plan, Sources Analyse, feature engineering Modélisation Itérer
  • 20. Les compétences et appétences du DS Machine Learning Rigueur Scientifique Analyse/ Synthèse Bon sensExpérimentation Technologie
  • 21. Les compétences et appétences du DS Computer Science / IT Machine Learning Rigueur Scientifique Bon sensExpérimentation Technologie Agilité, Réactivité Conception Production Analyse/ Synthèse
  • 22. Les compétences et appétences du DS Computer Science / IT Machine Learning Data communication, Domain/Business knowledge Rigueur Scientifique Bon sensExpérimentation Technologie Vulgarisation Communication, Relationnel Agilité, Réactivité Conception Production Analyse/ Synthèse
  • 23. Les compétences et appétences du DS Computer Science / IT Machine Learning Data communication, Domain/Business knowledge Rigueur Scientifique Bon sensExpérimentation Technologie Vulgarisation Communication, Relationnel Agilité, Réactivité Formation continue - R&D Méthodologie - Gestion de projet Conception Production Analyse/ Synthèse
  • 24. Les compétences et appétences du DS Computer Science / IT Machine Learning Data communication, Domain/Business knowledge Rigueur Scientifique Bon sensExpérimentation Technologie Conception Vulgarisation Communication, Relationnel Agilité, Réactivité Opérationnel Fonctionnel Production Analyse/ Synthèse
  • 25. Pour résumer … Computer Science / IT Machine Learning Data communication, Domain/Business knowledge Rigueur Scientifique Bon sensExpérimentation Technologie Conception Vulgarisation Communication, Relationnel Agilité, Réactivité Opérationnel Fonctionnel Production Analyse/ Synthèse Méthodologie - Gestion de projet Formation continue- R&D … Mais ça ouvre le champ des possibles d’un point de vu pro et perso
  • 26.
  • 29. Nos Prochains Événements 13 MARS — WORKSHOP 3 Avril — CONFÉRENCE
  • 30. Nos Prochaines Sessions — 40 HEURES 5 Mars - 25 Avril Mardis & Jeudis 18h30 - 21h Semaine — 9 Mars - 27 Avril Samedis 9h30 - 15h30 Weekend — 1 Avril - 12 Avril Lundi au Vendredi 9h30 - 15h30 Intensive —
  • 31. Nos Prochaines Sessions — FULLSTACK : DEVENEZ DATA SCIENTIST 4 Mars - 28 Septembre Lundi 18h30 - 21h Samedi 9h30 -15h30 TEMPS PARTIEL — 25 Février - 17 Mai Lundi au Vendredi 9h30 à 15h30 TEMPS COMPLET —
  • 32. Data Science Bootcamp Merci ! A la prochaine :)