SlideShare une entreprise Scribd logo
1  sur  36
Télécharger pour lire hors ligne
Big Data au service de la génétique
Abdelhalim Rafra
Institut Pasteur de Tunis
18 Avril 2017
Abdelhalim Rafra Big Data au service de la génétique 1/37
Qui je suis
Ingénieur RD
2010
-2013Doctorat
2014
-Present
Data Scientist
2007
-2010
Abdelhalim Rafra Big Data au service de la génétique 2/37
Contexte Big Data
Abdelhalim Rafra Big Data au service de la génétique 3/37
Contexte Big Data / Biomedical
Abdelhalim Rafra Big Data au service de la génétique 4/37
Contexte Big Data
Abdelhalim Rafra Big Data au service de la génétique 5/37
Génétique : Sources de données
Abdelhalim Rafra Big Data au service de la génétique 6/37
La Recherche
Abdelhalim Rafra Big Data au service de la génétique 7/37
L'application
Abdelhalim Rafra Big Data au service de la génétique 8/37
Use case : Séquençage de l'ADN
Abdelhalim Rafra Big Data au service de la génétique 9/37
Use case : Séquençage de l'ADN
Abdelhalim Rafra Big Data au service de la génétique 10/37
Projet Data Science : Théorie
Abdelhalim Rafra Big Data au service de la génétique 11/37
Projet Data Science : Application simple
Abdelhalim Rafra Big Data au service de la génétique 12/37
Projet Data Science : Application
Abdelhalim Rafra Big Data au service de la génétique 13/37
Machine Learning ?
Machine learning is the science of getting computers to act without
being explicitly programmed.  Andrew Ng
Machine Learning
Abdelhalim Rafra Big Data au service de la génétique 14/37
Extraction de descripteurs 1/2
Abdelhalim Rafra Big Data au service de la génétique 15/37
Extraction de descripteurs 2/2
Abdelhalim Rafra Big Data au service de la génétique 16/37
Apprentissage
Deux modes d'apprentissages :
◦ Supervisé :
- Un corpus pour l'apprentissage et un
corpus de validation.
- Simple à évaluer
- Généralisation sur des nouvelles données.
- Automatiser le traitement d'un ux de
données
◦ Non supervisé
- Détecter des corrélations cachées dans
des données.
- Compliqué à évaluer.
- La quantité de données améliore les
résultats.
Abdelhalim Rafra Big Data au service de la génétique 17/37
Apprentissage Supervisé
Abdelhalim Rafra Big Data au service de la génétique 18/37
Apprentissage Supervisé
Abdelhalim Rafra Big Data au service de la génétique 19/37
Arbre de décision
◦ Une règle par n÷ud.
◦ Un modèle de classication
simple.
◦ Modèle interprétable.
◦ Adaptable à un problème de
régression.
Abdelhalim Rafra Big Data au service de la génétique 20/37
Random Forest
Abdelhalim Rafra Big Data au service de la génétique 21/37
Machine à vecteur de support (SVM)
w = arg min
w
C(x, y) + λΩ(f )
◦ Hyperplan séparateur.
◦ Modèle linéaire.
◦ Classication binaire.
◦ Adaptable :
- au multi-classes.
- à la régression.
◦ Apprentissage par descente
de gradient.
◦ kernel trick
Abdelhalim Rafra Big Data au service de la génétique 22/37
Réseau de neurones
http://slideplayer.fr/slide/1575938/
◦ Reproduire le
fonctionnement des neurones
humains.
◦ Une somme pondérée.
◦ Fonction d'activation.
Abdelhalim Rafra Big Data au service de la génétique 23/37
Réseau de neurones
◦ Apprentissage par rétropropagation du gradient.
Abdelhalim Rafra Big Data au service de la génétique 24/37
Deep Learning
Abdelhalim Rafra Big Data au service de la génétique 25/37
Deep Learning
Abdelhalim Rafra Big Data au service de la génétique 26/37
évaluation du Modèle
Abdelhalim Rafra Big Data au service de la génétique 27/37
Apprentissage Non Supervisé
Abdelhalim Rafra Big Data au service de la génétique 28/37
Clustering
◦ Regroupe des données par
similarités.
◦ Minimise la distance
intra-groupe.
◦ Maximise la distance
inter-groupes.
◦ La qualité du modèle dépend
du nombre de groupes et de
la distance.
Abdelhalim Rafra Big Data au service de la génétique 29/37
Changement de dimension
◦ Réduire l'espace de
représentation.
◦ Préserve les liens entre les
données.
◦ Essentiel pour comprendre et
illustrer les données et les
résultats.
Abdelhalim Rafra Big Data au service de la génétique 30/37
En mode POC
Abdelhalim Rafra Big Data au service de la génétique 31/37
Équipe de choc
Abdelhalim Rafra Big Data au service de la génétique 32/37
Équipe de choc
Abdelhalim Rafra Big Data au service de la génétique 33/37
écosystème big Data 2017
Abdelhalim Rafra Big Data au service de la génétique 34/37
Open Source écosystème big Data 2017
Abdelhalim Rafra Big Data au service de la génétique 35/37
Abdelhalim Rafra Big Data au service de la génétique 36/37

Contenu connexe

Plus de Pasteur_Tunis

LA CONVENTION DE L’ONU SUR LA LUTTE CONTRE LA CORRUPTION ET MARCHES PUBLICS
LA CONVENTION DE L’ONU SUR LA LUTTE CONTRE LA CORRUPTION ET MARCHES PUBLICSLA CONVENTION DE L’ONU SUR LA LUTTE CONTRE LA CORRUPTION ET MARCHES PUBLICS
LA CONVENTION DE L’ONU SUR LA LUTTE CONTRE LA CORRUPTION ET MARCHES PUBLICSPasteur_Tunis
 
Exposé audit interne et controle interne
Exposé audit interne et controle interneExposé audit interne et controle interne
Exposé audit interne et controle internePasteur_Tunis
 
ABUS DE POSITION DOMINANTE: DROIT DE LA CONCURRENCE
ABUS  DE  POSITION DOMINANTE:  DROIT DE LA CONCURRENCE ABUS  DE  POSITION DOMINANTE:  DROIT DE LA CONCURRENCE
ABUS DE POSITION DOMINANTE: DROIT DE LA CONCURRENCE Pasteur_Tunis
 
Fiscalité Internationale des Marchés Publics en l’absence de convention fiscale
Fiscalité Internationale des Marchés Publics  en l’absence de convention fiscaleFiscalité Internationale des Marchés Publics  en l’absence de convention fiscale
Fiscalité Internationale des Marchés Publics en l’absence de convention fiscalePasteur_Tunis
 
Rapport 2020 Institut Pasteur de Tunis
Rapport 2020 Institut Pasteur de TunisRapport 2020 Institut Pasteur de Tunis
Rapport 2020 Institut Pasteur de TunisPasteur_Tunis
 
Rapport de l'Institut Pasteur de Tunis 2019
Rapport de l'Institut Pasteur de Tunis 2019Rapport de l'Institut Pasteur de Tunis 2019
Rapport de l'Institut Pasteur de Tunis 2019Pasteur_Tunis
 
Rapport d'activité de l'Institut Pasteur de Tunis 2018
Rapport d'activité de l'Institut Pasteur de Tunis 2018Rapport d'activité de l'Institut Pasteur de Tunis 2018
Rapport d'activité de l'Institut Pasteur de Tunis 2018Pasteur_Tunis
 
Le séquençage haut débit: NGS, une révolution de la biologie moléculaire au s...
Le séquençage haut débit: NGS, une révolution de la biologie moléculaire au s...Le séquençage haut débit: NGS, une révolution de la biologie moléculaire au s...
Le séquençage haut débit: NGS, une révolution de la biologie moléculaire au s...Pasteur_Tunis
 
Evolution des Exigences pour la Reconnaissance des Compétences LES ENJEUX DE ...
Evolution des Exigences pour la Reconnaissance des Compétences LES ENJEUX DE ...Evolution des Exigences pour la Reconnaissance des Compétences LES ENJEUX DE ...
Evolution des Exigences pour la Reconnaissance des Compétences LES ENJEUX DE ...Pasteur_Tunis
 
La gestion des Immobilisations
La gestion des ImmobilisationsLa gestion des Immobilisations
La gestion des ImmobilisationsPasteur_Tunis
 
PHINDaccess Conference Omics Challenges in Infectious Diseases Research - K...
PHINDaccess  Conference Omics Challenges in  Infectious Diseases Research - K...PHINDaccess  Conference Omics Challenges in  Infectious Diseases Research - K...
PHINDaccess Conference Omics Challenges in Infectious Diseases Research - K...Pasteur_Tunis
 
Science Ensemble : La boutique des Sciences de l'Institut Pasteur de Tunis
Science Ensemble : La boutique des Sciences de l'Institut Pasteur de TunisScience Ensemble : La boutique des Sciences de l'Institut Pasteur de Tunis
Science Ensemble : La boutique des Sciences de l'Institut Pasteur de TunisPasteur_Tunis
 
Rapport d'activité 2017 de l'Institut Pasteur de Tunis
Rapport d'activité 2017 de l'Institut Pasteur de TunisRapport d'activité 2017 de l'Institut Pasteur de Tunis
Rapport d'activité 2017 de l'Institut Pasteur de TunisPasteur_Tunis
 
The First Tunisian Science Shop: Between Research Requirements and Service to...
The First Tunisian Science Shop: Between Research Requirements and Service to...The First Tunisian Science Shop: Between Research Requirements and Service to...
The First Tunisian Science Shop: Between Research Requirements and Service to...Pasteur_Tunis
 
Science shop at the Institut Pasteur de Tunis (Tunisia) in the context of the...
Science shop at the Institut Pasteur de Tunis (Tunisia) in the context of the...Science shop at the Institut Pasteur de Tunis (Tunisia) in the context of the...
Science shop at the Institut Pasteur de Tunis (Tunisia) in the context of the...Pasteur_Tunis
 
Implementing Responsible Research and Innovation in Tunisia. The exeample of ...
Implementing Responsible Research and Innovation in Tunisia. The exeample of ...Implementing Responsible Research and Innovation in Tunisia. The exeample of ...
Implementing Responsible Research and Innovation in Tunisia. The exeample of ...Pasteur_Tunis
 
Plaquette IPT InSPIRES
Plaquette IPT InSPIRESPlaquette IPT InSPIRES
Plaquette IPT InSPIRESPasteur_Tunis
 
Science shop in North Africa: Preliminary experience at the Institut Pasteur ...
Science shop in North Africa: Preliminary experience at the Institut Pasteur ...Science shop in North Africa: Preliminary experience at the Institut Pasteur ...
Science shop in North Africa: Preliminary experience at the Institut Pasteur ...Pasteur_Tunis
 
 EFFICACITE ET EPANOUISSEMENT DANS LE MILIEU DU TRAVAIL
 EFFICACITE ET EPANOUISSEMENT DANS LE MILIEU DU TRAVAIL EFFICACITE ET EPANOUISSEMENT DANS LE MILIEU DU TRAVAIL
 EFFICACITE ET EPANOUISSEMENT DANS LE MILIEU DU TRAVAILPasteur_Tunis
 
L'olivier un marqueur culturel de la Méditerranée
L'olivier un marqueur culturel de la MéditerranéeL'olivier un marqueur culturel de la Méditerranée
L'olivier un marqueur culturel de la MéditerranéePasteur_Tunis
 

Plus de Pasteur_Tunis (20)

LA CONVENTION DE L’ONU SUR LA LUTTE CONTRE LA CORRUPTION ET MARCHES PUBLICS
LA CONVENTION DE L’ONU SUR LA LUTTE CONTRE LA CORRUPTION ET MARCHES PUBLICSLA CONVENTION DE L’ONU SUR LA LUTTE CONTRE LA CORRUPTION ET MARCHES PUBLICS
LA CONVENTION DE L’ONU SUR LA LUTTE CONTRE LA CORRUPTION ET MARCHES PUBLICS
 
Exposé audit interne et controle interne
Exposé audit interne et controle interneExposé audit interne et controle interne
Exposé audit interne et controle interne
 
ABUS DE POSITION DOMINANTE: DROIT DE LA CONCURRENCE
ABUS  DE  POSITION DOMINANTE:  DROIT DE LA CONCURRENCE ABUS  DE  POSITION DOMINANTE:  DROIT DE LA CONCURRENCE
ABUS DE POSITION DOMINANTE: DROIT DE LA CONCURRENCE
 
Fiscalité Internationale des Marchés Publics en l’absence de convention fiscale
Fiscalité Internationale des Marchés Publics  en l’absence de convention fiscaleFiscalité Internationale des Marchés Publics  en l’absence de convention fiscale
Fiscalité Internationale des Marchés Publics en l’absence de convention fiscale
 
Rapport 2020 Institut Pasteur de Tunis
Rapport 2020 Institut Pasteur de TunisRapport 2020 Institut Pasteur de Tunis
Rapport 2020 Institut Pasteur de Tunis
 
Rapport de l'Institut Pasteur de Tunis 2019
Rapport de l'Institut Pasteur de Tunis 2019Rapport de l'Institut Pasteur de Tunis 2019
Rapport de l'Institut Pasteur de Tunis 2019
 
Rapport d'activité de l'Institut Pasteur de Tunis 2018
Rapport d'activité de l'Institut Pasteur de Tunis 2018Rapport d'activité de l'Institut Pasteur de Tunis 2018
Rapport d'activité de l'Institut Pasteur de Tunis 2018
 
Le séquençage haut débit: NGS, une révolution de la biologie moléculaire au s...
Le séquençage haut débit: NGS, une révolution de la biologie moléculaire au s...Le séquençage haut débit: NGS, une révolution de la biologie moléculaire au s...
Le séquençage haut débit: NGS, une révolution de la biologie moléculaire au s...
 
Evolution des Exigences pour la Reconnaissance des Compétences LES ENJEUX DE ...
Evolution des Exigences pour la Reconnaissance des Compétences LES ENJEUX DE ...Evolution des Exigences pour la Reconnaissance des Compétences LES ENJEUX DE ...
Evolution des Exigences pour la Reconnaissance des Compétences LES ENJEUX DE ...
 
La gestion des Immobilisations
La gestion des ImmobilisationsLa gestion des Immobilisations
La gestion des Immobilisations
 
PHINDaccess Conference Omics Challenges in Infectious Diseases Research - K...
PHINDaccess  Conference Omics Challenges in  Infectious Diseases Research - K...PHINDaccess  Conference Omics Challenges in  Infectious Diseases Research - K...
PHINDaccess Conference Omics Challenges in Infectious Diseases Research - K...
 
Science Ensemble : La boutique des Sciences de l'Institut Pasteur de Tunis
Science Ensemble : La boutique des Sciences de l'Institut Pasteur de TunisScience Ensemble : La boutique des Sciences de l'Institut Pasteur de Tunis
Science Ensemble : La boutique des Sciences de l'Institut Pasteur de Tunis
 
Rapport d'activité 2017 de l'Institut Pasteur de Tunis
Rapport d'activité 2017 de l'Institut Pasteur de TunisRapport d'activité 2017 de l'Institut Pasteur de Tunis
Rapport d'activité 2017 de l'Institut Pasteur de Tunis
 
The First Tunisian Science Shop: Between Research Requirements and Service to...
The First Tunisian Science Shop: Between Research Requirements and Service to...The First Tunisian Science Shop: Between Research Requirements and Service to...
The First Tunisian Science Shop: Between Research Requirements and Service to...
 
Science shop at the Institut Pasteur de Tunis (Tunisia) in the context of the...
Science shop at the Institut Pasteur de Tunis (Tunisia) in the context of the...Science shop at the Institut Pasteur de Tunis (Tunisia) in the context of the...
Science shop at the Institut Pasteur de Tunis (Tunisia) in the context of the...
 
Implementing Responsible Research and Innovation in Tunisia. The exeample of ...
Implementing Responsible Research and Innovation in Tunisia. The exeample of ...Implementing Responsible Research and Innovation in Tunisia. The exeample of ...
Implementing Responsible Research and Innovation in Tunisia. The exeample of ...
 
Plaquette IPT InSPIRES
Plaquette IPT InSPIRESPlaquette IPT InSPIRES
Plaquette IPT InSPIRES
 
Science shop in North Africa: Preliminary experience at the Institut Pasteur ...
Science shop in North Africa: Preliminary experience at the Institut Pasteur ...Science shop in North Africa: Preliminary experience at the Institut Pasteur ...
Science shop in North Africa: Preliminary experience at the Institut Pasteur ...
 
 EFFICACITE ET EPANOUISSEMENT DANS LE MILIEU DU TRAVAIL
 EFFICACITE ET EPANOUISSEMENT DANS LE MILIEU DU TRAVAIL EFFICACITE ET EPANOUISSEMENT DANS LE MILIEU DU TRAVAIL
 EFFICACITE ET EPANOUISSEMENT DANS LE MILIEU DU TRAVAIL
 
L'olivier un marqueur culturel de la Méditerranée
L'olivier un marqueur culturel de la MéditerranéeL'olivier un marqueur culturel de la Méditerranée
L'olivier un marqueur culturel de la Méditerranée
 

Big Data au service de la génétique