ASAIM
Traitement “Big Data” en Biologie
Bérénice Batut
Post-doctorante - EA CIDAM
Yuta Onada
Génomique
2


Génomique
3




Génomique
4





Génomique
5








Métagénomique
6








Métagénomique
7









...
Métagénomique
8









...
Outils de métagénomique
9
Outils de métagénomique
10




Solution idéale
Facilité d’utilisation par les biologistes
11
Solution idéale
Facilité d’utilisation par les biologistes
Gestion de données massives et complexes
12
Solution idéale
Facilité d’utilisation par les biologistes
Gestion de données massives et complexes
Traitement rapide et c...
Solution idéale
Facilité d’utilisation par les biologistes
Gestion de données massives et complexes
Traitement rapide et c...
Solution proposée
Connection
Raw read upload
Pipeline, parameters
and metadata
definitions
File and data
saving
Pipeline j...
Pipeline








...
Pipeline








...
Principaux verrous
Gestion du workflow modulaire
Gestion et stockage des données massives
Durée des traitements et des anal...
Projet CPER Auvergne
19




Principaux verrous
Gestion du workflow modulaire
Gestion et stockage des données massives
Durée des traitements et des anal...
Prochain SlideShare
Chargement dans…5
×

Clermont'ech API Hour #15 - ASAIM : Traitement "Big Data" en Biologie

11 471 vues

Publié le

Le microbiote intestinal humain permet de prévenir les infections, de stimuler l’immunité ou encore de réduire les inflammations. La réduction des coûts de séquençage de l’ADN permet d’étudier plus facilement ces microorganismes. Cependant, ces techniques génèrent de grandes quantités de données qui sont complexes à analyser, surtout pour les biologistes. La plateforme Auvergne Sequence Analyses of Intestinal Microbiota (ASAIM) est développée afin d’offrir une solution à ces problématiques.

0 commentaire
1 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
11 471
Sur SlideShare
0
Issues des intégrations
0
Intégrations
8
Actions
Partages
0
Téléchargements
7
Commentaires
0
J’aime
1
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Clermont'ech API Hour #15 - ASAIM : Traitement "Big Data" en Biologie

  1. 1. ASAIM Traitement “Big Data” en Biologie Bérénice Batut Post-doctorante - EA CIDAM Yuta Onada
  2. 2. Génomique 2  
  3. 3. Génomique 3    
  4. 4. Génomique 4     
  5. 5. Génomique 5        
  6. 6. Métagénomique 6        
  7. 7. Métagénomique 7                      
  8. 8. Métagénomique 8                          
  9. 9. Outils de métagénomique 9
  10. 10. Outils de métagénomique 10    
  11. 11. Solution idéale Facilité d’utilisation par les biologistes 11
  12. 12. Solution idéale Facilité d’utilisation par les biologistes Gestion de données massives et complexes 12
  13. 13. Solution idéale Facilité d’utilisation par les biologistes Gestion de données massives et complexes Traitement rapide et complet des données 13
  14. 14. Solution idéale Facilité d’utilisation par les biologistes Gestion de données massives et complexes Traitement rapide et complet des données Modularité 14
  15. 15. Solution proposée Connection Raw read upload Pipeline, parameters and metadata definitions File and data saving Pipeline job submission Computer cluster Waiting job interrogation and execution Result sending and formating Email sending with a link toward result webpage Users Web interface Pipeline interface 15
  16. 16. Pipeline               16
  17. 17. Pipeline                                    17
  18. 18. Principaux verrous Gestion du workflow modulaire Gestion et stockage des données massives Durée des traitements et des analyses Choix outils à utiliser pour chaque étape Gestion des mises à jours des outils et bases de données utilisés Tests automatiques des sorties Nombreuses librairies à installer Gestion du flux d’utilisateurs 18
  19. 19. Projet CPER Auvergne 19    
  20. 20. Principaux verrous Gestion du workflow modulaire Gestion et stockage des données massives Durée des traitements et des analyses Choix outils à utiliser pour chaque étape Gestion des mises à jours des outils et bases de données utilisés Tests automatiques des sorties Nombreuses librairies à installer Gestion du flux d’utilisateurs 20

×