SlideShare une entreprise Scribd logo
1  sur  10
[object Object],Integragen S.A, 5 rue Henri Desbruères Evry France JRAB & Genocensus Deux outils de manipulation de données CGH et d'épidémiologie génétique. Pierre Lindenbaum, Ekrame Ayari-Jacoby, Frederic Tores, Peter Brooks, Abdel Benajjou et Philippe Gesnouin.
Notre base de données destinée à stocker des génotype est implémentée sous mysql, l'interface permettant de tracer les données et les programmes en ligne de commandes servant à  les exporter sont écrits en java.  Pour chacun des génotypes stocké dans la base de données, nous pouvons retrouver la  famille de l’individus et la position du marqueur. Ce système est capable de gérer la position des marqueurs génétiques en fonction de différentes versions (« build ») de l'assemblage du génome humain: la position de ce marqueur est en effet susceptible de varier selon les versions, nous pouvons donc suivre les modifications des positions de nos marqueurs sur les différents mise a jour de l’assemblage.  Chaque génotype est stocké avec la valeur des deux allèles, le lien vers l'échantillon d'ADN de l'individu,  un lien vers le marqueur génétique utilisé, un lien vers l'expérience et la date de l'insertion dans la base. Ce système nous permet également de génotyper un même point expérimental à différentes dates.
Genocensus TM ,[object Object]
Pedigrés ,[object Object],incompat 'parent' avec le marqueur TAQMAN ID 823 : RS6683015-G172 et l'individus gecko-id=48117  ,[object Object],;Female;  0  0  DFS_2006:48: 159  gecko-id: 47128  ;Male;  0  0  DFS_2006:48: 158  gecko-id: 47127  <---  ;Male;  159  158  DFS_2006:48: 157  gecko-id: 48117  VIC  DFS_2006:48:159  gecko-id: 47128  S3006LM0.sds:M15  data-id: 318747  <---  FAM  DFS_2006:48:158  gecko-id: 47127  S3006LM0.sds:K15  data-id: 318699  <---  VIC  DFS_2006:48:157  gecko-id: 48117  S3006LM0.sds:I15  data-id: 318651
Lectures et Analyses ,[object Object]
Analyse de Genome-Hip ,[object Object]
Génération de Fichiers Linkage ,[object Object],La génération des fichiers Linkage est possible en fonction des critéres définis par l'utilisateur (date, région génomique, type de marqueur, etc...). Lors de ce processus, chaque génotype est indexé sous la forme d'un nombre entier, représentant la base ou la taille de l'amplicon, et chaque  marqueur est ordonné en fonction de sa position dans le génome pour une version de « build » donné. A l'issue de ces indexations, le fichier Linkage est généré. Si un  individu a été génotypé plusieurs fois pour un même marqueur  et qu'il existe une incompatibilité entre ces génotypes, le système d'exportation permet d'ignorer tous les génotypes obtenus avec ce marqueur pour tous les membres de la famille de l'individu impliqué et de mettre les résultats à  « 0 ». Les haplotypes produits lors des analyses ultérieures peuvent éventuellement être insérés dans la base.
Analyses des Haplotypes. ,[object Object]
Perspectives Nous migrons d'un système d'interfaces web (java/tomcat) à un système interactif (java swing) où l'utilisateur pourra encore plus facilement manipuler les données (tableaux croisés, analyses graphiques, pipeline d'analyses) .
Conclusion ,[object Object]

Contenu connexe

Plus de Pierre Lindenbaum

Plus de Pierre Lindenbaum (20)

Introduction to Linux
Introduction to LinuxIntroduction to Linux
Introduction to Linux
 
Mum, I 3D printed a gel comb !
Mum, I 3D printed a gel comb !Mum, I 3D printed a gel comb !
Mum, I 3D printed a gel comb !
 
"Mon make à moi", (tout sauf Galaxy)
"Mon make à moi", (tout sauf Galaxy)"Mon make à moi", (tout sauf Galaxy)
"Mon make à moi", (tout sauf Galaxy)
 
Advanced NCBI
Advanced NCBI Advanced NCBI
Advanced NCBI
 
File formats for Next Generation Sequencing
File formats for Next Generation SequencingFile formats for Next Generation Sequencing
File formats for Next Generation Sequencing
 
Building a Simple LIMS with the Eclipse Modeling Framework (EMF) ,my notebook
Building a Simple LIMS with the Eclipse Modeling Framework (EMF) ,my notebookBuilding a Simple LIMS with the Eclipse Modeling Framework (EMF) ,my notebook
Building a Simple LIMS with the Eclipse Modeling Framework (EMF) ,my notebook
 
Make
MakeMake
Make
 
XML for bioinformatics
XML for bioinformaticsXML for bioinformatics
XML for bioinformatics
 
20120423.NGS.Rennes
20120423.NGS.Rennes20120423.NGS.Rennes
20120423.NGS.Rennes
 
Sketching 20120412
Sketching 20120412Sketching 20120412
Sketching 20120412
 
Introduction to mongodb for bioinformatics
Introduction to mongodb for bioinformaticsIntroduction to mongodb for bioinformatics
Introduction to mongodb for bioinformatics
 
Biostar17037
Biostar17037Biostar17037
Biostar17037
 
Tweeting for the BioStar Paper
Tweeting for the BioStar PaperTweeting for the BioStar Paper
Tweeting for the BioStar Paper
 
Variation Toolkit
Variation ToolkitVariation Toolkit
Variation Toolkit
 
Bioinformatician 2.0
Bioinformatician 2.0Bioinformatician 2.0
Bioinformatician 2.0
 
Analyzing Exome Data with KNIME
Analyzing Exome Data with KNIMEAnalyzing Exome Data with KNIME
Analyzing Exome Data with KNIME
 
NOTCH2 backstage
NOTCH2 backstageNOTCH2 backstage
NOTCH2 backstage
 
Bioinfo tweets
Bioinfo tweetsBioinfo tweets
Bioinfo tweets
 
Post doctoriales 2011
Post doctoriales 2011Post doctoriales 2011
Post doctoriales 2011
 
20110114 Next Generation Sequencing Course
20110114 Next Generation Sequencing Course20110114 Next Generation Sequencing Course
20110114 Next Generation Sequencing Course
 

JRAB & GenoCensus

  • 1.
  • 2. Notre base de données destinée à stocker des génotype est implémentée sous mysql, l'interface permettant de tracer les données et les programmes en ligne de commandes servant à  les exporter sont écrits en java. Pour chacun des génotypes stocké dans la base de données, nous pouvons retrouver la famille de l’individus et la position du marqueur. Ce système est capable de gérer la position des marqueurs génétiques en fonction de différentes versions (« build ») de l'assemblage du génome humain: la position de ce marqueur est en effet susceptible de varier selon les versions, nous pouvons donc suivre les modifications des positions de nos marqueurs sur les différents mise a jour de l’assemblage. Chaque génotype est stocké avec la valeur des deux allèles, le lien vers l'échantillon d'ADN de l'individu, un lien vers le marqueur génétique utilisé, un lien vers l'expérience et la date de l'insertion dans la base. Ce système nous permet également de génotyper un même point expérimental à différentes dates.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9. Perspectives Nous migrons d'un système d'interfaces web (java/tomcat) à un système interactif (java swing) où l'utilisateur pourra encore plus facilement manipuler les données (tableaux croisés, analyses graphiques, pipeline d'analyses) .
  • 10.