Rendre les standards de description de biopuces accessibles: réalisation d'un module de conversion inter-standard Pierre M...
Sommaire <ul><li>L’Institut  Européen  de Bioinformatique </li></ul><ul><ul><li>l’équipe  informatique Microarray </li></u...
S ervices   Banques de données R echerche  en bioinformatique et en biologie moleculaire Industrie Promouvoir des  standar...
 
S ervices   Banques de données R echerche  en bioinformatique et en biologie moleculaire Industrie Promouvoir des  standar...
l’équipe  Microarray   MicroArray Informatics Team <ul><li>les résultats d’expériences de biopuces  </li></ul><ul><li>Une ...
ArrayExpress
l’équipe  Microarray   MicroArray Informatics Team <ul><li>les expériences de biopuces  </li></ul><ul><li>-> petite équipe...
la standardisation ? <ul><li>Hétérogénéité des applications et des techniques </li></ul><ul><li>Des éléments non pris en  ...
Le projet <ul><li>Un constat : de plus en plus de données à traiter et un manque d’outils </li></ul><ul><li>Outil de conve...
Outil de conversion
Les descriptions d’agencement <ul><li>Informations initiales avant une expérience </li></ul><ul><ul><li>méta données   (co...
MAGE-ML (MAGE-OM)
MAGE-ML (suite)
Array Design File adh adr adc Header contacts Informations  techniques
Array Design File adr adc Feature  /Reporter Features Reporters
Array Design File Composite Caractéristiques Liens avec les reporters
Contribution <ul><li>Application </li></ul><ul><ul><li>indépendante (pas de DB) </li></ul></ul><ul><ul><li>Multi plateform...
Validation  (une étape obligatoire) <ul><li>Analyse syntaxique et lexicale des données </li></ul><ul><ul><li>Définition de...
Implémentation - choix techniques <ul><li>Utilisation de MAGE-stk (perl ou Java) </li></ul><ul><li>Simplicité d’installati...
Problèmes rencontrés <ul><li>Mémoire </li></ul><ul><ul><li>Beaucoup de données </li></ul></ul><ul><ul><li>Et leur redondan...
Une adresse :  http://www.ebi.ac.uk/adf http://www.ebi.ac.uk/adf/
Bilan <ul><li>Bilan pour l’équipe </li></ul><ul><ul><li>Premier outil de vérification complète des données de description ...
 
Prochain SlideShare
Chargement dans…5
×

Presentation Dess Ebi

1 091 vues

Publié le

Publié dans : Voyages, Technologie
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Presentation Dess Ebi

  1. 1. Rendre les standards de description de biopuces accessibles: réalisation d'un module de conversion inter-standard Pierre Marguerite – DESS Bioinformatique Lille EBI – Microarray Informatics Team 4 mai– 31 octobre 2004
  2. 2. Sommaire <ul><li>L’Institut Européen de Bioinformatique </li></ul><ul><ul><li>l’équipe informatique Microarray </li></ul></ul><ul><li>La standardisation des données de biopuces? </li></ul><ul><li>Le projet </li></ul><ul><ul><li>Les standards de description d’agencement </li></ul></ul><ul><ul><li>Contribution </li></ul></ul><ul><li>Bilan </li></ul>
  3. 3. S ervices Banques de données R echerche en bioinformatique et en biologie moleculaire Industrie Promouvoir des standards Formation Heidelberg Hinxton UK Monterotondo Hamburg Grenoble Service Research Training Industry E uropean M olecular B iology L aboratory EBI
  4. 5. S ervices Banques de données R echerche en bioinformatique et en biologie moleculaire Industrie Promouvoir des standards Formation Heidelberg Hinxton UK Monterotondo Hamburg Grenoble Service Research Training Industry E uropean M olecular B iology L aboratory EBI
  5. 6. l’équipe Microarray MicroArray Informatics Team <ul><li>les résultats d’expériences de biopuces </li></ul><ul><li>Une petite équipe : 26 développeurs, annotateurs, doctorants </li></ul><ul><li>Un projet ArrayExpress </li></ul><ul><ul><li>Banque de données publique de données de biopuces </li></ul></ul><ul><ul><li>Déclinaison en toxicogénomique et nutrigénomique </li></ul></ul><ul><li>MGED </li></ul><ul><ul><li>Standardisation des données de biopuces </li></ul></ul>
  6. 7. ArrayExpress
  7. 8. l’équipe Microarray MicroArray Informatics Team <ul><li>les expériences de biopuces </li></ul><ul><li>-> petite équipe : 26 développeurs, annotateurs </li></ul><ul><li>Un projet ArrayExpress </li></ul><ul><ul><li>Banque de données publique de données de biopuces </li></ul></ul><ul><ul><li>Déclinaison en toxicogénomique et nutrigénomique </li></ul></ul><ul><li>Le consortium MGED </li></ul><ul><ul><li>Standardisation des données de biopuces </li></ul></ul>
  8. 9. la standardisation ? <ul><li>Hétérogénéité des applications et des techniques </li></ul><ul><li>Des éléments non pris en compte </li></ul><ul><ul><li>=> expériences non comparables </li></ul></ul><ul><li>Nombreux formats de données </li></ul><ul><ul><li>Même données -> beaucoup de manipulation </li></ul></ul><ul><li>Différents termes -> pour la même signification </li></ul><ul><li>Le même terme -> des concepts différents </li></ul>MAGE Ontologie MGED Recommandations MIAME
  9. 10. Le projet <ul><li>Un constat : de plus en plus de données à traiter et un manque d’outils </li></ul><ul><li>Outil de conversion des fichiers de description d’agencement </li></ul>
  10. 11. Outil de conversion
  11. 12. Les descriptions d’agencement <ul><li>Informations initiales avant une expérience </li></ul><ul><ul><li>méta données (contacts, un numéro de version, …) </li></ul></ul><ul><ul><li>Feature: position sur une lame de biopuces, définie par ses coordonnées </li></ul></ul><ul><ul><li>Reporter: élément déposé sur une feature, qui a certaines caractéristiques, </li></ul></ul><ul><ul><li>Composites: séquences composites entre les « reporter » vers une entité biologique. </li></ul></ul><ul><li>2 formats: </li></ul><ul><ul><li>MAGE-ML :XML </li></ul></ul><ul><ul><li>ADF (Array Design File) : fichiers tabulaires </li></ul></ul>
  12. 13. MAGE-ML (MAGE-OM)
  13. 14. MAGE-ML (suite)
  14. 15. Array Design File adh adr adc Header contacts Informations techniques
  15. 16. Array Design File adr adc Feature /Reporter Features Reporters
  16. 17. Array Design File Composite Caractéristiques Liens avec les reporters
  17. 18. Contribution <ul><li>Application </li></ul><ul><ul><li>indépendante (pas de DB) </li></ul></ul><ul><ul><li>Multi plateforme </li></ul></ul><ul><li>En 2 étapes: </li></ul><ul><ul><li>Validation </li></ul></ul><ul><ul><li>conversion </li></ul></ul>
  18. 19. Validation (une étape obligatoire) <ul><li>Analyse syntaxique et lexicale des données </li></ul><ul><ul><li>Définition de règles de validation </li></ul></ul><ul><ul><li>Utilisation de fichiers XML pour décrire les structures des fichiers de données (ADF) </li></ul></ul><ul><ul><li>Vérification des termes de la ontologie MGED </li></ul></ul><ul><ul><li>Vérification des banques de données approuvées </li></ul></ul><ul><ul><li>Rapport d’erreurs pour correction (standardisation des données) </li></ul></ul>
  19. 20. Implémentation - choix techniques <ul><li>Utilisation de MAGE-stk (perl ou Java) </li></ul><ul><li>Simplicité d’installation </li></ul><ul><li>Multi plateforme </li></ul>- Multiples formats de sortie
  20. 21. Problèmes rencontrés <ul><li>Mémoire </li></ul><ul><ul><li>Beaucoup de données </li></ul></ul><ul><ul><li>Et leur redondance </li></ul></ul><ul><li>Flexibilité </li></ul><ul><ul><li>Acceptation et correction d’éléments incorrects </li></ul></ul><ul><ul><li>Nouvelles versions des formats de descriptions </li></ul></ul><ul><ul><li>Support minimum pour futurs applications des biopuces </li></ul></ul>
  21. 22. Une adresse : http://www.ebi.ac.uk/adf http://www.ebi.ac.uk/adf/
  22. 23. Bilan <ul><li>Bilan pour l’équipe </li></ul><ul><ul><li>Premier outil de vérification complète des données de description </li></ul></ul><ul><ul><li>Soulager le travail des annotateurs en déplaçant la validation des données de description à la source (biologistes ou fabricants) </li></ul></ul><ul><li>Un bilan personnel positif, mais douloureux </li></ul><ul><ul><li>6 mois en Angleterre </li></ul></ul><ul><ul><li>Gestion de projet </li></ul></ul><ul><ul><li>Nombreux contacts </li></ul></ul>

×