SlideShare une entreprise Scribd logo
1  sur  48
Télécharger pour lire hors ligne
Journées annuelles
  de la Société Française de Systématique
            Angers – 06/10/2009


Reconstruction combinatoire
de réseaux phylogénétiques

           Philippe Gambette
Plan

• Les réseaux phylogénétiques
• L'arbre en filigrane
• Motivations de l'approche combinatoire
• Méthodes de reconstruction combinatoire
• Limites des méthodes combinatoires
• Perspectives
Plan

• Les réseaux phylogénétiques
• L'arbre en filigrane
• Motivations de l'approche combinatoire
• Méthodes de reconstruction combinatoire
• Limites des méthodes combinatoires
• Perspectives
Les arbres phylogénétiques




       D'après Woese, Kandler, Wheelis : Towards a natural system of organisms:
       proposal for the domains Archaea, Bacteria, and Eucarya, Proceedings of
       the National Academy of Sciences, 87(12), 4576–4579 (1990)
Les réseaux phylogénétiques




              Réseau phylogénétique
              de la vie




       Doolittle : Uprooting the Tree of Life, Scientific American (Fév. 2000)
Les réseaux phylogénétiques




                            réseau de
          réseau de         bipartitions                  T-Rex
          niveau 2
Level-2                                            réticulogramme
                      SplitsTree
                                            réseau couvrant
diagramme                                   minimum
de synthèse
        HorizStory            réseau
                              médian


                           Network         TCS
Les réseaux phylogénétiques




                            réseau de
          réseau de         bipartitions                                      T-Rex
          niveau 2
Level-2                                                         réticulogramme
                      SplitsTree
                                                   réseau couvrant
diagramme                                          minimum
de synthèse
        HorizStory            réseau
                              médian


                           Network            TCS
                                           http://www.lirmm.fr/~gambette/PhylogeneticNetworks
Les réseaux phylogénétiques




                         http://www.lirmm.fr/~gambette/PhylogeneticNetworks
Les réseaux phylogénétiques




                         http://www.lirmm.fr/~gambette/PhylogeneticNetworks
Plan

• Les réseaux phylogénétiques
• L'arbre en filigrane
• Motivations de l'approche combinatoire
• Méthodes de reconstruction combinatoire
• Limites des méthodes combinatoires
• Perspectives
L'arbre en filigrane

 Modèle de transmission arborée de gènes
 (gène transmis intégralement)

 Clades “souples”
                      abc
                      ab    cd
                         bc



                    a b c d
L'arbre en filigrane

 Modèle de transmission arborée de gènes
 (gène transmis intégralement)

 Clades “souples”
                      abc
                      ab    cd
                         bc



                    a b c d
L'arbre en filigrane

 Modèle de transmission arborée de gènes
 (gène transmis intégralement)

 Clades “souples”
                       abc
                       ab    cd
                          bc



                      a b c d

 L'ensemble C(N) de tous les clusters souplement
 compatibles avec N peut être de taille exponentielle.
 Test de compatibilité souple NP-complet
                            (Kanj, Nakhleh, Than, Xia, TCS, 2008)
L'arbre en filigrane : réseaux restreints

 Algorithmes rapides pour des réseaux à structure proche
 d'un arbre.


                            niveau = nombre maximum
                            de noeuds de réticulation par
         h1        h3       partie non arborée.
              h2

  a b c d e f g h i j k
    réseau de niveau 2.
L'arbre en filigrane : réseaux restreints

 Algorithmes rapides pour des réseaux à structure proche
 d'un arbre.


                            niveau = nombre maximum
                            de noeuds de réticulation par
         h1         h3      partie non arborée.
               h2

  a b c d e f g h i j k
    réseau de niveau 2.



              réseau de niveau 1
              (“galled tree”)    a b c d e f g h i j k
L'arbre en filigrane : réseaux restreints

 Algorithmes rapides pour des réseaux à structure proche
 d'un arbre.


                             réseau à une couche de
                             réticulation (“galled
         h1        h3        network”) : la suppression
              h2             d'un noeud de réticulation
                             déconnecte le réseau.
  a b c d e f g h i j k
    réseau à une couche
    de réticulation.
L'arbre en filigrane : réseaux restreints

 Algorithmes rapides pour des réseaux à structure proche
 d'un arbre.


                               réseau à une couche de
                               réticulation (“galled
         h1           h3       network”) : la suppression
              h2               d'un noeud de réticulation
                               déconnecte le réseau.
  a b c d e f g h i j k
    réseau à une couche
    de réticulation.
                                          h2
                                      h1        h3
                   réseau à deux
                      couches de
                      réticulation. a b c d e f g h i j k
Plan

• Les réseaux phylogénétiques
• L'arbre en filigrane
• Motivations de l'approche combinatoire
• Méthodes de reconstruction combinatoire
• Limites des méthodes combinatoires
• Perspectives
Reconstruction de réseaux



         {séquences de gènes}

                     méthodes de distance
                           Bandelt & Dress 1992 - Legendre &
                     Makarenkov 2000 - Bryant & Moulton 2002
                     méthodes de parcimonie
                      Hein 1990 - Kececioglu & Gusfield 1994 -
                                Jin, Nakhleh, Snir, Tuller 2009
                     méthodes de vraisemblance
                         Snir & Tuller 2009 - Jin, Nakhleh, Snir,
                           Tuller 2009 - Velasco & Sober 2009


              réseau N
Reconstruction de réseaux

    Problème : méthodes généralement lentes,
       explosion du nombre de séquences.

           {séquences de gènes}

                       méthodes de distance
                             Bandelt & Dress 1992 - Legendre &
                       Makarenkov 2000 - Bryant & Moulton 2002
                       méthodes de parcimonie
                        Hein 1990 - Kececioglu & Gusfield 1994 -
                                  Jin, Nakhleh, Snir, Tuller 2009
                       méthodes de vraisemblance
                           Snir & Tuller 2009 - Jin, Nakhleh, Snir,
                             Tuller 2009 - Velasco & Sober 2009


                réseau N
Reconstruction combinatoire de réseaux

            {séquences de gènes}

                       Reconstruction d'un arbre
                       par ensemble de gènes
                       homologues

             phylome = {arbres}

                       Réconciliation ou
                       consensus d'arbres


              super-réseau N
Reconstruction combinatoire de réseaux

              {séquences de gènes}

                         Reconstruction d'un arbre
                         par ensemble de gènes
                         homologues

               phylome = {arbres}

                         Réconciliation ou
                         consensus d'arbres


                 super-réseau N
     Problème : le consensus d'arbres est un
       problème NP-complet pour 2 arbres
Triplets/quadruplets, splits/clades

Problème :
Reconstruire le super-réseau d'un ensemble d'arbres est
                        difficile.
Idée :
reconstuire un réseau contenant tous les :

                          triplets
                        quadruplets
                          clades
                           splits
                                         des arbres en entrée ?
                                        b       c
                                   a
                                    f
                                                 d   a b c d e
Motivations algorithmiques !                 e
Triplets/quadruplets, splits/clades

Idée :
reconstuire un réseau contenant tous les :


                           triplets           a|ce

                                      a b c d e




                                      des arbres en entrée ?
Triplets/quadruplets, splits/clades

Idée :
reconstuire un réseau contenant tous les :

      ab|ce                    triplets           a|ce
                   b       c
                                          a b c d e
              a
               f            quadruplets
                       e   d




                                          des arbres en entrée ?
Triplets/quadruplets, splits/clades

Idée :
reconstuire un réseau contenant tous les :

      ab|ce                    triplets           a|ce
                   b       c
                                          a b c d e
              a
               f            quadruplets
                       e   d
                               clades             {c,d,e}

                                          a b c d e



                                          des arbres en entrée ?
Triplets/quadruplets, splits/clades

Idée :
reconstuire un réseau contenant tous les :

      ab|ce                    triplets           a|ce
                   b       c
                                          a b c d e
              a
               f            quadruplets
                       e   d
                               clades             {c,d,e}

    {a,b,f}        b       c              a b c d e
    {c,d,e}                    splits
              a
               f
                       e   d              des arbres en entrée ?
Triplets/quadruplets, splits/clades

Idée :
modifier le type de données à traiter

                         {arbres}




                     super-réseau N
Triplets/quadruplets, splits/clades

Idée :
modifier le type de données à traiter

                         {arbres}




                       {triplets} {quadruplets} {splits} {clades}



 super-réseau N                     super-réseau N'
Triplets/quadruplets, splits/clades

Idée :
modifier le type de données à traiter

                         {arbres}




                       {triplets} {quadruplets} {splits} {clades}



 super-réseau N                     super-réseau N'


                        N'=N ?
Triplets/quadruplets, splits/clades
 Un réseau compatible avec l'ensemble de tous les triplets
 d'un arbre T n'est pas forcément compatible avec T.

                                compatible avec
   T              N             {a|bc,a|bd,a|cd,b|cd}
                                mais pas avec T

                                compatible avec
   a b c d       a b c d        {abcd,bcd,cd,a,b,c}
                                mais pas avec T

        compatible avec les clades d'un arbre T




                      compatible avec T.
Triplets/quadruplets, splits/clades
                           {arbres}




                        {triplets} {quadruplets} {splits} {clades}



 super-réseau N                       super-réseau N'

                          N'=N ?
                Pas nécessairement, mais :
              N' complexe      N complexe
          N contient également les triplets, quadruplets...
Triplets/quadruplets, splits/clades
                       {arbres}




                     {triplets} {quadruplets} {splits} {clades}



 super-réseau N                   super-réseau N'

                      N'=N ?
              Pas nécessairement, mais :
             N' peut être intéressant en soi...
Plan

• Les réseaux phylogénétiques
• L'arbre en filigrane
• Motivations de l'approche combinatoire
• Méthodes de reconstruction combinatoire
• Limites des méthodes combinatoires
• Perspectives
Reconstruction depuis les triplets

{arbres}     Méthodes exactes rapides pour reconstruire un
             réseau de niveau 1 et 2 (s'il en existe un) à partir
             d'un ensemble dense de triplets
                       (Jansson, Nguyen & Sung, SODA'05 : O(n3) pour niveau 1)
                         (van Iersel, Kelk & al, RECOMB'08 : O(n8) pour niveau 2)

             dense =
{triplets}   sur chaque ensemble de 3 feuilles, au moins 1 triplet existe dans T.

             Programme Simplistic




   N' réseau                       Réseau phylogénétique de
   de niveau 1                     levures - Van Iersel, Keijsper,
                                   Kelk, Stougie, Hagen Boekhout :
       ou 2                        Constructing level-2 phylogenetic
                                   networks from triplets.
                                   Recomb 2008
                                                               http://homepages.cwi.nl/~kelk/simplistic.html
Reconstruction depuis les clades souples

{arbres}       Consensus de clades souples :
               Dendroscope
                  (Huson, Dezulian, Franz, Rausch, Richter & Rupp, 2007)

               Méthode exacte rapide de reconstruction de
               réseaux à 1 couche de réticulation à partir
{clades}       de clades souples
                            (Huson, Rupp, Berry, Gambette & Paul, 2009)

               2 étapes :
               - choix du plus gros sous-ensemble de taxons où les
               clades sont compatibles avec un arbre
               - ajout du minimum de réticulations pour connecter les
               autres taxons

  N' réseau
     “galled
    network”

                                                          http://www.dendroscope.org
Reconstruction depuis les clades souples
           16 arbres de gènes de 46 espèces de bactéries
{arbres}   Réseau “galled network” des clades apparaissant
           dans 20% des arbres :



{clades}
               Dendroscope




  N' réseau                Enterobacteriales
     “galled                  Pasteurellales
                            Aeromonadales
    network”               Alteromonadales
                           Oceanospirillales
                           Rhodobacterales
                                 Rhizobiales

                  Données de la base HOGENOM, projet   PhylAriane
Reconstruction depuis les clades souples
                             {arbres}
            SplitsTree                     Dendroscope
                Filtre : présence dans 20% des arbres
 {splits}                                                 {clades}




                     Données de la base HOGENOM, projet    PhylAriane
Plan

• Les réseaux phylogénétiques
• L'arbre en filigrane
• Motivations de l'approche combinatoire
• Méthodes de reconstruction combinatoire
• Limites des méthodes combinatoires
• Perspectives
Limites des approches combinatoires

   Plusieurs réseaux minimaux ont exactement le même
         ensemble d'arbres, de triplets, de clades.
                                            Gambette & Huber, 2009




                        a           c
            a       c
                            b           b
                 b                c          a
 Caractérisation des réseaux de niveau 1 ayant exactement
    le même ensemble d'arbres, de triplets, de clades.
Limites des approches combinatoires

   Plusieurs réseaux minimaux ont exactement le même
         ensemble d'arbres, de triplets, de clades.
                                            Gambette & Huber, 2009




                                  x1
                          x1           x2
                     x2

                b
                          a      b      a
 2 réseaux de niveau 2 avec le même ensemble de triplets
Limites des approches combinatoires

   Plusieurs réseaux minimaux ont exactement le même
         ensemble d'arbres, de triplets, de clades.
                                            Gambette & Huber, 2009




                                  x1
                          x1           x2
                     x2

                 b
                          a      b      a
 2 réseaux de niveau 2 avec le même ensemble de triplets

Même avec des données de départ complètes et correctes,
  il est impossible de choisir entre les formes ambiguës !
Plan

• Les réseaux phylogénétiques
• L'arbre en filigrane
• Motivations de l'approche combinatoire
• Méthodes de reconstruction combinatoire
• Limites des méthodes combinatoires
• Perspectives
Perspectives

 Reconstruction du réseau par un dialogue entre méthodes
         combinatoires et méthodes statistiques


                                 Reconstruction combinatoire
                                 d'un ensemble de candidats

      Construction des
   données combinatoires

                                  Choix parmi les candidats
                                  par méthodes statistiques



                    Proposition d'un
                 réseau phylogénétique
Des questions ?
 Merci pour votre attention !
 Co-auteurs des résultats présentés :
 - Vincent Berry, Christophe Paul (LIRMM, Université Montpellier 2)
 - Katharina Huber (Université East Anglia, UK)
 - Daniel Huson, Regula Rupp (Université de Tübingen, Allemagne)

                                                                 Graphe de
                                                          collaboration des
                                                           auteurs les plus
                                                       représentés dans la
                                                         base de données
                                                              “who's who in
                                                               phylogenetic
                                                                 networks”.




                                                          http://www.lirmm.fr/~gambette
Reconstruction depuis les triplets

{arbres}     Méthodes exactes rapides pour reconstruire un
             réseau de niveau 1 et 2 (s'il en existe un) à partir
             d'un ensemble dense de triplets
                       (Jansson, Nguyen & Sung, SODA'05 : O(n3) pour niveau 1)
                         (van Iersel, Kelk & al, RECOMB'08 : O(n8) pour niveau 2)

             dense =
{triplets}   sur chaque ensemble de 3 feuilles, au moins 1 triplet existe dans T.

             Programme Simplistic




   N' réseau                       Réseau phylogénétique de
   de niveau 1                     levures - Van Iersel, Keijsper,
                                   Kelk, Stougie, Hagen Boekhout :
       ou 2                        Constructing level-2 phylogenetic
                                   networks from triplets.
                                   Recomb 2008
                                                               http://homepages.cwi.nl/~kelk/simplistic.html
L'arbre en filigrane : réseaux restreints

 Algorithmes rapides pour des réseaux à structure proche
 d'un arbre.


                            niveau = nombre maximum
                            de noeuds de réticulation par
         h1        h3       partie non arborée.
              h2

  a b c d e f g h i j k
    réseau de niveau 2.
Reconstruction depuis les clades souples
           16 arbres de gènes de 46 espèces de bactéries
{arbres}   Réseau “galled network” des clades apparaissant
           dans 20% des arbres :



{clades}
               Dendroscope




  N' réseau                Enterobacteriales
     “galled                  Pasteurellales
                            Aeromonadales
    network”               Alteromonadales
                           Oceanospirillales
                           Rhodobacterales
                                 Rhizobiales

                  Données de la base HOGENOM, projet   PhylAriane

Contenu connexe

Similaire à Reconstruction combinatoire de réseaux phylogénétiques

Quadruplets et réseaux non enracinés de niveau k
Quadruplets et réseaux non enracinés de niveau kQuadruplets et réseaux non enracinés de niveau k
Quadruplets et réseaux non enracinés de niveau kPhilippe Gambette
 
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...Philippe Gambette
 
Recursive Neural Network summary
Recursive Neural Network summaryRecursive Neural Network summary
Recursive Neural Network summaryStephen Larroque
 
Cassandra pour les développeurs java
Cassandra pour les développeurs javaCassandra pour les développeurs java
Cassandra pour les développeurs javaJérémy Sevellec
 

Similaire à Reconstruction combinatoire de réseaux phylogénétiques (6)

Quadruplets et réseaux non enracinés de niveau k
Quadruplets et réseaux non enracinés de niveau kQuadruplets et réseaux non enracinés de niveau k
Quadruplets et réseaux non enracinés de niveau k
 
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
 
Recursive Neural Network summary
Recursive Neural Network summaryRecursive Neural Network summary
Recursive Neural Network summary
 
Réseaux neurons
Réseaux neuronsRéseaux neurons
Réseaux neurons
 
Cassandra pour les développeurs java
Cassandra pour les développeurs javaCassandra pour les développeurs java
Cassandra pour les développeurs java
 
Soutenance 17 Avril 2003
Soutenance 17 Avril 2003Soutenance 17 Avril 2003
Soutenance 17 Avril 2003
 

Plus de Philippe Gambette

Nuages arborés et analyse textuelle de corpus politiques avec TreeCloud
Nuages arborés et analyse textuelle de corpus politiques avec TreeCloudNuages arborés et analyse textuelle de corpus politiques avec TreeCloud
Nuages arborés et analyse textuelle de corpus politiques avec TreeCloudPhilippe Gambette
 
Nuages arborés et analyse textuelle - Présentation de l’outil TreeCloud
Nuages arborés et analyse textuelle - Présentation de l’outil TreeCloudNuages arborés et analyse textuelle - Présentation de l’outil TreeCloud
Nuages arborés et analyse textuelle - Présentation de l’outil TreeCloudPhilippe Gambette
 
Longueur de branches et arbres de mots
Longueur de branches et arbres de motsLongueur de branches et arbres de mots
Longueur de branches et arbres de motsPhilippe Gambette
 
Practical use of combinatorial methods for phylogenetic network reconstruction
Practical use of combinatorial methods for phylogenetic network reconstructionPractical use of combinatorial methods for phylogenetic network reconstruction
Practical use of combinatorial methods for phylogenetic network reconstructionPhilippe Gambette
 
Méthodes combinatoires de reconstruction de réseaux phylogénétiques
Méthodes combinatoires de reconstruction de réseaux phylogénétiquesMéthodes combinatoires de reconstruction de réseaux phylogénétiques
Méthodes combinatoires de reconstruction de réseaux phylogénétiquesPhilippe Gambette
 
Utilisation de la visualisation en nuage arboré pour l'analyse littéraire
Utilisation de la visualisation en nuage arboré pour l'analyse littéraireUtilisation de la visualisation en nuage arboré pour l'analyse littéraire
Utilisation de la visualisation en nuage arboré pour l'analyse littérairePhilippe Gambette
 
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...Philippe Gambette
 
Analyse de textes avec TreeCloud et Lexico3
Analyse de textes avec TreeCloud et Lexico3Analyse de textes avec TreeCloud et Lexico3
Analyse de textes avec TreeCloud et Lexico3Philippe Gambette
 
Géolocalisation de données et conception de cartes interactives
Géolocalisation de données et conception de cartes interactivesGéolocalisation de données et conception de cartes interactives
Géolocalisation de données et conception de cartes interactivesPhilippe Gambette
 
The Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic NetworksThe Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic NetworksPhilippe Gambette
 
Visualiser un texte par un nuage arboré
Visualiser un texte par un nuage arboréVisualiser un texte par un nuage arboré
Visualiser un texte par un nuage arboréPhilippe Gambette
 
Estimation du nombre de citations de papillotes et de blagues Carambar
Estimation du nombre de citations de papillotes et de blagues CarambarEstimation du nombre de citations de papillotes et de blagues Carambar
Estimation du nombre de citations de papillotes et de blagues CarambarPhilippe Gambette
 
On restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphsOn restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphsPhilippe Gambette
 

Plus de Philippe Gambette (13)

Nuages arborés et analyse textuelle de corpus politiques avec TreeCloud
Nuages arborés et analyse textuelle de corpus politiques avec TreeCloudNuages arborés et analyse textuelle de corpus politiques avec TreeCloud
Nuages arborés et analyse textuelle de corpus politiques avec TreeCloud
 
Nuages arborés et analyse textuelle - Présentation de l’outil TreeCloud
Nuages arborés et analyse textuelle - Présentation de l’outil TreeCloudNuages arborés et analyse textuelle - Présentation de l’outil TreeCloud
Nuages arborés et analyse textuelle - Présentation de l’outil TreeCloud
 
Longueur de branches et arbres de mots
Longueur de branches et arbres de motsLongueur de branches et arbres de mots
Longueur de branches et arbres de mots
 
Practical use of combinatorial methods for phylogenetic network reconstruction
Practical use of combinatorial methods for phylogenetic network reconstructionPractical use of combinatorial methods for phylogenetic network reconstruction
Practical use of combinatorial methods for phylogenetic network reconstruction
 
Méthodes combinatoires de reconstruction de réseaux phylogénétiques
Méthodes combinatoires de reconstruction de réseaux phylogénétiquesMéthodes combinatoires de reconstruction de réseaux phylogénétiques
Méthodes combinatoires de reconstruction de réseaux phylogénétiques
 
Utilisation de la visualisation en nuage arboré pour l'analyse littéraire
Utilisation de la visualisation en nuage arboré pour l'analyse littéraireUtilisation de la visualisation en nuage arboré pour l'analyse littéraire
Utilisation de la visualisation en nuage arboré pour l'analyse littéraire
 
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
 
Analyse de textes avec TreeCloud et Lexico3
Analyse de textes avec TreeCloud et Lexico3Analyse de textes avec TreeCloud et Lexico3
Analyse de textes avec TreeCloud et Lexico3
 
Géolocalisation de données et conception de cartes interactives
Géolocalisation de données et conception de cartes interactivesGéolocalisation de données et conception de cartes interactives
Géolocalisation de données et conception de cartes interactives
 
The Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic NetworksThe Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic Networks
 
Visualiser un texte par un nuage arboré
Visualiser un texte par un nuage arboréVisualiser un texte par un nuage arboré
Visualiser un texte par un nuage arboré
 
Estimation du nombre de citations de papillotes et de blagues Carambar
Estimation du nombre de citations de papillotes et de blagues CarambarEstimation du nombre de citations de papillotes et de blagues Carambar
Estimation du nombre de citations de papillotes et de blagues Carambar
 
On restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphsOn restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphs
 

Dernier

L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...Faga1939
 
Computer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptxComputer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptxRayane619450
 
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfCOURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfabatanebureau
 
Cours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfCours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfssuserc72852
 
Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfachrafbrahimi1
 
La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film françaisTxaruka
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...Nguyen Thanh Tu Collection
 
Bolero. pptx . Film de A nnne Fontaine
Bolero. pptx . Film   de  A nnne FontaineBolero. pptx . Film   de  A nnne Fontaine
Bolero. pptx . Film de A nnne FontaineTxaruka
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.Txaruka
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaireTxaruka
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film françaisTxaruka
 
gestion des conflits dans les entreprises
gestion des  conflits dans les entreprisesgestion des  conflits dans les entreprises
gestion des conflits dans les entreprisesMajdaKtiri2
 

Dernier (13)

L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
 
Computer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptxComputer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptx
 
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfCOURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
 
Cours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfCours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdf
 
Evaluación Alumnos de Ecole Victor Hugo
Evaluación Alumnos de Ecole  Victor HugoEvaluación Alumnos de Ecole  Victor Hugo
Evaluación Alumnos de Ecole Victor Hugo
 
Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdf
 
La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film français
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
 
Bolero. pptx . Film de A nnne Fontaine
Bolero. pptx . Film   de  A nnne FontaineBolero. pptx . Film   de  A nnne Fontaine
Bolero. pptx . Film de A nnne Fontaine
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaire
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film français
 
gestion des conflits dans les entreprises
gestion des  conflits dans les entreprisesgestion des  conflits dans les entreprises
gestion des conflits dans les entreprises
 

Reconstruction combinatoire de réseaux phylogénétiques

  • 1. Journées annuelles de la Société Française de Systématique Angers – 06/10/2009 Reconstruction combinatoire de réseaux phylogénétiques Philippe Gambette
  • 2. Plan • Les réseaux phylogénétiques • L'arbre en filigrane • Motivations de l'approche combinatoire • Méthodes de reconstruction combinatoire • Limites des méthodes combinatoires • Perspectives
  • 3. Plan • Les réseaux phylogénétiques • L'arbre en filigrane • Motivations de l'approche combinatoire • Méthodes de reconstruction combinatoire • Limites des méthodes combinatoires • Perspectives
  • 4. Les arbres phylogénétiques D'après Woese, Kandler, Wheelis : Towards a natural system of organisms: proposal for the domains Archaea, Bacteria, and Eucarya, Proceedings of the National Academy of Sciences, 87(12), 4576–4579 (1990)
  • 5. Les réseaux phylogénétiques Réseau phylogénétique de la vie Doolittle : Uprooting the Tree of Life, Scientific American (Fév. 2000)
  • 6. Les réseaux phylogénétiques réseau de réseau de bipartitions T-Rex niveau 2 Level-2 réticulogramme SplitsTree réseau couvrant diagramme minimum de synthèse HorizStory réseau médian Network TCS
  • 7. Les réseaux phylogénétiques réseau de réseau de bipartitions T-Rex niveau 2 Level-2 réticulogramme SplitsTree réseau couvrant diagramme minimum de synthèse HorizStory réseau médian Network TCS http://www.lirmm.fr/~gambette/PhylogeneticNetworks
  • 8. Les réseaux phylogénétiques http://www.lirmm.fr/~gambette/PhylogeneticNetworks
  • 9. Les réseaux phylogénétiques http://www.lirmm.fr/~gambette/PhylogeneticNetworks
  • 10. Plan • Les réseaux phylogénétiques • L'arbre en filigrane • Motivations de l'approche combinatoire • Méthodes de reconstruction combinatoire • Limites des méthodes combinatoires • Perspectives
  • 11. L'arbre en filigrane Modèle de transmission arborée de gènes (gène transmis intégralement) Clades “souples” abc ab cd bc a b c d
  • 12. L'arbre en filigrane Modèle de transmission arborée de gènes (gène transmis intégralement) Clades “souples” abc ab cd bc a b c d
  • 13. L'arbre en filigrane Modèle de transmission arborée de gènes (gène transmis intégralement) Clades “souples” abc ab cd bc a b c d L'ensemble C(N) de tous les clusters souplement compatibles avec N peut être de taille exponentielle. Test de compatibilité souple NP-complet (Kanj, Nakhleh, Than, Xia, TCS, 2008)
  • 14. L'arbre en filigrane : réseaux restreints Algorithmes rapides pour des réseaux à structure proche d'un arbre. niveau = nombre maximum de noeuds de réticulation par h1 h3 partie non arborée. h2 a b c d e f g h i j k réseau de niveau 2.
  • 15. L'arbre en filigrane : réseaux restreints Algorithmes rapides pour des réseaux à structure proche d'un arbre. niveau = nombre maximum de noeuds de réticulation par h1 h3 partie non arborée. h2 a b c d e f g h i j k réseau de niveau 2. réseau de niveau 1 (“galled tree”) a b c d e f g h i j k
  • 16. L'arbre en filigrane : réseaux restreints Algorithmes rapides pour des réseaux à structure proche d'un arbre. réseau à une couche de réticulation (“galled h1 h3 network”) : la suppression h2 d'un noeud de réticulation déconnecte le réseau. a b c d e f g h i j k réseau à une couche de réticulation.
  • 17. L'arbre en filigrane : réseaux restreints Algorithmes rapides pour des réseaux à structure proche d'un arbre. réseau à une couche de réticulation (“galled h1 h3 network”) : la suppression h2 d'un noeud de réticulation déconnecte le réseau. a b c d e f g h i j k réseau à une couche de réticulation. h2 h1 h3 réseau à deux couches de réticulation. a b c d e f g h i j k
  • 18. Plan • Les réseaux phylogénétiques • L'arbre en filigrane • Motivations de l'approche combinatoire • Méthodes de reconstruction combinatoire • Limites des méthodes combinatoires • Perspectives
  • 19. Reconstruction de réseaux {séquences de gènes} méthodes de distance Bandelt & Dress 1992 - Legendre & Makarenkov 2000 - Bryant & Moulton 2002 méthodes de parcimonie Hein 1990 - Kececioglu & Gusfield 1994 - Jin, Nakhleh, Snir, Tuller 2009 méthodes de vraisemblance Snir & Tuller 2009 - Jin, Nakhleh, Snir, Tuller 2009 - Velasco & Sober 2009 réseau N
  • 20. Reconstruction de réseaux Problème : méthodes généralement lentes, explosion du nombre de séquences. {séquences de gènes} méthodes de distance Bandelt & Dress 1992 - Legendre & Makarenkov 2000 - Bryant & Moulton 2002 méthodes de parcimonie Hein 1990 - Kececioglu & Gusfield 1994 - Jin, Nakhleh, Snir, Tuller 2009 méthodes de vraisemblance Snir & Tuller 2009 - Jin, Nakhleh, Snir, Tuller 2009 - Velasco & Sober 2009 réseau N
  • 21. Reconstruction combinatoire de réseaux {séquences de gènes} Reconstruction d'un arbre par ensemble de gènes homologues phylome = {arbres} Réconciliation ou consensus d'arbres super-réseau N
  • 22. Reconstruction combinatoire de réseaux {séquences de gènes} Reconstruction d'un arbre par ensemble de gènes homologues phylome = {arbres} Réconciliation ou consensus d'arbres super-réseau N Problème : le consensus d'arbres est un problème NP-complet pour 2 arbres
  • 23. Triplets/quadruplets, splits/clades Problème : Reconstruire le super-réseau d'un ensemble d'arbres est difficile. Idée : reconstuire un réseau contenant tous les : triplets quadruplets clades splits des arbres en entrée ? b c a f d a b c d e Motivations algorithmiques ! e
  • 24. Triplets/quadruplets, splits/clades Idée : reconstuire un réseau contenant tous les : triplets a|ce a b c d e des arbres en entrée ?
  • 25. Triplets/quadruplets, splits/clades Idée : reconstuire un réseau contenant tous les : ab|ce triplets a|ce b c a b c d e a f quadruplets e d des arbres en entrée ?
  • 26. Triplets/quadruplets, splits/clades Idée : reconstuire un réseau contenant tous les : ab|ce triplets a|ce b c a b c d e a f quadruplets e d clades {c,d,e} a b c d e des arbres en entrée ?
  • 27. Triplets/quadruplets, splits/clades Idée : reconstuire un réseau contenant tous les : ab|ce triplets a|ce b c a b c d e a f quadruplets e d clades {c,d,e} {a,b,f} b c a b c d e {c,d,e} splits a f e d des arbres en entrée ?
  • 28. Triplets/quadruplets, splits/clades Idée : modifier le type de données à traiter {arbres} super-réseau N
  • 29. Triplets/quadruplets, splits/clades Idée : modifier le type de données à traiter {arbres} {triplets} {quadruplets} {splits} {clades} super-réseau N super-réseau N'
  • 30. Triplets/quadruplets, splits/clades Idée : modifier le type de données à traiter {arbres} {triplets} {quadruplets} {splits} {clades} super-réseau N super-réseau N' N'=N ?
  • 31. Triplets/quadruplets, splits/clades Un réseau compatible avec l'ensemble de tous les triplets d'un arbre T n'est pas forcément compatible avec T. compatible avec T N {a|bc,a|bd,a|cd,b|cd} mais pas avec T compatible avec a b c d a b c d {abcd,bcd,cd,a,b,c} mais pas avec T compatible avec les clades d'un arbre T compatible avec T.
  • 32. Triplets/quadruplets, splits/clades {arbres} {triplets} {quadruplets} {splits} {clades} super-réseau N super-réseau N' N'=N ? Pas nécessairement, mais : N' complexe N complexe N contient également les triplets, quadruplets...
  • 33. Triplets/quadruplets, splits/clades {arbres} {triplets} {quadruplets} {splits} {clades} super-réseau N super-réseau N' N'=N ? Pas nécessairement, mais : N' peut être intéressant en soi...
  • 34. Plan • Les réseaux phylogénétiques • L'arbre en filigrane • Motivations de l'approche combinatoire • Méthodes de reconstruction combinatoire • Limites des méthodes combinatoires • Perspectives
  • 35. Reconstruction depuis les triplets {arbres} Méthodes exactes rapides pour reconstruire un réseau de niveau 1 et 2 (s'il en existe un) à partir d'un ensemble dense de triplets (Jansson, Nguyen & Sung, SODA'05 : O(n3) pour niveau 1) (van Iersel, Kelk & al, RECOMB'08 : O(n8) pour niveau 2) dense = {triplets} sur chaque ensemble de 3 feuilles, au moins 1 triplet existe dans T. Programme Simplistic N' réseau Réseau phylogénétique de de niveau 1 levures - Van Iersel, Keijsper, Kelk, Stougie, Hagen Boekhout : ou 2 Constructing level-2 phylogenetic networks from triplets. Recomb 2008 http://homepages.cwi.nl/~kelk/simplistic.html
  • 36. Reconstruction depuis les clades souples {arbres} Consensus de clades souples : Dendroscope (Huson, Dezulian, Franz, Rausch, Richter & Rupp, 2007) Méthode exacte rapide de reconstruction de réseaux à 1 couche de réticulation à partir {clades} de clades souples (Huson, Rupp, Berry, Gambette & Paul, 2009) 2 étapes : - choix du plus gros sous-ensemble de taxons où les clades sont compatibles avec un arbre - ajout du minimum de réticulations pour connecter les autres taxons N' réseau “galled network” http://www.dendroscope.org
  • 37. Reconstruction depuis les clades souples 16 arbres de gènes de 46 espèces de bactéries {arbres} Réseau “galled network” des clades apparaissant dans 20% des arbres : {clades} Dendroscope N' réseau Enterobacteriales “galled Pasteurellales Aeromonadales network” Alteromonadales Oceanospirillales Rhodobacterales Rhizobiales Données de la base HOGENOM, projet PhylAriane
  • 38. Reconstruction depuis les clades souples {arbres} SplitsTree Dendroscope Filtre : présence dans 20% des arbres {splits} {clades} Données de la base HOGENOM, projet PhylAriane
  • 39. Plan • Les réseaux phylogénétiques • L'arbre en filigrane • Motivations de l'approche combinatoire • Méthodes de reconstruction combinatoire • Limites des méthodes combinatoires • Perspectives
  • 40. Limites des approches combinatoires Plusieurs réseaux minimaux ont exactement le même ensemble d'arbres, de triplets, de clades. Gambette & Huber, 2009 a c a c b b b c a Caractérisation des réseaux de niveau 1 ayant exactement le même ensemble d'arbres, de triplets, de clades.
  • 41. Limites des approches combinatoires Plusieurs réseaux minimaux ont exactement le même ensemble d'arbres, de triplets, de clades. Gambette & Huber, 2009 x1 x1 x2 x2 b a b a 2 réseaux de niveau 2 avec le même ensemble de triplets
  • 42. Limites des approches combinatoires Plusieurs réseaux minimaux ont exactement le même ensemble d'arbres, de triplets, de clades. Gambette & Huber, 2009 x1 x1 x2 x2 b a b a 2 réseaux de niveau 2 avec le même ensemble de triplets Même avec des données de départ complètes et correctes, il est impossible de choisir entre les formes ambiguës !
  • 43. Plan • Les réseaux phylogénétiques • L'arbre en filigrane • Motivations de l'approche combinatoire • Méthodes de reconstruction combinatoire • Limites des méthodes combinatoires • Perspectives
  • 44. Perspectives Reconstruction du réseau par un dialogue entre méthodes combinatoires et méthodes statistiques Reconstruction combinatoire d'un ensemble de candidats Construction des données combinatoires Choix parmi les candidats par méthodes statistiques Proposition d'un réseau phylogénétique
  • 45. Des questions ? Merci pour votre attention ! Co-auteurs des résultats présentés : - Vincent Berry, Christophe Paul (LIRMM, Université Montpellier 2) - Katharina Huber (Université East Anglia, UK) - Daniel Huson, Regula Rupp (Université de Tübingen, Allemagne) Graphe de collaboration des auteurs les plus représentés dans la base de données “who's who in phylogenetic networks”. http://www.lirmm.fr/~gambette
  • 46. Reconstruction depuis les triplets {arbres} Méthodes exactes rapides pour reconstruire un réseau de niveau 1 et 2 (s'il en existe un) à partir d'un ensemble dense de triplets (Jansson, Nguyen & Sung, SODA'05 : O(n3) pour niveau 1) (van Iersel, Kelk & al, RECOMB'08 : O(n8) pour niveau 2) dense = {triplets} sur chaque ensemble de 3 feuilles, au moins 1 triplet existe dans T. Programme Simplistic N' réseau Réseau phylogénétique de de niveau 1 levures - Van Iersel, Keijsper, Kelk, Stougie, Hagen Boekhout : ou 2 Constructing level-2 phylogenetic networks from triplets. Recomb 2008 http://homepages.cwi.nl/~kelk/simplistic.html
  • 47. L'arbre en filigrane : réseaux restreints Algorithmes rapides pour des réseaux à structure proche d'un arbre. niveau = nombre maximum de noeuds de réticulation par h1 h3 partie non arborée. h2 a b c d e f g h i j k réseau de niveau 2.
  • 48. Reconstruction depuis les clades souples 16 arbres de gènes de 46 espèces de bactéries {arbres} Réseau “galled network” des clades apparaissant dans 20% des arbres : {clades} Dendroscope N' réseau Enterobacteriales “galled Pasteurellales Aeromonadales network” Alteromonadales Oceanospirillales Rhodobacterales Rhizobiales Données de la base HOGENOM, projet PhylAriane