SlideShare une entreprise Scribd logo
1  sur  68
Télécharger pour lire hors ligne
Rencontres ALPHY-GTGC
             Montpellier– 27/01/2009

          Reconstruction
   de réseaux phylogénétiques
        à structure arborée
  depuis un ensemble de clusters

           Daniel Huson, Regula Rupp,
Vincent Berry, Philippe Gambette, Christophe Paul
Plan

• Les réseaux phylogénétiques à structure arborée
• Reconstruction depuis des clusters
• Une approche en deux étapes
• L'ensemble minimum de conflits
• L'attachement minimum
• L'implémentation dans Dendroscope
Plan

• Les réseaux phylogénétiques à structure arborée
• Reconstruction depuis des clusters
• Une approche en deux étapes
• L'ensemble minimum de conflits
• L'attachement minimum
• L'implémentation dans Dendroscope
Les arbres phylogénétiques




       D'après Woese, Kandler, Wheelis : Towards a natural system of organisms:
       proposal for the domains Archaea, Bacteria, and Eucarya, Proceedings of
       the National Academy of Sciences, 87(12), 4576–4579 (1990)
Les réseaux phylogénétiques




              Réseau phylogénétique
              de la vie




       Doolittle : Uprooting the Tree of Life, Scientific American (Fév. 2000)
Les réseaux phylogénétiques




                            réseau de
                                                          T-Rex
          réseau de         bipartitions
          niveau 2
                                                   réticulogramme
Level-2
                      SplitsTree
                                            réseau couvrant
                                            minimum
diagramme
de synthèse
                              réseau
        HorizStory
                              médian


                           Network         TCS
Les réseaux phylogénétiques




                            réseau de
                                                          T-Rex
          réseau de         bipartitions
          niveau 2
                                                   réticulogramme
Level-2
                      SplitsTree
                                            réseau couvrant
                                            minimum
diagramme
de synthèse
                              réseau
        HorizStory
                              médian


                           Network         TCS
Réseaux abstraits ou explicites

Un réseau phylogénétique explicite est un réseau
phylogénétique dont tous les noeuds correspondent à des
événements biologiques précis.

Un réseau phylogénétique abstrait reflète des signaux
phylogénétiques sans nécessairement représenter
explicitement des événements biologiques.
Réseaux abstraits ou explicites

Un réseau phylogénétique explicite est un réseau
phylogénétique dont tous les noeuds correspondent à des
événements biologiques précis.

Un réseau phylogénétique abstrait reflète des signaux
phylogénétiques sans nécessairement représenter
explicitement des événements biologiques.




                                Réseau phylogénétique explicite de
                                levures, Leo van Iersel, Judith Keijsper,
                                Steven Kelk, Leen Stougie, Ferry Hagen,
                                Teun Boekhout : Constructing level-2
                                phylogenetic networks from triplets.
                                RECOMB'08
Réseaux abstraits ou explicites

Un réseau phylogénétique explicite est un réseau
phylogénétique dont tous les noeuds correspondent à des
événements biologiques précis.

Un réseau phylogénétique abstrait reflète des signaux
phylogénétiques sans nécessairement représenter
explicitement des événements biologiques.




         Réseau phylogénétique abstrait de
         champignons, www.splitstree.org
Hiérarchie de sous-classes de réseaux
Des restrictions pour obtenir des algorithmes efficaces :
 généralement                                                      généralement
 explicite                                                              abstrait




                                    http://www.lirmm.fr/~gambette/RePhylogeneticNetworks.php
Les réseaux à structure arborée
         réseau à structure arborée = galled network
 généralement                                                     généralement
 explicite                                                             abstrait




                                   http://www.lirmm.fr/~gambette/RePhylogeneticNetworks.php
Les réseaux à structure arborée
   Définition d'un réseau à structure arborée
   “galled network” :
   réseau phylogénétique tel que
   pour tout noeud hybride, sa suppression
   déconnecte le graphe.

                                       feuilles, taxons
       N
                                       noeud d'arbre
           h2
                                       noeud hybride
                                       arc d'arbre
                          h4
                   h3
       h1                              arc hybride

   abcdefghi                   jk

   Réseau enraciné : arcs orientés vers le bas
Les réseaux à structure arborée
   Définition d'un réseau à structure arborée
   “galled network” :
   réseau phylogénétique tel que
   pour tout noeud hybride, sa suppression
   déconnecte le graphe.

                                       feuilles, taxons
       N
                                       noeud d'arbre
        déconnecté en
        supprimant h2                  noeud hybride
                                       arc d'arbre
                          h4
                   h3
       h1                              arc hybride

   abcdefghi                   jk

   Réseau enraciné : arcs orientés vers le bas
Les réseaux à structure arborée
   Définition d'un réseau à structure arborée
   “galled network” :
   réseau phylogénétique tel que
   pour tout noeud hybride, sa suppression
   déconnecte le graphe.

      N'
                                  N' n'est pas un réseau
           h2
                                  à structure arborée.

                        h4
                h5 h3
       h1

   abcdefghi                 jk
Les réseaux à structure arborée
   Définition d'un réseau à structure arborée
   “galled network” :
   réseau phylogénétique tel que
   pour tout noeud hybride, sa suppression
   déconnecte le graphe.

      N'
                                  N' n'est pas un réseau
                                  à structure arborée.

                                  N' reste connecté après
                        h4        suppression de h2
              h5 h3
       h1

   abcdefghi                 jk
Plan

• Les réseaux phylogénétiques à structure arborée
• Reconstruction depuis des clusters
• Une approche en deux étapes
• L'ensemble minimum de conflits
• L'attachement minimum
• L'implémentation dans Dendroscope
Super-réseaux

Problème :
Reconstruire le super-réseau d'un ensemble d'arbres avec
le minimum de réticulations est
                       difficile.
                                Bordewich & Semple, DAM, 2007
Idée :
reconstuire un réseau contenant tous les :
                          triplets
                        quadruplets
                          clusters
                           splits
                                      des arbres en entrée ?
                                       b       c
                                  a
                                   f
                                                   abcde
                                               d
Motivation algorithmique                   e
Super-réseaux

Idée :
reconstuire un réseau contenant tous les :

                                               a|ce
                           triplets
                                      abcde




                                      des arbres en entrée ?
Super-réseaux

Idée :
reconstuire un réseau contenant tous les :

      ab|ce                                        a|ce
                               triplets
                   b       c
                                          abcde
              a
                            quadruplets
               f
                           d
                       e




                                          des arbres en entrée ?
Super-réseaux

Idée :
reconstuire un réseau contenant tous les :

      ab|ce                                        a|ce
                               triplets
                   b       c
                                          abcde
              a
                            quadruplets
               f
                           d
                       e
                                                   {c,d,e}
                               clusters

                                          abcde



                                          des arbres en entrée ?
Super-réseaux

Idée :
reconstuire un réseau contenant tous les :

      ab|ce                                        a|ce
                               triplets
                   b       c
                                          abcde
              a
                            quadruplets
               f
                           d
                       e
                                                   {c,d,e}
                               clusters

                   b
    {a,b,f}                               abcde
                           c
    {c,d,e}                     splits
              a
               f
                           d              des arbres en entrée ?
                       e
Super-réseaux

Idée :
reconstuire un réseau contenant tous les



                                                 {c,d,e}
                         clusters
                                       abcde



                                      des arbres en entrée ?
Clusters pleins / souples et réseaux
 X cluster pleinement compatible avec N (hardwired)
 si X est l'ensemble des feuilles sous un noeud de N.

 X cluster souplement compatible avec N (softwired)
 s'il existe un arbre T dans N sur les taxons L tel que X est
 l'ensemble des feuilles sous un noeud de T.

                         abc        cd
                               bc



                        abcd
Clusters pleins / souples et réseaux
 X cluster pleinement compatible avec N (hardwired)
 si X est l'ensemble des feuilles sous un noeud de N.

 X cluster souplement compatible avec N (softwired)
 s'il existe un arbre T dans N sur les taxons L tel que X est
 l'ensemble des feuilles sous un noeud de T.
                          abc
                          ab    cd
                             bc



                        abcd
Clusters pleins / souples et réseaux
 X cluster pleinement compatible avec N (hardwired)
 si X est l'ensemble des feuilles sous un noeud de N.

 X cluster souplement compatible avec N (softwired)
 s'il existe un arbre T dans N sur les taxons L tel que X est
 l'ensemble des feuilles sous un noeud de T.
                          abc
                          ab    cd
                             bc



                        abcd
Clusters pleins / souples et réseaux
 X cluster pleinement compatible avec N (hardwired)
 si X est l'ensemble des feuilles sous un noeud de N.

 X cluster souplement compatible avec N (softwired)
 s'il existe un arbre T dans N sur les taxons L tel que X est
 l'ensemble des feuilles sous un noeud de T.
                          abc
                          ab    cd
                             bc



                        abcd
L'ensemble C(N) de tous les clusters souplement
compatibles avec N peut être de taille exponentielle.
Test de compatibilité souple NP-complet.
                               Kanj, Nakhleh, Than & Xia, TCS, 2008
Clusters et réseaux à structure arborée

 Test de compatibilité souple polynomial sur les réseaux à
 structure arborée.



 Pour tout ensemble C de clusters, il existe un réseau à
 structure arborée compatible avec C.


            N
                         Le réseau à structure arborée N
                         est compatible avec
                         tout cluster sur {a,b,c,d,e,f}.

     abcdef
Clusters et réseaux à structure arborée

 Test de compatibilité souple polynomial sur les réseaux à
 structure arborée.



 Pour tout ensemble C de clusters, il existe un réseau à
 structure arborée compatible avec C.

    {a,b,d}
              N
                         Le réseau à structure arborée N
                         est compatible avec
                         tout cluster sur {a,b,c,d,e,f}.

     abcdef
Reconstruction depuis les clusters


                    {arbres}




                           {clusters}



       super-réseau N    super-réseau N'
Reconstruction depuis les clusters


                    {arbres}




                           {clusters}



       super-réseau N    super-réseau N'


                   N'=N ?
Reconstruction depuis les clusters
Un réseau N compatible avec tous les clusters d'un arbre T
n'est pas forcément compatible avec T.


      T               N           pleinement/souplement
                                  compatible avec
                                  {abcd,bcd,cd,a,b,c,d}
                                  mais pas avec T
      abcd           abcd


          compatible avec les clusters d'un arbre T




                     compatible avec T.
Reconstruction depuis les clusters


                    {arbres}




                           {clusters}



       super-réseau N    super-réseau N'


        N plus complexe que N'
Plan

• Les réseaux phylogénétiques à structure arborée
• Reconstruction depuis des clusters
• Une approche en deux étapes
• L'ensemble minimum de réticulations
• L'attachement minimum
• L'implémentation dans Dendroscope
Une approche en deux étapes


1- Trouver un ensemble minimum de conflits parmi les
clusters :
- partie sans conflits arbre,
- taxons impliqués dans des conflits sous les réticulations.

                MAXIMUM COMPATIBLE SUBSET



2- Attacher les taxons impliqués dans des conflits à l'arbre
avec un nombre minimal d'arcs.

              MINIMUM ATTACHMENT PROBLEM
Une approche en deux étapes


1- Trouver un ensemble minimum de conflits parmi les
clusters :
- partie sans conflits arbre,
- taxons impliqués dans des conflits sous les réticulations.

                MAXIMUM COMPATIBLE SUBSET



2- Attacher les taxons impliqués dans des conflits à l'arbre
avec un nombre minimal d'arcs.

              MINIMUM ATTACHMENT PROBLEM
Plan

• Les réseaux phylogénétiques à structure arborée
• Reconstruction depuis des clusters
• Une approche en deux étapes
• L'ensemble minimum de conflits
• L'attachement minimum
• L'implémentation dans Dendroscope
L'ensemble minimum de conflits
 Clusters incompatibles si ni inclus ni disjoints : A                  B

 Graphe d'incompatibilité d'un ensemble de clusters :
 - un cluster par sommet,
 - une arête entre deux clusters incompatibles.

 Exemple : {{a,b},{a,b,x},{a,x},{b,x},{b,y},{c,d},{c,d,x,y},{c,x},{d,y},{x,y}}


               ab   abx
                                  Problème :
         xy               ax
                                  pour chaque composante
                                  connexe du graphe, enlever le
        dy                 bx
                                  nombre minimum de taxons pour
         cx               by      supprimer toutes les arêtes.
              cdxy cd
L'ensemble minimum de conflits
 Exemple : {{a,b},{a,b,x},{a,x},{b,x},{b,y},{c,d},{c,d,x,y},{c,x},{d,y},{x,y}}
            ab    abx
                                  Problème :
                                  pour chaque composante
    xy                  ax
                                  connexe du graphe, enlever un
  dy                     bx
                                  nombre minimum de taxons pour
                                  supprimer toutes les arêtes.
    cx                  by
           cdxy cd
                                       ({b},{a},{x})         ({x},{b},{y})
                                       ({a},{b},{x})         ({b},{x},{c,d,y})
                                       ({a},{b},{y})         ({b},{x},{c})
 Déclaration                           ({a,x},{b},{y})       ({b},{x},{y})
                                       ({a,b},{x},{c,d,y})   ({b},{y},{c,d,x})
 d'incompatibilités :
                                       ({a,b},{x},{c})       ({b},{y},{d})
 (AB,A∩B,BA)
                                       ({a,b},{x},{y})       ({b},{y},{x})
       A      B                        ({a},{x},{b})         ({d},{c},{x})
                                       ({a},{x},{c,d,y})     ({c},{d},{y})
 pour tous clusters A et B             ({a},{x},{c})         ({c},{x},{y})
 incompatibles                         ({a},{x},{y})         ({d},{y},{x})
L'ensemble minimum de conflits
 Exemple : {{a,b},{a,b,x},{a,x},{b,x},{b,y},{c,d},{c,d,x,y},{c,x},{d,y},{x,y}}
          ab   abx
                                  Problème :
                                  pour chaque composante
    xy                 ax
                                  connexe du graphe, enlever un
  dy                    bx
                                  nombre minimum de taxons pour
                                  supprimer toutes les arêtes.
    cx                 by
         cdxy cd
                                       ({b},{a},{x})         ({x},{b},{y})
                                       ({a},{b},{x})         ({b},{x},{c,d,y})
                                       ({a},{b},{y})         ({b},{x},{c})
 Choisir un nombre                     ({a,x},{b},{y})       ({b},{x},{y})
 minimum de taxons                     ({a,b},{x},{c,d,y})   ({b},{y},{c,d,x})
 pour supprimer un élément             ({a,b},{x},{c})       ({b},{y},{d})
                                       ({a,b},{x},{y})       ({b},{y},{x})
 dans chaque déclaration
                                       ({a},{x},{b})         ({d},{c},{x})
 d'incompatibilité                     ({a},{x},{c,d,y})     ({c},{d},{y})
                                       ({a},{x},{c})         ({c},{x},{y})
           A       B
                                       ({a},{x},{y})         ({d},{y},{x})
L'ensemble minimum de conflits
 Exemple : {{a,b},{a,b,x},{a,x},{b,x},{b,y},{c,d},{c,d,x,y},{c,x},{d,y},{x,y}}
          ab   abx
                                  Problème :
                                  pour chaque composante
    xy                 ax
                                  connexe du graphe, enlever un
  dy                    bx
                                  nombre minimum de taxons pour
                                  supprimer toutes les arêtes.
    cx                 by
         cdxy cd
                                       ({b},{a},{x})         ({x},{b},{y})
                                       ({a},{b},{x})         ({b},{x},{c,d,y})
                                       ({a},{b},{y})         ({b},{x},{c})
 Choisir un nombre                     ({a,x},{b},{y})       ({b},{x},{y})
 minimum de taxons (x et y)            ({a,b},{x},{c,d,y})   ({b},{y},{c,d,x})
 pour supprimer un élément             ({a,b},{x},{c})       ({b},{y},{d})
 dans chaque déclaration               ({a,b},{x},{y})       ({b},{y},{x})
                                       ({a},{x},{b})         ({d},{c},{x})
 d'incompatibilité
                                       ({a},{x},{c,d,y})     ({c},{d},{y})
                                       ({a},{x},{c})         ({c},{x},{y})
           A       B
                                       ({a},{x},{y})         ({d},{y},{x})
L'ensemble minimum de conflits
 Problème :
 enlever un nombre minimum k de taxons pour supprimer
 toutes les incompatibilités pour un ensemble H de
 déclarations d'incompatibilité.

 NP-complet dans le cas général
                                       Steel & Hamel, AML, 1996

 NP-complet sur un graphe connexe, sans taxons “jumeaux”
                                  réduction depuis le cas général

 Algorithme FPT en O(3k k |H|) sur un graphe connexe, sans
 taxons “jumeaux”
                               algorithme incrémental basé sur le
                              choix du candidat de taille minimale
                               qui résout le plus d'incompatibilités
                                  pour tenter de lui faire résoudre
                                          l'incompatibilité suivante
                              (implémenté dans Dendroscope 2).
Plan

• Les réseaux phylogénétiques à structure arborée
• Reconstruction depuis des clusters
• Une approche en deux étapes
• L'ensemble minimum de conflits
• L'attachement minimum
• L'implémentation dans Dendroscope
L'attachement minimum
 Etape précédente :
 ensemble minimum de taxons R tels que les clusters
 sur XR sont compatibles (avec un arbre T).

                                     T : arbre représentant
                    ab   cd
                                     les clusters sur XR
                  abx      cdxy
                ax bx cx      dy
                      by
                a   b    c      d
                                    XR
                          xy
                                     B : réseau représentant les
                               B
                                     clusters maximaux sur R et
                      x    y
                                     les singletons de R.
                               R
 Problème :
 Attacher T à B avec le minimum de liens.
L'attachement minimum
                                   T
                        ab   cd
                      abx      cdxy
                    ax bx cx      dy
                          by
                    a   b    c      d

                              xy
                                   B
                          x    y


 C1 - Satisfaction des clusters de T :
 Pour tout arc e de l'arbre T et tout taxon r de R contenu
 dans un cluster de e, il existe un lien depuis un des
 descendants de e dans T vers le noeud correspondant à r
 dans B, ou un noeud de B correspondant à un cluster
 maximal qui contient r.
L'attachement minimum
                                   T
                        ab   cd
                      abx      cdxy
                    ax bx cx      dy
                          by
                    a   b    c      d

                              xy
                                   B
                          x    y


 C1 - Satisfaction des clusters de T :
 Pour tout arc e de l'arbre T et tout taxon r de R contenu
 dans un cluster de e, il existe un lien depuis un des
 descendants de e dans T vers le noeud correspondant à r
 dans B, ou un noeud de B correspondant à un cluster
 maximal qui contient r.
L'attachement minimum
                                   T
                        ab   cd
                      abx      cdxy
                    ax bx cx      dy
                          by
                    a   b    c      d

                              xy
                                   B
                          x    y


 C1 - Satisfaction des clusters de T :
 Pour tout arc e de l'arbre T et tout taxon r de R contenu
 dans un cluster de e, il existe un lien depuis un des
 descendants de e dans T vers le noeud correspondant à r
 dans B, ou un noeud de B correspondant à un cluster
 maximal qui contient r.
L'attachement minimum
                                        T
                           ab      cd
                         abx        cdxy
                    ax                  dy
                                   cx
                    a      b        c   d

                                   xy
                                        B
                               x    y


 C2 - Satisfaction de la paternité des noeuds de B :
 Tout noeud de B correspondant à plus d'un taxon est relié à
 un noeud de T par un lien exactement.
L'attachement minimum
                                        T
                           ab      cd
                         abx        cdxy
                    ax                  dy
                                   cx
                    a      b        c   d

                                   xy
                                        B
                               x    y


 C2 - Satisfaction de la paternité des noeuds de B :
 Tout noeud de B correspondant à plus d'un taxon est relié à
 un noeud de T par un lien exactement.
L'attachement minimum
                                        T
                           ab      cd
                         abx        cdxy
                    ax                  dy
                                   cx
                    a      b        c   d

                                   xy
                                        B
                               x    y


 C2 - Satisfaction de la paternité des noeuds de B :
 Tout noeud de B correspondant à plus d'un taxon est relié à
 un noeud de T par un lien exactement.
L'attachement minimum
                                   T
                        ab   cd
                      abx
                    ax bx cx
                          by
                    a   b    c     d

                              xy
                                   B
                          x    y


 C3 – Absence de parasites des clusters de T dans B :
 Pour tout arc e de T, si un cluster correspondant à e ne
 contient pas un taxon r de R, il existe un chemin d'un noeud
 qui ne descend pas de e vers le noeud associé à r.
L'attachement minimum
                                   T
                        ab   cd
                      abx
                    ax bx cx
                          by
                    a   b    c     d

                              xy
                                   B
                          x    y


 C3 – Absence de parasites des clusters de T dans B :
 Pour tout arc e de T, si un cluster correspondant à e ne
 contient pas un taxon r de R, il existe un chemin d'un noeud
 qui ne descend pas de e vers le noeud associé à r.
L'attachement minimum
                                   T
                        ab   cd
                      abx
                    ax bx cx
                          by
                    a   b    c     d

                              xy
                                   B
                          x    y


 C3 – Absence de parasites des clusters de T dans B :
 Pour tout arc e de T, si un cluster correspondant à e ne
 contient pas un taxon r de R, il existe un chemin d'un noeud
 qui ne descend pas de e vers le noeud associé à r.
L'attachement minimum
                                   T
                        ab   cd
                      abx      cdxy
                    ax bx cx      dy
                          by
                    a   b    c      d

                              xy
                                   B
                          x    y


 Problème :
 Trouver un attachement
 respectant les contraintes C1, C2, et C3
 et de taille minimale.
L'attachement minimum

 Problème :
 Trouver un attachement respectant les contraintes
 C1, C2, et C3, et de taille minimale.

 NP-complet
                                          réduction depuis SetCover

 W[2]-dur, paramétré par le nombre de liens à ajouter.
                                          réduction depuis SetCover

 Algorithmes :
 - Séparation et évaluation
                 (branch-and-bound, implémenté dans Dendroscope 2)
 - Programme linéaire en nombres entiers
Plan

• Les réseaux phylogénétiques à structure arborée
• Reconstruction depuis des clusters
• Une approche en deux étapes
• L'ensemble minimum de conflits
• L'attachement minimum
• L'implémentation dans Dendroscope
L'implémentation dans Dendroscope




               google(phylogenetic networks) → http://www.lirmm.fr/~gambette/PhylogeneticNetworks
L'implémentation dans Dendroscope




               google(phylogenetic networks) → http://www.lirmm.fr/~gambette/PhylogeneticNetworks
L'implémentation dans Dendroscope




                         google(Dendroscope) → http://www.dendroscope.org
L'implémentation dans Dendroscope
L'implémentation dans Dendroscope
L'implémentation dans Dendroscope
L'implémentation dans Dendroscope




             Données fournies par le Grass Phylogeny Working Group, Phylogeny and
             subfamilial classification of the grasses (poaceae), Annals of the Missouri
                             Botanical Garden, 88(3), 373-457 (2001),




  Données utilisées également par Bordewich, Linz, St John et Semple dans A reduction algorithm
  for computing the hybridization number of two trees, Evolutionary Bioinformatics, 3, 86-98, 2007.
L'implémentation dans Dendroscope
Merci pour votre attention !




                               http://www.lirmm.fr/~gambette
Merci pour votre attention !




    Réseau phylogénétique à structure arborée des clusters de co-publication
                                                                               http://www.lirmm.fr/~gambette
Annexe : figures (éventuellement) utiles




Données de : Auch, Steigele, Huson, Henz – Horizontal gene transfer in a common set of prokariotic genes, in preparation.
Annexe : tableau (éventuellement) utile

Contenu connexe

Plus de Philippe Gambette

Utilisation de la visualisation en nuage arboré pour l'analyse littéraire
Utilisation de la visualisation en nuage arboré pour l'analyse littéraireUtilisation de la visualisation en nuage arboré pour l'analyse littéraire
Utilisation de la visualisation en nuage arboré pour l'analyse littérairePhilippe Gambette
 
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...Philippe Gambette
 
Analyse de textes avec TreeCloud et Lexico3
Analyse de textes avec TreeCloud et Lexico3Analyse de textes avec TreeCloud et Lexico3
Analyse de textes avec TreeCloud et Lexico3Philippe Gambette
 
Géolocalisation de données et conception de cartes interactives
Géolocalisation de données et conception de cartes interactivesGéolocalisation de données et conception de cartes interactives
Géolocalisation de données et conception de cartes interactivesPhilippe Gambette
 
The Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic NetworksThe Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic NetworksPhilippe Gambette
 
Visualiser un texte par un nuage arboré
Visualiser un texte par un nuage arboréVisualiser un texte par un nuage arboré
Visualiser un texte par un nuage arboréPhilippe Gambette
 
Estimation du nombre de citations de papillotes et de blagues Carambar
Estimation du nombre de citations de papillotes et de blagues CarambarEstimation du nombre de citations de papillotes et de blagues Carambar
Estimation du nombre de citations de papillotes et de blagues CarambarPhilippe Gambette
 
On restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphsOn restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphsPhilippe Gambette
 
Visualising a text with a tree cloud
Visualising a text with a tree cloudVisualising a text with a tree cloud
Visualising a text with a tree cloudPhilippe Gambette
 

Plus de Philippe Gambette (9)

Utilisation de la visualisation en nuage arboré pour l'analyse littéraire
Utilisation de la visualisation en nuage arboré pour l'analyse littéraireUtilisation de la visualisation en nuage arboré pour l'analyse littéraire
Utilisation de la visualisation en nuage arboré pour l'analyse littéraire
 
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
 
Analyse de textes avec TreeCloud et Lexico3
Analyse de textes avec TreeCloud et Lexico3Analyse de textes avec TreeCloud et Lexico3
Analyse de textes avec TreeCloud et Lexico3
 
Géolocalisation de données et conception de cartes interactives
Géolocalisation de données et conception de cartes interactivesGéolocalisation de données et conception de cartes interactives
Géolocalisation de données et conception de cartes interactives
 
The Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic NetworksThe Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic Networks
 
Visualiser un texte par un nuage arboré
Visualiser un texte par un nuage arboréVisualiser un texte par un nuage arboré
Visualiser un texte par un nuage arboré
 
Estimation du nombre de citations de papillotes et de blagues Carambar
Estimation du nombre de citations de papillotes et de blagues CarambarEstimation du nombre de citations de papillotes et de blagues Carambar
Estimation du nombre de citations de papillotes et de blagues Carambar
 
On restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphsOn restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphs
 
Visualising a text with a tree cloud
Visualising a text with a tree cloudVisualising a text with a tree cloud
Visualising a text with a tree cloud
 

Dernier

Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfachrafbrahimi1
 
Mécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.pptMécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.pptssusercbaa22
 
MaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.pptMaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.pptssusercbaa22
 
gestion des conflits dans les entreprises
gestion des  conflits dans les entreprisesgestion des  conflits dans les entreprises
gestion des conflits dans les entreprisesMajdaKtiri2
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.Txaruka
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film françaisTxaruka
 
A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.Franck Apolis
 
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfCOURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfabatanebureau
 
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...M2i Formation
 
Approche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptxApproche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptxssusercbaa22
 
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptxSUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptxssuserbd075f
 
La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film françaisTxaruka
 
presentation l'interactionnisme symbolique finale.pptx
presentation l'interactionnisme symbolique  finale.pptxpresentation l'interactionnisme symbolique  finale.pptx
presentation l'interactionnisme symbolique finale.pptxMalikaIdseaid1
 
Bolero. pptx . Film de A nnne Fontaine
Bolero. pptx . Film   de  A nnne FontaineBolero. pptx . Film   de  A nnne Fontaine
Bolero. pptx . Film de A nnne FontaineTxaruka
 
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptxSAID MASHATE
 

Dernier (16)

Evaluación Alumnos de Ecole Victor Hugo
Evaluación Alumnos de Ecole  Victor HugoEvaluación Alumnos de Ecole  Victor Hugo
Evaluación Alumnos de Ecole Victor Hugo
 
Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdf
 
Mécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.pptMécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.ppt
 
MaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.pptMaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.ppt
 
gestion des conflits dans les entreprises
gestion des  conflits dans les entreprisesgestion des  conflits dans les entreprises
gestion des conflits dans les entreprises
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film français
 
A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.
 
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfCOURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
 
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
 
Approche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptxApproche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptx
 
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptxSUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
 
La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film français
 
presentation l'interactionnisme symbolique finale.pptx
presentation l'interactionnisme symbolique  finale.pptxpresentation l'interactionnisme symbolique  finale.pptx
presentation l'interactionnisme symbolique finale.pptx
 
Bolero. pptx . Film de A nnne Fontaine
Bolero. pptx . Film   de  A nnne FontaineBolero. pptx . Film   de  A nnne Fontaine
Bolero. pptx . Film de A nnne Fontaine
 
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
 

Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensemble de clusters

  • 1. Rencontres ALPHY-GTGC Montpellier– 27/01/2009 Reconstruction de réseaux phylogénétiques à structure arborée depuis un ensemble de clusters Daniel Huson, Regula Rupp, Vincent Berry, Philippe Gambette, Christophe Paul
  • 2. Plan • Les réseaux phylogénétiques à structure arborée • Reconstruction depuis des clusters • Une approche en deux étapes • L'ensemble minimum de conflits • L'attachement minimum • L'implémentation dans Dendroscope
  • 3. Plan • Les réseaux phylogénétiques à structure arborée • Reconstruction depuis des clusters • Une approche en deux étapes • L'ensemble minimum de conflits • L'attachement minimum • L'implémentation dans Dendroscope
  • 4. Les arbres phylogénétiques D'après Woese, Kandler, Wheelis : Towards a natural system of organisms: proposal for the domains Archaea, Bacteria, and Eucarya, Proceedings of the National Academy of Sciences, 87(12), 4576–4579 (1990)
  • 5. Les réseaux phylogénétiques Réseau phylogénétique de la vie Doolittle : Uprooting the Tree of Life, Scientific American (Fév. 2000)
  • 6. Les réseaux phylogénétiques réseau de T-Rex réseau de bipartitions niveau 2 réticulogramme Level-2 SplitsTree réseau couvrant minimum diagramme de synthèse réseau HorizStory médian Network TCS
  • 7. Les réseaux phylogénétiques réseau de T-Rex réseau de bipartitions niveau 2 réticulogramme Level-2 SplitsTree réseau couvrant minimum diagramme de synthèse réseau HorizStory médian Network TCS
  • 8. Réseaux abstraits ou explicites Un réseau phylogénétique explicite est un réseau phylogénétique dont tous les noeuds correspondent à des événements biologiques précis. Un réseau phylogénétique abstrait reflète des signaux phylogénétiques sans nécessairement représenter explicitement des événements biologiques.
  • 9. Réseaux abstraits ou explicites Un réseau phylogénétique explicite est un réseau phylogénétique dont tous les noeuds correspondent à des événements biologiques précis. Un réseau phylogénétique abstrait reflète des signaux phylogénétiques sans nécessairement représenter explicitement des événements biologiques. Réseau phylogénétique explicite de levures, Leo van Iersel, Judith Keijsper, Steven Kelk, Leen Stougie, Ferry Hagen, Teun Boekhout : Constructing level-2 phylogenetic networks from triplets. RECOMB'08
  • 10. Réseaux abstraits ou explicites Un réseau phylogénétique explicite est un réseau phylogénétique dont tous les noeuds correspondent à des événements biologiques précis. Un réseau phylogénétique abstrait reflète des signaux phylogénétiques sans nécessairement représenter explicitement des événements biologiques. Réseau phylogénétique abstrait de champignons, www.splitstree.org
  • 11. Hiérarchie de sous-classes de réseaux Des restrictions pour obtenir des algorithmes efficaces : généralement généralement explicite abstrait http://www.lirmm.fr/~gambette/RePhylogeneticNetworks.php
  • 12. Les réseaux à structure arborée réseau à structure arborée = galled network généralement généralement explicite abstrait http://www.lirmm.fr/~gambette/RePhylogeneticNetworks.php
  • 13. Les réseaux à structure arborée Définition d'un réseau à structure arborée “galled network” : réseau phylogénétique tel que pour tout noeud hybride, sa suppression déconnecte le graphe. feuilles, taxons N noeud d'arbre h2 noeud hybride arc d'arbre h4 h3 h1 arc hybride abcdefghi jk Réseau enraciné : arcs orientés vers le bas
  • 14. Les réseaux à structure arborée Définition d'un réseau à structure arborée “galled network” : réseau phylogénétique tel que pour tout noeud hybride, sa suppression déconnecte le graphe. feuilles, taxons N noeud d'arbre déconnecté en supprimant h2 noeud hybride arc d'arbre h4 h3 h1 arc hybride abcdefghi jk Réseau enraciné : arcs orientés vers le bas
  • 15. Les réseaux à structure arborée Définition d'un réseau à structure arborée “galled network” : réseau phylogénétique tel que pour tout noeud hybride, sa suppression déconnecte le graphe. N' N' n'est pas un réseau h2 à structure arborée. h4 h5 h3 h1 abcdefghi jk
  • 16. Les réseaux à structure arborée Définition d'un réseau à structure arborée “galled network” : réseau phylogénétique tel que pour tout noeud hybride, sa suppression déconnecte le graphe. N' N' n'est pas un réseau à structure arborée. N' reste connecté après h4 suppression de h2 h5 h3 h1 abcdefghi jk
  • 17. Plan • Les réseaux phylogénétiques à structure arborée • Reconstruction depuis des clusters • Une approche en deux étapes • L'ensemble minimum de conflits • L'attachement minimum • L'implémentation dans Dendroscope
  • 18. Super-réseaux Problème : Reconstruire le super-réseau d'un ensemble d'arbres avec le minimum de réticulations est difficile. Bordewich & Semple, DAM, 2007 Idée : reconstuire un réseau contenant tous les : triplets quadruplets clusters splits des arbres en entrée ? b c a f abcde d Motivation algorithmique e
  • 19. Super-réseaux Idée : reconstuire un réseau contenant tous les : a|ce triplets abcde des arbres en entrée ?
  • 20. Super-réseaux Idée : reconstuire un réseau contenant tous les : ab|ce a|ce triplets b c abcde a quadruplets f d e des arbres en entrée ?
  • 21. Super-réseaux Idée : reconstuire un réseau contenant tous les : ab|ce a|ce triplets b c abcde a quadruplets f d e {c,d,e} clusters abcde des arbres en entrée ?
  • 22. Super-réseaux Idée : reconstuire un réseau contenant tous les : ab|ce a|ce triplets b c abcde a quadruplets f d e {c,d,e} clusters b {a,b,f} abcde c {c,d,e} splits a f d des arbres en entrée ? e
  • 23. Super-réseaux Idée : reconstuire un réseau contenant tous les {c,d,e} clusters abcde des arbres en entrée ?
  • 24. Clusters pleins / souples et réseaux X cluster pleinement compatible avec N (hardwired) si X est l'ensemble des feuilles sous un noeud de N. X cluster souplement compatible avec N (softwired) s'il existe un arbre T dans N sur les taxons L tel que X est l'ensemble des feuilles sous un noeud de T. abc cd bc abcd
  • 25. Clusters pleins / souples et réseaux X cluster pleinement compatible avec N (hardwired) si X est l'ensemble des feuilles sous un noeud de N. X cluster souplement compatible avec N (softwired) s'il existe un arbre T dans N sur les taxons L tel que X est l'ensemble des feuilles sous un noeud de T. abc ab cd bc abcd
  • 26. Clusters pleins / souples et réseaux X cluster pleinement compatible avec N (hardwired) si X est l'ensemble des feuilles sous un noeud de N. X cluster souplement compatible avec N (softwired) s'il existe un arbre T dans N sur les taxons L tel que X est l'ensemble des feuilles sous un noeud de T. abc ab cd bc abcd
  • 27. Clusters pleins / souples et réseaux X cluster pleinement compatible avec N (hardwired) si X est l'ensemble des feuilles sous un noeud de N. X cluster souplement compatible avec N (softwired) s'il existe un arbre T dans N sur les taxons L tel que X est l'ensemble des feuilles sous un noeud de T. abc ab cd bc abcd L'ensemble C(N) de tous les clusters souplement compatibles avec N peut être de taille exponentielle. Test de compatibilité souple NP-complet. Kanj, Nakhleh, Than & Xia, TCS, 2008
  • 28. Clusters et réseaux à structure arborée Test de compatibilité souple polynomial sur les réseaux à structure arborée. Pour tout ensemble C de clusters, il existe un réseau à structure arborée compatible avec C. N Le réseau à structure arborée N est compatible avec tout cluster sur {a,b,c,d,e,f}. abcdef
  • 29. Clusters et réseaux à structure arborée Test de compatibilité souple polynomial sur les réseaux à structure arborée. Pour tout ensemble C de clusters, il existe un réseau à structure arborée compatible avec C. {a,b,d} N Le réseau à structure arborée N est compatible avec tout cluster sur {a,b,c,d,e,f}. abcdef
  • 30. Reconstruction depuis les clusters {arbres} {clusters} super-réseau N super-réseau N'
  • 31. Reconstruction depuis les clusters {arbres} {clusters} super-réseau N super-réseau N' N'=N ?
  • 32. Reconstruction depuis les clusters Un réseau N compatible avec tous les clusters d'un arbre T n'est pas forcément compatible avec T. T N pleinement/souplement compatible avec {abcd,bcd,cd,a,b,c,d} mais pas avec T abcd abcd compatible avec les clusters d'un arbre T compatible avec T.
  • 33. Reconstruction depuis les clusters {arbres} {clusters} super-réseau N super-réseau N' N plus complexe que N'
  • 34. Plan • Les réseaux phylogénétiques à structure arborée • Reconstruction depuis des clusters • Une approche en deux étapes • L'ensemble minimum de réticulations • L'attachement minimum • L'implémentation dans Dendroscope
  • 35. Une approche en deux étapes 1- Trouver un ensemble minimum de conflits parmi les clusters : - partie sans conflits arbre, - taxons impliqués dans des conflits sous les réticulations. MAXIMUM COMPATIBLE SUBSET 2- Attacher les taxons impliqués dans des conflits à l'arbre avec un nombre minimal d'arcs. MINIMUM ATTACHMENT PROBLEM
  • 36. Une approche en deux étapes 1- Trouver un ensemble minimum de conflits parmi les clusters : - partie sans conflits arbre, - taxons impliqués dans des conflits sous les réticulations. MAXIMUM COMPATIBLE SUBSET 2- Attacher les taxons impliqués dans des conflits à l'arbre avec un nombre minimal d'arcs. MINIMUM ATTACHMENT PROBLEM
  • 37. Plan • Les réseaux phylogénétiques à structure arborée • Reconstruction depuis des clusters • Une approche en deux étapes • L'ensemble minimum de conflits • L'attachement minimum • L'implémentation dans Dendroscope
  • 38. L'ensemble minimum de conflits Clusters incompatibles si ni inclus ni disjoints : A B Graphe d'incompatibilité d'un ensemble de clusters : - un cluster par sommet, - une arête entre deux clusters incompatibles. Exemple : {{a,b},{a,b,x},{a,x},{b,x},{b,y},{c,d},{c,d,x,y},{c,x},{d,y},{x,y}} ab abx Problème : xy ax pour chaque composante connexe du graphe, enlever le dy bx nombre minimum de taxons pour cx by supprimer toutes les arêtes. cdxy cd
  • 39. L'ensemble minimum de conflits Exemple : {{a,b},{a,b,x},{a,x},{b,x},{b,y},{c,d},{c,d,x,y},{c,x},{d,y},{x,y}} ab abx Problème : pour chaque composante xy ax connexe du graphe, enlever un dy bx nombre minimum de taxons pour supprimer toutes les arêtes. cx by cdxy cd ({b},{a},{x}) ({x},{b},{y}) ({a},{b},{x}) ({b},{x},{c,d,y}) ({a},{b},{y}) ({b},{x},{c}) Déclaration ({a,x},{b},{y}) ({b},{x},{y}) ({a,b},{x},{c,d,y}) ({b},{y},{c,d,x}) d'incompatibilités : ({a,b},{x},{c}) ({b},{y},{d}) (AB,A∩B,BA) ({a,b},{x},{y}) ({b},{y},{x}) A B ({a},{x},{b}) ({d},{c},{x}) ({a},{x},{c,d,y}) ({c},{d},{y}) pour tous clusters A et B ({a},{x},{c}) ({c},{x},{y}) incompatibles ({a},{x},{y}) ({d},{y},{x})
  • 40. L'ensemble minimum de conflits Exemple : {{a,b},{a,b,x},{a,x},{b,x},{b,y},{c,d},{c,d,x,y},{c,x},{d,y},{x,y}} ab abx Problème : pour chaque composante xy ax connexe du graphe, enlever un dy bx nombre minimum de taxons pour supprimer toutes les arêtes. cx by cdxy cd ({b},{a},{x}) ({x},{b},{y}) ({a},{b},{x}) ({b},{x},{c,d,y}) ({a},{b},{y}) ({b},{x},{c}) Choisir un nombre ({a,x},{b},{y}) ({b},{x},{y}) minimum de taxons ({a,b},{x},{c,d,y}) ({b},{y},{c,d,x}) pour supprimer un élément ({a,b},{x},{c}) ({b},{y},{d}) ({a,b},{x},{y}) ({b},{y},{x}) dans chaque déclaration ({a},{x},{b}) ({d},{c},{x}) d'incompatibilité ({a},{x},{c,d,y}) ({c},{d},{y}) ({a},{x},{c}) ({c},{x},{y}) A B ({a},{x},{y}) ({d},{y},{x})
  • 41. L'ensemble minimum de conflits Exemple : {{a,b},{a,b,x},{a,x},{b,x},{b,y},{c,d},{c,d,x,y},{c,x},{d,y},{x,y}} ab abx Problème : pour chaque composante xy ax connexe du graphe, enlever un dy bx nombre minimum de taxons pour supprimer toutes les arêtes. cx by cdxy cd ({b},{a},{x}) ({x},{b},{y}) ({a},{b},{x}) ({b},{x},{c,d,y}) ({a},{b},{y}) ({b},{x},{c}) Choisir un nombre ({a,x},{b},{y}) ({b},{x},{y}) minimum de taxons (x et y) ({a,b},{x},{c,d,y}) ({b},{y},{c,d,x}) pour supprimer un élément ({a,b},{x},{c}) ({b},{y},{d}) dans chaque déclaration ({a,b},{x},{y}) ({b},{y},{x}) ({a},{x},{b}) ({d},{c},{x}) d'incompatibilité ({a},{x},{c,d,y}) ({c},{d},{y}) ({a},{x},{c}) ({c},{x},{y}) A B ({a},{x},{y}) ({d},{y},{x})
  • 42. L'ensemble minimum de conflits Problème : enlever un nombre minimum k de taxons pour supprimer toutes les incompatibilités pour un ensemble H de déclarations d'incompatibilité. NP-complet dans le cas général Steel & Hamel, AML, 1996 NP-complet sur un graphe connexe, sans taxons “jumeaux” réduction depuis le cas général Algorithme FPT en O(3k k |H|) sur un graphe connexe, sans taxons “jumeaux” algorithme incrémental basé sur le choix du candidat de taille minimale qui résout le plus d'incompatibilités pour tenter de lui faire résoudre l'incompatibilité suivante (implémenté dans Dendroscope 2).
  • 43. Plan • Les réseaux phylogénétiques à structure arborée • Reconstruction depuis des clusters • Une approche en deux étapes • L'ensemble minimum de conflits • L'attachement minimum • L'implémentation dans Dendroscope
  • 44. L'attachement minimum Etape précédente : ensemble minimum de taxons R tels que les clusters sur XR sont compatibles (avec un arbre T). T : arbre représentant ab cd les clusters sur XR abx cdxy ax bx cx dy by a b c d XR xy B : réseau représentant les B clusters maximaux sur R et x y les singletons de R. R Problème : Attacher T à B avec le minimum de liens.
  • 45. L'attachement minimum T ab cd abx cdxy ax bx cx dy by a b c d xy B x y C1 - Satisfaction des clusters de T : Pour tout arc e de l'arbre T et tout taxon r de R contenu dans un cluster de e, il existe un lien depuis un des descendants de e dans T vers le noeud correspondant à r dans B, ou un noeud de B correspondant à un cluster maximal qui contient r.
  • 46. L'attachement minimum T ab cd abx cdxy ax bx cx dy by a b c d xy B x y C1 - Satisfaction des clusters de T : Pour tout arc e de l'arbre T et tout taxon r de R contenu dans un cluster de e, il existe un lien depuis un des descendants de e dans T vers le noeud correspondant à r dans B, ou un noeud de B correspondant à un cluster maximal qui contient r.
  • 47. L'attachement minimum T ab cd abx cdxy ax bx cx dy by a b c d xy B x y C1 - Satisfaction des clusters de T : Pour tout arc e de l'arbre T et tout taxon r de R contenu dans un cluster de e, il existe un lien depuis un des descendants de e dans T vers le noeud correspondant à r dans B, ou un noeud de B correspondant à un cluster maximal qui contient r.
  • 48. L'attachement minimum T ab cd abx cdxy ax dy cx a b c d xy B x y C2 - Satisfaction de la paternité des noeuds de B : Tout noeud de B correspondant à plus d'un taxon est relié à un noeud de T par un lien exactement.
  • 49. L'attachement minimum T ab cd abx cdxy ax dy cx a b c d xy B x y C2 - Satisfaction de la paternité des noeuds de B : Tout noeud de B correspondant à plus d'un taxon est relié à un noeud de T par un lien exactement.
  • 50. L'attachement minimum T ab cd abx cdxy ax dy cx a b c d xy B x y C2 - Satisfaction de la paternité des noeuds de B : Tout noeud de B correspondant à plus d'un taxon est relié à un noeud de T par un lien exactement.
  • 51. L'attachement minimum T ab cd abx ax bx cx by a b c d xy B x y C3 – Absence de parasites des clusters de T dans B : Pour tout arc e de T, si un cluster correspondant à e ne contient pas un taxon r de R, il existe un chemin d'un noeud qui ne descend pas de e vers le noeud associé à r.
  • 52. L'attachement minimum T ab cd abx ax bx cx by a b c d xy B x y C3 – Absence de parasites des clusters de T dans B : Pour tout arc e de T, si un cluster correspondant à e ne contient pas un taxon r de R, il existe un chemin d'un noeud qui ne descend pas de e vers le noeud associé à r.
  • 53. L'attachement minimum T ab cd abx ax bx cx by a b c d xy B x y C3 – Absence de parasites des clusters de T dans B : Pour tout arc e de T, si un cluster correspondant à e ne contient pas un taxon r de R, il existe un chemin d'un noeud qui ne descend pas de e vers le noeud associé à r.
  • 54. L'attachement minimum T ab cd abx cdxy ax bx cx dy by a b c d xy B x y Problème : Trouver un attachement respectant les contraintes C1, C2, et C3 et de taille minimale.
  • 55. L'attachement minimum Problème : Trouver un attachement respectant les contraintes C1, C2, et C3, et de taille minimale. NP-complet réduction depuis SetCover W[2]-dur, paramétré par le nombre de liens à ajouter. réduction depuis SetCover Algorithmes : - Séparation et évaluation (branch-and-bound, implémenté dans Dendroscope 2) - Programme linéaire en nombres entiers
  • 56. Plan • Les réseaux phylogénétiques à structure arborée • Reconstruction depuis des clusters • Une approche en deux étapes • L'ensemble minimum de conflits • L'attachement minimum • L'implémentation dans Dendroscope
  • 57. L'implémentation dans Dendroscope google(phylogenetic networks) → http://www.lirmm.fr/~gambette/PhylogeneticNetworks
  • 58. L'implémentation dans Dendroscope google(phylogenetic networks) → http://www.lirmm.fr/~gambette/PhylogeneticNetworks
  • 59. L'implémentation dans Dendroscope google(Dendroscope) → http://www.dendroscope.org
  • 63. L'implémentation dans Dendroscope Données fournies par le Grass Phylogeny Working Group, Phylogeny and subfamilial classification of the grasses (poaceae), Annals of the Missouri Botanical Garden, 88(3), 373-457 (2001), Données utilisées également par Bordewich, Linz, St John et Semple dans A reduction algorithm for computing the hybridization number of two trees, Evolutionary Bioinformatics, 3, 86-98, 2007.
  • 65. Merci pour votre attention ! http://www.lirmm.fr/~gambette
  • 66. Merci pour votre attention ! Réseau phylogénétique à structure arborée des clusters de co-publication http://www.lirmm.fr/~gambette
  • 67. Annexe : figures (éventuellement) utiles Données de : Auch, Steigele, Huson, Henz – Horizontal gene transfer in a common set of prokariotic genes, in preparation.
  • 68. Annexe : tableau (éventuellement) utile