Journées Graphes et Algorithmes
Marseille – 09/11/2010
Quadruplets et réseaux
non enracinés de niveau k
Philippe Gambette,...
• Réseaux non enracinés de niveau k
• Complexité de la reconstruction
• Réseaux phylogénétiques
• Triplets et quadruplets
...
Les arbres phylogénétiques
D'après Woese, Kandler, Wheelis : Towards a natural system of organisms:
proposal for the domai...
Les réseaux phylogénétiques
D'après Parker & Stone, South Park S10E12 – The Theory
of Evolution according to Mrs Garrison ...
Les réseaux phylogénétiques
Doolittle : Uprooting the Tree of Life, Scientific American (Fév. 2000)
Réseau phylogénétique
...
Les réseaux phylogénétiques
TCS
SplitsTree
Network
Level-2
T-Rex
HorizStory réseau
médian
réseau couvrant
minimum
réseau d...
Reconstruction de réseaux
{séquences de gènes}
réseau N
méthodes de distance
Bandelt & Dress 1992 - Legendre &
Makarenkov ...
Reconstruction de réseaux
Problème : méthodes généralement lentes,
explosion du nombre de séquences.
{séquences de gènes}
...
Reconstruction combinatoire de réseaux
phylome = {arbres}
super-réseau N
{séquences de gènes}
Reconstruction d'un arbre
pa...
Reconstruction combinatoire de réseaux
phylome = {arbres}
super-réseau N
{séquences de gènes}
Reconstruction d'un arbre
pa...
Triplets/quadruplets, splits/clades
Problème :
Reconstruire le super-réseau d'un ensemble d'arbres est
difficile.
Idée :
r...
• Réseaux non enracinés de niveau k
• Complexité de la reconstruction
• Réseaux phylogénétiques
• Triplets et quadruplets
...
Triplets et quadruplets
Idée :
reconstuire un réseau contenant tous les :
triplets
des arbres en entrée ?
a b c d e
a|ce
Triplets et quadruplets
Idée :
reconstuire un réseau contenant tous les :
triplets
quadruplets
des arbres en entrée ?
a b ...
Triplets et quadruplets
Idée :
modifier le type de données à traiter
{arbres}
super-réseau N
Triplets et quadruplets
Idée :
modifier le type de données à traiter
{arbres}
super-réseau N super-réseau N'
{triplets} {q...
Triplets et quadruplets
Idée :
modifier le type de données à traiter
{arbres}
super-réseau N super-réseau N'
{triplets} {q...
Triplets et quadruplets
Un réseau contenant tous les quadruplets d'un arbre T
ne contient pas forcément T.
Contient tous l...
Triplets et quadruplets
Pas nécessairement, mais :
N'=N ?
{ N } ⊆ { N' }
{arbres}
super-réseau N super-réseau N'
{triplets...
• Réseaux non enracinés de niveau k
• Complexité de la reconstruction
• Réseaux phylogénétiques
• Triplets et quadruplets
...
Réseaux non enracinés de niveau k
Algorithmes rapides pour des réseaux à structure proche
d'un arbre.
a
b c
d
e
f
ghi comp...
Réseaux non enracinés de niveau k
Algorithmes rapides pour des réseaux à structure proche
d'un arbre.
niveau = maximum, pa...
Réseaux non enracinés de niveau k
Algorithmes rapides pour des réseaux à structure proche
d'un arbre.
réseau non enraciné
...
Réseaux non enracinés de niveau k
Algorithmes rapides pour des réseaux à structure proche
d'un arbre.
réseau non enraciné
...
Réseaux non enracinés de niveau k
Algorithmes rapides pour des réseaux à structure proche
d'un arbre.
niveau = mesure de
“...
Réseaux non enracinés de niveau k
Algorithmes rapides pour des réseaux à structure proche
d'un arbre.
réseau non enraciné
...
Réseaux non enracinés de niveau k
Algorithmes rapides pour des réseaux à structure proche
d'un arbre.
réseau non enraciné
...
Réseaux non enracinés de niveau k
Algorithmes rapides pour des réseaux à structure proche
d'un arbre.
réseau non enraciné
...
• Réseaux non enracinés de niveau k
• Complexité de la reconstruction
• Réseaux phylogénétiques
• Triplets et quadruplets
...
Complexité de la vérification
N, réseau non enraciné de niveau k
Ensemble des quadruplets de N ?
a
b c
d
e
f
ghi
N
Complexité de la vérification
a
b c
d
e
f
ghi
N
N, réseau non enraciné de niveau k
Ensemble des quadruplets de N ?
ab|cd q...
Complexité de la vérification
a
b c
d
e
f
ghi
N
N, réseau non enraciné de niveau k
Ensemble des quadruplets de N ?
ab|cd q...
Complexité de la vérification
a
b c
d
e
f
ghi
N
N, réseau non enraciné de niveau k
Ensemble des quadruplets de N ?
ab|cd q...
Complexité de la vérification
a
b c
d
e
f
ghi
N
ab|cd quadruplet de N
N contient deux chemins
sommet-disjoints :
- entre a...
Complexité de la vérification
a
b c
d
e
f
ghi
N
ab|cd quadruplet de N
N contient deux chemins
sommet-disjoints :
- entre a...
Complexité de la vérification
N, réseau non enraciné de niveau k
Ensemble des quadruplets de N ?
En O(n5
(1+α(n,n)))
N enr...
Complexité de la reconstruction
Q, ensemble de quadruplets
∃? réseau non enraciné de niveau k qui contient Q ?
Complexité de reconstruction
non enraciné enraciné
général
dense
1 quadruplet
par ensemble
de 4 feuilles
complet
tous les
...
Complexité de reconstruction
non enraciné enraciné
général
dense
1 quadruplet
par ensemble
de 4 feuilles
complet
tous les
...
Complexité de la reconstruction
Q, ensemble de quadruplets
∃? réseau non enraciné de niveau k qui contient Q ?
T, ensemble...
Complexité de la reconstruction
Q, ensemble de quadruplets
∃? réseau non enraciné de niveau k qui contient Q ?
T, ensemble...
Réduction depuis Betweenness
C, ensemble de contraintes ci
=(a,b,c) : b “entre” a et c ∈ A
∃? ordre σ sur A qui vérifie le...
Réduction depuis Betweenness
ci
= (a,b,c)
Qi
= {pi
p'i
|ab, pi
a|bc, pi
b|cqi
, pi
c|qi
q'i
, pi
α|p'i
β, qi
α|q'i
β}
Q' =...
Réduction depuis Betweenness
ci
= (a,b,c)
Qi
= {pi
p'i
|ab, pi
a|bc, pi
b|cqi
, pi
c|qi
q'i
, pi
α|p'i
β, qi
α|q'i
β}
Q' =...
Réduction depuis Betweenness
ci
= (a,b,c)
Qi
= {pi
p'i
|ab, pi
a|bc, pi
b|cqi
, pi
c|qi
q'i
, pi
α|p'i
β, qi
α|q'i
β}
Q' =...
Réduction depuis Betweenness
ci
= (a,b,c)
Qi
= {pi
p'i
|ab, pi
a|bc, pi
b|cqi
, pi
c|qi
q'i
, pi
α|p'i
β, qi
α|q'i
β}
Q' =...
Réduction depuis Betweenness
ci
= (a,b,c)
Qi
= {pi
p'i
|ab, pi
a|bc, pi
b|cqi
, pi
c|qi
q'i
, pi
α|p'i
β, qi
α|q'i
β}
Q' =...
• Réseaux non enracinés de niveau k
• Complexité de la reconstruction
• Réseaux phylogénétiques
• Triplets et quadruplets
...
Complexité de reconstruction
non enraciné enraciné
général
dense
1 quadruplet
par ensemble
de 4 feuilles
complet
tous les
...
Décomposition dans le cas dense
• Q, ensemble dense de quadruplets :
Sur tout ensemble de quatre feuilles,
il existe un qu...
Décomposition dans le cas dense
Q, ensemble dense de quadruplets
L'ensemble des SN-bipartitions de Q est compatible, i.e.
...
Décomposition dans le cas dense
Q, ensemble dense de quadruplets
L'ensemble des SN-bipartitions de Q est compatible, i.e.
...
Décomposition dans le cas dense
Q, ensemble dense de quadruplets
L'ensemble des SN-bipartitions de Q est compatible, i.e.
...
Décomposition dans le cas dense
Q, ensemble dense de quadruplets
contenus dans un réseau N de niveau 1
Il existe un réseau...
Décomposition dans le cas complet
Q(N), ensemble de tous les quadruplets
contenus dans un réseau N de niveau k
Les SN-bipa...
Décomposition dans le cas complet
Q(N), ensemble de tous les quadruplets
contenus dans un réseau N de niveau k
Les SN-bipa...
• Réseaux non enracinés de niveau k
• Complexité de la reconstruction
• Réseaux phylogénétiques
• Triplets et quadruplets
...
Complexité de reconstruction
non enraciné enraciné
général
dense
1 quadruplet
par ensemble
de 4 feuilles
complet
tous les
...
Reconstruction dans le cas complet
Comment reconstruire chaque composante
2-arête-connexe de N de niveau 1 à partir de Q(N...
Reconstruction dans le cas complet
Comment reconstruire chaque composante
2-arête-connexe de N de niveau 1 à partir de Q(N...
• Réseaux non enracinés de niveau k
• Complexité de la reconstruction
• Réseaux phylogénétiques
• Triplets et quadruplets
...
Complexité de reconstruction
non enraciné enraciné
général
dense
1 quadruplet
par ensemble
de 4 feuilles
complet
tous les
...
Lien avec Non-Betweenness
Comment reconstruire chaque composante
2-arête-connexe de N de niveau 1 à partir de Q(N) ?
Recon...
Lien avec Non-Betweenness
Comment reconstruire chaque composante
2-arête-connexe de N de niveau 1 à partir de Q(N) ?
Recon...
Merci pour votre attention !
non enraciné enraciné
général
dense
1 quadruplet
par ensemble
de 4 feuilles
complet
tous les
...
Prochain SlideShare
Chargement dans…5
×

Quadruplets et réseaux non enracinés de niveau k

771 vues

Publié le

Présentation aux JGA 2010 (Journées Graphes et Algorithmes) au CIRM (Marseille)

Publié dans : Formation
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
771
Sur SlideShare
0
Issues des intégrations
0
Intégrations
3
Actions
Partages
0
Téléchargements
2
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Quadruplets et réseaux non enracinés de niveau k

  1. 1. Journées Graphes et Algorithmes Marseille – 09/11/2010 Quadruplets et réseaux non enracinés de niveau k Philippe Gambette, Vincent Berry, Christophe Paul
  2. 2. • Réseaux non enracinés de niveau k • Complexité de la reconstruction • Réseaux phylogénétiques • Triplets et quadruplets • Décomposition dans le cas dense Plan • Reconstruction dans le cas complet • Lien avec Non-Betweenness
  3. 3. Les arbres phylogénétiques D'après Woese, Kandler, Wheelis : Towards a natural system of organisms: proposal for the domains Archaea, Bacteria, and Eucarya, Proceedings of the National Academy of Sciences, 87(12), 4576–4579 (1990)
  4. 4. Les réseaux phylogénétiques D'après Parker & Stone, South Park S10E12 – The Theory of Evolution according to Mrs Garrison (2006) Problème : prendre en compte les échanges de matériel génétique entre espèces coexistantes
  5. 5. Les réseaux phylogénétiques Doolittle : Uprooting the Tree of Life, Scientific American (Fév. 2000) Réseau phylogénétique de la vie
  6. 6. Les réseaux phylogénétiques TCS SplitsTree Network Level-2 T-Rex HorizStory réseau médian réseau couvrant minimum réseau de niveau 2 réseau de bipartitions réticulogramme diagramme de synthèse
  7. 7. Reconstruction de réseaux {séquences de gènes} réseau N méthodes de distance Bandelt & Dress 1992 - Legendre & Makarenkov 2000 - Bryant & Moulton 2002 méthodes de parcimonie Hein 1990 - Kececioglu & Gusfield 1994 - Jin, Nakhleh, Snir, Tuller 2009 méthodes de vraisemblance Snir & Tuller 2009 - Jin, Nakhleh, Snir, Tuller 2009 - Velasco & Sober 2009 AATTGCAGTAGCCCAAAAT ACCTGCAGTAGACCAAT GCTTGCCGTAGACAAGAAT ATTTGCAGAAGACCAAAT AATTGCAGTAGACAAGAAT ACTTGCAGTAGCACAAAAT ACCTGGTGTAAAAT
  8. 8. Reconstruction de réseaux Problème : méthodes généralement lentes, explosion du nombre de séquences. {séquences de gènes} réseau N AATTGCAGTAGCCCAAAAT ACCTGCAGTAGACCAAT GCTTGCCGTAGACAAGAAT ATTTGCAGAAGACCAAAT AATTGCAGTAGACAAGAAT ACTTGCAGTAGCACAAAAT ACCTGGTGTAAAAT méthodes de distance Bandelt & Dress 1992 - Legendre & Makarenkov 2000 - Bryant & Moulton 2002 méthodes de parcimonie Hein 1990 - Kececioglu & Gusfield 1994 - Jin, Nakhleh, Snir, Tuller 2009 méthodes de vraisemblance Snir & Tuller 2009 - Jin, Nakhleh, Snir, Tuller 2009 - Velasco & Sober 2009
  9. 9. Reconstruction combinatoire de réseaux phylome = {arbres} super-réseau N {séquences de gènes} Reconstruction d'un arbre par ensemble de gènes homologues Réconciliation ou consensus d'arbres AATTGCAGTAGCCCAAAAT ACCTGCAGTAGACCAAT GCTTGCCGTAGACAAGAAT ATTTGCAGAAGACCAAAT AATTGCAGTAGACAAGAAT ACTTGCAGTAGCACAAAAT ACCTGGTGTAAAAT
  10. 10. Reconstruction combinatoire de réseaux phylome = {arbres} super-réseau N {séquences de gènes} Reconstruction d'un arbre par ensemble de gènes homologues Réconciliation ou consensus d'arbres Problème : le consensus d'arbres est un problème NP-complet pour 2 arbres AATTGCAGTAGCCCAAAAT ACCTGCAGTAGACCAAT GCTTGCCGTAGACAAGAAT ATTTGCAGAAGACCAAAT AATTGCAGTAGACAAGAAT ACTTGCAGTAGCACAAAAT ACCTGGTGTAAAAT
  11. 11. Triplets/quadruplets, splits/clades Problème : Reconstruire le super-réseau d'un ensemble d'arbres est difficile. Idée : reconstuire un réseau contenant tous les : triplets quadruplets des arbres en entrée ? Motivations algorithmiques ! a b c d e a f b c de
  12. 12. • Réseaux non enracinés de niveau k • Complexité de la reconstruction • Réseaux phylogénétiques • Triplets et quadruplets • Décomposition dans le cas dense Plan • Reconstruction dans le cas complet • Lien avec Non-Betweenness
  13. 13. Triplets et quadruplets Idée : reconstuire un réseau contenant tous les : triplets des arbres en entrée ? a b c d e a|ce
  14. 14. Triplets et quadruplets Idée : reconstuire un réseau contenant tous les : triplets quadruplets des arbres en entrée ? a b c d e a|ce ab|ce a f b c de
  15. 15. Triplets et quadruplets Idée : modifier le type de données à traiter {arbres} super-réseau N
  16. 16. Triplets et quadruplets Idée : modifier le type de données à traiter {arbres} super-réseau N super-réseau N' {triplets} {quadruplets}
  17. 17. Triplets et quadruplets Idée : modifier le type de données à traiter {arbres} super-réseau N super-réseau N' {triplets} {quadruplets} N'=N ?
  18. 18. Triplets et quadruplets Un réseau contenant tous les quadruplets d'un arbre T ne contient pas forcément T. Contient tous les quadruplets d'un arbre T contient T. T N contient tous les quadruplets de T mais pas T a b c d e f a b c de f N
  19. 19. Triplets et quadruplets Pas nécessairement, mais : N'=N ? { N } ⊆ { N' } {arbres} super-réseau N super-réseau N' {triplets} {quadruplets}
  20. 20. • Réseaux non enracinés de niveau k • Complexité de la reconstruction • Réseaux phylogénétiques • Triplets et quadruplets • Décomposition dans le cas dense Plan • Reconstruction dans le cas complet • Lien avec Non-Betweenness
  21. 21. Réseaux non enracinés de niveau k Algorithmes rapides pour des réseaux à structure proche d'un arbre. a b c d e f ghi composante 2-arête connexe = sous-graphe sans isthme (arête qui déconnecte le graphe) maximal
  22. 22. Réseaux non enracinés de niveau k Algorithmes rapides pour des réseaux à structure proche d'un arbre. niveau = maximum, parmi toutes les composantes 2-arêtes-connexes, du nombre minimum d'arêtes à supprimer pour obtenir un arbre. réseau non enraciné de niveau 2. a b c d e f ghi composante 2-arête connexe = sous-graphe sans isthme (arête qui déconnecte le graphe) maximal
  23. 23. Réseaux non enracinés de niveau k Algorithmes rapides pour des réseaux à structure proche d'un arbre. réseau non enraciné de niveau 2. a b c d e f ghi équivalent non enraciné du niveau des réseaux enracinés Choy, Jansson, Sadakane & Sung 2005
  24. 24. Réseaux non enracinés de niveau k Algorithmes rapides pour des réseaux à structure proche d'un arbre. réseau non enraciné de niveau 2. a b c d e f ghi équivalent non enraciné du niveau des réseaux enracinés Choy, Jansson, Sadakane & Sung 2005 Enraciner un arbre : difficile en phylogénie le faire plutôt à la fin !
  25. 25. Réseaux non enracinés de niveau k Algorithmes rapides pour des réseaux à structure proche d'un arbre. niveau = mesure de “complexité” du réseau phylogénétique réseau non enraciné de niveau 2. a b c d e f ghi
  26. 26. Réseaux non enracinés de niveau k Algorithmes rapides pour des réseaux à structure proche d'un arbre. réseau non enraciné de niveau 1. a b c d e f ghi niveau = mesure de “complexité” du réseau phylogénétique niveau 0 = arbre
  27. 27. Réseaux non enracinés de niveau k Algorithmes rapides pour des réseaux à structure proche d'un arbre. réseau non enraciné de niveau 1. a b c d e f ghi niveau = mesure de “complexité” du réseau phylogénétique niveau 0 = arbre niveau 1 = “arbre de cycles”
  28. 28. Réseaux non enracinés de niveau k Algorithmes rapides pour des réseaux à structure proche d'un arbre. réseau non enraciné de niveau > 1. a b c d e f ghi niveau = mesure de “complexité” du réseau phylogénétique niveau 0 = arbre niveau 1 = “arbre de cycles” niveau > 1 = “arbre de blobs”
  29. 29. • Réseaux non enracinés de niveau k • Complexité de la reconstruction • Réseaux phylogénétiques • Triplets et quadruplets • Décomposition dans le cas dense Plan • Reconstruction dans le cas complet • Lien avec Non-Betweenness
  30. 30. Complexité de la vérification N, réseau non enraciné de niveau k Ensemble des quadruplets de N ? a b c d e f ghi N
  31. 31. Complexité de la vérification a b c d e f ghi N N, réseau non enraciné de niveau k Ensemble des quadruplets de N ? ab|cd quadruplet de N N contient deux chemins sommet-disjoints :
  32. 32. Complexité de la vérification a b c d e f ghi N N, réseau non enraciné de niveau k Ensemble des quadruplets de N ? ab|cd quadruplet de N N contient deux chemins sommet-disjoints : - entre a et b
  33. 33. Complexité de la vérification a b c d e f ghi N N, réseau non enraciné de niveau k Ensemble des quadruplets de N ? ab|cd quadruplet de N N contient deux chemins sommet-disjoints : - entre a et b - entre c et d
  34. 34. Complexité de la vérification a b c d e f ghi N ab|cd quadruplet de N N contient deux chemins sommet-disjoints : - entre a et b - entre c et d N, réseau non enraciné de niveau k Ensemble des quadruplets de N ?
  35. 35. Complexité de la vérification a b c d e f ghi N ab|cd quadruplet de N N contient deux chemins sommet-disjoints : - entre a et b - entre c et d N, réseau non enraciné de niveau k Ensemble des quadruplets de N ? algo 2-Vertex-Disjoint-Paths en O(n+n.α(n,n)) Tholey 2009
  36. 36. Complexité de la vérification N, réseau non enraciné de niveau k Ensemble des quadruplets de N ? En O(n5 (1+α(n,n))) N enraciné Triplets de N ? En O(n3 ) programmation dynamique, Byrka, Gawrychowski, Huber & Kelk 2010
  37. 37. Complexité de la reconstruction Q, ensemble de quadruplets ∃? réseau non enraciné de niveau k qui contient Q ?
  38. 38. Complexité de reconstruction non enraciné enraciné général dense 1 quadruplet par ensemble de 4 feuilles complet tous les quadruplets du réseau NP-complet niveau 1 ? décomposition en temps polynomial O(n4 ) ? ? ? ? décomposition en temps polynomial niveau k>1 niveau 1 niveau k>1 NP-complet Jansson, Nguyen & Sung 2006 O(n3 ) Jansson, Nguyen & Sung 2006 O(n3 ) Jansson, Nguyen & Sung 2006 O(n5k+4 ) To & Habib 2009 O(n3k+3 ) Van Iersel & Kelk 2009 NP-complet Van Iersel, Kelk & Mnich 2009
  39. 39. Complexité de reconstruction non enraciné enraciné général dense 1 quadruplet par ensemble de 4 feuilles complet tous les quadruplets du réseau NP-complet NP-complet Jansson, Nguyen & Sung 2006 niveau 1 ? décomposition en temps polynomial O(n3 ) Jansson, Nguyen & Sung 2006 O(n4 ) O(n3 ) Jansson, Nguyen & Sung 2006 ? ? ? ? décomposition en temps polynomial O(n5k+4 ) To & Habib 2009 O(n3k+3 ) Van Iersel & Kelk 2009 niveau k>1 niveau 1 niveau k>1 NP-complet Van Iersel, Kelk & Mnich 2009
  40. 40. Complexité de la reconstruction Q, ensemble de quadruplets ∃? réseau non enraciné de niveau k qui contient Q ? T, ensemble de triplets ∃? réseau enraciné de niveau k qui contient T ? En O(n3 ) pour k = 0 NP-complet pour k = 1 NP-complet pour k > 1 NP-complet pour k = 0 Steel 1992 Aho & al. 1981, Jansson & al. 2005 Jansson, Nguyen & Sung 2006 Van Iersel, Kelk & Mnich 2009
  41. 41. Complexité de la reconstruction Q, ensemble de quadruplets ∃? réseau non enraciné de niveau k qui contient Q ? T, ensemble de triplets ∃? réseau enraciné de niveau k qui contient T ? En O(n3 ) pour k = 0 NP-complet pour k = 1 NP-complet pour k > 1 NP-complet pour k = 0 NP-complet pour k = 1, réduction de Betweenness Steel 1992 Aho & al. 1981, Jansson & al. 2005 Jansson, Nguyen & Sung 2006 Van Iersel, Kelk & Mnich 2009
  42. 42. Réduction depuis Betweenness C, ensemble de contraintes ci =(a,b,c) : b “entre” a et c ∈ A ∃? ordre σ sur A qui vérifie les contraintes de C ? NP-complet Opatrny 1979 Betweenness Q, ensemble de quadruplets ∃? réseau non enraciné de niveau 1 qui contient Q ? Réduction : adaptation de la preuve de Steel 1992
  43. 43. Réduction depuis Betweenness ci = (a,b,c) Qi = {pi p'i |ab, pi a|bc, pi b|cqi , pi c|qi q'i , pi α|p'i β, qi α|q'i β} Q' = {αα'|ββ', αβ|α'β'}∪{ββ'|xα, αα'|xβ, α'β'|xβ, x∈A∪{pi ,p'i ,qi ,q'i }} Q = Q' ∪ UQi C, ensemble de contraintes ci =(a,b,c) : b “entre” a et c ∈ A ∃? ordre σ sur A qui vérifie les contraintes de C ? Betweenness Q, ensemble de quadruplets ∃? réseau non enraciné de niveau 1 qui contient Q ? i
  44. 44. Réduction depuis Betweenness ci = (a,b,c) Qi = {pi p'i |ab, pi a|bc, pi b|cqi , pi c|qi q'i , pi α|p'i β, qi α|q'i β} Q' = {αα'|ββ', αβ|α'β'}∪{ββ'|xα, αα'|xβ, α'β'|xβ, x∈A∪{pi ,p'i ,qi ,q'i }} Q = Q' ∪ UQi C, ensemble de contraintes ci =(a,b,c) : b “entre” a et c ∈ A ∃? ordre σ sur A qui vérifie les contraintes de C ? Betweenness Q, ensemble de quadruplets ∃? réseau non enraciné de niveau 1 qui contient Q ? i x α β α' β' α'' β''
  45. 45. Réduction depuis Betweenness ci = (a,b,c) Qi = {pi p'i |ab, pi a|bc, pi b|cqi , pi c|qi q'i , pi α|p'i β, qi α|q'i β} Q' = {αα'|ββ', αβ|α'β'}∪{ββ'|xα, αα'|xβ, α'β'|xβ, x∈A∪{pi ,p'i ,qi ,q'i }} Q = Q' ∪ UQi C, ensemble de contraintes ci =(a,b,c) : b “entre” a et c ∈ A ∃? ordre σ sur A qui vérifie les contraintes de C ? Betweenness Q, ensemble de quadruplets ∃? réseau non enraciné de niveau 1 qui contient Q ? i x α β α' β' α'' β'' p bp' q q'ca q' bq p' pac i i i i ou i i i i b' a'c' b' c'a' α'' α'' β'' β'' α α β β
  46. 46. Réduction depuis Betweenness ci = (a,b,c) Qi = {pi p'i |ab, pi a|bc, pi b|cqi , pi c|qi q'i , pi α|p'i β, qi α|q'i β} Q' = {αα'|ββ', αβ|α'β'}∪{ββ'|xα, αα'|xβ, α'β'|xβ, x∈A∪{pi ,p'i ,qi ,q'i }} Q = Q' ∪ UQi C, ensemble de contraintes ci =(a,b,c) : b “entre” a et c ∈ A ∃? ordre σ sur A qui vérifie les contraintes de C ? Betweenness Q, ensemble de quadruplets ∃? réseau non enraciné de niveau 1 qui contient Q ? i pi p'i qi q'i pi p'i qi q'i A α β α' β' σ
  47. 47. Réduction depuis Betweenness ci = (a,b,c) Qi = {pi p'i |ab, pi a|bc, pi b|cqi , pi c|qi q'i , pi α|p'i β, qi α|q'i β} Q' = {αα'|ββ', αβ|α'β'}∪{ββ'|xα, αα'|xβ, α'β'|xβ, x∈A∪{pi ,p'i ,qi ,q'i }} Q = Q' ∪ UQi C, ensemble de contraintes ci =(a,b,c) : b “entre” a et c ∈ A ∃? ordre σ sur A qui vérifie les contraintes de C ? Betweenness Q, ensemble de quadruplets ∃? réseau non enraciné de niveau 1 qui contient Q ? i pi p'i qi q'i pi p'i qi q'i A α β α' β' σ
  48. 48. • Réseaux non enracinés de niveau k • Complexité de la reconstruction • Réseaux phylogénétiques • Triplets et quadruplets • Décomposition dans le cas dense Plan • Reconstruction dans le cas complet • Lien avec Non-Betweenness
  49. 49. Complexité de reconstruction non enraciné enraciné général dense 1 quadruplet par ensemble de 4 feuilles complet tous les quadruplets du réseau NP-complet niveau 1 ? décomposition en temps polynomial O(n4 ) ? ? ? ? décomposition en temps polynomial niveau k>1 niveau 1 niveau k>1 NP-complet Jansson, Nguyen & Sung 2006 O(n3 ) Jansson, Nguyen & Sung 2006 O(n3 ) Jansson, Nguyen & Sung 2006 O(n5k+4 ) To & Habib 2009 O(n3k+3 ) Van Iersel & Kelk 2009 NP-complet Van Iersel, Kelk & Mnich 2009
  50. 50. Décomposition dans le cas dense • Q, ensemble dense de quadruplets : Sur tout ensemble de quatre feuilles, il existe un quadruplet dans Q • A|A SN-bipartition de Q : Pour toutes feuilles x,y ∈ A, z,t ∈ A, le seul quadruplet de Q sur ces 4 feuilles est xy|zt Q, ensemble dense de quadruplets L'ensemble des SN-bipartitions de Q est compatible, i.e. peut être représenté par un arbre non enraciné
  51. 51. Décomposition dans le cas dense Q, ensemble dense de quadruplets L'ensemble des SN-bipartitions de Q est compatible, i.e. peut être représenté par un arbre non enraciné a c f g h b d eN {a}| {bcdefgh} {b}| {acdefgh} {ab}| {cdefgh} {c}| {abdefgh} {abc}| {defgh} {d}| {abcefgh} {e}| {abcdfgh} {de}| {abcfgh} {f}| {abcdegh} {h}| {abcdefg} {g}| {abcdefh} Q = { quadruplets de N }
  52. 52. Décomposition dans le cas dense Q, ensemble dense de quadruplets L'ensemble des SN-bipartitions de Q est compatible, i.e. peut être représenté par un arbre non enraciné a c f g h b d eN {a}| {bcdefgh} {b}| {acdefgh} {ab}| {cdefgh} {c}| {abdefgh} {abc}| {defgh} {d}| {abcefgh} {e}| {abcdfgh} {de}| {abcfgh} {f}| {abcdegh} {h}| {abcdefg} {g}| {abcdefh} Q = { quadruplets de N }
  53. 53. Décomposition dans le cas dense Q, ensemble dense de quadruplets L'ensemble des SN-bipartitions de Q est compatible, i.e. peut être représenté par un arbre non enraciné Calcul des SN-bipartitions en O(n4 ) variante de l'algorithme Q*, Berry & Gascuel 2001 Equivalent enraciné : Calcul des SN-ensembles en O(n3 ) Jansson, Nguyen & Sung 2006
  54. 54. Décomposition dans le cas dense Q, ensemble dense de quadruplets contenus dans un réseau N de niveau 1 Il existe un réseau N ' de niveau 1 contenant Q tel que l'ensemble des SN-bipartitions de Q est en bijection avec les isthmes de N '.
  55. 55. Décomposition dans le cas complet Q(N), ensemble de tous les quadruplets contenus dans un réseau N de niveau k Les SN-bipartitions de Q(N) sont en bijection avec les isthmes de N. a c f g h b d eN {a}| {bcdefgh} {b}| {acdefgh} {ab}| {cdefgh} {c}| {abdefgh} {abc}| {defgh} {d}| {abcefgh} {e}| {abcdfgh} {de}| {abcfgh} {f}| {abcdegh} {h}| {abcdefg} {g}| {abcdefh}
  56. 56. Décomposition dans le cas complet Q(N), ensemble de tous les quadruplets contenus dans un réseau N de niveau k Les SN-bipartitions de Q(N) sont en bijection avec les isthmes de N. On sait séparer les composantes 2-arête-connexes de N à partir de Q(N). Comment reconstruire chaque composante 2-arête-connexe de N ?
  57. 57. • Réseaux non enracinés de niveau k • Complexité de la reconstruction • Réseaux phylogénétiques • Triplets et quadruplets • Décomposition dans le cas dense Plan • Reconstruction dans le cas complet • Lien avec Non-Betweenness
  58. 58. Complexité de reconstruction non enraciné enraciné général dense 1 quadruplet par ensemble de 4 feuilles complet tous les quadruplets du réseau NP-complet niveau 1 ? décomposition en temps polynomial O(n4 ) ? ? ? ? décomposition en temps polynomial niveau k>1 niveau 1 niveau k>1 NP-complet Jansson, Nguyen & Sung 2006 O(n3 ) Jansson, Nguyen & Sung 2006 O(n3 ) Jansson, Nguyen & Sung 2006 O(n5k+4 ) To & Habib 2009 O(n3k+3 ) Van Iersel & Kelk 2009 NP-complet Van Iersel, Kelk & Mnich 2009
  59. 59. Reconstruction dans le cas complet Comment reconstruire chaque composante 2-arête-connexe de N de niveau 1 à partir de Q(N) ? Graphe d'ordre des quadruplets : G(Q) = ({{a,b}, a,b ∈ X},{arête {a,b}{b,c} si ∀d ∈ X, ac|bd∉Q}) {a,b} {b,c} {c,d} {a,e}{a,c} {b,e} {b,d} {d,e} {a,d} {c,e} a e b d c a b c d e N G(Q(N)) N réseau de niveau 1 à une composante 2-arête-connexe G(Q(N)) = cycle à n sommets + sommets isolés. arête {a,b}{b,c} étiquetée par “b”
  60. 60. Reconstruction dans le cas complet Comment reconstruire chaque composante 2-arête-connexe de N de niveau 1 à partir de Q(N) ? Reconstruction en O(n4 )
  61. 61. • Réseaux non enracinés de niveau k • Complexité de la reconstruction • Réseaux phylogénétiques • Triplets et quadruplets • Décomposition dans le cas dense Plan • Reconstruction dans le cas complet • Lien avec Non-Betweenness
  62. 62. Complexité de reconstruction non enraciné enraciné général dense 1 quadruplet par ensemble de 4 feuilles complet tous les quadruplets du réseau NP-complet niveau 1 ? décomposition en temps polynomial O(n4 ) ? ? ? ? décomposition en temps polynomial niveau k>1 niveau 1 niveau k>1 NP-complet Jansson, Nguyen & Sung 2006 O(n3 ) Jansson, Nguyen & Sung 2006 O(n3 ) Jansson, Nguyen & Sung 2006 O(n5k+4 ) To & Habib 2009 O(n3k+3 ) Van Iersel & Kelk 2009 NP-complet Van Iersel, Kelk & Mnich 2009
  63. 63. Lien avec Non-Betweenness Comment reconstruire chaque composante 2-arête-connexe de N de niveau 1 à partir de Q(N) ? Reconstruction en O(n4 ) Comment reconstruire chaque composante 2-arête-connexe de N de niveau 1 à partir de Q dense ?
  64. 64. Lien avec Non-Betweenness Comment reconstruire chaque composante 2-arête-connexe de N de niveau 1 à partir de Q(N) ? Reconstruction en O(n4 ) Comment reconstruire chaque composante 2-arête-connexe de N de niveau 1 à partir de Q dense ? Variante de Non-Betweenness (dense) ab|cd dans un réseau de niveau 1 : a b d c a b c d a c d b c “entre” a et b par rapport à d
  65. 65. Merci pour votre attention ! non enraciné enraciné général dense 1 quadruplet par ensemble de 4 feuilles complet tous les quadruplets du réseau NP-complet NP-complet Jansson, Nguyen & Sung 2006 niveau 1 ? décomposition en temps polynomial O(n3 ) Jansson, Nguyen & Sung 2006 O(n4 ) O(n3 ) Jansson, Nguyen & Sung 2006 ? ? ? ? décomposition en temps polynomial O(n5k+4 ) To & Habib 2009 O(n3k+3 ) Van Iersel & Kelk 2009 niveau k>1 niveau 1 niveau k>1 NP-complet Van Iersel, Kelk & Mnich 2009 Des questions ?

×