SlideShare une entreprise Scribd logo
1  sur  65
Télécharger pour lire hors ligne
Journées Graphes et Algorithmes
Marseille – 09/11/2010
Quadruplets et réseaux
non enracinés de niveau k
Philippe Gambette,
Vincent Berry, Christophe Paul
• Réseaux non enracinés de niveau k
• Complexité de la reconstruction
• Réseaux phylogénétiques
• Triplets et quadruplets
• Décomposition dans le cas dense
Plan
• Reconstruction dans le cas complet
• Lien avec Non-Betweenness
Les arbres phylogénétiques
D'après Woese, Kandler, Wheelis : Towards a natural system of organisms:
proposal for the domains Archaea, Bacteria, and Eucarya, Proceedings of
the National Academy of Sciences, 87(12), 4576–4579 (1990)
Les réseaux phylogénétiques
D'après Parker & Stone, South Park S10E12 – The Theory
of Evolution according to Mrs Garrison (2006)
Problème : prendre en compte les échanges de
matériel génétique entre espèces coexistantes
Les réseaux phylogénétiques
Doolittle : Uprooting the Tree of Life, Scientific American (Fév. 2000)
Réseau phylogénétique
de la vie
Les réseaux phylogénétiques
TCS
SplitsTree
Network
Level-2
T-Rex
HorizStory réseau
médian
réseau couvrant
minimum
réseau de
niveau 2
réseau de
bipartitions
réticulogramme
diagramme
de synthèse
Reconstruction de réseaux
{séquences de gènes}
réseau N
méthodes de distance
Bandelt & Dress 1992 - Legendre &
Makarenkov 2000 - Bryant & Moulton 2002
méthodes de parcimonie
Hein 1990 - Kececioglu & Gusfield 1994 -
Jin, Nakhleh, Snir, Tuller 2009
méthodes de vraisemblance
Snir & Tuller 2009 - Jin, Nakhleh, Snir,
Tuller 2009 - Velasco & Sober 2009
AATTGCAGTAGCCCAAAAT
ACCTGCAGTAGACCAAT
GCTTGCCGTAGACAAGAAT
ATTTGCAGAAGACCAAAT
AATTGCAGTAGACAAGAAT
ACTTGCAGTAGCACAAAAT
ACCTGGTGTAAAAT
Reconstruction de réseaux
Problème : méthodes généralement lentes,
explosion du nombre de séquences.
{séquences de gènes}
réseau N
AATTGCAGTAGCCCAAAAT
ACCTGCAGTAGACCAAT
GCTTGCCGTAGACAAGAAT
ATTTGCAGAAGACCAAAT
AATTGCAGTAGACAAGAAT
ACTTGCAGTAGCACAAAAT
ACCTGGTGTAAAAT
méthodes de distance
Bandelt & Dress 1992 - Legendre &
Makarenkov 2000 - Bryant & Moulton 2002
méthodes de parcimonie
Hein 1990 - Kececioglu & Gusfield 1994 -
Jin, Nakhleh, Snir, Tuller 2009
méthodes de vraisemblance
Snir & Tuller 2009 - Jin, Nakhleh, Snir,
Tuller 2009 - Velasco & Sober 2009
Reconstruction combinatoire de réseaux
phylome = {arbres}
super-réseau N
{séquences de gènes}
Reconstruction d'un arbre
par ensemble de gènes
homologues
Réconciliation ou
consensus d'arbres
AATTGCAGTAGCCCAAAAT
ACCTGCAGTAGACCAAT
GCTTGCCGTAGACAAGAAT
ATTTGCAGAAGACCAAAT
AATTGCAGTAGACAAGAAT
ACTTGCAGTAGCACAAAAT
ACCTGGTGTAAAAT
Reconstruction combinatoire de réseaux
phylome = {arbres}
super-réseau N
{séquences de gènes}
Reconstruction d'un arbre
par ensemble de gènes
homologues
Réconciliation ou
consensus d'arbres
Problème : le consensus d'arbres est un
problème NP-complet pour 2 arbres
AATTGCAGTAGCCCAAAAT
ACCTGCAGTAGACCAAT
GCTTGCCGTAGACAAGAAT
ATTTGCAGAAGACCAAAT
AATTGCAGTAGACAAGAAT
ACTTGCAGTAGCACAAAAT
ACCTGGTGTAAAAT
Triplets/quadruplets, splits/clades
Problème :
Reconstruire le super-réseau d'un ensemble d'arbres est
difficile.
Idée :
reconstuire un réseau contenant tous les :
triplets
quadruplets
des arbres en entrée ?
Motivations algorithmiques !
a b c d e
a
f
b c
de
• Réseaux non enracinés de niveau k
• Complexité de la reconstruction
• Réseaux phylogénétiques
• Triplets et quadruplets
• Décomposition dans le cas dense
Plan
• Reconstruction dans le cas complet
• Lien avec Non-Betweenness
Triplets et quadruplets
Idée :
reconstuire un réseau contenant tous les :
triplets
des arbres en entrée ?
a b c d e
a|ce
Triplets et quadruplets
Idée :
reconstuire un réseau contenant tous les :
triplets
quadruplets
des arbres en entrée ?
a b c d e
a|ce
ab|ce
a
f
b c
de
Triplets et quadruplets
Idée :
modifier le type de données à traiter
{arbres}
super-réseau N
Triplets et quadruplets
Idée :
modifier le type de données à traiter
{arbres}
super-réseau N super-réseau N'
{triplets} {quadruplets}
Triplets et quadruplets
Idée :
modifier le type de données à traiter
{arbres}
super-réseau N super-réseau N'
{triplets} {quadruplets}
N'=N ?
Triplets et quadruplets
Un réseau contenant tous les quadruplets d'un arbre T
ne contient pas forcément T.
Contient tous les quadruplets d'un arbre T
contient T.
T
N contient tous
les quadruplets de T
mais pas T
a
b
c
d
e
f
a b
c
de
f
N
Triplets et quadruplets
Pas nécessairement, mais :
N'=N ?
{ N } ⊆ { N' }
{arbres}
super-réseau N super-réseau N'
{triplets} {quadruplets}
• Réseaux non enracinés de niveau k
• Complexité de la reconstruction
• Réseaux phylogénétiques
• Triplets et quadruplets
• Décomposition dans le cas dense
Plan
• Reconstruction dans le cas complet
• Lien avec Non-Betweenness
Réseaux non enracinés de niveau k
Algorithmes rapides pour des réseaux à structure proche
d'un arbre.
a
b c
d
e
f
ghi composante 2-arête
connexe = sous-graphe
sans isthme (arête qui
déconnecte le graphe)
maximal
Réseaux non enracinés de niveau k
Algorithmes rapides pour des réseaux à structure proche
d'un arbre.
niveau = maximum, parmi
toutes les composantes
2-arêtes-connexes, du
nombre minimum d'arêtes
à supprimer pour obtenir
un arbre.
réseau non enraciné
de niveau 2.
a
b c
d
e
f
ghi composante 2-arête
connexe = sous-graphe
sans isthme (arête qui
déconnecte le graphe)
maximal
Réseaux non enracinés de niveau k
Algorithmes rapides pour des réseaux à structure proche
d'un arbre.
réseau non enraciné
de niveau 2.
a
b c
d
e
f
ghi
équivalent non enraciné
du niveau des réseaux
enracinés
Choy, Jansson,
Sadakane & Sung 2005
Réseaux non enracinés de niveau k
Algorithmes rapides pour des réseaux à structure proche
d'un arbre.
réseau non enraciné
de niveau 2.
a
b c
d
e
f
ghi
équivalent non enraciné
du niveau des réseaux
enracinés
Choy, Jansson,
Sadakane & Sung 2005
Enraciner un arbre :
difficile en phylogénie
le faire plutôt à la fin !
Réseaux non enracinés de niveau k
Algorithmes rapides pour des réseaux à structure proche
d'un arbre.
niveau = mesure de
“complexité” du réseau
phylogénétique
réseau non enraciné
de niveau 2.
a
b c
d
e
f
ghi
Réseaux non enracinés de niveau k
Algorithmes rapides pour des réseaux à structure proche
d'un arbre.
réseau non enraciné
de niveau 1.
a
b c
d
e
f
ghi niveau = mesure de
“complexité” du réseau
phylogénétique
niveau 0 = arbre
Réseaux non enracinés de niveau k
Algorithmes rapides pour des réseaux à structure proche
d'un arbre.
réseau non enraciné
de niveau 1.
a
b c
d
e
f
ghi niveau = mesure de
“complexité” du réseau
phylogénétique
niveau 0 = arbre
niveau 1 = “arbre de
cycles”
Réseaux non enracinés de niveau k
Algorithmes rapides pour des réseaux à structure proche
d'un arbre.
réseau non enraciné
de niveau > 1.
a
b c
d
e
f
ghi niveau = mesure de
“complexité” du réseau
phylogénétique
niveau 0 = arbre
niveau 1 = “arbre de
cycles”
niveau > 1 = “arbre de
blobs”
• Réseaux non enracinés de niveau k
• Complexité de la reconstruction
• Réseaux phylogénétiques
• Triplets et quadruplets
• Décomposition dans le cas dense
Plan
• Reconstruction dans le cas complet
• Lien avec Non-Betweenness
Complexité de la vérification
N, réseau non enraciné de niveau k
Ensemble des quadruplets de N ?
a
b c
d
e
f
ghi
N
Complexité de la vérification
a
b c
d
e
f
ghi
N
N, réseau non enraciné de niveau k
Ensemble des quadruplets de N ?
ab|cd quadruplet de N
N contient deux chemins
sommet-disjoints :
Complexité de la vérification
a
b c
d
e
f
ghi
N
N, réseau non enraciné de niveau k
Ensemble des quadruplets de N ?
ab|cd quadruplet de N
N contient deux chemins
sommet-disjoints :
- entre a et b
Complexité de la vérification
a
b c
d
e
f
ghi
N
N, réseau non enraciné de niveau k
Ensemble des quadruplets de N ?
ab|cd quadruplet de N
N contient deux chemins
sommet-disjoints :
- entre a et b
- entre c et d
Complexité de la vérification
a
b c
d
e
f
ghi
N
ab|cd quadruplet de N
N contient deux chemins
sommet-disjoints :
- entre a et b
- entre c et d
N, réseau non enraciné de niveau k
Ensemble des quadruplets de N ?
Complexité de la vérification
a
b c
d
e
f
ghi
N
ab|cd quadruplet de N
N contient deux chemins
sommet-disjoints :
- entre a et b
- entre c et d
N, réseau non enraciné de niveau k
Ensemble des quadruplets de N ?
algo 2-Vertex-Disjoint-Paths
en O(n+n.α(n,n))
Tholey 2009
Complexité de la vérification
N, réseau non enraciné de niveau k
Ensemble des quadruplets de N ?
En O(n5
(1+α(n,n)))
N enraciné
Triplets de N ?
En O(n3
)
programmation
dynamique,
Byrka, Gawrychowski,
Huber & Kelk 2010
Complexité de la reconstruction
Q, ensemble de quadruplets
∃? réseau non enraciné de niveau k qui contient Q ?
Complexité de reconstruction
non enraciné enraciné
général
dense
1 quadruplet
par ensemble
de 4 feuilles
complet
tous les
quadruplets
du réseau
NP-complet
niveau 1
?
décomposition
en temps
polynomial
O(n4
)
?
?
?
?
décomposition
en temps
polynomial
niveau k>1 niveau 1 niveau k>1
NP-complet
Jansson, Nguyen
& Sung 2006
O(n3
)
Jansson, Nguyen
& Sung 2006
O(n3
)
Jansson, Nguyen
& Sung 2006
O(n5k+4
)
To &
Habib 2009
O(n3k+3
)
Van Iersel
& Kelk 2009
NP-complet
Van Iersel, Kelk
& Mnich 2009
Complexité de reconstruction
non enraciné enraciné
général
dense
1 quadruplet
par ensemble
de 4 feuilles
complet
tous les
quadruplets
du réseau
NP-complet NP-complet
Jansson, Nguyen
& Sung 2006
niveau 1
?
décomposition
en temps
polynomial
O(n3
)
Jansson, Nguyen
& Sung 2006
O(n4
) O(n3
)
Jansson, Nguyen
& Sung 2006
?
?
?
?
décomposition
en temps
polynomial
O(n5k+4
)
To &
Habib 2009
O(n3k+3
)
Van Iersel
& Kelk 2009
niveau k>1 niveau 1 niveau k>1
NP-complet
Van Iersel, Kelk
& Mnich 2009
Complexité de la reconstruction
Q, ensemble de quadruplets
∃? réseau non enraciné de niveau k qui contient Q ?
T, ensemble de triplets
∃? réseau enraciné de niveau k qui contient T ?
En O(n3
) pour k = 0
NP-complet pour k = 1
NP-complet pour k > 1
NP-complet pour k = 0 Steel 1992
Aho & al. 1981, Jansson & al. 2005
Jansson, Nguyen & Sung 2006
Van Iersel, Kelk & Mnich 2009
Complexité de la reconstruction
Q, ensemble de quadruplets
∃? réseau non enraciné de niveau k qui contient Q ?
T, ensemble de triplets
∃? réseau enraciné de niveau k qui contient T ?
En O(n3
) pour k = 0
NP-complet pour k = 1
NP-complet pour k > 1
NP-complet pour k = 0
NP-complet pour k = 1, réduction de Betweenness
Steel 1992
Aho & al. 1981, Jansson & al. 2005
Jansson, Nguyen & Sung 2006
Van Iersel, Kelk & Mnich 2009
Réduction depuis Betweenness
C, ensemble de contraintes ci
=(a,b,c) : b “entre” a et c ∈ A
∃? ordre σ sur A qui vérifie les contraintes de C ?
NP-complet Opatrny 1979
Betweenness
Q, ensemble de quadruplets
∃? réseau non enraciné de niveau 1 qui contient Q ?
Réduction :
adaptation de la preuve de Steel 1992
Réduction depuis Betweenness
ci
= (a,b,c)
Qi
= {pi
p'i
|ab, pi
a|bc, pi
b|cqi
, pi
c|qi
q'i
, pi
α|p'i
β, qi
α|q'i
β}
Q' = {αα'|ββ', αβ|α'β'}∪{ββ'|xα, αα'|xβ, α'β'|xβ, x∈A∪{pi
,p'i
,qi
,q'i
}}
Q = Q' ∪ UQi
C, ensemble de contraintes ci
=(a,b,c) : b “entre” a et c ∈ A
∃? ordre σ sur A qui vérifie les contraintes de C ?
Betweenness
Q, ensemble de quadruplets
∃? réseau non enraciné de niveau 1 qui contient Q ?
i
Réduction depuis Betweenness
ci
= (a,b,c)
Qi
= {pi
p'i
|ab, pi
a|bc, pi
b|cqi
, pi
c|qi
q'i
, pi
α|p'i
β, qi
α|q'i
β}
Q' = {αα'|ββ', αβ|α'β'}∪{ββ'|xα, αα'|xβ, α'β'|xβ, x∈A∪{pi
,p'i
,qi
,q'i
}}
Q = Q' ∪ UQi
C, ensemble de contraintes ci
=(a,b,c) : b “entre” a et c ∈ A
∃? ordre σ sur A qui vérifie les contraintes de C ?
Betweenness
Q, ensemble de quadruplets
∃? réseau non enraciné de niveau 1 qui contient Q ?
i
x
α β
α' β'
α'' β''
Réduction depuis Betweenness
ci
= (a,b,c)
Qi
= {pi
p'i
|ab, pi
a|bc, pi
b|cqi
, pi
c|qi
q'i
, pi
α|p'i
β, qi
α|q'i
β}
Q' = {αα'|ββ', αβ|α'β'}∪{ββ'|xα, αα'|xβ, α'β'|xβ, x∈A∪{pi
,p'i
,qi
,q'i
}}
Q = Q' ∪ UQi
C, ensemble de contraintes ci
=(a,b,c) : b “entre” a et c ∈ A
∃? ordre σ sur A qui vérifie les contraintes de C ?
Betweenness
Q, ensemble de quadruplets
∃? réseau non enraciné de niveau 1 qui contient Q ?
i
x
α β
α' β'
α'' β''
p bp' q q'ca
q' bq p' pac
i i i i
ou
i i i i
b' a'c'
b' c'a'
α''
α''
β''
β''
α
α
β
β
Réduction depuis Betweenness
ci
= (a,b,c)
Qi
= {pi
p'i
|ab, pi
a|bc, pi
b|cqi
, pi
c|qi
q'i
, pi
α|p'i
β, qi
α|q'i
β}
Q' = {αα'|ββ', αβ|α'β'}∪{ββ'|xα, αα'|xβ, α'β'|xβ, x∈A∪{pi
,p'i
,qi
,q'i
}}
Q = Q' ∪ UQi
C, ensemble de contraintes ci
=(a,b,c) : b “entre” a et c ∈ A
∃? ordre σ sur A qui vérifie les contraintes de C ?
Betweenness
Q, ensemble de quadruplets
∃? réseau non enraciné de niveau 1 qui contient Q ?
i
pi
p'i
qi
q'i
pi
p'i
qi
q'i
A
α β
α' β'
σ
Réduction depuis Betweenness
ci
= (a,b,c)
Qi
= {pi
p'i
|ab, pi
a|bc, pi
b|cqi
, pi
c|qi
q'i
, pi
α|p'i
β, qi
α|q'i
β}
Q' = {αα'|ββ', αβ|α'β'}∪{ββ'|xα, αα'|xβ, α'β'|xβ, x∈A∪{pi
,p'i
,qi
,q'i
}}
Q = Q' ∪ UQi
C, ensemble de contraintes ci
=(a,b,c) : b “entre” a et c ∈ A
∃? ordre σ sur A qui vérifie les contraintes de C ?
Betweenness
Q, ensemble de quadruplets
∃? réseau non enraciné de niveau 1 qui contient Q ?
i
pi
p'i
qi
q'i
pi
p'i
qi
q'i
A
α β
α' β'
σ
• Réseaux non enracinés de niveau k
• Complexité de la reconstruction
• Réseaux phylogénétiques
• Triplets et quadruplets
• Décomposition dans le cas dense
Plan
• Reconstruction dans le cas complet
• Lien avec Non-Betweenness
Complexité de reconstruction
non enraciné enraciné
général
dense
1 quadruplet
par ensemble
de 4 feuilles
complet
tous les
quadruplets
du réseau
NP-complet
niveau 1
?
décomposition
en temps
polynomial
O(n4
)
?
?
?
?
décomposition
en temps
polynomial
niveau k>1 niveau 1 niveau k>1
NP-complet
Jansson, Nguyen
& Sung 2006
O(n3
)
Jansson, Nguyen
& Sung 2006
O(n3
)
Jansson, Nguyen
& Sung 2006
O(n5k+4
)
To &
Habib 2009
O(n3k+3
)
Van Iersel
& Kelk 2009
NP-complet
Van Iersel, Kelk
& Mnich 2009
Décomposition dans le cas dense
• Q, ensemble dense de quadruplets :
Sur tout ensemble de quatre feuilles,
il existe un quadruplet dans Q
• A|A SN-bipartition de Q :
Pour toutes feuilles x,y ∈ A, z,t ∈ A,
le seul quadruplet de Q sur ces 4 feuilles est xy|zt
Q, ensemble dense de quadruplets
L'ensemble des SN-bipartitions de Q est compatible, i.e.
peut être représenté par un arbre non enraciné
Décomposition dans le cas dense
Q, ensemble dense de quadruplets
L'ensemble des SN-bipartitions de Q est compatible, i.e.
peut être représenté par un arbre non enraciné
a
c
f
g
h
b
d
eN
{a}|
{bcdefgh}
{b}|
{acdefgh}
{ab}|
{cdefgh}
{c}|
{abdefgh}
{abc}|
{defgh}
{d}|
{abcefgh}
{e}|
{abcdfgh}
{de}|
{abcfgh}
{f}|
{abcdegh}
{h}|
{abcdefg}
{g}|
{abcdefh}
Q = { quadruplets de N }
Décomposition dans le cas dense
Q, ensemble dense de quadruplets
L'ensemble des SN-bipartitions de Q est compatible, i.e.
peut être représenté par un arbre non enraciné
a
c
f
g
h
b
d
eN
{a}|
{bcdefgh}
{b}|
{acdefgh}
{ab}|
{cdefgh}
{c}|
{abdefgh}
{abc}|
{defgh}
{d}|
{abcefgh}
{e}|
{abcdfgh}
{de}|
{abcfgh}
{f}|
{abcdegh}
{h}|
{abcdefg}
{g}|
{abcdefh}
Q = { quadruplets de N }
Décomposition dans le cas dense
Q, ensemble dense de quadruplets
L'ensemble des SN-bipartitions de Q est compatible, i.e.
peut être représenté par un arbre non enraciné
Calcul des SN-bipartitions
en O(n4
)
variante de l'algorithme Q*,
Berry & Gascuel 2001
Equivalent enraciné :
Calcul des SN-ensembles
en O(n3
)
Jansson, Nguyen
& Sung 2006
Décomposition dans le cas dense
Q, ensemble dense de quadruplets
contenus dans un réseau N de niveau 1
Il existe un réseau N ' de niveau 1 contenant Q
tel que l'ensemble des SN-bipartitions de Q
est en bijection avec les isthmes de N '.
Décomposition dans le cas complet
Q(N), ensemble de tous les quadruplets
contenus dans un réseau N de niveau k
Les SN-bipartitions de Q(N)
sont en bijection avec les isthmes de N.
a
c
f
g
h
b
d
eN
{a}|
{bcdefgh}
{b}|
{acdefgh}
{ab}|
{cdefgh}
{c}|
{abdefgh}
{abc}|
{defgh}
{d}|
{abcefgh}
{e}|
{abcdfgh}
{de}|
{abcfgh}
{f}|
{abcdegh}
{h}|
{abcdefg}
{g}|
{abcdefh}
Décomposition dans le cas complet
Q(N), ensemble de tous les quadruplets
contenus dans un réseau N de niveau k
Les SN-bipartitions de Q(N)
sont en bijection avec les isthmes de N.
On sait séparer les composantes 2-arête-connexes
de N à partir de Q(N).
Comment reconstruire chaque
composante 2-arête-connexe de N ?
• Réseaux non enracinés de niveau k
• Complexité de la reconstruction
• Réseaux phylogénétiques
• Triplets et quadruplets
• Décomposition dans le cas dense
Plan
• Reconstruction dans le cas complet
• Lien avec Non-Betweenness
Complexité de reconstruction
non enraciné enraciné
général
dense
1 quadruplet
par ensemble
de 4 feuilles
complet
tous les
quadruplets
du réseau
NP-complet
niveau 1
?
décomposition
en temps
polynomial
O(n4
)
?
?
?
?
décomposition
en temps
polynomial
niveau k>1 niveau 1 niveau k>1
NP-complet
Jansson, Nguyen
& Sung 2006
O(n3
)
Jansson, Nguyen
& Sung 2006
O(n3
)
Jansson, Nguyen
& Sung 2006
O(n5k+4
)
To &
Habib 2009
O(n3k+3
)
Van Iersel
& Kelk 2009
NP-complet
Van Iersel, Kelk
& Mnich 2009
Reconstruction dans le cas complet
Comment reconstruire chaque composante
2-arête-connexe de N de niveau 1 à partir de Q(N) ?
Graphe d'ordre des quadruplets :
G(Q) = ({{a,b}, a,b ∈ X},{arête {a,b}{b,c} si ∀d ∈ X, ac|bd∉Q})
{a,b}
{b,c} {c,d}
{a,e}{a,c}
{b,e}
{b,d}
{d,e}
{a,d}
{c,e}
a e
b d
c
a
b c
d
e
N G(Q(N))
N réseau de niveau 1 à une composante 2-arête-connexe
G(Q(N)) = cycle à n sommets + sommets isolés.
arête {a,b}{b,c} étiquetée par “b”
Reconstruction dans le cas complet
Comment reconstruire chaque composante
2-arête-connexe de N de niveau 1 à partir de Q(N) ?
Reconstruction en O(n4
)
• Réseaux non enracinés de niveau k
• Complexité de la reconstruction
• Réseaux phylogénétiques
• Triplets et quadruplets
• Décomposition dans le cas dense
Plan
• Reconstruction dans le cas complet
• Lien avec Non-Betweenness
Complexité de reconstruction
non enraciné enraciné
général
dense
1 quadruplet
par ensemble
de 4 feuilles
complet
tous les
quadruplets
du réseau
NP-complet
niveau 1
?
décomposition
en temps
polynomial
O(n4
)
?
?
?
?
décomposition
en temps
polynomial
niveau k>1 niveau 1 niveau k>1
NP-complet
Jansson, Nguyen
& Sung 2006
O(n3
)
Jansson, Nguyen
& Sung 2006
O(n3
)
Jansson, Nguyen
& Sung 2006
O(n5k+4
)
To &
Habib 2009
O(n3k+3
)
Van Iersel
& Kelk 2009
NP-complet
Van Iersel, Kelk
& Mnich 2009
Lien avec Non-Betweenness
Comment reconstruire chaque composante
2-arête-connexe de N de niveau 1 à partir de Q(N) ?
Reconstruction en O(n4
)
Comment reconstruire chaque composante
2-arête-connexe de N de niveau 1 à partir de Q dense ?
Lien avec Non-Betweenness
Comment reconstruire chaque composante
2-arête-connexe de N de niveau 1 à partir de Q(N) ?
Reconstruction en O(n4
)
Comment reconstruire chaque composante
2-arête-connexe de N de niveau 1 à partir de Q dense ?
Variante de Non-Betweenness (dense)
ab|cd dans un réseau de niveau 1 :
a
b
d
c
a
b
c
d
a
c
d
b
c “entre” a et b
par rapport à d
Merci pour votre attention !
non enraciné enraciné
général
dense
1 quadruplet
par ensemble
de 4 feuilles
complet
tous les
quadruplets
du réseau
NP-complet NP-complet
Jansson, Nguyen
& Sung 2006
niveau 1
?
décomposition
en temps
polynomial
O(n3
)
Jansson, Nguyen
& Sung 2006
O(n4
) O(n3
)
Jansson, Nguyen
& Sung 2006
?
?
?
?
décomposition
en temps
polynomial
O(n5k+4
)
To &
Habib 2009
O(n3k+3
)
Van Iersel
& Kelk 2009
niveau k>1 niveau 1 niveau k>1
NP-complet
Van Iersel, Kelk
& Mnich 2009
Des questions ?

Contenu connexe

Plus de Philippe Gambette

Nuages arborés et analyse textuelle de corpus politiques avec TreeCloud
Nuages arborés et analyse textuelle de corpus politiques avec TreeCloudNuages arborés et analyse textuelle de corpus politiques avec TreeCloud
Nuages arborés et analyse textuelle de corpus politiques avec TreeCloudPhilippe Gambette
 
Nuages arborés et analyse textuelle - Présentation de l’outil TreeCloud
Nuages arborés et analyse textuelle - Présentation de l’outil TreeCloudNuages arborés et analyse textuelle - Présentation de l’outil TreeCloud
Nuages arborés et analyse textuelle - Présentation de l’outil TreeCloudPhilippe Gambette
 
Practical use of combinatorial methods for phylogenetic network reconstruction
Practical use of combinatorial methods for phylogenetic network reconstructionPractical use of combinatorial methods for phylogenetic network reconstruction
Practical use of combinatorial methods for phylogenetic network reconstructionPhilippe Gambette
 
Méthodes combinatoires de reconstruction de réseaux phylogénétiques
Méthodes combinatoires de reconstruction de réseaux phylogénétiquesMéthodes combinatoires de reconstruction de réseaux phylogénétiques
Méthodes combinatoires de reconstruction de réseaux phylogénétiquesPhilippe Gambette
 
Utilisation de la visualisation en nuage arboré pour l'analyse littéraire
Utilisation de la visualisation en nuage arboré pour l'analyse littéraireUtilisation de la visualisation en nuage arboré pour l'analyse littéraire
Utilisation de la visualisation en nuage arboré pour l'analyse littérairePhilippe Gambette
 
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...Philippe Gambette
 
The Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic NetworksThe Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic NetworksPhilippe Gambette
 
Visualiser un texte par un nuage arboré
Visualiser un texte par un nuage arboréVisualiser un texte par un nuage arboré
Visualiser un texte par un nuage arboréPhilippe Gambette
 
Estimation du nombre de citations de papillotes et de blagues Carambar
Estimation du nombre de citations de papillotes et de blagues CarambarEstimation du nombre de citations de papillotes et de blagues Carambar
Estimation du nombre de citations de papillotes et de blagues CarambarPhilippe Gambette
 
On restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphsOn restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphsPhilippe Gambette
 
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...Philippe Gambette
 
Visualising a text with a tree cloud
Visualising a text with a tree cloudVisualising a text with a tree cloud
Visualising a text with a tree cloudPhilippe Gambette
 

Plus de Philippe Gambette (12)

Nuages arborés et analyse textuelle de corpus politiques avec TreeCloud
Nuages arborés et analyse textuelle de corpus politiques avec TreeCloudNuages arborés et analyse textuelle de corpus politiques avec TreeCloud
Nuages arborés et analyse textuelle de corpus politiques avec TreeCloud
 
Nuages arborés et analyse textuelle - Présentation de l’outil TreeCloud
Nuages arborés et analyse textuelle - Présentation de l’outil TreeCloudNuages arborés et analyse textuelle - Présentation de l’outil TreeCloud
Nuages arborés et analyse textuelle - Présentation de l’outil TreeCloud
 
Practical use of combinatorial methods for phylogenetic network reconstruction
Practical use of combinatorial methods for phylogenetic network reconstructionPractical use of combinatorial methods for phylogenetic network reconstruction
Practical use of combinatorial methods for phylogenetic network reconstruction
 
Méthodes combinatoires de reconstruction de réseaux phylogénétiques
Méthodes combinatoires de reconstruction de réseaux phylogénétiquesMéthodes combinatoires de reconstruction de réseaux phylogénétiques
Méthodes combinatoires de reconstruction de réseaux phylogénétiques
 
Utilisation de la visualisation en nuage arboré pour l'analyse littéraire
Utilisation de la visualisation en nuage arboré pour l'analyse littéraireUtilisation de la visualisation en nuage arboré pour l'analyse littéraire
Utilisation de la visualisation en nuage arboré pour l'analyse littéraire
 
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
 
The Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic NetworksThe Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic Networks
 
Visualiser un texte par un nuage arboré
Visualiser un texte par un nuage arboréVisualiser un texte par un nuage arboré
Visualiser un texte par un nuage arboré
 
Estimation du nombre de citations de papillotes et de blagues Carambar
Estimation du nombre de citations de papillotes et de blagues CarambarEstimation du nombre de citations de papillotes et de blagues Carambar
Estimation du nombre de citations de papillotes et de blagues Carambar
 
On restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphsOn restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphs
 
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
 
Visualising a text with a tree cloud
Visualising a text with a tree cloudVisualising a text with a tree cloud
Visualising a text with a tree cloud
 

Dernier

SciencesPo_Aix_InnovationPédagogique_Bilan.pdf
SciencesPo_Aix_InnovationPédagogique_Bilan.pdfSciencesPo_Aix_InnovationPédagogique_Bilan.pdf
SciencesPo_Aix_InnovationPédagogique_Bilan.pdfSKennel
 
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdfSciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdfSKennel
 
Annie Ernaux Extérieurs. pptx. Exposition basée sur un livre .
Annie   Ernaux  Extérieurs. pptx. Exposition basée sur un livre .Annie   Ernaux  Extérieurs. pptx. Exposition basée sur un livre .
Annie Ernaux Extérieurs. pptx. Exposition basée sur un livre .Txaruka
 
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdfSKennel
 
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...Faga1939
 
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdfSKennel
 
Evaluation du systeme d'Education. Marocpptx
Evaluation du systeme d'Education. MarocpptxEvaluation du systeme d'Education. Marocpptx
Evaluation du systeme d'Education. MarocpptxAsmaa105193
 
le present des verbes reguliers -er.pptx
le present des verbes reguliers -er.pptxle present des verbes reguliers -er.pptx
le present des verbes reguliers -er.pptxmmatar2
 
Le Lean sur une ligne de production : Formation et mise en application directe
Le Lean sur une ligne de production : Formation et mise en application directeLe Lean sur une ligne de production : Formation et mise en application directe
Le Lean sur une ligne de production : Formation et mise en application directeXL Groupe
 
Fondation Louis Vuitton. pptx
Fondation      Louis      Vuitton.   pptxFondation      Louis      Vuitton.   pptx
Fondation Louis Vuitton. pptxTxaruka
 
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdfSKennel
 
Cours SE Le système Linux : La ligne de commande bash - IG IPSET
Cours SE Le système Linux : La ligne de commande bash - IG IPSETCours SE Le système Linux : La ligne de commande bash - IG IPSET
Cours SE Le système Linux : La ligne de commande bash - IG IPSETMedBechir
 
Cours SE Gestion des périphériques - IG IPSET
Cours SE Gestion des périphériques - IG IPSETCours SE Gestion des périphériques - IG IPSET
Cours SE Gestion des périphériques - IG IPSETMedBechir
 
Zotero avancé - support de formation doctorants SHS 2024
Zotero avancé - support de formation doctorants SHS 2024Zotero avancé - support de formation doctorants SHS 2024
Zotero avancé - support de formation doctorants SHS 2024Alain Marois
 
Presentation de la plateforme Moodle - avril 2024
Presentation de la plateforme Moodle - avril 2024Presentation de la plateforme Moodle - avril 2024
Presentation de la plateforme Moodle - avril 2024Gilles Le Page
 
Saint Georges, martyr, et la lègend du dragon.pptx
Saint Georges, martyr, et la lègend du dragon.pptxSaint Georges, martyr, et la lègend du dragon.pptx
Saint Georges, martyr, et la lègend du dragon.pptxMartin M Flynn
 
Présentation_ Didactique 1_SVT (S4) complet.pptx
Présentation_ Didactique 1_SVT (S4) complet.pptxPrésentation_ Didactique 1_SVT (S4) complet.pptx
Présentation_ Didactique 1_SVT (S4) complet.pptxrababouerdighi
 
Formation M2i - Comprendre les neurosciences pour développer son leadership
Formation M2i - Comprendre les neurosciences pour développer son leadershipFormation M2i - Comprendre les neurosciences pour développer son leadership
Formation M2i - Comprendre les neurosciences pour développer son leadershipM2i Formation
 

Dernier (20)

SciencesPo_Aix_InnovationPédagogique_Bilan.pdf
SciencesPo_Aix_InnovationPédagogique_Bilan.pdfSciencesPo_Aix_InnovationPédagogique_Bilan.pdf
SciencesPo_Aix_InnovationPédagogique_Bilan.pdf
 
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdfSciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
 
Annie Ernaux Extérieurs. pptx. Exposition basée sur un livre .
Annie   Ernaux  Extérieurs. pptx. Exposition basée sur un livre .Annie   Ernaux  Extérieurs. pptx. Exposition basée sur un livre .
Annie Ernaux Extérieurs. pptx. Exposition basée sur un livre .
 
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
 
Pâques de Sainte Marie-Euphrasie Pelletier
Pâques de Sainte Marie-Euphrasie PelletierPâques de Sainte Marie-Euphrasie Pelletier
Pâques de Sainte Marie-Euphrasie Pelletier
 
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
 
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
 
Evaluation du systeme d'Education. Marocpptx
Evaluation du systeme d'Education. MarocpptxEvaluation du systeme d'Education. Marocpptx
Evaluation du systeme d'Education. Marocpptx
 
le present des verbes reguliers -er.pptx
le present des verbes reguliers -er.pptxle present des verbes reguliers -er.pptx
le present des verbes reguliers -er.pptx
 
Le Lean sur une ligne de production : Formation et mise en application directe
Le Lean sur une ligne de production : Formation et mise en application directeLe Lean sur une ligne de production : Formation et mise en application directe
Le Lean sur une ligne de production : Formation et mise en application directe
 
Fondation Louis Vuitton. pptx
Fondation      Louis      Vuitton.   pptxFondation      Louis      Vuitton.   pptx
Fondation Louis Vuitton. pptx
 
DO PALÁCIO À ASSEMBLEIA .
DO PALÁCIO À ASSEMBLEIA                 .DO PALÁCIO À ASSEMBLEIA                 .
DO PALÁCIO À ASSEMBLEIA .
 
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
 
Cours SE Le système Linux : La ligne de commande bash - IG IPSET
Cours SE Le système Linux : La ligne de commande bash - IG IPSETCours SE Le système Linux : La ligne de commande bash - IG IPSET
Cours SE Le système Linux : La ligne de commande bash - IG IPSET
 
Cours SE Gestion des périphériques - IG IPSET
Cours SE Gestion des périphériques - IG IPSETCours SE Gestion des périphériques - IG IPSET
Cours SE Gestion des périphériques - IG IPSET
 
Zotero avancé - support de formation doctorants SHS 2024
Zotero avancé - support de formation doctorants SHS 2024Zotero avancé - support de formation doctorants SHS 2024
Zotero avancé - support de formation doctorants SHS 2024
 
Presentation de la plateforme Moodle - avril 2024
Presentation de la plateforme Moodle - avril 2024Presentation de la plateforme Moodle - avril 2024
Presentation de la plateforme Moodle - avril 2024
 
Saint Georges, martyr, et la lègend du dragon.pptx
Saint Georges, martyr, et la lègend du dragon.pptxSaint Georges, martyr, et la lègend du dragon.pptx
Saint Georges, martyr, et la lègend du dragon.pptx
 
Présentation_ Didactique 1_SVT (S4) complet.pptx
Présentation_ Didactique 1_SVT (S4) complet.pptxPrésentation_ Didactique 1_SVT (S4) complet.pptx
Présentation_ Didactique 1_SVT (S4) complet.pptx
 
Formation M2i - Comprendre les neurosciences pour développer son leadership
Formation M2i - Comprendre les neurosciences pour développer son leadershipFormation M2i - Comprendre les neurosciences pour développer son leadership
Formation M2i - Comprendre les neurosciences pour développer son leadership
 

Quadruplets et réseaux non enracinés de niveau k

  • 1. Journées Graphes et Algorithmes Marseille – 09/11/2010 Quadruplets et réseaux non enracinés de niveau k Philippe Gambette, Vincent Berry, Christophe Paul
  • 2. • Réseaux non enracinés de niveau k • Complexité de la reconstruction • Réseaux phylogénétiques • Triplets et quadruplets • Décomposition dans le cas dense Plan • Reconstruction dans le cas complet • Lien avec Non-Betweenness
  • 3. Les arbres phylogénétiques D'après Woese, Kandler, Wheelis : Towards a natural system of organisms: proposal for the domains Archaea, Bacteria, and Eucarya, Proceedings of the National Academy of Sciences, 87(12), 4576–4579 (1990)
  • 4. Les réseaux phylogénétiques D'après Parker & Stone, South Park S10E12 – The Theory of Evolution according to Mrs Garrison (2006) Problème : prendre en compte les échanges de matériel génétique entre espèces coexistantes
  • 5. Les réseaux phylogénétiques Doolittle : Uprooting the Tree of Life, Scientific American (Fév. 2000) Réseau phylogénétique de la vie
  • 6. Les réseaux phylogénétiques TCS SplitsTree Network Level-2 T-Rex HorizStory réseau médian réseau couvrant minimum réseau de niveau 2 réseau de bipartitions réticulogramme diagramme de synthèse
  • 7. Reconstruction de réseaux {séquences de gènes} réseau N méthodes de distance Bandelt & Dress 1992 - Legendre & Makarenkov 2000 - Bryant & Moulton 2002 méthodes de parcimonie Hein 1990 - Kececioglu & Gusfield 1994 - Jin, Nakhleh, Snir, Tuller 2009 méthodes de vraisemblance Snir & Tuller 2009 - Jin, Nakhleh, Snir, Tuller 2009 - Velasco & Sober 2009 AATTGCAGTAGCCCAAAAT ACCTGCAGTAGACCAAT GCTTGCCGTAGACAAGAAT ATTTGCAGAAGACCAAAT AATTGCAGTAGACAAGAAT ACTTGCAGTAGCACAAAAT ACCTGGTGTAAAAT
  • 8. Reconstruction de réseaux Problème : méthodes généralement lentes, explosion du nombre de séquences. {séquences de gènes} réseau N AATTGCAGTAGCCCAAAAT ACCTGCAGTAGACCAAT GCTTGCCGTAGACAAGAAT ATTTGCAGAAGACCAAAT AATTGCAGTAGACAAGAAT ACTTGCAGTAGCACAAAAT ACCTGGTGTAAAAT méthodes de distance Bandelt & Dress 1992 - Legendre & Makarenkov 2000 - Bryant & Moulton 2002 méthodes de parcimonie Hein 1990 - Kececioglu & Gusfield 1994 - Jin, Nakhleh, Snir, Tuller 2009 méthodes de vraisemblance Snir & Tuller 2009 - Jin, Nakhleh, Snir, Tuller 2009 - Velasco & Sober 2009
  • 9. Reconstruction combinatoire de réseaux phylome = {arbres} super-réseau N {séquences de gènes} Reconstruction d'un arbre par ensemble de gènes homologues Réconciliation ou consensus d'arbres AATTGCAGTAGCCCAAAAT ACCTGCAGTAGACCAAT GCTTGCCGTAGACAAGAAT ATTTGCAGAAGACCAAAT AATTGCAGTAGACAAGAAT ACTTGCAGTAGCACAAAAT ACCTGGTGTAAAAT
  • 10. Reconstruction combinatoire de réseaux phylome = {arbres} super-réseau N {séquences de gènes} Reconstruction d'un arbre par ensemble de gènes homologues Réconciliation ou consensus d'arbres Problème : le consensus d'arbres est un problème NP-complet pour 2 arbres AATTGCAGTAGCCCAAAAT ACCTGCAGTAGACCAAT GCTTGCCGTAGACAAGAAT ATTTGCAGAAGACCAAAT AATTGCAGTAGACAAGAAT ACTTGCAGTAGCACAAAAT ACCTGGTGTAAAAT
  • 11. Triplets/quadruplets, splits/clades Problème : Reconstruire le super-réseau d'un ensemble d'arbres est difficile. Idée : reconstuire un réseau contenant tous les : triplets quadruplets des arbres en entrée ? Motivations algorithmiques ! a b c d e a f b c de
  • 12. • Réseaux non enracinés de niveau k • Complexité de la reconstruction • Réseaux phylogénétiques • Triplets et quadruplets • Décomposition dans le cas dense Plan • Reconstruction dans le cas complet • Lien avec Non-Betweenness
  • 13. Triplets et quadruplets Idée : reconstuire un réseau contenant tous les : triplets des arbres en entrée ? a b c d e a|ce
  • 14. Triplets et quadruplets Idée : reconstuire un réseau contenant tous les : triplets quadruplets des arbres en entrée ? a b c d e a|ce ab|ce a f b c de
  • 15. Triplets et quadruplets Idée : modifier le type de données à traiter {arbres} super-réseau N
  • 16. Triplets et quadruplets Idée : modifier le type de données à traiter {arbres} super-réseau N super-réseau N' {triplets} {quadruplets}
  • 17. Triplets et quadruplets Idée : modifier le type de données à traiter {arbres} super-réseau N super-réseau N' {triplets} {quadruplets} N'=N ?
  • 18. Triplets et quadruplets Un réseau contenant tous les quadruplets d'un arbre T ne contient pas forcément T. Contient tous les quadruplets d'un arbre T contient T. T N contient tous les quadruplets de T mais pas T a b c d e f a b c de f N
  • 19. Triplets et quadruplets Pas nécessairement, mais : N'=N ? { N } ⊆ { N' } {arbres} super-réseau N super-réseau N' {triplets} {quadruplets}
  • 20. • Réseaux non enracinés de niveau k • Complexité de la reconstruction • Réseaux phylogénétiques • Triplets et quadruplets • Décomposition dans le cas dense Plan • Reconstruction dans le cas complet • Lien avec Non-Betweenness
  • 21. Réseaux non enracinés de niveau k Algorithmes rapides pour des réseaux à structure proche d'un arbre. a b c d e f ghi composante 2-arête connexe = sous-graphe sans isthme (arête qui déconnecte le graphe) maximal
  • 22. Réseaux non enracinés de niveau k Algorithmes rapides pour des réseaux à structure proche d'un arbre. niveau = maximum, parmi toutes les composantes 2-arêtes-connexes, du nombre minimum d'arêtes à supprimer pour obtenir un arbre. réseau non enraciné de niveau 2. a b c d e f ghi composante 2-arête connexe = sous-graphe sans isthme (arête qui déconnecte le graphe) maximal
  • 23. Réseaux non enracinés de niveau k Algorithmes rapides pour des réseaux à structure proche d'un arbre. réseau non enraciné de niveau 2. a b c d e f ghi équivalent non enraciné du niveau des réseaux enracinés Choy, Jansson, Sadakane & Sung 2005
  • 24. Réseaux non enracinés de niveau k Algorithmes rapides pour des réseaux à structure proche d'un arbre. réseau non enraciné de niveau 2. a b c d e f ghi équivalent non enraciné du niveau des réseaux enracinés Choy, Jansson, Sadakane & Sung 2005 Enraciner un arbre : difficile en phylogénie le faire plutôt à la fin !
  • 25. Réseaux non enracinés de niveau k Algorithmes rapides pour des réseaux à structure proche d'un arbre. niveau = mesure de “complexité” du réseau phylogénétique réseau non enraciné de niveau 2. a b c d e f ghi
  • 26. Réseaux non enracinés de niveau k Algorithmes rapides pour des réseaux à structure proche d'un arbre. réseau non enraciné de niveau 1. a b c d e f ghi niveau = mesure de “complexité” du réseau phylogénétique niveau 0 = arbre
  • 27. Réseaux non enracinés de niveau k Algorithmes rapides pour des réseaux à structure proche d'un arbre. réseau non enraciné de niveau 1. a b c d e f ghi niveau = mesure de “complexité” du réseau phylogénétique niveau 0 = arbre niveau 1 = “arbre de cycles”
  • 28. Réseaux non enracinés de niveau k Algorithmes rapides pour des réseaux à structure proche d'un arbre. réseau non enraciné de niveau > 1. a b c d e f ghi niveau = mesure de “complexité” du réseau phylogénétique niveau 0 = arbre niveau 1 = “arbre de cycles” niveau > 1 = “arbre de blobs”
  • 29. • Réseaux non enracinés de niveau k • Complexité de la reconstruction • Réseaux phylogénétiques • Triplets et quadruplets • Décomposition dans le cas dense Plan • Reconstruction dans le cas complet • Lien avec Non-Betweenness
  • 30. Complexité de la vérification N, réseau non enraciné de niveau k Ensemble des quadruplets de N ? a b c d e f ghi N
  • 31. Complexité de la vérification a b c d e f ghi N N, réseau non enraciné de niveau k Ensemble des quadruplets de N ? ab|cd quadruplet de N N contient deux chemins sommet-disjoints :
  • 32. Complexité de la vérification a b c d e f ghi N N, réseau non enraciné de niveau k Ensemble des quadruplets de N ? ab|cd quadruplet de N N contient deux chemins sommet-disjoints : - entre a et b
  • 33. Complexité de la vérification a b c d e f ghi N N, réseau non enraciné de niveau k Ensemble des quadruplets de N ? ab|cd quadruplet de N N contient deux chemins sommet-disjoints : - entre a et b - entre c et d
  • 34. Complexité de la vérification a b c d e f ghi N ab|cd quadruplet de N N contient deux chemins sommet-disjoints : - entre a et b - entre c et d N, réseau non enraciné de niveau k Ensemble des quadruplets de N ?
  • 35. Complexité de la vérification a b c d e f ghi N ab|cd quadruplet de N N contient deux chemins sommet-disjoints : - entre a et b - entre c et d N, réseau non enraciné de niveau k Ensemble des quadruplets de N ? algo 2-Vertex-Disjoint-Paths en O(n+n.α(n,n)) Tholey 2009
  • 36. Complexité de la vérification N, réseau non enraciné de niveau k Ensemble des quadruplets de N ? En O(n5 (1+α(n,n))) N enraciné Triplets de N ? En O(n3 ) programmation dynamique, Byrka, Gawrychowski, Huber & Kelk 2010
  • 37. Complexité de la reconstruction Q, ensemble de quadruplets ∃? réseau non enraciné de niveau k qui contient Q ?
  • 38. Complexité de reconstruction non enraciné enraciné général dense 1 quadruplet par ensemble de 4 feuilles complet tous les quadruplets du réseau NP-complet niveau 1 ? décomposition en temps polynomial O(n4 ) ? ? ? ? décomposition en temps polynomial niveau k>1 niveau 1 niveau k>1 NP-complet Jansson, Nguyen & Sung 2006 O(n3 ) Jansson, Nguyen & Sung 2006 O(n3 ) Jansson, Nguyen & Sung 2006 O(n5k+4 ) To & Habib 2009 O(n3k+3 ) Van Iersel & Kelk 2009 NP-complet Van Iersel, Kelk & Mnich 2009
  • 39. Complexité de reconstruction non enraciné enraciné général dense 1 quadruplet par ensemble de 4 feuilles complet tous les quadruplets du réseau NP-complet NP-complet Jansson, Nguyen & Sung 2006 niveau 1 ? décomposition en temps polynomial O(n3 ) Jansson, Nguyen & Sung 2006 O(n4 ) O(n3 ) Jansson, Nguyen & Sung 2006 ? ? ? ? décomposition en temps polynomial O(n5k+4 ) To & Habib 2009 O(n3k+3 ) Van Iersel & Kelk 2009 niveau k>1 niveau 1 niveau k>1 NP-complet Van Iersel, Kelk & Mnich 2009
  • 40. Complexité de la reconstruction Q, ensemble de quadruplets ∃? réseau non enraciné de niveau k qui contient Q ? T, ensemble de triplets ∃? réseau enraciné de niveau k qui contient T ? En O(n3 ) pour k = 0 NP-complet pour k = 1 NP-complet pour k > 1 NP-complet pour k = 0 Steel 1992 Aho & al. 1981, Jansson & al. 2005 Jansson, Nguyen & Sung 2006 Van Iersel, Kelk & Mnich 2009
  • 41. Complexité de la reconstruction Q, ensemble de quadruplets ∃? réseau non enraciné de niveau k qui contient Q ? T, ensemble de triplets ∃? réseau enraciné de niveau k qui contient T ? En O(n3 ) pour k = 0 NP-complet pour k = 1 NP-complet pour k > 1 NP-complet pour k = 0 NP-complet pour k = 1, réduction de Betweenness Steel 1992 Aho & al. 1981, Jansson & al. 2005 Jansson, Nguyen & Sung 2006 Van Iersel, Kelk & Mnich 2009
  • 42. Réduction depuis Betweenness C, ensemble de contraintes ci =(a,b,c) : b “entre” a et c ∈ A ∃? ordre σ sur A qui vérifie les contraintes de C ? NP-complet Opatrny 1979 Betweenness Q, ensemble de quadruplets ∃? réseau non enraciné de niveau 1 qui contient Q ? Réduction : adaptation de la preuve de Steel 1992
  • 43. Réduction depuis Betweenness ci = (a,b,c) Qi = {pi p'i |ab, pi a|bc, pi b|cqi , pi c|qi q'i , pi α|p'i β, qi α|q'i β} Q' = {αα'|ββ', αβ|α'β'}∪{ββ'|xα, αα'|xβ, α'β'|xβ, x∈A∪{pi ,p'i ,qi ,q'i }} Q = Q' ∪ UQi C, ensemble de contraintes ci =(a,b,c) : b “entre” a et c ∈ A ∃? ordre σ sur A qui vérifie les contraintes de C ? Betweenness Q, ensemble de quadruplets ∃? réseau non enraciné de niveau 1 qui contient Q ? i
  • 44. Réduction depuis Betweenness ci = (a,b,c) Qi = {pi p'i |ab, pi a|bc, pi b|cqi , pi c|qi q'i , pi α|p'i β, qi α|q'i β} Q' = {αα'|ββ', αβ|α'β'}∪{ββ'|xα, αα'|xβ, α'β'|xβ, x∈A∪{pi ,p'i ,qi ,q'i }} Q = Q' ∪ UQi C, ensemble de contraintes ci =(a,b,c) : b “entre” a et c ∈ A ∃? ordre σ sur A qui vérifie les contraintes de C ? Betweenness Q, ensemble de quadruplets ∃? réseau non enraciné de niveau 1 qui contient Q ? i x α β α' β' α'' β''
  • 45. Réduction depuis Betweenness ci = (a,b,c) Qi = {pi p'i |ab, pi a|bc, pi b|cqi , pi c|qi q'i , pi α|p'i β, qi α|q'i β} Q' = {αα'|ββ', αβ|α'β'}∪{ββ'|xα, αα'|xβ, α'β'|xβ, x∈A∪{pi ,p'i ,qi ,q'i }} Q = Q' ∪ UQi C, ensemble de contraintes ci =(a,b,c) : b “entre” a et c ∈ A ∃? ordre σ sur A qui vérifie les contraintes de C ? Betweenness Q, ensemble de quadruplets ∃? réseau non enraciné de niveau 1 qui contient Q ? i x α β α' β' α'' β'' p bp' q q'ca q' bq p' pac i i i i ou i i i i b' a'c' b' c'a' α'' α'' β'' β'' α α β β
  • 46. Réduction depuis Betweenness ci = (a,b,c) Qi = {pi p'i |ab, pi a|bc, pi b|cqi , pi c|qi q'i , pi α|p'i β, qi α|q'i β} Q' = {αα'|ββ', αβ|α'β'}∪{ββ'|xα, αα'|xβ, α'β'|xβ, x∈A∪{pi ,p'i ,qi ,q'i }} Q = Q' ∪ UQi C, ensemble de contraintes ci =(a,b,c) : b “entre” a et c ∈ A ∃? ordre σ sur A qui vérifie les contraintes de C ? Betweenness Q, ensemble de quadruplets ∃? réseau non enraciné de niveau 1 qui contient Q ? i pi p'i qi q'i pi p'i qi q'i A α β α' β' σ
  • 47. Réduction depuis Betweenness ci = (a,b,c) Qi = {pi p'i |ab, pi a|bc, pi b|cqi , pi c|qi q'i , pi α|p'i β, qi α|q'i β} Q' = {αα'|ββ', αβ|α'β'}∪{ββ'|xα, αα'|xβ, α'β'|xβ, x∈A∪{pi ,p'i ,qi ,q'i }} Q = Q' ∪ UQi C, ensemble de contraintes ci =(a,b,c) : b “entre” a et c ∈ A ∃? ordre σ sur A qui vérifie les contraintes de C ? Betweenness Q, ensemble de quadruplets ∃? réseau non enraciné de niveau 1 qui contient Q ? i pi p'i qi q'i pi p'i qi q'i A α β α' β' σ
  • 48. • Réseaux non enracinés de niveau k • Complexité de la reconstruction • Réseaux phylogénétiques • Triplets et quadruplets • Décomposition dans le cas dense Plan • Reconstruction dans le cas complet • Lien avec Non-Betweenness
  • 49. Complexité de reconstruction non enraciné enraciné général dense 1 quadruplet par ensemble de 4 feuilles complet tous les quadruplets du réseau NP-complet niveau 1 ? décomposition en temps polynomial O(n4 ) ? ? ? ? décomposition en temps polynomial niveau k>1 niveau 1 niveau k>1 NP-complet Jansson, Nguyen & Sung 2006 O(n3 ) Jansson, Nguyen & Sung 2006 O(n3 ) Jansson, Nguyen & Sung 2006 O(n5k+4 ) To & Habib 2009 O(n3k+3 ) Van Iersel & Kelk 2009 NP-complet Van Iersel, Kelk & Mnich 2009
  • 50. Décomposition dans le cas dense • Q, ensemble dense de quadruplets : Sur tout ensemble de quatre feuilles, il existe un quadruplet dans Q • A|A SN-bipartition de Q : Pour toutes feuilles x,y ∈ A, z,t ∈ A, le seul quadruplet de Q sur ces 4 feuilles est xy|zt Q, ensemble dense de quadruplets L'ensemble des SN-bipartitions de Q est compatible, i.e. peut être représenté par un arbre non enraciné
  • 51. Décomposition dans le cas dense Q, ensemble dense de quadruplets L'ensemble des SN-bipartitions de Q est compatible, i.e. peut être représenté par un arbre non enraciné a c f g h b d eN {a}| {bcdefgh} {b}| {acdefgh} {ab}| {cdefgh} {c}| {abdefgh} {abc}| {defgh} {d}| {abcefgh} {e}| {abcdfgh} {de}| {abcfgh} {f}| {abcdegh} {h}| {abcdefg} {g}| {abcdefh} Q = { quadruplets de N }
  • 52. Décomposition dans le cas dense Q, ensemble dense de quadruplets L'ensemble des SN-bipartitions de Q est compatible, i.e. peut être représenté par un arbre non enraciné a c f g h b d eN {a}| {bcdefgh} {b}| {acdefgh} {ab}| {cdefgh} {c}| {abdefgh} {abc}| {defgh} {d}| {abcefgh} {e}| {abcdfgh} {de}| {abcfgh} {f}| {abcdegh} {h}| {abcdefg} {g}| {abcdefh} Q = { quadruplets de N }
  • 53. Décomposition dans le cas dense Q, ensemble dense de quadruplets L'ensemble des SN-bipartitions de Q est compatible, i.e. peut être représenté par un arbre non enraciné Calcul des SN-bipartitions en O(n4 ) variante de l'algorithme Q*, Berry & Gascuel 2001 Equivalent enraciné : Calcul des SN-ensembles en O(n3 ) Jansson, Nguyen & Sung 2006
  • 54. Décomposition dans le cas dense Q, ensemble dense de quadruplets contenus dans un réseau N de niveau 1 Il existe un réseau N ' de niveau 1 contenant Q tel que l'ensemble des SN-bipartitions de Q est en bijection avec les isthmes de N '.
  • 55. Décomposition dans le cas complet Q(N), ensemble de tous les quadruplets contenus dans un réseau N de niveau k Les SN-bipartitions de Q(N) sont en bijection avec les isthmes de N. a c f g h b d eN {a}| {bcdefgh} {b}| {acdefgh} {ab}| {cdefgh} {c}| {abdefgh} {abc}| {defgh} {d}| {abcefgh} {e}| {abcdfgh} {de}| {abcfgh} {f}| {abcdegh} {h}| {abcdefg} {g}| {abcdefh}
  • 56. Décomposition dans le cas complet Q(N), ensemble de tous les quadruplets contenus dans un réseau N de niveau k Les SN-bipartitions de Q(N) sont en bijection avec les isthmes de N. On sait séparer les composantes 2-arête-connexes de N à partir de Q(N). Comment reconstruire chaque composante 2-arête-connexe de N ?
  • 57. • Réseaux non enracinés de niveau k • Complexité de la reconstruction • Réseaux phylogénétiques • Triplets et quadruplets • Décomposition dans le cas dense Plan • Reconstruction dans le cas complet • Lien avec Non-Betweenness
  • 58. Complexité de reconstruction non enraciné enraciné général dense 1 quadruplet par ensemble de 4 feuilles complet tous les quadruplets du réseau NP-complet niveau 1 ? décomposition en temps polynomial O(n4 ) ? ? ? ? décomposition en temps polynomial niveau k>1 niveau 1 niveau k>1 NP-complet Jansson, Nguyen & Sung 2006 O(n3 ) Jansson, Nguyen & Sung 2006 O(n3 ) Jansson, Nguyen & Sung 2006 O(n5k+4 ) To & Habib 2009 O(n3k+3 ) Van Iersel & Kelk 2009 NP-complet Van Iersel, Kelk & Mnich 2009
  • 59. Reconstruction dans le cas complet Comment reconstruire chaque composante 2-arête-connexe de N de niveau 1 à partir de Q(N) ? Graphe d'ordre des quadruplets : G(Q) = ({{a,b}, a,b ∈ X},{arête {a,b}{b,c} si ∀d ∈ X, ac|bd∉Q}) {a,b} {b,c} {c,d} {a,e}{a,c} {b,e} {b,d} {d,e} {a,d} {c,e} a e b d c a b c d e N G(Q(N)) N réseau de niveau 1 à une composante 2-arête-connexe G(Q(N)) = cycle à n sommets + sommets isolés. arête {a,b}{b,c} étiquetée par “b”
  • 60. Reconstruction dans le cas complet Comment reconstruire chaque composante 2-arête-connexe de N de niveau 1 à partir de Q(N) ? Reconstruction en O(n4 )
  • 61. • Réseaux non enracinés de niveau k • Complexité de la reconstruction • Réseaux phylogénétiques • Triplets et quadruplets • Décomposition dans le cas dense Plan • Reconstruction dans le cas complet • Lien avec Non-Betweenness
  • 62. Complexité de reconstruction non enraciné enraciné général dense 1 quadruplet par ensemble de 4 feuilles complet tous les quadruplets du réseau NP-complet niveau 1 ? décomposition en temps polynomial O(n4 ) ? ? ? ? décomposition en temps polynomial niveau k>1 niveau 1 niveau k>1 NP-complet Jansson, Nguyen & Sung 2006 O(n3 ) Jansson, Nguyen & Sung 2006 O(n3 ) Jansson, Nguyen & Sung 2006 O(n5k+4 ) To & Habib 2009 O(n3k+3 ) Van Iersel & Kelk 2009 NP-complet Van Iersel, Kelk & Mnich 2009
  • 63. Lien avec Non-Betweenness Comment reconstruire chaque composante 2-arête-connexe de N de niveau 1 à partir de Q(N) ? Reconstruction en O(n4 ) Comment reconstruire chaque composante 2-arête-connexe de N de niveau 1 à partir de Q dense ?
  • 64. Lien avec Non-Betweenness Comment reconstruire chaque composante 2-arête-connexe de N de niveau 1 à partir de Q(N) ? Reconstruction en O(n4 ) Comment reconstruire chaque composante 2-arête-connexe de N de niveau 1 à partir de Q dense ? Variante de Non-Betweenness (dense) ab|cd dans un réseau de niveau 1 : a b d c a b c d a c d b c “entre” a et b par rapport à d
  • 65. Merci pour votre attention ! non enraciné enraciné général dense 1 quadruplet par ensemble de 4 feuilles complet tous les quadruplets du réseau NP-complet NP-complet Jansson, Nguyen & Sung 2006 niveau 1 ? décomposition en temps polynomial O(n3 ) Jansson, Nguyen & Sung 2006 O(n4 ) O(n3 ) Jansson, Nguyen & Sung 2006 ? ? ? ? décomposition en temps polynomial O(n5k+4 ) To & Habib 2009 O(n3k+3 ) Van Iersel & Kelk 2009 niveau k>1 niveau 1 niveau k>1 NP-complet Van Iersel, Kelk & Mnich 2009 Des questions ?