Gautier m grenoble_2011

482 vues

Publié le

Publié dans : Technologie, Business
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
482
Sur SlideShare
0
Issues des intégrations
0
Intégrations
1
Actions
Partages
0
Téléchargements
10
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Gautier m grenoble_2011

  1. 1. Introduction Mod`les D´mographiques e e Un exemple d’application D´veloppements e Conclusion Mod`les hi´rarchiques bay´siens de diff´renciation e e e e g´n´tique et recherche de signatures de s´lection e e e applications ` des jeux de donn´es SNP haut-d´bit a e e Mathieu Gautier UMR INRA/CIRAD/IRD/SupAgro CBGP 29 Juin 2011
  2. 2. Introduction Mod`les D´mographiques e e Un exemple d’application D´veloppements e Conclusion Recherche de signatures de s´lection e Forces ´volutives gouvernant l’´volution des fr´quences e e e all´liques e ˆ Mutation (et recombinaison ` l’´chelle haplotypique) a e : source de la variabilit´ e ˆ D´rive g´n´tique : introduit la stochasticit´ (Taille finie des populations) e e e e ˆ Migration en terme de flux de g`nes e ˆ S´lection e Influence diff´rente ` l’´chelle du g´nome e a e e (Cavalli-Sforza, 1966) ˆ Facteurs d´mographiques (d´rive, flux de g`ne) ⇒ effet global e e e ˆ Selection (mutation et recombinaison) ⇒ effet local
  3. 3. Introduction Mod`les D´mographiques e e Un exemple d’application D´veloppements e Conclusion Diff´rentes approches e Principe G´n´ral e e ˆ D´finition d’un estimateur de la variabilit´ g´n´tique intra/inter e e e e population (e.g. FST , EHH) ˆ Recherche d’outliers (relativement ` l’attendu neutre) a ˆ Distribution th´orique (Lewontin et Krakauer, 1973, Bonhomme et al., 2010) e ˆ Distribution simul´e (Bowcock et al., 1991, Beaumont & Nichols, 1996) e ˆ Distribution empirique (Akey et al., 2002) Mod`lisation Hi´rarchique (Bay´sienne) e e e ˆ Efficace pour distinguer les effets locus des effets population-sp´cifique e sur la variabilit´ g´n´tique e e e ˆ La distribution (fr´quences all´liques) e e est connue (ou approchable) pour diff´rents e mod`les e (d´mographiques) e
  4. 4. Introduction Mod`les D´mographiques e e Un exemple d’application D´veloppements e Conclusion FST et pure-d´rive e Mod`le (d´mographique) de Wright/Fisher e e ˆ Les populations ont ´volu´ pendant t g´n´rations e e e e (non chevauchantes) en complet isolement depuis une population ancestrale commune ˆ Illustration dans le cas de taille de population constante (N) Evolution des fr´quences all´liques e e ˆ P(Xt+1 = j|Xt = i) = j 2N ψij (1 − ψi )2N−j o` ψi = u i ,E[Xt+1 |Xt = xt ] = xt et V[Xt+1 |Xt = xt ] = 2Nxt (1 − xt ) 2N ˆ E[Xt ] ≡ E[E[Xt |Xt−1 ]] = E[Xt−1 ] = ... = x0 = 2Np0 ⇒ E[pt = Xt 2N ] = p0 ˆ V[pt ] = p0 (1 − p0 )[1 − (1 − 1/2N)t ]
  5. 5. Introduction Mod`les D´mographiques e e Un exemple d’application D´veloppements e Conclusion FST et pure-d´rive e Mod`le en d´s´quilibre e ee (e.g. temps de fixation) ˆ t(p0 ) = − 4Ne (1−pp0 0 )ln(1−p0 ) (Kimura et Ohta, 1971) ˆ Si p 1 (e.g. p0 = 2Ne ) ⇒ t(p0 ) 1 4Ne (pfix1 = p0 , pfix2 = 1 − p0 ) Evolution de la diff´rentiation e ˆ La variabilit´ des fr´quences all´liques inter-pop e e e (diff´rentiation) e augmente au cours du temps (Vmax = p0 (1 − p0 )) ˆ D´finition : FST = e V (p) p0 (1−p0 ) = 1 − (1 − 2N )t 1 t 2N ⇔ Mesure de l’avancement du processus de d´rive (aboutissant ` la fixation d’un all`le) e a e
  6. 6. Introduction Mod`les D´mographiques e e Un exemple d’application D´veloppements e Conclusion Simulations : 8 pops (2Ne = 500), 10000 SNPs (8500 neu, 250 per s class) t = 50 generations t = 100 generations
  7. 7. Introduction Mod`les D´mographiques e e Un exemple d’application D´veloppements e Conclusion Mod´lisation hi´rarchique e e Principe {πi } ∼ β(0.7, 0.7) {cj } ∼ β(1, 1) ˆ On veut s´parer l’influence de πi e (p0 ) et cj (d´rive) e d   sur la variance des αij ˆ Contraster les αij inter-pop informe sur les πi d   d     ˆ Contraster les αij intra-pop informe sur les cj ‚ d © {αij } f (αij |πi , cj ) Distribution a priori sur les αij |πi , cj ˆ αij |πi , cj ∼ N[0,1] πi , cj πi (1 − πi ) (Nicholson et al.,2002) ˆ 1−c 1−c c αij |πi , cj ∼ β πi c j , (1 − πi ) c j j j Y, N Yij ∼ Bin(αij , Nij ) ˆ Prior ”exacte” : eq. de diffusion de Kimura (en pr´p.) e
  8. 8. Introduction Mod`les D´mographiques e e Un exemple d’application D´veloppements e Conclusion Comparaisons (4 pops, 300 SNPs, 2Ne=1000) model 1 (Tr. Gaussian) 1.0 1 2 3 4 4 2 1 3 1 3 4 2 4 3 3 4 1 2 2 1 3 1 4 0.8 2 3 4 2 1 0.6 c value 3 0.4 1 2 4 2 2 4 3 2 3 1 4 1 3 0.2 1 4 2 4 3 2 4 3 1 1 4 1 3 2 t/2N 4 2 1 2 4 1 3 FST=1−(1−1/2N)^t 3 4 2 3 1 0.0 2 3 4 1 10 20 50 100 200 500 1000 Generation model 2 (Beta) 1.0 0.8 1 2 4 4 3 2 1 1 0.6 2 4 3 3 3 c value 4 4 1 3 1 2 2 1 3 4 2 0.4 3 4 1 2 1 3 2 4 2 4 3 0.2 2 1 3 1 2 3 4 1 4 3 1 2 4 2 3 4 1 4 1 3 t/2N 2 1 2 2 4 4 3 FST=1−(1−1/2N)^t 1 3 2 4 3 1 0.0 2 1 3 4 10 20 50 100 200 500 1000 Generation model 3 (Exact) 1.0 1 3 2 4 4 2 1 0.8 1 2 3 3 4 3 4 4 1 0.6 3 2 2 1 t/2N 1 3 4 2 0.4 3 4 1 2 1 3 2 4 2 0.2 2 1 3 3 4 1 2 3 4 1 4 3 3 4 2 2 1 4 1 4 1 3 2 1 2 2 4 4 3 t/2N 1 3 2 4 3 1 0.0 4 3 2 1 10 20 50 100 200 500 1000 Generation
  9. 9. Introduction Mod`les D´mographiques e e Un exemple d’application D´veloppements e Conclusion Identification de locus outliers : PPP-value (Gautier et al., 2010) Ecart au mod`le e (H0 : ´changeabilit´ des loci) e e J [yij −E(yij |πi ,cj )]2 ˆ Mesure de discr´pance : T (yij , πi , cj ) = e V(yij |πi ,cj ) j=1 πi (1−πi )(1+(nij −1)cj ) avec E(yij | πi , cj ) = πi et V(yij | πi , cj ) = nij ˆ Pi = P T (yij , πi , cj ) T (yij , πi , cj ) | yij r Impl´mentation (MCMC) e ˆ A chaque it´ration t, on ´chantillonne yij ∼ Bin(nij , αij ) e e r t  J Tt (yij , πit , cjt ) − Tt (yij , πit , cjt ) 0 r ˆ On calcule :  1 si Pt = i j=1  0 sinon  N ˆ Pi = 1 N Pt i t=1

×