SlideShare une entreprise Scribd logo
1  sur  19
Télécharger pour lire hors ligne
GREZY Aude
Encadrants : Crouau-Roy brigitte /Lecompte Emilie
Année 2009-2010
LL’’éévvoolluuttiioonn ddeess cchhrroommoossoommeess sseexxuueellss :: ééttuuddee
éévvoolluuttiivvee ddeess ggèènneess PPRRKKXX//YY
Chromosome Y, le laissé pour compte de l’évolution ?
Parmi les 23 paires de chromosomes observées dans un caryotype humain mâle, l’une d’elle, avec son 
hétéromorphisme prononcé, attire le regard. Et pour cause, cette paire contient deux chromosomes de tailles 
différentes. Le plus petit des deux, le chromosome Y, contrôle grâce à son gène SRY la différenciation testiculaire 
dans l’embryon, autrement dit, a le contrôle du sexe de l’individu qui le porte. Pourtant, alors que le reste du 
génome  humain  est  entièrement  séquencé  depuis  2001,  il  a  fallu  attendre  2003  pour  obtenir  une  séquence 
complète du chromosome Y. Aujourd’hui, en 2010, cette séquence n’a pas encore révélé tous ces secrets. Car, si 
les problèmes liés à la fertilité et au gène SRY sont étudiés depuis un moment déjà, une nouvelle question est 
soulevée  par  cet  étrange  chromosome :  celle  de  l’évolution  particulière  des  chromosomes  sexuels  chez  les 
primates. En effet, le chromosome Y, avec son accumulation de mutations délétères qui le font dégénérer à vue 
d’œil, donne l’impression d’être délaissé par la sélection. C’est à travers une étude évolutive entre l’homme et 
des espèces phylogénétiquement proches, étude rendue possible par les avancées de ces dernières années dans 
le  domaine  de  la  génomique,  de  la  biologie  moléculaire  et  de  la  bioinformatique,  que  des  réponses  vont 
probablement pouvoir émerger.
Introduction
Matériel
Les gènes PRKX/Y
L’ordre des primates
Méthode
Amplification des séquences de PRKX/Y chez différentes espèces de primates
Analyse des séquences, reconstruction phylogénétique, tests de sélection
Résultats
Analyse des séquences et détection de la signature de sélection
Séquences PRKX
Séquences PRKY
Séquences PRKX vs séquences PRKY
Approche phylogénétique
Exon 2
Exon 3
Discussion
Histoire évolutive des gènes PRKX et PRKY
PRKX/Y : des gènes conservés ?
PRKX/Y : région instable du génome ?
Le gène PRKY, témoin d’un début de dégénérescence de la quatrième strate ?
Conclusion et perspectives
Introduction
L‘homme est un mammifère qui partage, entre autres choses, avec le reste du groupe, un
système de reproduction sexué, gonochorique (où il existe des individus mâles et
femelles, par opposition aux hermaphrodites), avec comme système de déterminisme du
sexe des chromosomes sexuels XY. Dans ce système, les gènes du déterminisme du
sexe sont individualisés du reste du génome, sur deux chromosomes distincts. Ainsi, le
type de gamète (X ou Y) transmis, sera suffisant pour déterminer le sexe de l’individu :
le mâle est hétérogamétique XY, et la femelle homogamétique XX. Il existe à travers le
règne animal et végétal de nombreux autres modes de reproduction, et parmi les espèces
à reproduction sexuée, il existe de nombreux autres types de déterminisme du sexe. Par
exemple chez les reptiles, le sexe n’est pas déterminé de manière génétique, mais est
dépendant de la température d’incubation de l’œuf. Néanmoins, le système de
déterminisme du sexe par des chromosomes sexuels n’est pas un cas unique. Ce
système est apparu de nombreuses fois indépendamment dans l’évolution, que ce soit
chez les plantes ou les métazoaires (Graves 2008). Le système XY humain est apparu il
y a environ 160 millions d’années (Ma), avant la divergence des marsupiaux du reste
des mammifères (Veyrunes et al. 2008). Il a évolué à partir d’une paire d’autosomes, où
l’un des chromosomes de la paire a acquis le gène du déterminisme du sexe SRY (par
mutation du gène Sox 3, à l’époque autosomal) (Graves 2006). Le chromosome portant
ce nouveau gène SRY a évolué pour devenir le futur chromosome Y, alors que son
homologue est devenu le chromosome X. Il existe sur les paires d’autosomes, un
système empêchant une trop grande divergence du contenu génétique entre deux
chromosomes homologues d’une même paire : la recombinaison homologue. Le
maintien du gène SRY n’aurait donc pas été possible, si un événement d’inversion sur le
chromosome Y n’avait pas été sélectionné, entrainant un arrêt de la recombinaison
homologue aux alentours de ce gène. En l’absence de recombinaison, cette région du
futur chromosome Y a vu son contenu génétique commencer à diverger par rapport à
celle du chromosome X. Puis des évènements d’inversions se sont répandus le long de
la paire, permettant la divergence d’autres régions du chromosome (Figure 1). Ainsi, en
observant la séquence du chromosome Y et en la comparant à celle du X, on peut
discerner plusieurs strates de divergence correspondant à des régions ayant commencé à
diverger plus ou moins précocement (Lahn & Page 1999).
1
Figure 1 : Schéma de l’évolution des chromosomes
XY (d’après Graves 2006).
TDF : Testis Determining Factor.
MSY : Male Specifique Region of the Y
Les chromosomes sexuels XY, à l’heure
actuelle, possèdent des régions pseudo-
autosomales (les PAR), témoin de leur origine
autosomale, où la recombinaison entre les
deux chromosomes sexuels a toujours lieu,
permettant une ségrégation correcte du
chromosome Y à la méiose (Figure 1).
L’arrêt de la recombinaison homologue explique la divergence du contenu génétique
entre les chromosomes X et Y, mais il pourrait également expliquer en partie un autre
phénomène touchant les chromosomes sexuels : la dégénérescence du chromosome Y. En
effet, celui-ci est loin de ressembler à l’autosome dont il est issu. Au cours de ces 160
millions d’années d’évolution, il est devenu court, pauvre en gènes fonctionnels, riche en
séquences répétées et en hétérochromatine (Tableau I).
Tableau I : Tableau comparatif des chromosomes X et Y humain. (d’après Ross et al. 2005 ;
Graves 2006 ; et données récupérées sur la base de données Ensembl)
Chromosome X Y
Longueur (Mégabases) 155,270,560 59,373,566
Nombre de gènes 1098 45
fonction(s) majoritaire(s)
reproduction
développement de l'encéphale (ex : Sox 3)
reproduction
(ex : SRY)
Nombre de pseudogènes 700 313
De nombreuses hypothèses tentent d’expliquer la dégénérescence du Y ainsi que
l’accumulation de mutations délétères qui devraient être éliminées par la sélection. Le
génome est en constante évolution, et l’un des moteurs de cette évolution est la dérive
génétique (fluctuation aléatoire des fréquences alléliques dans une population). Or on sait
que plus une population est petite, plus la dérive génétique y est forte. Le chromosome Y
pourrait souffrir d’une dérive génétique forte due à sa taille efficace réduite dans la
population (1Y pour 4 autosomes). De plus, le Y est transmis de manière haplotypique, ce
qui pourrait être à l’origine de cette évolution particulière. En effet, alors que le X peut
2
encore recombiner chez les femelles, le chromosome Y n’en a jamais l’occasion. Ainsi,
des mutations même faiblement délétères peuvent être fixées, simplement du fait de leur
proximité d’un site sélectionné. La sélection serait alors moins efficace en absence de
recombinaison. Néanmoins, on ne sait pas dans quelles proportions ces différentes
hypothèses jouent un rôle dans l’évolution du Y (Charlesworth 2000). Mais une chose est
sûre : ce chromosome est soumis à des forces particulières, et le génome gardant la trace
des forces évolutives qu’il a subit, on peut, en étudiant la séquence primaire du
chromosome Y, essayer de retracer son histoire.
Ainsi, l’équipe « Structure génétique des populations et évolution du génome » (EDB) a
entrepris l’étude de plusieurs gènes, présents à la fois sur les chromosomes X et Y. Deux
paires de gènes ont déjà été étudiées, et j’ai commencé l’étude d’une troisième : les gènes
PRKX/Y. Cette étude a été réalisée à travers la lignée des primates, dont la phylogénie est
bien établie, ce qui permet de disposer d’un cadre évolutif connu et de dater les
évènements évolutifs observés lors de l’étude. Afin de reconstruire l’histoire évolutive
des gènes PRKX/Y, plusieurs étapes ont été nécessaires. Tout d’abord, nous avons
récupéré les informations déjà existantes sur le gène, ainsi que les séquences disponibles
dans les banques. Ensuite, nous avons généré de nouvelles séquences de PRKX/Y pour le
maximum d’espèces de primates, à l’aide d’amorces hétérologues. Finalement, nous
avons comparé et analysé les séquences X et Y des différentes espèces et recherché, par
des tests permettant de distinguer les différents types de sélection, une signature de
sélection afin d’identifier les mécanismes moléculaires en jeu. Les principaux types de
sélection sont la sélection positive (sélection qui favorise la fixation de nouvelles
mutations conférant une meilleure valeur sélective), et la sélection purificatrice (sélection
qui tend à empêcher la fixation de nouvelles mutations et qui préserve la fonction du
gène). Ainsi, nous essaierons de formuler une hypothèse quand au type de sélection subit
par les gènes PRKX/Y et de déterminer dans quelle mesure le gène PRKY est soumis à la
dégénérescence étant donné sa position sur le Y.
Matériel
Les gènes PRKX/Y :
Les gènes PRKX/Y codent pour une sérine/thréonine CREB-kinase dépendante de l’AMP
cyclique, appartenant à la famille des kinases AGC, une famille de protéines kinases
incluant notamment les PKA, PKC et PKG (Pearce et al. 2010), bien que Li et al. (2002)
3
ont montré que PRKX/Y possèderaient des fonctions uniques, non partagées avec les
kinases AGC. Elles seraient plus proches des kinases KAPC-DICDI de Dictyostelum et de
DC2 de Drosophila, toutes deux impliquées dans la migration et la différenciation
cellulaire. En effet, PRKX est impliquée dans la migration des cellules rénales au cours
du développement (Li et al 2002) ainsi que dans une voie de signalisation, conduisant à la
maturation de macrophages et de granulocytes (Semizarov et al. 1998).
Chez l’homme, le gène PRKX (situé dans la région p22.33) est composé de 9 exons,
codant pour 358 acides aminés (aa). L’exon 9 et les 166 premiers nucléotides de l’exon 1
ne sont pas traduits. Le gène PRKY (situé dans la région p11.2) ne comprend que 8
exons, codant pour 277 aa, car la séquence homologue de l’exon 6 de PRKX y est
absente. Les gènes PRKX/Y se trouvent dans la 4ème
strate de divergence des
chromosomes sexuels, donc la plus récente (Skaletsky et al. 2003). Les gènes PRKX/Y
sont à l’origine de syndromes de réversions sexuels chez l’homme. Ces pathologies sont
dues à des échanges de portions de chromosomes qui ont lieu de manière anormale,
donnant lieu, à des individus de génotype XX, et de phénotype masculin, car portant sur
un de leur chromosome X, la région du gène SRY. En effet, les gènes PRKX/Y, bien
qu’éloignés des PAR, possèdent, après ces régions, le plus fort taux de recombinaison
observé sur le chromosome Y. Cela est certainement dû au fait que ces deux gènes, bien
qu’isolés par arrêt de la recombinaison il y a ~30 Ma, présentent encore 94% de similarité
de séquences chez l’Homme. De plus, ils sont orientés de manière identique sur X et Y et
le locus est de taille assez importante (environ 110 Kb) (Schiebel et al. 1997). Des
évènements de conversion génique (échange non réciproque de matériel chromosomique)
ont eu lieu, au cours de l’histoire des chromosomes sexuels, notamment aux alentours de
PRKX/Y. Ainsi, la vision des chromosomes sexuels n’échangeant aucun matériel
génétique entre eux semble ne pas être vraie sur la totalité des chromosomes X/Y, et
notamment sur les gènes PRKX/Y. Cette conversion génique pourrait jouer un rôle dans
la préservation des copies présentes sur le Y (Rosser et al. 2009).
L’ordre des primates :
L’ordre des Primates comprend au moins 376 espèces regroupées dans 70 genres. (Fabres
et al. 2009). Notre étude a été réalisée au sein des Haplorrhini, ces derniers étant
subdivisés en singes du nouveau monde (les Platyrrhini) et en singes de l’ancien monde
(les Catarrhini). Les Catarrhini contiennent les grands singes, formés de deux familles :
4
les Hominidae (Orang-outan, Gorille, Chimpanzé et Homme) et les Hylobatidae
(Gibbons) ; ainsi que les Cercopithecidae (Figure 2). Les primates sont de plus en plus
étudiés en génomique car leurs relations de parenté avec l’Homme sont un atout pour les
recherches de génomique évolutive. La séquence du chromosome X est disponible pour
l’homme (Homo), le chimpanzé (Pan), le gorille (Gorilla), l’orang-outan (Pongo), le
macaque (Macaca), le tarsier (Tarsius), l’otolemur (Otolemur) et le microcèbe
(Microcebus). Au cours de mon stage, sont arrivés dans les banques, le génome du
babouin (Papio) et du ouistiti (Callitrix), preuve que les primates représentent un intérêt
grandissant en génomique.
Figure 2 : Phylogénie consensus des Primates (d’après Fabres et al. 2009). Les photos
proviennent du site Animal Diversity Web (http://animaldiversity.ummz.
umich.edu/site/index.html). L’infra-ordre des Catarrhini est en rouge, et l’infra-ordre des
Platyrrhini en rose.
En revanche, le chromosome Y n’est séquencé que chez l’homme et le chimpanzé. Le
gène PRKY du gorille est présent sous forme d’ADNc, et celui du macaque a été identifié
dans des BACs dont la séquence est disponible. Cependant, il est à noter que les
séquences des banques de données, que ce soit pour le X ou le Y, sont souvent
5
incomplètes (présence de N), et ne sont pas toujours annotées. Ceci crée une difficulté
pour récupérer les séquences du gène voulu. C’est notamment le cas des séquences de
l’Otolemur et du microcèbe, où un Blast n’a pas permis de récupérer la séquence de
PRKX, du fait de la trop grande divergence avec la séquence utilisée pour le blast.
Méthode
Amplification des séquences de PRKX/Y chez différentes espèces de primates :
Les séquences ont été récupérées dans les banques de données (ensembl, NCBI) soit par
recherche dans les génomes annotés, soit en ayant recours à un Blast en utilisant l’espèce
la plus proche possible de la séquence désirée. Des amorces hétérologues ont été
dessinées dans les régions introniques les plus conservées entre espèces et à proximité des
exons. Ces amorces, d’environ 20 paires de bases, présentent une composition en CG
d’environ 40 à 60%, et ne doivent pas former ni boucles ni dimères. Elles ont été
dessinées dans le but d’être spécifiques du X, du Y, ou d’être capable d’amplifier les
deux, en se basant sur les séquences connues. Néanmoins, une amorce dessinée pour être
spécifique-X ne le sera pas forcément chez une espèce éloignée et cela est d’autant plus
vrai pour les amorces destinées à être spécifiques-Y, étant donné que le Y présente une
forte variabilité inter-espèce. Etant donné l’incertitude de la spécificité des amorces, il
s’avère très difficile de savoir a priori si les séquences obtenues sont du X ou du Y. Afin
d’être sure de la nature des séquences obtenues, des femelles étaient utilisées autant que
possible pour l’obtention de séquences X. Au total, 29 amorces ont été testées pour les
exons 1, 2 et 3 ; 6 amorces supplémentaires ont été redessinées lors de l’arrivée de
Callitrix dans les banques de données. Les PCR ont été réalisées avec un mix : Green
GoTaq ™ buffer (Promega) 1X, dNTP à 0.1 mM, amorces à 0.5 uM chacune, 1 unité de
Taq Promega, 25 ng d’ADN et eau à qsp 25 ul. Elles ont été mises au point pour chaque
espèce, en jouant sur la spécificité des amorces et en modifiant la température ou le temps
d’hybridation du programme. Nous avons également utilisé des programmes en touch-
down, où la température d’hybridation descend du nombre de degrés voulu à chaque
cycle, pendant un nombre de cycles choisi, permettant plus de spécificité des amorces.
Parfois, du fait d’une amplification aspécifique, la bande recherchée a été découpée sur
gel d’agarose (kit d’extraction sur gel Gene Jet™ Fermentas). Quand les produits de PCR
contenaient plusieurs amplifiats non séparables par découpage sur gel, nous avons
procédé à du clonage. Les ligations sont effectuées dans un vecteur pGemT-easy Promega
6
24h à 4 °C, ou 1h à température ambiante. Des bactéries JM109 sont transformées par
choc thermique avec 2 ul de ligation. Des PCR sont réalisées directement sur les colonies
bactériennes avec les amorces M13F et M13R, qui s’hybrident sur le vecteur. Les
produits ont ensuite été séquencés, soit au laboratoire EDB, soit par l’entreprise Millegen.
Afin d’être sûr de nos séquences, les PCR ont si possible été réalisées sur 2 individus ou 2
PCR indépendantes sur le même échantillon, et le séquençage a été réalisé en sens et anti-
sens.
Analyses des séquences, reconstructions phylogénétiques, tests de sélection :
Les séquences obtenues après séquençage ont été nettoyées manuellement avec le logiciel
SequenceScanner et des séquences consensus ont été réalisées sur chaque espèce en
comparant ces séquences obtenues à celles des banques. Puis elles ont été alignées avec
BioEdit (Hall 1999). Les régions ambiguës, ou ne pouvant répondre de manière fiable à
l’hypothèse d’homologie, ont été éliminées de l’alignement. Le modèle d’évolution
correspondant le mieux au jeu de données a été recherché grâce au logiciel Modeltest
(Posada & Crandall 1998) et sélectionné suivant le critère d’Akaike (AIC), puis a été
utilisé pour la reconstruction phylogénétique. Celle-ci a été conduite selon la méthode de
maximum de Vraisemblance en utilisant le logiciel PhyML (Guindon & Gascuel 2003), et
la robustesse des nœuds a été évaluée par une analyse de bootstrap utilisant 100 réplicats.
Le taxon des Platyrrhini a servi de groupe externe pour enraciner l’arbre, les Catarrhini
représentant la majeure partie de notre jeu de données.
Une première analyse, à la fois nucléotidique et protéique a été réalisée avec BioEdit et
Mega : recherche de codons stops, calcul de divergence entre les séquences, recherche de
motifs dans les séquences. Le logiciel DnaSP (Rozas et al. 2003), a permis de calculer le
taux estimé de substitutions synonymes (Ks ; modèle de Jukes et Cantor à 1 paramètre),
c’est-à-dire le nombre de changements de nucléotides n’affectant pas la séquence en
acides aminés, et le taux estimé de substitutions non-synonymes (Ka), soit le nombre de
changement de nucléotide affectant la séquence en acides aminés, de nos séquences X
prises deux à deux, et de nos séquences Y prises deux à deux. Ceci a permis de calculer le
rapport Ka/Ks des séquences prises deux à deux. Un Ka/Ks ~1 indique une absence de
sélection sur la séquence, donc une évolution neutre. Un ka/Ks <1 indique que la
séquence est sous sélection purificatrice. Un Ka/Ks >1 indique que la séquence est sous
sélection positive.
7
Résultats
Les 3 premiers exons des gènes ont été testés. Le premier exon, après 18 PCR mettant en
jeu 5 couples d’amorces, ne donnant aucun résultat, et n’étant pas totalement traduit, a été
abandonné. Nous avons testé l’amplification des exons 2 et 3 sur un certain nombre de
Platyrrhini, de Catarrhini et de Strepsirrhini. Sur 318 PCR et 10 clonages réalisés, 46
séquences exploitables ont été obtenues (Tableau II). Certaines séquences ont permis de
vérifier celles présentes dans les banques, les autres ont permis d’apporter des données
nouvelles.
Tableau II : Espèces testées. Une croix verte indique que la séquence est présente dans les
banques de données. Une croix rouge indique que nous avons obtenu la séquence.
Sous-Ordre Famille Sous-Famille Genre
Exon
2 X
Exon
3 X
exon
2 Y
exon
3 Y
Platyrrhini Cebidae Callithricinae Saguinus + +
Callithrix ++ +
Cebinae Cebus +
Saimirinae Saimiri
Atelidae Atelinae Ateles +
Pithecidae Pithecinae Pithecia +
Catarrhini Cercopithecidae Cercopithecinae Allenopithecus +
Cercopithecus + + +
Chlorocebus +
Erythrocebus +
Macaca ++ ++ + +
Mandrillus + +
Papio + ++
Colobinae Colobus +
Hylobatidae Hylobatinae Hylobates + +
Nomascus + + +
Hominidae Hominidae Pongo ++ ++
Gorilla ++ ++ + ++
Pan + + + +
Homo + ++ + +
Strepsirrhini Lemuridae Lemuridae Eulemur
Indriidae Indriidae Propithecus
Analyse des séquences et détection de la signature de sélection :
• Séquences PRKX
Les séquences des exons de PRKX présentent un polymorphisme de substitution inter-
spécifique, mais aucun polymorphisme de délétion ou d’insertion, phénomène de
mutation plus rare au niveau du génome. L’exon 2, est conservé dans l’infra-ordre des
Platyrrhini et des Catarrhini, puisqu’il n’existe aucune substitution non-synonyme fixée à
l’intérieur de ces infra-ordres, alors qu’il existe une mutation non-synonyme entre ces
deux groupes (Tableau III). Ainsi, aucune substitution non-synonyme entre ces séquences
n’est apparue depuis la divergence des Platyrrhini et des Catarrhini dans l’exon 2 (i.e.
8
33.7 Ma, Fabre et al, 2009). Pour l’exon 3 des Catarrhini, on observe une mutation non-
synonyme dans la séquence du chimpanzé, et trois dans la séquence du Chlorocebus. De
plus, la séquence du Chlorocebus, dont on est sûr que c’est une séquence X puisque
l’individu amplifié était une femelle, possède un codon stop.
Tableau III : Valeurs moyennes de Ka, de Ks, et de Ka/Ks pour les différents groupes de primates,
obtenues grâce au logiciel DnaSP.
Exon 2 Exon 3
Catarrhini Ka 0 0.03
Ks 0.15 0.11
Ka/Ks 0 0.03
Platyrrhini Ka 0 0.01
Ks 0.06 0.04
Ka/Ks 0 0.27
Catarrhini + Platyrrhini Ka 0.002 0.005
Ks 0.17 0.14
Ka/Ks 0.011 0.05
Les exons 2 et 3 se situent dans la partie catalytique de PRKX (Li et al. 2002).
Néanmoins aucune substitution non-synonyme, que ce soit pour l’exon 2 ou pour l’exon
3, ne concerne les résidus critiques de la fonction kinase.
Toutes les valeurs de Ka/Ks sont très inférieures à 1 (Tableau III), c’est-à-dire qu’il y a
plus de substitutions synonymes que de non-synonymes. Ainsi ces deux exons du gène
PRKX n’évoluent pas sous neutralité, mais sont soumis à une sélection purificatrice.
L’intron adjacent en 5’ à l’exon 3 possède deux motifs répétés de manière assez
complexe. Ces motifs sont présents sur toutes les séquences, que ce soient sur les X ou les
Y mais le nombre de répétitions pour chaque motif n’est pas le même entre les espèces ni
entre les X et les Y. On observe du polymorphisme de substitution entre les différentes
répétitions d’un motif, et ces motifs se trouvent parfois répétés en tandem.
• Séquences PRKY
Les séquences des exons des gènes PRKY présentent un polymorphisme de substitution
inter-spécifique et aucun polymorphisme d’insertion ou de délétion. Les zones introniques
présentent de grandes séquences d’insertions spécifiques.
Chez PRKY de Nomascus une substitution non-synonyme se trouve dans le domaine Mg-
ATP-binding (exon 2) et une autre dans un résidu critique pour l’activité kinase (exon 2).
La séquence Y du chimpanzé possède une mutation non-synonyme dans la boucle
catalytique (exon 3). Ainsi, des mutations non-synonymes sont présentes dans des résidus
9
critiques de la protéine, à la différence des séquences X, où ces substitutions ne se
trouvent pas dans de tels résidus.
Les valeurs de Ka/Ks sont toutes très inférieures à 1 (ne dépassant pas 0,26), même avec
la séquence de l’exon 2 de Nomascus, qui a une divergence telle que nous l’avons retiré
de l’échantillonnage dans certaines analyses. On détecte donc pour toutes les séquences Y
une signature de sélection purificatrice.
• Séquences PRKX vs séquences PRKY
Chez les Catarrhini, le taux estimé de substitutions non-synonymes est plus important
entre les séquences orthologues du gène PRKY, qu’entre les séquences orthologues du
gène PRKX (Tableau IV), ainsi les séquences de PRKY sont plus divergentes entre elles,
que les séquences de PRKX entre elles. La divergence entre les séquences X/Y est moins
importante pour l’exon 2 que pour l’exon 3, et se trouve plus marquée dans les séquences
introniques. (Tableau V)
Tableau IV : valeurs moyennes de Ka, de Ks, de Ka/Ks (données obtenues avec DnaSP) et de
pourcentages de divergence entre les séquences (méthode de p-distance réalisée avec le logiciel
Mega). Seules les séquences X dont nous possédons l’homologue Y ont été utilisées. (exon 2 :
X/Y de l’homme, du gorille, du chimpanzé et du macaque, pour l’exon 3 : X/Y de l’homme, du
gorille, du chimpanzé, du macaque, du cercopithèque et du mandrill). Le gibbon Nomascus a été
retiré de l’analyse car il est très divergent.
X2 Y2 X3 Y3
Ka moyen 0 0.0039 0.0017 0.017
Ks moyen 0.137 0.059 0.096 0.113
Ka/Ks moyen 0 0.011 0.018 0.176
% de divergence les,séquences 2.7 % 1.5 % 2 % 3.4 %
Tableau V : distances calculées à partir de matrices de distances d’acides nucléiques via le logiciel
BioEdit. Les calculs des colonnes « a » sont réalisées sur les mêmes séquences que celles utilisées
pour la phylogénie, c'est-à-dire les exons plus des séquences introniques. Les calculs des colonnes
« b » sont réalisés avec les séquences exoniques uniquement. ND : données non disponibles
exon 2 a exon 3 a exon 2 b exon 3 b
Homo X/Y 2.8 % 6,4 % 2.41 % 4.67 %
Gorilla X/Y 0,26 % 3.7 % 0 % 2.69 %
Pan X/Y 2.13 % 6,46 % 1.19 % 3.10 %
Nomascus X/Y 17 % ND 16 % ND
Macaca X/Y 0.78 % 4,19 % 0 % 1.53 %
Cercopithecus X/Y ND 1.86 % ND 0 %
Mandrillus X/Y ND 3.46 % ND 0.4 %
Homo X / Callitrix X 11.7 % 13 % 7 % 4.29 %
Approche phylogénétique
Afin de retracer l’histoire évolutive des gènes PRKX et PRKY, les séquences obtenues
des exons 2 et 3, ainsi que des régions introniques adjacentes ont été utilisées. Le modèle
d’évolution sélectionné grâce au logiciel ModelTest, pour nos deux jeux de données est le
10
modèle GTR+G (yang 1994a), soit un modèle où il est autorisé un taux différent pour les
six types de substitutions, avec une distribution gamma donnée, et admettant des
fréquences propres à chaque nucléotide.
Nomascus Y
Figure 3 : arbre phylogénétique réalisé à partir de l’alignement des séquences de l’exon 2 et des
régions introniques adjacentes. Sur 807 sites, 30 sites sont informatifs. Seules les valeurs de
bootstrap au dessus de 50 (c’est-à-dire jugées assez robustes) sont indiquées.
• Exon 2
La topologie de l’arbre phylogénétique reconstruit à partir des séquences de l’exon 2 (169
pb) et des régions introniques adjacentes (314 pb de l’intron 1 et 324 pb de l’intron 2), est
congruente avec la phylogénie connue des primates (Figure 3).
Dans cet arbre, les Homonidae et les Cercopithecidae apparaissent monophylétiques,
incluant les X et les Y. Par contre, dans chacun de ces clades, les séquences X et Y ne
sont pas séparées, ce qui montre que la divergence X/Y n’est pas assez importante pour
que la reconstruction de l’arbre ait permis de les séparer. Seule la séquence Y de
Nomascus est très divergente par rapport aux autres, ce qui était déjà clairement visible
sur l’alignement. A tel point que la position de la branche dans l’arbre, à la base des
Catarrhini, est certainement dû à un phénomène d’attraction de longue branche (artéfact
lors de la reconstruction de l’arbre, où une branche longue est placée au mauvais endroit
dans le but de minimiser sa longueur).
0.1
Pongo X
Homo Y
Pan Y
Pan X
76
70
Homo X
Gorilla Y
Gorilla X
83
73
71
Nomascus X
Hylobates X
85
91
Mandrillus X
Cercopithecus X
Macaca mulatta Y
Papio papio X
Macaca mulatta X
50
50
86
81
100
Callitrix X
Hominidae
Catarrhini
Hylobatidae
Cercopithecidae
PlatyrrhiniSaguinus X
11
Il est intéressant de noter que le taux de divergence entre le X et le Y de Nomascus est
plus important que celui entre l’exon X de l’homme et celui du plus éloigné des
Platyrrhini, Callitrix (Tableau V). Cela souligne à quel point la divergence entre X et Y
peut être importante, et explique pourquoi il est difficile de les amplifier.
• Exon 3
Sur l’arbre obtenu à partir des séquences de l’exon 3 (264 pb) et de fragments d’introns
adjacents (458 pb de l’intron 2 et de 81 pb de l’intron 3), on retrouve également la
phylogénie des primates, au niveau des familles (Figure 4). L’homme est ici plus proche
du gorille que du chimpanzé. Ceci est assez fréquent dans le génome. En effet, si
l’ensemble du génome de l’homme est plus proche du chimpanzé que du gorille, ce n’est
pas vrai pour tous les gènes.
Figure 4 : arbre phylogénétique réalisé à partir de l’alignement des séquences de l’exon 3 et
d’introns adjacents. Sur les 803 sites, 41 sont informatifs. Seules les valeurs de bootstrap
supérieures à 50 sont indiquées.
Dans cet arbre, les séquences de PRKX et de PRKY sont bien séparées. Seule la séquence
X de Chlorocebus est placée au milieu des séquences Y des autres Cercopithecidae. La
divergence XY, d’après cet arbre, a eu lieu après la séparation des Hominidae et
12
Cercopithecidae, et avant la divergence au sein de ces deux familles, soit entre 17 et 26
Ma.
La séquence de PRKY de l’orang-outan ne se trouve pas à sa place biologique (malgré
une faible valeur de robustesse) dans cette phylogénie. Or, elle possède une insertion
spécifique, qui provient de la répétition d’un motif TGCCC dans sa partie intronique.
Lorsque l’arbre est reconstruit en éliminant les séquences introniques (non montré), la
séquence X de l’orang-outan est placée au sein de Homonidae. Par contre, dans ce nouvel
arbre, les X et les Y ne sont plus séparés, ce qui montre que c’est essentiellement la partie
intronique qui permet de différencier les X des Y pour l’exon 3 (tableau V).
Discussion
Cette étude sur l’histoire évolutive des chromosomes sexuels et la dégénérescence du
chromosome Y au cours de l’évolution nécessite la comparaison d’un grand nombre de
séquences, aussi bien sur le chromosome X que Y. Néanmoins, l’absence de telles
données dans les banques, notamment au niveau des séquences Y, constitue une entrave à
cette étude. Plusieurs problèmes se sont posés lors de l’obtention des séquences :
l’utilisation d’amorces hétérologues et leur rendement faible, et l’incertitude à propos de
la nature X ou Y des séquences obtenues. Cette incertitude vient de l’utilisation de ces
amorces et surtout de la divergence faible entre les copies X et Y. Les décisions prises
lors de la réalisation de l’alignement (notamment lors de l’existence de motifs répétés)
peuvent être une source d’erreur dans la reconstruction phylogénétique puisque les
hypothèses d’homologie formulées peuvent être erronées. De plus, afin d’obtenir des
séquences fiables, chaque séquence consensus utilisée pour les analyses doit être réalisée
à partir de séquences obtenues chez plusieurs individus, et idéalement, chaque séquence
devrait être obtenue plusieurs fois pour chaque individu, grâce à des PCR indépendantes.
Ceci est d’autant plus vrai pour les séquences obtenues par clonage, dont on sait qu’il
peut introduire des mutations lors des réplications dans la bactérie. La durée du stage,
ainsi que la limitation en ADN du laboratoire ne nous a pas toujours permis de confirmer
nos séquences.
Histoire évolutive des gènes PRKX et PRKY
Toutes les espèces chez qui on a réussi à amplifier, soit le gène PRKX, soit PRKY,
possèdent respectivement ces gènes. On peut les supposer fonctionnels dans la mesure où
aucun codon stop n’est présent dans les exons amplifiés, à l’exception de la séquence de
13
l’exon 2 de PRKX de Chlorocebus tantalus. Celui-ci possède un codon stop, ce qui
pourrait être du à l’amplification d’une copie non fonctionnelle du gène PRKX chez cette
espèce (pseudogène) sur lequel les amorces se seraient hybridées préférentiellement
plutôt que sur la copie fonctionnelle. Des substitutions non-synonymes ont été identifiées
sur la séquence Y de l’exon 2 du gibbon Nomascus, notamment au niveau des résidus
critiques du site catalytique, ce qui pourrait affecter la fonctionnalité de la protéine
PRKY. Ces deux séquences pourraient donc appartenir à un gène PRK non fonctionnel,
et il serait intéressant de le vérifier (après avoir valider les séquences obtenues), d’autant
qu’un pseudogène de PRKX a été identifié chez l’homme sur le chromosome 15
(Schiebel et al. 1997). Le fait que ces gènes soient présents ne nous assurent pas qu’ils
soient localisés sur les chromosomes sexuels, et non ailleurs dans le génome. Afin de
s’assurer de leur position, mais aussi de vérifier s’il n’existe pas des copies de ces gènes
ailleurs dans le génome chez les différentes espèces, il faudrait réaliser des expériences
d’hybridation fluorescente in situ. Ceci a déjà été réalisé chez certains grands singes, où la
position de PRKX/Y sur les chromosomes sexuels a bien été vérifiée (Glaser et al 1997).
PRKX et PRKY : des gènes conservés ?
L’absence de mutations non-synonymes dans les résidus fonctionnels de PRKX suggère
une forte conservation des séquences X, notamment au niveau de l’exon 2 où aucune
substitution non-synonyme n’a eu lieu depuis 33,7 Ma. La divergence des copies X/Y
semble essentiellement liée aux différences dans les régions introniques, ce qui montre
que la séquence des exons de PRKY est assez proche de PRKX. Ceci va dans le sens
d’une conservation du gène PRKY.
Le fait que ces deux exons se situent dans le domaine catalytique de la protéine est
certainement la raison de leur forte conservation. Il n’est donc pas étonnant de détecter de
la sélection purificatrice dans la séquence X de ce gène chez toutes les espèces étudiées.
Si les séquences Y sont bien codantes pour une protéine fonctionnelle, il n’est pas non
plus étonnant d’y détecter une telle sélection, et le fait que les séquences Y soient
également sous cette sélection va dans le sens de leur fonctionnalité. Cette conservation
des séquences des copies X comme Y peut être le résultat de la sélection purificatrice,
mais on ne peut pas exclure qu’elle soit le résultat d’un autre mécanisme moléculaire qui
peut homogénéiser les séquences X et Y : la conversion génique. Celle-ci a été mise en
évidence comme un phénomène important agissant sur les gènes en palindromes sur le
14
chromosome Y (Rozen et al 2003) mais aussi entre certains gènes X et Y (Pamilo &
Bianchi, 1993), dont récemment à proximité de PRKX et PRKY (Rosser et al., 2009). Il
serait intéressant d’étudier un exon ne se trouvant pas dans le domaine catalytique, ainsi
que l’exon 9 qui n’est pas traduit, ou l’exon 1 qui n’est que partiellement traduit. Cette
étude nous permettrait de savoir si ces exons sont aussi conservés et si ils se trouvent
également sous une sélection purificatrice.
PRKX/Y : région instable du génome ?
Les motifs répétés présents en amont de l’exon 3, le nombre de répétitions, et la
complexité dans la manière dont ils sont répétés, sont fortement révélateurs d’une zone
d’instabilité génétique. Cela va dans le sens du fort taux de recombinaison observé entre
les gènes PRKX et Y (Schiebel et al 1997) et du fait que les gènes PRKX/Y soient situées
dans un hotspot de translocation, siège de conversion génique (Rosser et al 2009). La
présence d’un polymorphisme de substitution entre ces motifs répétés signifie que les
évènements à l’origine de leurs duplications sont assez anciens. L’instabilité au niveau de
l’intron 2 a pu être une raison supplémentaire à la difficulté d’hybridation des amorces,
lors des étapes d’amplification. Néanmoins, ces répétitions pourront, lorsque plus de
données auront été obtenues, présenter une région d’étude intéressante, car la présence de
motifs répétés dans une séquence est très informative pour suivre son histoire évolutive.
Le gène PRKY, témoin d’un début de dégénérescence de la quatrième strate ?
PRKY se trouve dans la quatrième de strate de divergence du chromosome Y, c’est à dire
dans la région où l’arrêt de la recombinaison homologue est le plus récent (Skaletsky et
al. 2003). Nos arbres phylogénétiques indiquent qu’il y a bien divergence entre les
séquences de PRKX et de PRKY pour le fragment incluant l’exon 3 chez les grands
singes et chez les Cercopithecidae, même si cette divergence semble moins prononcée à
partir des données de l’exon 2. Cette divergence entre PRKX/Y peut être datée entre 17 et
26 Ma. Cette date est cohérente avec la date d’arrêt de la recombinaison indiquée pour
cette strate, soit entre 23 et 43 Ma (Lahn and Page 1999). D’après le contexte connu de
l’évolution des chromosomes sexuels, un arrêt de la recombinaison entre X et Y est
supposé entrainer une divergence du contenu génétique et la dégénérescence du
chromosome Y (Charlesworth 2000). On s’attend donc à retrouver les effets de cette
dégénérescence du chromosome Y sur le gène PRKY. Or, les exons 2 et 3 de PRKY sont
soumis à une sélection purificatrice, qui conserve la séquence de PRKY. Pourtant, le taux
15
de substitutions non-synonymes est plus important entre les séquences orthologues Y,
qu’entre les séquences X. De plus, sur les 7 espèces pour lesquelles nous possédons une
séquence de la copie Y, deux présentent des substitutions non-synonymes dans des
résidus critiques de la protéine (le gibbon Nomascus et le chimpanzé). Chez l’Homme, la
protéine PRKY est plus courte que la copie PRKX (277 aa versus 364 aa). Toutes ces
données laissent penser que, malgré la sélection purificatrice qui agit sur le gène, PRKY
subit un début d’accumulation de mutations faiblement délétères, qui pourrait être la
marque d’un début de dégénérescence du chromosome Y dans la région de PRKY, et de
manière plus générale de la strate 4. D’ailleurs, dans cette strate, 9 gènes sur 14 ne sont
plus fonctionnels (Skaletsky et al. 2003).
Conclusion et perspectives
Nous avons donc généré un certain nombre de séquences, qui n’étaient pas disponibles
dans les banques de données, et qui nous ont permis de réaliser une étude préliminaire des
gènes PRKX/Y à travers l’ordre des primates. Nous avons mis en évidence une sélection
purificatrice très forte, sur la totalité des séquences, X comme Y. Néanmoins, malgré
cette sélection, le gène PRKY comporte plus de mutations non-synonymes que le X, ce
qui pourrait être le témoin d’un début de dégénérescence de la 4ème
strate.
Cette étude devra être continuée, en générant plus de séquences, afin d’obtenir des
séquences plus fiables et de nouvelles données permettant d’aller plus loin dans l’analyse,
à plusieurs échelles. A une échelle inter-exons, il sera intéressant d’obtenir les séquences
de tous les exons pour y comparer les forces qui y agissent. Les gènes PRKX/Y nous ont
pour l’instant montré l’image de gènes conservés chez la plupart des espèces étudiée, ce
qui nous ramène à la question de l’importance de ce gène, et du pourquoi celui-ci n’a pas
dégénéré contrairement aux centaines de pseudogènes présents sur le chromosome Y. A
une échelle inter-espèces, obtenir ces séquences chez de nombreuses espèces de primates
permettra de savoir si le gène PRKY a résisté à la dégénérescence chez toutes les espèces,
si la protéine y est fonctionnelle et s’il s’y trouve toujours sous la même pression de
sélection. Finalement, une étude comparant les gènes PRKX/Y à d’autres gènes de la
même strate, ou même du reste du chromosome, permettrait d’avoir une idée de
l’évolution globale de celui-ci.
16
Bibliographie
J.A Marshall Graves (2008). Weird Animal Genomes and the Evolution of Vertebrate Sex and Sex
Chromosomes. Annu. Rev. Genet. 42:565-586.
J.A Marshall Graves (2006). Sex Chromosome Specialization and Degeneration in Mammals. Cell
124 : 901-914.
B.T. Lahn and D.C. Page (1999). Four Evolutionary Strata on the Human X Chromosome. Science
286 : 964-967.
F. Veyrunes, P.D. Waters, P. Miethke, W. Rens, D. McMillan, A.E. Alsop, F. Grützner, J.E.
Deakin, C.M. Whittington, K. Schatzkamer, C.L. Kremitzki, T. Graves, M.A. Ferguson-Smith,
W.Warren, and J.A. Marshall Graves1 (2008). Bird-like sex chromosomes of platypus imply recent
origin of mammal sex chromosomes. Genome Res. 18(6): 965–973.
M.T. Ross, D.V. Grafham et al. (2005). The DNA sequence of the human X chromosome. Nature
434 : 325-337.
B.Charlesworth and D. Charlesworth (2000). The degeneration of Y chromosomes. Phil. Trans. R.
Soc. Lond. B 355 : 1563-1572.
L.R. Pearce, D.Komander and D.Alessi (2010). The nuts and bolts of AGC protein kinases.
Molecular cell Biology 11 : 9-22.
X. li, H. Li, K. Amsler, D. Hyink, P.D. Wilson and C.R. Burrow (2002). PRKX, a phylogenetically
and functionally distinct cAMP-dependant protein kinase, activates renal epithelial cell migration
and morphogenesis. PNAS. 99 : 9260-9265.
D. Semizarov, D. Glesne, A. Laouar, K. Schiebel and E. Huberman (1998). A lineage-specific
protein kinase crucial for myeloid maturation. Cell Biology, 95 : 15412-15417.
H. Skaletsky, T. Kudora-Kawaguchi et al. (2003). The male-specific region of the human Y
chromosome is a mosaic of discrete sequence classes. Nature 423 : 825-837
K. Schiebel, M. Winkelmann, A. Mertz, X. Xu, D.C. Page, D. Weil, C. Petit and G.A. Rappold
(1997). Abnormal XY interchange between a novel isolated protein kinase gene, PRKY, and its
homologue, PRKX, accounts for one third of all (Y+)XX males and (Y-)XY females. Human
Molecular Genetics 6 : 1985-1989.
Z.H. Rosser, P. Balaresque and M.A. Jobling (2009). Gene Conversion between the X
Chromosome and the Male-Specific Region of the Y Chromosome at a Translocation Hotspot. The
American journal of Human Genetics 85 : 130-134.
P.H. Fabre, A. Rodrigues, E.J.P Douzery (2009). Patterns of macroevolution among Primates
inferred from a supermatrix of mitochondrial and nuclear DNA. Molecular Phylogenetics and
Evolution 53 : 808-825.
T.A. Hall (1999). BioEdit: a user-friendly biological sequence alignment editor and analysis
program for Windows 95/98/NT. Nucleic Acids Symposium Series No. 41: 95-98.
D. Posada, and K. A. Crandall, 1998 MODELTEST: testing the model of DNA substitution.
Bioinformatics 14: 817-818.
S. Guindon, and O. Gascuel (2003). A simple, fast, and accurate algorithm to estimate large
phylogenies by maximum likelihood. Syst Biol 52: 696-704.
J. Rozas, J. C. Sanchez-Delbarrio, X. Messeguer and R. Rozas (2003) DnaSP, DNA polymorphism
analyses by the coalescent and other methods. Bioinformatics 19: 2496-2497.
B. Gläser, F. Grützner, K. Taylor, K. Schiebel, G. Meroni, K. Tsioupra, J. Pasantes, W. Rietschel,
R. Toder, U. Willmann, S. Zeitler, P. Yen, A. Ballabio, G. Rappold and W. Schempp (1997).
Comparative mapping of Xp22 genes in hominoids – evolutionary linear instability of their Y
homologues. Chromosome Research 5 : 167-176.
S. Rozen, H. Skaletsky, J.D. Marszalek, P.J. Minx, H.S. Cordum, R.H. Waterston, R.K. Wilson
and D.C. Page (2003). Abundant gene conversion between arms of palindromes in human and ape
Y chromosomes. Nature 423 : 873 -876.
P. Pamilo and N.O. Bianchi (1993). Evolution of the Zfx and Zfy Genes : Rates and
Interdependance between the Genes. Mol. Biol. Evol. 10 : 271-281.
17

Contenu connexe

Tendances

Diagnostic antenatal et foetal 2ème version
Diagnostic antenatal et foetal 2ème versionDiagnostic antenatal et foetal 2ème version
Diagnostic antenatal et foetal 2ème versionesf3
 
Ano Chro De Nombre étudiants
Ano Chro De Nombre étudiantsAno Chro De Nombre étudiants
Ano Chro De Nombre étudiantsguestd0be2
 
Série d'exercices: génétique formelle - 4 Sc.Exp
Série d'exercices: génétique formelle - 4 Sc.ExpSérie d'exercices: génétique formelle - 4 Sc.Exp
Série d'exercices: génétique formelle - 4 Sc.ExpAbdelghani Akremi
 
Où se cachent nos gènes ?
Où se cachent nos gènes ?Où se cachent nos gènes ?
Où se cachent nos gènes ?sciencesalannoy
 
Hulot et al lapine morphometrie
Hulot et al  lapine morphometrieHulot et al  lapine morphometrie
Hulot et al lapine morphometrieHafidh Sebaa
 
La Théorie de l'évolution
La Théorie de l'évolutionLa Théorie de l'évolution
La Théorie de l'évolutionLuis Galárraga
 
Mendel et les débuts de la génétique
Mendel et les débuts de la génétiqueMendel et les débuts de la génétique
Mendel et les débuts de la génétiqueSIFFRAY DANIEL
 
4ºeso chapitre 2
4ºeso chapitre 24ºeso chapitre 2
4ºeso chapitre 2imarcascar
 
Nicolas Rode - Coévolutions mâle-femelle dans la nature : Mise en évidence pa...
Nicolas Rode - Coévolutions mâle-femelle dans la nature : Mise en évidence pa...Nicolas Rode - Coévolutions mâle-femelle dans la nature : Mise en évidence pa...
Nicolas Rode - Coévolutions mâle-femelle dans la nature : Mise en évidence pa...Seminaire MEE
 
Iup etu pathol_avort4e_os
Iup etu pathol_avort4e_osIup etu pathol_avort4e_os
Iup etu pathol_avort4e_osmai13
 

Tendances (20)

Diagnostic antenatal et foetal 2ème version
Diagnostic antenatal et foetal 2ème versionDiagnostic antenatal et foetal 2ème version
Diagnostic antenatal et foetal 2ème version
 
Ano Chro De Nombre étudiants
Ano Chro De Nombre étudiantsAno Chro De Nombre étudiants
Ano Chro De Nombre étudiants
 
4ºeso tema5 l'évolution des êtres vivants
4ºeso tema5 l'évolution des êtres vivants4ºeso tema5 l'évolution des êtres vivants
4ºeso tema5 l'évolution des êtres vivants
 
Série d'exercices: génétique formelle - 4 Sc.Exp
Série d'exercices: génétique formelle - 4 Sc.ExpSérie d'exercices: génétique formelle - 4 Sc.Exp
Série d'exercices: génétique formelle - 4 Sc.Exp
 
4ºeso chapitre 3 Les lois de Mendel
4ºeso chapitre 3 Les lois de Mendel 4ºeso chapitre 3 Les lois de Mendel
4ºeso chapitre 3 Les lois de Mendel
 
Présentation1
Présentation1Présentation1
Présentation1
 
CMC chapitre 5 réduit
CMC chapitre 5 réduitCMC chapitre 5 réduit
CMC chapitre 5 réduit
 
Où se cachent nos gènes ?
Où se cachent nos gènes ?Où se cachent nos gènes ?
Où se cachent nos gènes ?
 
CMC Chapitre 5 des greffes aux cellules souches
CMC Chapitre 5 des greffes aux cellules souchesCMC Chapitre 5 des greffes aux cellules souches
CMC Chapitre 5 des greffes aux cellules souches
 
Hulot et al lapine morphometrie
Hulot et al  lapine morphometrieHulot et al  lapine morphometrie
Hulot et al lapine morphometrie
 
CMC Chapitre 2 L'évolution
CMC Chapitre 2 L'évolutionCMC Chapitre 2 L'évolution
CMC Chapitre 2 L'évolution
 
La Théorie de l'évolution
La Théorie de l'évolutionLa Théorie de l'évolution
La Théorie de l'évolution
 
4ºeso chapitre 2 Reproduction et héredité. IBI
4ºeso chapitre 2 Reproduction et héredité. IBI4ºeso chapitre 2 Reproduction et héredité. IBI
4ºeso chapitre 2 Reproduction et héredité. IBI
 
La génétique
La génétiqueLa génétique
La génétique
 
Thème 2
Thème 2Thème 2
Thème 2
 
Mendel et les débuts de la génétique
Mendel et les débuts de la génétiqueMendel et les débuts de la génétique
Mendel et les débuts de la génétique
 
4ºeso Chapitre 2 L'héritage
4ºeso Chapitre 2 L'héritage4ºeso Chapitre 2 L'héritage
4ºeso Chapitre 2 L'héritage
 
4ºeso chapitre 2
4ºeso chapitre 24ºeso chapitre 2
4ºeso chapitre 2
 
Nicolas Rode - Coévolutions mâle-femelle dans la nature : Mise en évidence pa...
Nicolas Rode - Coévolutions mâle-femelle dans la nature : Mise en évidence pa...Nicolas Rode - Coévolutions mâle-femelle dans la nature : Mise en évidence pa...
Nicolas Rode - Coévolutions mâle-femelle dans la nature : Mise en évidence pa...
 
Iup etu pathol_avort4e_os
Iup etu pathol_avort4e_osIup etu pathol_avort4e_os
Iup etu pathol_avort4e_os
 

Similaire à Rapport de stage prk grezy aude (1)

LA MEIOSE/ UNIVERSITE DE GOMA
LA MEIOSE/ UNIVERSITE DE GOMALA MEIOSE/ UNIVERSITE DE GOMA
LA MEIOSE/ UNIVERSITE DE GOMAJustinJosue1
 
chromosome et chromatine
chromosome et chromatine chromosome et chromatine
chromosome et chromatine ARICHI Bouchra
 
Virginie Rougeron - Sexuality and clonality in Leishmania
Virginie Rougeron - Sexuality and clonality in LeishmaniaVirginie Rougeron - Sexuality and clonality in Leishmania
Virginie Rougeron - Sexuality and clonality in LeishmaniaSeminaire MEE
 
Hérédité
HéréditéHérédité
Héréditécorpin0172
 
M krahn organisation_genome_et_analyses_genomiques_2009
M krahn organisation_genome_et_analyses_genomiques_2009M krahn organisation_genome_et_analyses_genomiques_2009
M krahn organisation_genome_et_analyses_genomiques_2009Elsa von Licy
 
appareil genetal mal
appareil genetal malappareil genetal mal
appareil genetal malnoraeah med
 
Synthèse Examen De Noel Biologie
Synthèse Examen De Noel BiologieSynthèse Examen De Noel Biologie
Synthèse Examen De Noel BiologieGiouchki
 

Similaire à Rapport de stage prk grezy aude (1) (12)

LA MEIOSE/ UNIVERSITE DE GOMA
LA MEIOSE/ UNIVERSITE DE GOMALA MEIOSE/ UNIVERSITE DE GOMA
LA MEIOSE/ UNIVERSITE DE GOMA
 
chromosome et chromatine
chromosome et chromatine chromosome et chromatine
chromosome et chromatine
 
4ºeso chap3 mendel
4ºeso chap3 mendel4ºeso chap3 mendel
4ºeso chap3 mendel
 
Virginie Rougeron - Sexuality and clonality in Leishmania
Virginie Rougeron - Sexuality and clonality in LeishmaniaVirginie Rougeron - Sexuality and clonality in Leishmania
Virginie Rougeron - Sexuality and clonality in Leishmania
 
4ºeso Chapitre 3 Les lois de Mendel réduit
4ºeso Chapitre 3 Les lois de Mendel réduit4ºeso Chapitre 3 Les lois de Mendel réduit
4ºeso Chapitre 3 Les lois de Mendel réduit
 
Hérédité
HéréditéHérédité
Hérédité
 
Hérédité
HéréditéHérédité
Hérédité
 
M krahn organisation_genome_et_analyses_genomiques_2009
M krahn organisation_genome_et_analyses_genomiques_2009M krahn organisation_genome_et_analyses_genomiques_2009
M krahn organisation_genome_et_analyses_genomiques_2009
 
La Meiose
La  MeioseLa  Meiose
La Meiose
 
appareil genetal mal
appareil genetal malappareil genetal mal
appareil genetal mal
 
Chromosomes
ChromosomesChromosomes
Chromosomes
 
Synthèse Examen De Noel Biologie
Synthèse Examen De Noel BiologieSynthèse Examen De Noel Biologie
Synthèse Examen De Noel Biologie
 

Rapport de stage prk grezy aude (1)

  • 1. GREZY Aude Encadrants : Crouau-Roy brigitte /Lecompte Emilie Année 2009-2010 LL’’éévvoolluuttiioonn ddeess cchhrroommoossoommeess sseexxuueellss :: ééttuuddee éévvoolluuttiivvee ddeess ggèènneess PPRRKKXX//YY
  • 2. Chromosome Y, le laissé pour compte de l’évolution ? Parmi les 23 paires de chromosomes observées dans un caryotype humain mâle, l’une d’elle, avec son  hétéromorphisme prononcé, attire le regard. Et pour cause, cette paire contient deux chromosomes de tailles  différentes. Le plus petit des deux, le chromosome Y, contrôle grâce à son gène SRY la différenciation testiculaire  dans l’embryon, autrement dit, a le contrôle du sexe de l’individu qui le porte. Pourtant, alors que le reste du  génome  humain  est  entièrement  séquencé  depuis  2001,  il  a  fallu  attendre  2003  pour  obtenir  une  séquence  complète du chromosome Y. Aujourd’hui, en 2010, cette séquence n’a pas encore révélé tous ces secrets. Car, si  les problèmes liés à la fertilité et au gène SRY sont étudiés depuis un moment déjà, une nouvelle question est  soulevée  par  cet  étrange  chromosome :  celle  de  l’évolution  particulière  des  chromosomes  sexuels  chez  les  primates. En effet, le chromosome Y, avec son accumulation de mutations délétères qui le font dégénérer à vue  d’œil, donne l’impression d’être délaissé par la sélection. C’est à travers une étude évolutive entre l’homme et  des espèces phylogénétiquement proches, étude rendue possible par les avancées de ces dernières années dans  le  domaine  de  la  génomique,  de  la  biologie  moléculaire  et  de  la  bioinformatique,  que  des  réponses  vont  probablement pouvoir émerger. Introduction Matériel Les gènes PRKX/Y L’ordre des primates Méthode Amplification des séquences de PRKX/Y chez différentes espèces de primates Analyse des séquences, reconstruction phylogénétique, tests de sélection Résultats Analyse des séquences et détection de la signature de sélection Séquences PRKX Séquences PRKY Séquences PRKX vs séquences PRKY Approche phylogénétique Exon 2 Exon 3 Discussion Histoire évolutive des gènes PRKX et PRKY PRKX/Y : des gènes conservés ? PRKX/Y : région instable du génome ? Le gène PRKY, témoin d’un début de dégénérescence de la quatrième strate ? Conclusion et perspectives
  • 3. Introduction L‘homme est un mammifère qui partage, entre autres choses, avec le reste du groupe, un système de reproduction sexué, gonochorique (où il existe des individus mâles et femelles, par opposition aux hermaphrodites), avec comme système de déterminisme du sexe des chromosomes sexuels XY. Dans ce système, les gènes du déterminisme du sexe sont individualisés du reste du génome, sur deux chromosomes distincts. Ainsi, le type de gamète (X ou Y) transmis, sera suffisant pour déterminer le sexe de l’individu : le mâle est hétérogamétique XY, et la femelle homogamétique XX. Il existe à travers le règne animal et végétal de nombreux autres modes de reproduction, et parmi les espèces à reproduction sexuée, il existe de nombreux autres types de déterminisme du sexe. Par exemple chez les reptiles, le sexe n’est pas déterminé de manière génétique, mais est dépendant de la température d’incubation de l’œuf. Néanmoins, le système de déterminisme du sexe par des chromosomes sexuels n’est pas un cas unique. Ce système est apparu de nombreuses fois indépendamment dans l’évolution, que ce soit chez les plantes ou les métazoaires (Graves 2008). Le système XY humain est apparu il y a environ 160 millions d’années (Ma), avant la divergence des marsupiaux du reste des mammifères (Veyrunes et al. 2008). Il a évolué à partir d’une paire d’autosomes, où l’un des chromosomes de la paire a acquis le gène du déterminisme du sexe SRY (par mutation du gène Sox 3, à l’époque autosomal) (Graves 2006). Le chromosome portant ce nouveau gène SRY a évolué pour devenir le futur chromosome Y, alors que son homologue est devenu le chromosome X. Il existe sur les paires d’autosomes, un système empêchant une trop grande divergence du contenu génétique entre deux chromosomes homologues d’une même paire : la recombinaison homologue. Le maintien du gène SRY n’aurait donc pas été possible, si un événement d’inversion sur le chromosome Y n’avait pas été sélectionné, entrainant un arrêt de la recombinaison homologue aux alentours de ce gène. En l’absence de recombinaison, cette région du futur chromosome Y a vu son contenu génétique commencer à diverger par rapport à celle du chromosome X. Puis des évènements d’inversions se sont répandus le long de la paire, permettant la divergence d’autres régions du chromosome (Figure 1). Ainsi, en observant la séquence du chromosome Y et en la comparant à celle du X, on peut discerner plusieurs strates de divergence correspondant à des régions ayant commencé à diverger plus ou moins précocement (Lahn & Page 1999). 1
  • 4. Figure 1 : Schéma de l’évolution des chromosomes XY (d’après Graves 2006). TDF : Testis Determining Factor. MSY : Male Specifique Region of the Y Les chromosomes sexuels XY, à l’heure actuelle, possèdent des régions pseudo- autosomales (les PAR), témoin de leur origine autosomale, où la recombinaison entre les deux chromosomes sexuels a toujours lieu, permettant une ségrégation correcte du chromosome Y à la méiose (Figure 1). L’arrêt de la recombinaison homologue explique la divergence du contenu génétique entre les chromosomes X et Y, mais il pourrait également expliquer en partie un autre phénomène touchant les chromosomes sexuels : la dégénérescence du chromosome Y. En effet, celui-ci est loin de ressembler à l’autosome dont il est issu. Au cours de ces 160 millions d’années d’évolution, il est devenu court, pauvre en gènes fonctionnels, riche en séquences répétées et en hétérochromatine (Tableau I). Tableau I : Tableau comparatif des chromosomes X et Y humain. (d’après Ross et al. 2005 ; Graves 2006 ; et données récupérées sur la base de données Ensembl) Chromosome X Y Longueur (Mégabases) 155,270,560 59,373,566 Nombre de gènes 1098 45 fonction(s) majoritaire(s) reproduction développement de l'encéphale (ex : Sox 3) reproduction (ex : SRY) Nombre de pseudogènes 700 313 De nombreuses hypothèses tentent d’expliquer la dégénérescence du Y ainsi que l’accumulation de mutations délétères qui devraient être éliminées par la sélection. Le génome est en constante évolution, et l’un des moteurs de cette évolution est la dérive génétique (fluctuation aléatoire des fréquences alléliques dans une population). Or on sait que plus une population est petite, plus la dérive génétique y est forte. Le chromosome Y pourrait souffrir d’une dérive génétique forte due à sa taille efficace réduite dans la population (1Y pour 4 autosomes). De plus, le Y est transmis de manière haplotypique, ce qui pourrait être à l’origine de cette évolution particulière. En effet, alors que le X peut 2
  • 5. encore recombiner chez les femelles, le chromosome Y n’en a jamais l’occasion. Ainsi, des mutations même faiblement délétères peuvent être fixées, simplement du fait de leur proximité d’un site sélectionné. La sélection serait alors moins efficace en absence de recombinaison. Néanmoins, on ne sait pas dans quelles proportions ces différentes hypothèses jouent un rôle dans l’évolution du Y (Charlesworth 2000). Mais une chose est sûre : ce chromosome est soumis à des forces particulières, et le génome gardant la trace des forces évolutives qu’il a subit, on peut, en étudiant la séquence primaire du chromosome Y, essayer de retracer son histoire. Ainsi, l’équipe « Structure génétique des populations et évolution du génome » (EDB) a entrepris l’étude de plusieurs gènes, présents à la fois sur les chromosomes X et Y. Deux paires de gènes ont déjà été étudiées, et j’ai commencé l’étude d’une troisième : les gènes PRKX/Y. Cette étude a été réalisée à travers la lignée des primates, dont la phylogénie est bien établie, ce qui permet de disposer d’un cadre évolutif connu et de dater les évènements évolutifs observés lors de l’étude. Afin de reconstruire l’histoire évolutive des gènes PRKX/Y, plusieurs étapes ont été nécessaires. Tout d’abord, nous avons récupéré les informations déjà existantes sur le gène, ainsi que les séquences disponibles dans les banques. Ensuite, nous avons généré de nouvelles séquences de PRKX/Y pour le maximum d’espèces de primates, à l’aide d’amorces hétérologues. Finalement, nous avons comparé et analysé les séquences X et Y des différentes espèces et recherché, par des tests permettant de distinguer les différents types de sélection, une signature de sélection afin d’identifier les mécanismes moléculaires en jeu. Les principaux types de sélection sont la sélection positive (sélection qui favorise la fixation de nouvelles mutations conférant une meilleure valeur sélective), et la sélection purificatrice (sélection qui tend à empêcher la fixation de nouvelles mutations et qui préserve la fonction du gène). Ainsi, nous essaierons de formuler une hypothèse quand au type de sélection subit par les gènes PRKX/Y et de déterminer dans quelle mesure le gène PRKY est soumis à la dégénérescence étant donné sa position sur le Y. Matériel Les gènes PRKX/Y : Les gènes PRKX/Y codent pour une sérine/thréonine CREB-kinase dépendante de l’AMP cyclique, appartenant à la famille des kinases AGC, une famille de protéines kinases incluant notamment les PKA, PKC et PKG (Pearce et al. 2010), bien que Li et al. (2002) 3
  • 6. ont montré que PRKX/Y possèderaient des fonctions uniques, non partagées avec les kinases AGC. Elles seraient plus proches des kinases KAPC-DICDI de Dictyostelum et de DC2 de Drosophila, toutes deux impliquées dans la migration et la différenciation cellulaire. En effet, PRKX est impliquée dans la migration des cellules rénales au cours du développement (Li et al 2002) ainsi que dans une voie de signalisation, conduisant à la maturation de macrophages et de granulocytes (Semizarov et al. 1998). Chez l’homme, le gène PRKX (situé dans la région p22.33) est composé de 9 exons, codant pour 358 acides aminés (aa). L’exon 9 et les 166 premiers nucléotides de l’exon 1 ne sont pas traduits. Le gène PRKY (situé dans la région p11.2) ne comprend que 8 exons, codant pour 277 aa, car la séquence homologue de l’exon 6 de PRKX y est absente. Les gènes PRKX/Y se trouvent dans la 4ème strate de divergence des chromosomes sexuels, donc la plus récente (Skaletsky et al. 2003). Les gènes PRKX/Y sont à l’origine de syndromes de réversions sexuels chez l’homme. Ces pathologies sont dues à des échanges de portions de chromosomes qui ont lieu de manière anormale, donnant lieu, à des individus de génotype XX, et de phénotype masculin, car portant sur un de leur chromosome X, la région du gène SRY. En effet, les gènes PRKX/Y, bien qu’éloignés des PAR, possèdent, après ces régions, le plus fort taux de recombinaison observé sur le chromosome Y. Cela est certainement dû au fait que ces deux gènes, bien qu’isolés par arrêt de la recombinaison il y a ~30 Ma, présentent encore 94% de similarité de séquences chez l’Homme. De plus, ils sont orientés de manière identique sur X et Y et le locus est de taille assez importante (environ 110 Kb) (Schiebel et al. 1997). Des évènements de conversion génique (échange non réciproque de matériel chromosomique) ont eu lieu, au cours de l’histoire des chromosomes sexuels, notamment aux alentours de PRKX/Y. Ainsi, la vision des chromosomes sexuels n’échangeant aucun matériel génétique entre eux semble ne pas être vraie sur la totalité des chromosomes X/Y, et notamment sur les gènes PRKX/Y. Cette conversion génique pourrait jouer un rôle dans la préservation des copies présentes sur le Y (Rosser et al. 2009). L’ordre des primates : L’ordre des Primates comprend au moins 376 espèces regroupées dans 70 genres. (Fabres et al. 2009). Notre étude a été réalisée au sein des Haplorrhini, ces derniers étant subdivisés en singes du nouveau monde (les Platyrrhini) et en singes de l’ancien monde (les Catarrhini). Les Catarrhini contiennent les grands singes, formés de deux familles : 4
  • 7. les Hominidae (Orang-outan, Gorille, Chimpanzé et Homme) et les Hylobatidae (Gibbons) ; ainsi que les Cercopithecidae (Figure 2). Les primates sont de plus en plus étudiés en génomique car leurs relations de parenté avec l’Homme sont un atout pour les recherches de génomique évolutive. La séquence du chromosome X est disponible pour l’homme (Homo), le chimpanzé (Pan), le gorille (Gorilla), l’orang-outan (Pongo), le macaque (Macaca), le tarsier (Tarsius), l’otolemur (Otolemur) et le microcèbe (Microcebus). Au cours de mon stage, sont arrivés dans les banques, le génome du babouin (Papio) et du ouistiti (Callitrix), preuve que les primates représentent un intérêt grandissant en génomique. Figure 2 : Phylogénie consensus des Primates (d’après Fabres et al. 2009). Les photos proviennent du site Animal Diversity Web (http://animaldiversity.ummz. umich.edu/site/index.html). L’infra-ordre des Catarrhini est en rouge, et l’infra-ordre des Platyrrhini en rose. En revanche, le chromosome Y n’est séquencé que chez l’homme et le chimpanzé. Le gène PRKY du gorille est présent sous forme d’ADNc, et celui du macaque a été identifié dans des BACs dont la séquence est disponible. Cependant, il est à noter que les séquences des banques de données, que ce soit pour le X ou le Y, sont souvent 5
  • 8. incomplètes (présence de N), et ne sont pas toujours annotées. Ceci crée une difficulté pour récupérer les séquences du gène voulu. C’est notamment le cas des séquences de l’Otolemur et du microcèbe, où un Blast n’a pas permis de récupérer la séquence de PRKX, du fait de la trop grande divergence avec la séquence utilisée pour le blast. Méthode Amplification des séquences de PRKX/Y chez différentes espèces de primates : Les séquences ont été récupérées dans les banques de données (ensembl, NCBI) soit par recherche dans les génomes annotés, soit en ayant recours à un Blast en utilisant l’espèce la plus proche possible de la séquence désirée. Des amorces hétérologues ont été dessinées dans les régions introniques les plus conservées entre espèces et à proximité des exons. Ces amorces, d’environ 20 paires de bases, présentent une composition en CG d’environ 40 à 60%, et ne doivent pas former ni boucles ni dimères. Elles ont été dessinées dans le but d’être spécifiques du X, du Y, ou d’être capable d’amplifier les deux, en se basant sur les séquences connues. Néanmoins, une amorce dessinée pour être spécifique-X ne le sera pas forcément chez une espèce éloignée et cela est d’autant plus vrai pour les amorces destinées à être spécifiques-Y, étant donné que le Y présente une forte variabilité inter-espèce. Etant donné l’incertitude de la spécificité des amorces, il s’avère très difficile de savoir a priori si les séquences obtenues sont du X ou du Y. Afin d’être sure de la nature des séquences obtenues, des femelles étaient utilisées autant que possible pour l’obtention de séquences X. Au total, 29 amorces ont été testées pour les exons 1, 2 et 3 ; 6 amorces supplémentaires ont été redessinées lors de l’arrivée de Callitrix dans les banques de données. Les PCR ont été réalisées avec un mix : Green GoTaq ™ buffer (Promega) 1X, dNTP à 0.1 mM, amorces à 0.5 uM chacune, 1 unité de Taq Promega, 25 ng d’ADN et eau à qsp 25 ul. Elles ont été mises au point pour chaque espèce, en jouant sur la spécificité des amorces et en modifiant la température ou le temps d’hybridation du programme. Nous avons également utilisé des programmes en touch- down, où la température d’hybridation descend du nombre de degrés voulu à chaque cycle, pendant un nombre de cycles choisi, permettant plus de spécificité des amorces. Parfois, du fait d’une amplification aspécifique, la bande recherchée a été découpée sur gel d’agarose (kit d’extraction sur gel Gene Jet™ Fermentas). Quand les produits de PCR contenaient plusieurs amplifiats non séparables par découpage sur gel, nous avons procédé à du clonage. Les ligations sont effectuées dans un vecteur pGemT-easy Promega 6
  • 9. 24h à 4 °C, ou 1h à température ambiante. Des bactéries JM109 sont transformées par choc thermique avec 2 ul de ligation. Des PCR sont réalisées directement sur les colonies bactériennes avec les amorces M13F et M13R, qui s’hybrident sur le vecteur. Les produits ont ensuite été séquencés, soit au laboratoire EDB, soit par l’entreprise Millegen. Afin d’être sûr de nos séquences, les PCR ont si possible été réalisées sur 2 individus ou 2 PCR indépendantes sur le même échantillon, et le séquençage a été réalisé en sens et anti- sens. Analyses des séquences, reconstructions phylogénétiques, tests de sélection : Les séquences obtenues après séquençage ont été nettoyées manuellement avec le logiciel SequenceScanner et des séquences consensus ont été réalisées sur chaque espèce en comparant ces séquences obtenues à celles des banques. Puis elles ont été alignées avec BioEdit (Hall 1999). Les régions ambiguës, ou ne pouvant répondre de manière fiable à l’hypothèse d’homologie, ont été éliminées de l’alignement. Le modèle d’évolution correspondant le mieux au jeu de données a été recherché grâce au logiciel Modeltest (Posada & Crandall 1998) et sélectionné suivant le critère d’Akaike (AIC), puis a été utilisé pour la reconstruction phylogénétique. Celle-ci a été conduite selon la méthode de maximum de Vraisemblance en utilisant le logiciel PhyML (Guindon & Gascuel 2003), et la robustesse des nœuds a été évaluée par une analyse de bootstrap utilisant 100 réplicats. Le taxon des Platyrrhini a servi de groupe externe pour enraciner l’arbre, les Catarrhini représentant la majeure partie de notre jeu de données. Une première analyse, à la fois nucléotidique et protéique a été réalisée avec BioEdit et Mega : recherche de codons stops, calcul de divergence entre les séquences, recherche de motifs dans les séquences. Le logiciel DnaSP (Rozas et al. 2003), a permis de calculer le taux estimé de substitutions synonymes (Ks ; modèle de Jukes et Cantor à 1 paramètre), c’est-à-dire le nombre de changements de nucléotides n’affectant pas la séquence en acides aminés, et le taux estimé de substitutions non-synonymes (Ka), soit le nombre de changement de nucléotide affectant la séquence en acides aminés, de nos séquences X prises deux à deux, et de nos séquences Y prises deux à deux. Ceci a permis de calculer le rapport Ka/Ks des séquences prises deux à deux. Un Ka/Ks ~1 indique une absence de sélection sur la séquence, donc une évolution neutre. Un ka/Ks <1 indique que la séquence est sous sélection purificatrice. Un Ka/Ks >1 indique que la séquence est sous sélection positive. 7
  • 10. Résultats Les 3 premiers exons des gènes ont été testés. Le premier exon, après 18 PCR mettant en jeu 5 couples d’amorces, ne donnant aucun résultat, et n’étant pas totalement traduit, a été abandonné. Nous avons testé l’amplification des exons 2 et 3 sur un certain nombre de Platyrrhini, de Catarrhini et de Strepsirrhini. Sur 318 PCR et 10 clonages réalisés, 46 séquences exploitables ont été obtenues (Tableau II). Certaines séquences ont permis de vérifier celles présentes dans les banques, les autres ont permis d’apporter des données nouvelles. Tableau II : Espèces testées. Une croix verte indique que la séquence est présente dans les banques de données. Une croix rouge indique que nous avons obtenu la séquence. Sous-Ordre Famille Sous-Famille Genre Exon 2 X Exon 3 X exon 2 Y exon 3 Y Platyrrhini Cebidae Callithricinae Saguinus + + Callithrix ++ + Cebinae Cebus + Saimirinae Saimiri Atelidae Atelinae Ateles + Pithecidae Pithecinae Pithecia + Catarrhini Cercopithecidae Cercopithecinae Allenopithecus + Cercopithecus + + + Chlorocebus + Erythrocebus + Macaca ++ ++ + + Mandrillus + + Papio + ++ Colobinae Colobus + Hylobatidae Hylobatinae Hylobates + + Nomascus + + + Hominidae Hominidae Pongo ++ ++ Gorilla ++ ++ + ++ Pan + + + + Homo + ++ + + Strepsirrhini Lemuridae Lemuridae Eulemur Indriidae Indriidae Propithecus Analyse des séquences et détection de la signature de sélection : • Séquences PRKX Les séquences des exons de PRKX présentent un polymorphisme de substitution inter- spécifique, mais aucun polymorphisme de délétion ou d’insertion, phénomène de mutation plus rare au niveau du génome. L’exon 2, est conservé dans l’infra-ordre des Platyrrhini et des Catarrhini, puisqu’il n’existe aucune substitution non-synonyme fixée à l’intérieur de ces infra-ordres, alors qu’il existe une mutation non-synonyme entre ces deux groupes (Tableau III). Ainsi, aucune substitution non-synonyme entre ces séquences n’est apparue depuis la divergence des Platyrrhini et des Catarrhini dans l’exon 2 (i.e. 8
  • 11. 33.7 Ma, Fabre et al, 2009). Pour l’exon 3 des Catarrhini, on observe une mutation non- synonyme dans la séquence du chimpanzé, et trois dans la séquence du Chlorocebus. De plus, la séquence du Chlorocebus, dont on est sûr que c’est une séquence X puisque l’individu amplifié était une femelle, possède un codon stop. Tableau III : Valeurs moyennes de Ka, de Ks, et de Ka/Ks pour les différents groupes de primates, obtenues grâce au logiciel DnaSP. Exon 2 Exon 3 Catarrhini Ka 0 0.03 Ks 0.15 0.11 Ka/Ks 0 0.03 Platyrrhini Ka 0 0.01 Ks 0.06 0.04 Ka/Ks 0 0.27 Catarrhini + Platyrrhini Ka 0.002 0.005 Ks 0.17 0.14 Ka/Ks 0.011 0.05 Les exons 2 et 3 se situent dans la partie catalytique de PRKX (Li et al. 2002). Néanmoins aucune substitution non-synonyme, que ce soit pour l’exon 2 ou pour l’exon 3, ne concerne les résidus critiques de la fonction kinase. Toutes les valeurs de Ka/Ks sont très inférieures à 1 (Tableau III), c’est-à-dire qu’il y a plus de substitutions synonymes que de non-synonymes. Ainsi ces deux exons du gène PRKX n’évoluent pas sous neutralité, mais sont soumis à une sélection purificatrice. L’intron adjacent en 5’ à l’exon 3 possède deux motifs répétés de manière assez complexe. Ces motifs sont présents sur toutes les séquences, que ce soient sur les X ou les Y mais le nombre de répétitions pour chaque motif n’est pas le même entre les espèces ni entre les X et les Y. On observe du polymorphisme de substitution entre les différentes répétitions d’un motif, et ces motifs se trouvent parfois répétés en tandem. • Séquences PRKY Les séquences des exons des gènes PRKY présentent un polymorphisme de substitution inter-spécifique et aucun polymorphisme d’insertion ou de délétion. Les zones introniques présentent de grandes séquences d’insertions spécifiques. Chez PRKY de Nomascus une substitution non-synonyme se trouve dans le domaine Mg- ATP-binding (exon 2) et une autre dans un résidu critique pour l’activité kinase (exon 2). La séquence Y du chimpanzé possède une mutation non-synonyme dans la boucle catalytique (exon 3). Ainsi, des mutations non-synonymes sont présentes dans des résidus 9
  • 12. critiques de la protéine, à la différence des séquences X, où ces substitutions ne se trouvent pas dans de tels résidus. Les valeurs de Ka/Ks sont toutes très inférieures à 1 (ne dépassant pas 0,26), même avec la séquence de l’exon 2 de Nomascus, qui a une divergence telle que nous l’avons retiré de l’échantillonnage dans certaines analyses. On détecte donc pour toutes les séquences Y une signature de sélection purificatrice. • Séquences PRKX vs séquences PRKY Chez les Catarrhini, le taux estimé de substitutions non-synonymes est plus important entre les séquences orthologues du gène PRKY, qu’entre les séquences orthologues du gène PRKX (Tableau IV), ainsi les séquences de PRKY sont plus divergentes entre elles, que les séquences de PRKX entre elles. La divergence entre les séquences X/Y est moins importante pour l’exon 2 que pour l’exon 3, et se trouve plus marquée dans les séquences introniques. (Tableau V) Tableau IV : valeurs moyennes de Ka, de Ks, de Ka/Ks (données obtenues avec DnaSP) et de pourcentages de divergence entre les séquences (méthode de p-distance réalisée avec le logiciel Mega). Seules les séquences X dont nous possédons l’homologue Y ont été utilisées. (exon 2 : X/Y de l’homme, du gorille, du chimpanzé et du macaque, pour l’exon 3 : X/Y de l’homme, du gorille, du chimpanzé, du macaque, du cercopithèque et du mandrill). Le gibbon Nomascus a été retiré de l’analyse car il est très divergent. X2 Y2 X3 Y3 Ka moyen 0 0.0039 0.0017 0.017 Ks moyen 0.137 0.059 0.096 0.113 Ka/Ks moyen 0 0.011 0.018 0.176 % de divergence les,séquences 2.7 % 1.5 % 2 % 3.4 % Tableau V : distances calculées à partir de matrices de distances d’acides nucléiques via le logiciel BioEdit. Les calculs des colonnes « a » sont réalisées sur les mêmes séquences que celles utilisées pour la phylogénie, c'est-à-dire les exons plus des séquences introniques. Les calculs des colonnes « b » sont réalisés avec les séquences exoniques uniquement. ND : données non disponibles exon 2 a exon 3 a exon 2 b exon 3 b Homo X/Y 2.8 % 6,4 % 2.41 % 4.67 % Gorilla X/Y 0,26 % 3.7 % 0 % 2.69 % Pan X/Y 2.13 % 6,46 % 1.19 % 3.10 % Nomascus X/Y 17 % ND 16 % ND Macaca X/Y 0.78 % 4,19 % 0 % 1.53 % Cercopithecus X/Y ND 1.86 % ND 0 % Mandrillus X/Y ND 3.46 % ND 0.4 % Homo X / Callitrix X 11.7 % 13 % 7 % 4.29 % Approche phylogénétique Afin de retracer l’histoire évolutive des gènes PRKX et PRKY, les séquences obtenues des exons 2 et 3, ainsi que des régions introniques adjacentes ont été utilisées. Le modèle d’évolution sélectionné grâce au logiciel ModelTest, pour nos deux jeux de données est le 10
  • 13. modèle GTR+G (yang 1994a), soit un modèle où il est autorisé un taux différent pour les six types de substitutions, avec une distribution gamma donnée, et admettant des fréquences propres à chaque nucléotide. Nomascus Y Figure 3 : arbre phylogénétique réalisé à partir de l’alignement des séquences de l’exon 2 et des régions introniques adjacentes. Sur 807 sites, 30 sites sont informatifs. Seules les valeurs de bootstrap au dessus de 50 (c’est-à-dire jugées assez robustes) sont indiquées. • Exon 2 La topologie de l’arbre phylogénétique reconstruit à partir des séquences de l’exon 2 (169 pb) et des régions introniques adjacentes (314 pb de l’intron 1 et 324 pb de l’intron 2), est congruente avec la phylogénie connue des primates (Figure 3). Dans cet arbre, les Homonidae et les Cercopithecidae apparaissent monophylétiques, incluant les X et les Y. Par contre, dans chacun de ces clades, les séquences X et Y ne sont pas séparées, ce qui montre que la divergence X/Y n’est pas assez importante pour que la reconstruction de l’arbre ait permis de les séparer. Seule la séquence Y de Nomascus est très divergente par rapport aux autres, ce qui était déjà clairement visible sur l’alignement. A tel point que la position de la branche dans l’arbre, à la base des Catarrhini, est certainement dû à un phénomène d’attraction de longue branche (artéfact lors de la reconstruction de l’arbre, où une branche longue est placée au mauvais endroit dans le but de minimiser sa longueur). 0.1 Pongo X Homo Y Pan Y Pan X 76 70 Homo X Gorilla Y Gorilla X 83 73 71 Nomascus X Hylobates X 85 91 Mandrillus X Cercopithecus X Macaca mulatta Y Papio papio X Macaca mulatta X 50 50 86 81 100 Callitrix X Hominidae Catarrhini Hylobatidae Cercopithecidae PlatyrrhiniSaguinus X 11
  • 14. Il est intéressant de noter que le taux de divergence entre le X et le Y de Nomascus est plus important que celui entre l’exon X de l’homme et celui du plus éloigné des Platyrrhini, Callitrix (Tableau V). Cela souligne à quel point la divergence entre X et Y peut être importante, et explique pourquoi il est difficile de les amplifier. • Exon 3 Sur l’arbre obtenu à partir des séquences de l’exon 3 (264 pb) et de fragments d’introns adjacents (458 pb de l’intron 2 et de 81 pb de l’intron 3), on retrouve également la phylogénie des primates, au niveau des familles (Figure 4). L’homme est ici plus proche du gorille que du chimpanzé. Ceci est assez fréquent dans le génome. En effet, si l’ensemble du génome de l’homme est plus proche du chimpanzé que du gorille, ce n’est pas vrai pour tous les gènes. Figure 4 : arbre phylogénétique réalisé à partir de l’alignement des séquences de l’exon 3 et d’introns adjacents. Sur les 803 sites, 41 sont informatifs. Seules les valeurs de bootstrap supérieures à 50 sont indiquées. Dans cet arbre, les séquences de PRKX et de PRKY sont bien séparées. Seule la séquence X de Chlorocebus est placée au milieu des séquences Y des autres Cercopithecidae. La divergence XY, d’après cet arbre, a eu lieu après la séparation des Hominidae et 12
  • 15. Cercopithecidae, et avant la divergence au sein de ces deux familles, soit entre 17 et 26 Ma. La séquence de PRKY de l’orang-outan ne se trouve pas à sa place biologique (malgré une faible valeur de robustesse) dans cette phylogénie. Or, elle possède une insertion spécifique, qui provient de la répétition d’un motif TGCCC dans sa partie intronique. Lorsque l’arbre est reconstruit en éliminant les séquences introniques (non montré), la séquence X de l’orang-outan est placée au sein de Homonidae. Par contre, dans ce nouvel arbre, les X et les Y ne sont plus séparés, ce qui montre que c’est essentiellement la partie intronique qui permet de différencier les X des Y pour l’exon 3 (tableau V). Discussion Cette étude sur l’histoire évolutive des chromosomes sexuels et la dégénérescence du chromosome Y au cours de l’évolution nécessite la comparaison d’un grand nombre de séquences, aussi bien sur le chromosome X que Y. Néanmoins, l’absence de telles données dans les banques, notamment au niveau des séquences Y, constitue une entrave à cette étude. Plusieurs problèmes se sont posés lors de l’obtention des séquences : l’utilisation d’amorces hétérologues et leur rendement faible, et l’incertitude à propos de la nature X ou Y des séquences obtenues. Cette incertitude vient de l’utilisation de ces amorces et surtout de la divergence faible entre les copies X et Y. Les décisions prises lors de la réalisation de l’alignement (notamment lors de l’existence de motifs répétés) peuvent être une source d’erreur dans la reconstruction phylogénétique puisque les hypothèses d’homologie formulées peuvent être erronées. De plus, afin d’obtenir des séquences fiables, chaque séquence consensus utilisée pour les analyses doit être réalisée à partir de séquences obtenues chez plusieurs individus, et idéalement, chaque séquence devrait être obtenue plusieurs fois pour chaque individu, grâce à des PCR indépendantes. Ceci est d’autant plus vrai pour les séquences obtenues par clonage, dont on sait qu’il peut introduire des mutations lors des réplications dans la bactérie. La durée du stage, ainsi que la limitation en ADN du laboratoire ne nous a pas toujours permis de confirmer nos séquences. Histoire évolutive des gènes PRKX et PRKY Toutes les espèces chez qui on a réussi à amplifier, soit le gène PRKX, soit PRKY, possèdent respectivement ces gènes. On peut les supposer fonctionnels dans la mesure où aucun codon stop n’est présent dans les exons amplifiés, à l’exception de la séquence de 13
  • 16. l’exon 2 de PRKX de Chlorocebus tantalus. Celui-ci possède un codon stop, ce qui pourrait être du à l’amplification d’une copie non fonctionnelle du gène PRKX chez cette espèce (pseudogène) sur lequel les amorces se seraient hybridées préférentiellement plutôt que sur la copie fonctionnelle. Des substitutions non-synonymes ont été identifiées sur la séquence Y de l’exon 2 du gibbon Nomascus, notamment au niveau des résidus critiques du site catalytique, ce qui pourrait affecter la fonctionnalité de la protéine PRKY. Ces deux séquences pourraient donc appartenir à un gène PRK non fonctionnel, et il serait intéressant de le vérifier (après avoir valider les séquences obtenues), d’autant qu’un pseudogène de PRKX a été identifié chez l’homme sur le chromosome 15 (Schiebel et al. 1997). Le fait que ces gènes soient présents ne nous assurent pas qu’ils soient localisés sur les chromosomes sexuels, et non ailleurs dans le génome. Afin de s’assurer de leur position, mais aussi de vérifier s’il n’existe pas des copies de ces gènes ailleurs dans le génome chez les différentes espèces, il faudrait réaliser des expériences d’hybridation fluorescente in situ. Ceci a déjà été réalisé chez certains grands singes, où la position de PRKX/Y sur les chromosomes sexuels a bien été vérifiée (Glaser et al 1997). PRKX et PRKY : des gènes conservés ? L’absence de mutations non-synonymes dans les résidus fonctionnels de PRKX suggère une forte conservation des séquences X, notamment au niveau de l’exon 2 où aucune substitution non-synonyme n’a eu lieu depuis 33,7 Ma. La divergence des copies X/Y semble essentiellement liée aux différences dans les régions introniques, ce qui montre que la séquence des exons de PRKY est assez proche de PRKX. Ceci va dans le sens d’une conservation du gène PRKY. Le fait que ces deux exons se situent dans le domaine catalytique de la protéine est certainement la raison de leur forte conservation. Il n’est donc pas étonnant de détecter de la sélection purificatrice dans la séquence X de ce gène chez toutes les espèces étudiées. Si les séquences Y sont bien codantes pour une protéine fonctionnelle, il n’est pas non plus étonnant d’y détecter une telle sélection, et le fait que les séquences Y soient également sous cette sélection va dans le sens de leur fonctionnalité. Cette conservation des séquences des copies X comme Y peut être le résultat de la sélection purificatrice, mais on ne peut pas exclure qu’elle soit le résultat d’un autre mécanisme moléculaire qui peut homogénéiser les séquences X et Y : la conversion génique. Celle-ci a été mise en évidence comme un phénomène important agissant sur les gènes en palindromes sur le 14
  • 17. chromosome Y (Rozen et al 2003) mais aussi entre certains gènes X et Y (Pamilo & Bianchi, 1993), dont récemment à proximité de PRKX et PRKY (Rosser et al., 2009). Il serait intéressant d’étudier un exon ne se trouvant pas dans le domaine catalytique, ainsi que l’exon 9 qui n’est pas traduit, ou l’exon 1 qui n’est que partiellement traduit. Cette étude nous permettrait de savoir si ces exons sont aussi conservés et si ils se trouvent également sous une sélection purificatrice. PRKX/Y : région instable du génome ? Les motifs répétés présents en amont de l’exon 3, le nombre de répétitions, et la complexité dans la manière dont ils sont répétés, sont fortement révélateurs d’une zone d’instabilité génétique. Cela va dans le sens du fort taux de recombinaison observé entre les gènes PRKX et Y (Schiebel et al 1997) et du fait que les gènes PRKX/Y soient situées dans un hotspot de translocation, siège de conversion génique (Rosser et al 2009). La présence d’un polymorphisme de substitution entre ces motifs répétés signifie que les évènements à l’origine de leurs duplications sont assez anciens. L’instabilité au niveau de l’intron 2 a pu être une raison supplémentaire à la difficulté d’hybridation des amorces, lors des étapes d’amplification. Néanmoins, ces répétitions pourront, lorsque plus de données auront été obtenues, présenter une région d’étude intéressante, car la présence de motifs répétés dans une séquence est très informative pour suivre son histoire évolutive. Le gène PRKY, témoin d’un début de dégénérescence de la quatrième strate ? PRKY se trouve dans la quatrième de strate de divergence du chromosome Y, c’est à dire dans la région où l’arrêt de la recombinaison homologue est le plus récent (Skaletsky et al. 2003). Nos arbres phylogénétiques indiquent qu’il y a bien divergence entre les séquences de PRKX et de PRKY pour le fragment incluant l’exon 3 chez les grands singes et chez les Cercopithecidae, même si cette divergence semble moins prononcée à partir des données de l’exon 2. Cette divergence entre PRKX/Y peut être datée entre 17 et 26 Ma. Cette date est cohérente avec la date d’arrêt de la recombinaison indiquée pour cette strate, soit entre 23 et 43 Ma (Lahn and Page 1999). D’après le contexte connu de l’évolution des chromosomes sexuels, un arrêt de la recombinaison entre X et Y est supposé entrainer une divergence du contenu génétique et la dégénérescence du chromosome Y (Charlesworth 2000). On s’attend donc à retrouver les effets de cette dégénérescence du chromosome Y sur le gène PRKY. Or, les exons 2 et 3 de PRKY sont soumis à une sélection purificatrice, qui conserve la séquence de PRKY. Pourtant, le taux 15
  • 18. de substitutions non-synonymes est plus important entre les séquences orthologues Y, qu’entre les séquences X. De plus, sur les 7 espèces pour lesquelles nous possédons une séquence de la copie Y, deux présentent des substitutions non-synonymes dans des résidus critiques de la protéine (le gibbon Nomascus et le chimpanzé). Chez l’Homme, la protéine PRKY est plus courte que la copie PRKX (277 aa versus 364 aa). Toutes ces données laissent penser que, malgré la sélection purificatrice qui agit sur le gène, PRKY subit un début d’accumulation de mutations faiblement délétères, qui pourrait être la marque d’un début de dégénérescence du chromosome Y dans la région de PRKY, et de manière plus générale de la strate 4. D’ailleurs, dans cette strate, 9 gènes sur 14 ne sont plus fonctionnels (Skaletsky et al. 2003). Conclusion et perspectives Nous avons donc généré un certain nombre de séquences, qui n’étaient pas disponibles dans les banques de données, et qui nous ont permis de réaliser une étude préliminaire des gènes PRKX/Y à travers l’ordre des primates. Nous avons mis en évidence une sélection purificatrice très forte, sur la totalité des séquences, X comme Y. Néanmoins, malgré cette sélection, le gène PRKY comporte plus de mutations non-synonymes que le X, ce qui pourrait être le témoin d’un début de dégénérescence de la 4ème strate. Cette étude devra être continuée, en générant plus de séquences, afin d’obtenir des séquences plus fiables et de nouvelles données permettant d’aller plus loin dans l’analyse, à plusieurs échelles. A une échelle inter-exons, il sera intéressant d’obtenir les séquences de tous les exons pour y comparer les forces qui y agissent. Les gènes PRKX/Y nous ont pour l’instant montré l’image de gènes conservés chez la plupart des espèces étudiée, ce qui nous ramène à la question de l’importance de ce gène, et du pourquoi celui-ci n’a pas dégénéré contrairement aux centaines de pseudogènes présents sur le chromosome Y. A une échelle inter-espèces, obtenir ces séquences chez de nombreuses espèces de primates permettra de savoir si le gène PRKY a résisté à la dégénérescence chez toutes les espèces, si la protéine y est fonctionnelle et s’il s’y trouve toujours sous la même pression de sélection. Finalement, une étude comparant les gènes PRKX/Y à d’autres gènes de la même strate, ou même du reste du chromosome, permettrait d’avoir une idée de l’évolution globale de celui-ci. 16
  • 19. Bibliographie J.A Marshall Graves (2008). Weird Animal Genomes and the Evolution of Vertebrate Sex and Sex Chromosomes. Annu. Rev. Genet. 42:565-586. J.A Marshall Graves (2006). Sex Chromosome Specialization and Degeneration in Mammals. Cell 124 : 901-914. B.T. Lahn and D.C. Page (1999). Four Evolutionary Strata on the Human X Chromosome. Science 286 : 964-967. F. Veyrunes, P.D. Waters, P. Miethke, W. Rens, D. McMillan, A.E. Alsop, F. Grützner, J.E. Deakin, C.M. Whittington, K. Schatzkamer, C.L. Kremitzki, T. Graves, M.A. Ferguson-Smith, W.Warren, and J.A. Marshall Graves1 (2008). Bird-like sex chromosomes of platypus imply recent origin of mammal sex chromosomes. Genome Res. 18(6): 965–973. M.T. Ross, D.V. Grafham et al. (2005). The DNA sequence of the human X chromosome. Nature 434 : 325-337. B.Charlesworth and D. Charlesworth (2000). The degeneration of Y chromosomes. Phil. Trans. R. Soc. Lond. B 355 : 1563-1572. L.R. Pearce, D.Komander and D.Alessi (2010). The nuts and bolts of AGC protein kinases. Molecular cell Biology 11 : 9-22. X. li, H. Li, K. Amsler, D. Hyink, P.D. Wilson and C.R. Burrow (2002). PRKX, a phylogenetically and functionally distinct cAMP-dependant protein kinase, activates renal epithelial cell migration and morphogenesis. PNAS. 99 : 9260-9265. D. Semizarov, D. Glesne, A. Laouar, K. Schiebel and E. Huberman (1998). A lineage-specific protein kinase crucial for myeloid maturation. Cell Biology, 95 : 15412-15417. H. Skaletsky, T. Kudora-Kawaguchi et al. (2003). The male-specific region of the human Y chromosome is a mosaic of discrete sequence classes. Nature 423 : 825-837 K. Schiebel, M. Winkelmann, A. Mertz, X. Xu, D.C. Page, D. Weil, C. Petit and G.A. Rappold (1997). Abnormal XY interchange between a novel isolated protein kinase gene, PRKY, and its homologue, PRKX, accounts for one third of all (Y+)XX males and (Y-)XY females. Human Molecular Genetics 6 : 1985-1989. Z.H. Rosser, P. Balaresque and M.A. Jobling (2009). Gene Conversion between the X Chromosome and the Male-Specific Region of the Y Chromosome at a Translocation Hotspot. The American journal of Human Genetics 85 : 130-134. P.H. Fabre, A. Rodrigues, E.J.P Douzery (2009). Patterns of macroevolution among Primates inferred from a supermatrix of mitochondrial and nuclear DNA. Molecular Phylogenetics and Evolution 53 : 808-825. T.A. Hall (1999). BioEdit: a user-friendly biological sequence alignment editor and analysis program for Windows 95/98/NT. Nucleic Acids Symposium Series No. 41: 95-98. D. Posada, and K. A. Crandall, 1998 MODELTEST: testing the model of DNA substitution. Bioinformatics 14: 817-818. S. Guindon, and O. Gascuel (2003). A simple, fast, and accurate algorithm to estimate large phylogenies by maximum likelihood. Syst Biol 52: 696-704. J. Rozas, J. C. Sanchez-Delbarrio, X. Messeguer and R. Rozas (2003) DnaSP, DNA polymorphism analyses by the coalescent and other methods. Bioinformatics 19: 2496-2497. B. Gläser, F. Grützner, K. Taylor, K. Schiebel, G. Meroni, K. Tsioupra, J. Pasantes, W. Rietschel, R. Toder, U. Willmann, S. Zeitler, P. Yen, A. Ballabio, G. Rappold and W. Schempp (1997). Comparative mapping of Xp22 genes in hominoids – evolutionary linear instability of their Y homologues. Chromosome Research 5 : 167-176. S. Rozen, H. Skaletsky, J.D. Marszalek, P.J. Minx, H.S. Cordum, R.H. Waterston, R.K. Wilson and D.C. Page (2003). Abundant gene conversion between arms of palindromes in human and ape Y chromosomes. Nature 423 : 873 -876. P. Pamilo and N.O. Bianchi (1993). Evolution of the Zfx and Zfy Genes : Rates and Interdependance between the Genes. Mol. Biol. Evol. 10 : 271-281. 17