1. Sélection Assistée par Marqueurs
Principe : révéler des marqueurs de polymorphisme
génétique associés avec le polymorphisme de caractère à
sélectionner
L’amélioration du phénotypage (instrumentation
pour l’acquisition rapide de données en lien avec les
caractères d’intérêt) facilite l’identification de
marqueurs diagnostics
Source LemnaTech
Le génotypage à haut débit accélère la sélection des
individus portant les bons allèles (sur les marqueurs
en liaison génétique avec le caractère) et le contrôle
du fond génétique (pour le reste du génome)
2. Déterminisme des caractères
Caractères « qualitatifs » (simples)
• Contrôlés par un gène
• Sans effet fort du milieu
Caractères « complexes »
• Contrôlés par plusieurs gènes
• Avec effets du milieu
Idéal du sélectionneur:
• avoir repéré TOUS ces gènes sur les
chromosomes
• pouvoir suivre leurs allèles au cours
des processus de sélection
3. Le génotypage, c’est (de + en +) facile
génome gène séquence
A
T
G
Ind1
G
T Toute une panoplie de cM
C
marqueurs génétiques,
T
Positionnés le long du
A
T génome en fonction des
Ind2 G fréquences de
C
T
recombinaison…
C
T
4. Le phénotypage (pour les caractères d’intérêt du
sélectionneur), c’est souvent bien plus
complexe…
5. Notion d’héritabilité
Variation génétique
Héritabilité: additive =
transmissible,
accessible à la sélection
6. Le problème: comment associer
génotype et phénotype?
Idéal: association au plus près du
polymorphisme causal
7. A la base: le déséquilibre de liaison
Association directe Association indirecte
SNP
Chromosome
Polymorphisme
DL
responsable de la variation D’après Hirschborn and Daly, 2005
phénotypique
DL = Association non
aléatoire entre des allèles
Codon STOP à des locus différents au
Variation d’expression…
sein d’une population
Attention, le DL peut-être causé par d’autres facteurs !
8. Etude de caractères à déterminisme
génétique simple
• Un caractère à déterminisme génétique
simple est contrôlé par un seul gène
• exemple: la couleur jaune du fruit du piment
INRA Avignon
9. La couleur jaune du piment
y+y+ yy
Croisement
y+y
Autofécondation
1/4 yy + 1/2 y+y + 1/4 y+y+
Le caractère ségrège dans la population F2
Mutation récessive contrôlée par un gène y
10. Marquage moléculaire de y
CD25
Croisement T16_1.6
CT204
Autofécondation
y
chromosome
indigo
Le marqueur CT204 marque la mutation y (aux recombinaisons près)
11. La couleur du fruit de piment
Dernière étape de synthèse des keto-
caroténoïdes contrôlée par le gène C.C.S.
anthéraxanthine violaxanthine
C.C.S.
capsanthine capsorubine
Bouvier et al., 1994
12. La couleur du fruit de piment
Cartographie de CCS
CD25
T16_1.6
CT204
y
CCS
chromosome
indigo
Lefebvre et al., 1998
Le polymorphisme de CCS marque à 100% la mutation y du piment
13. Etude de caractères complexes
Caractères quantitatifs, à distribution normale
B
N
5
4
3
2
1
0
% saccharose
10 12 14 16 18 20
snv.jussieu.fr
Exple: Teneur en saccharose dans la
racine de betterave
Comment identifier des régions génétiques controlant les caractères complexes?
14. Les caractères quantitatifs:
décomposition en plusieurs locus à
effet discret
• Variation continue
• Contrôlés par plusieurs
gènes /plusieurs locus:
les QTL
(Quantitative Trait Loci),
d’effets variables
15. La notion de QTL (Quantitative Trait Locus)
- Tout locus impliqué dans la variation d’un
caractère quantitatif :
un QTL rend compte d’une part de la variation du
caractère dans la population (R2)
- Tout locus pour lequel une substitution
allélique modifie la valeur du caractère (a)
Un QTL n’est jamais seul !
Un QTL est par définition polymorphe !
16. But de l’analyse de QTL
• On veut connaître:
– le nombre de locus en cause
– leur position dans le génome
– leurs effets sur la variation du caractère
– leur robustesse
– leurs caractéristiques génétiques (dominance,
additivité, épistasie…)
• Les marqueurs qui repèrent les QTL (les plus
importants) pourraient alors être utilisés en
sélection
17. Principe de l’analyse de QTL
• On cherche s'il existe une liaison statistique
entre les allèles aux marqueurs et le phénotype
des plantes Soit dans une population en
ségrégation (QTL, analyse par
liaison génétique)
Soit dans la variation
présente dans les populations
naturelles (Génétique
d’association)
18. Cartographie par Cartographie par
liaison association
• Au départ: un croisement • Au final: une collection
entre des parents connus représentative
?
Croisement Quelques
entre deux individus
lignées fondateurs
n générations
Peu de générations
Maille grossière Maille plus fine
19. Relation entre la masse de la graine de haricot
et sa pigmentation sur une descendance
(179 F2) (Karl Sax, 1923)
Génotype Couleur Masse
30,7 ± 0,6 - Un (des) facteur (s)
P/P contrôlant la masse au
voisinage de chacun
de ces gènes
28,3 ± 0,3
P/p
- La recombinaison peut faire
diminuer la corrélation
p/p 26,4 ± 0,5
Notion de marqueur de
gène à effet quantitatif
20. Variation fonctionnelle dans le gène Dwarf8
du maïs (Thornsberry et al. 2001)
2 Amino Acid
MITE Deletion
Indel
SH2 Domain
1,8
Days to Silking relative to B73
Sur 92 lignées de maïs 1,6
de diverses origines (en
1,4
contrôlant la structure de la
association
population), 1,2
avec la date de floraison 1
et la hauteur sur 12 0,8
environnements. 0,6
D8 SH2 Variant
21. Eléments nécessaires à la détection de
QTL par liaison génétique
• Une descendance en ségrégation
– Produite en quelques générations: on s’affranchit des
contraintes évolutives de la génétique des populations
– Le DL est directement lié à la liaison physique sur un
chromosome
• Une carte génétique de bonne qualité
• Une évaluation fiable du caractère
22. Les populations de NB: Ce qui permet
Parents de distinguer le
cartographie de QTL X jaune du rouge, ce
sont des
BC marqueurs
polymorphes entre
F1 les parents du
2 classes : AA et AB croisement
x P2
BC
génotypage en BC
phénotypage en BC ou mélange de BC1S1
23. Les populations de
Parents
cartographie de QTL X
HD
F1
2 classes : AA et BB
Androgénèse
lignées
HD
génotypage et phénotypage en HD
24. Les populations de
Parents
cartographie de QTL X
F2
F1
3 classes : AA, AB, BB
F2
génotypage en F2
phénotypage en F2 ou mélange de F3
26. Les populations de
cartographie de QTL
F'1
Parents
Parents
hétérozygotes X
F'1
génotypage et phénotypage en F'1
une carte de chaque parent
Jusqu'à 4 classes : AC, AD, BC, BD
27. Eléments nécessaires à la détection de
QTL par liaison génétique
• Une descendance en ségrégation
• Une carte génétique de bonne qualité
• pour chaque individu de la descendance, disposer
du génotype à un ensemble de marqueurs
régulièrement répartis sur les chromosomes
• Une évaluation fiable du caractère
28. Utilisation de marqueurs moléculaires:
liaison génétique
A, a: 2 allèles du locus A
A a
B, b: 2 allèles du locus B
B b
Au sein d’un individu Aa
ou d’un ensemble d’individus F1
Bb
Marqueur co-dominant
29. Rétro-croisement de la F1 avec un parent: Backcross
Locus A
X Parents Locus B
Gamètes
P R P
Desc.
BC
Codo.
7/16 1/16 1/16 7/16
P R R P
30. X Parents
Gamètes
P R P
Desc.
BC
Codo.
4/16 4/16 4/16 4/16
1 1 1 1
P R R P
31. Constitution d’une carte génétique
1. Identification de groupes de marqueurs liés
entre eux :
Indépendance génétique / liaison génétique
Définition des groupes de liaison
2. Ordonner les marqueurs d’un groupe de liaison
Estimation du taux de recombinaison entre les
marqueurs
Estimation de la distance génétique entre les
marqueurs mitoyens
32. Sur une carte génétique,
les chromosomes sont
représentés par des
marqueurs ordonnés le
long de groupes de liaison
Les distances entre
marqueurs sont fonction
des pourcentages de
recombinaisons observés
dans une population en
ségrégation
33. Intérêt des cartes génétiques
• Positionner sur les chromosomes des régions
(locus) d’intérêt agronomique
a
M’
b
m’1, m’2
c
M’’
d m’’1, m’’2
e M
f m1, m2...
g
34. Eléments nécessaires à la détection de
QTL par liaison génétique
• Une descendance en ségrégation
• Une carte génétique de bonne qualité
• Une évaluation fiable du caractère
• pour chaque individu de la descendance, disposer
du phénotype pour le(s) caractère(s) considéré(s)
– Dépend de l ’héritabilité du caractère et la qualité de
l’évaluation du caractère
– Evaluation sur des familles (HD, S1, F3, TC, RIL)
35. Analyse simple marqueur
Lignée Allèle au Taille ....Allèle au Taille
marqueur 1 de la marqueur n de la
plante plante
1 B 85 A 85
2 A 115 B 115
3 B 90 A 90
4 B 80 B 80
5 A 115 B 115
6 B 83 A 83
7 A 118 A 118
8 A 120 B 120
9 A 115 A 115
10 B 82 B 82
Moyenne A 117 A 98
B 84 B 102
36. Recherche de QTL
valeur
du
caractère
QTL
(Population F2)
AA AB BB génotype au
marqueur Mo
Régression du nombre d’allèles B sur la valeur du phénotype
Phénotype = β X + b (X: nb d’allèles B, β : pente). J’accepte H0
Je teste hypothèse nulle H0: β = 0
37. Recherche de QTL
valeur
du
caractère
QTL
Il existe un
QTL au
voisinage
de M1
(Population F2) AA AB BB génotype au
marqueur M1
Régression du nombre d’allèles B sur la valeur du phénotype Je refuse H0
Phénotype = β X + b (X: nb d’allèles B, β : pente).
Je teste hypothèse nulle H0: β = 0
38. Dominance et additivité
valeur
du
caractère
mbb
a = (mbb - maa ) /2
mab
d
(mbb + maa ) /2
d = mab - (mbb + maa ) /2
maa
AA AB BB
(Population F2)
40. Localisation des QTL sur la carte génétique
du croisement:
cartographie d’intervalle
Valeur seuil du LOD
V(présence QTL) (a, d)
LOD = log10 --------------------
V(absence QTL) (a=0, d =0)
A chaque point (défini par sa distance aux marqueurs flanquants)
on estime la vraisemblance d’avoir un QTL au voisinage de ce point
41. Tests statistiques de détection de QTL
• Méthode basée sur le maximum de vraisemblance
(Lander and Botstein, 1989)
Test de LOD score (LOD="log of the odd ratio")
L( a , d ) vraisemblance " il y a un QTL"
LOD = log10 = log10
L(a = 0, d = 0) vraisemblance " il n' y a pas de QTL"
• Choix d’un seuil de LOD (2 ou 3), au delà duquel l’existence d’un QTL
est fortement probable
• LOD = 3 : existence d’un QTL 1000 fois plus probable que son absence
LOD
LODscore = 3
Q
42. Exemples de recherche et utilisation
des QTL: végétaux
• Couleur de la tomate et teneur en caroténoïdes
Couleur
Carotène Couleur Couleur 9
Lycopène
Carotène
4a
1
Carotène
2
3
43. Vers la caractérisation des QTL…
• Cartographie fine et clonage de gènes
• exemple chez le riz:
– QTL de sensibilité / photopériode = facteur de
transcription
– Mutation sd-1 (semi-dwarf)= altération dans un gène de
GA-20 oxydase
• exemple chez la tomate:
– QTL de taille du fruit: régulation d ’un gène homologue à
un oncogène, exprimé pendant la floraison
• à compléter par des études biochimiques et de
transformation
44. Génétique d’association
• Même principe que la recherche de QTLs,
mais sur un échantillonnage de la diversité de
l’espèce.
Q
r
M
Q
r
M
2N générations
Analyse par pedigree:
Parents connus
Cartographie d’association:
peu de méioses
Origine inconnue
Liaison génétique
Beaucoup de méioses
45. DL dans les populations
Q M
Au temps t
Q M
Aujourd’hui
Création du DL Réduction du DL
Mutation Recombinaison
Dérive génétique
Sélection La persistance du DL est reliée à la
Migration liaison physique (locus très proches)
Structure de population (!)
46. Principe de la génétique d’association
Recherche d’une association statistique entre le
polymorphisme allélique et la variation phénotypique.
Haplotype 2
A A T A C G A ---------- T
A A T A C G A ---------- T
A A T A C G A ---------- T
A A T A C G A ---------- T
G A T A C A A INDEL C
G A T A C A A INDEL C
Haplotype 1
G A T A C A A INDEL C
G A T A C A A INDEL C
G A T A C A A INDEL C
Panel représentatif de la diversité Haplotypes
Phénotypes
L’intensité de l’association dépend du déséquilibre de
liaison entre marqueurs
47. A la base: le déséquilibre de liaison
Attention!
D’autres paramètres peuvent perturber
l’équilibre de Hardy-Weinberg et les
fréquences au niveau des
populations
– Régimes de reproduction
DL – Migrations
– Mutations
– Sélection
DL = Association non – Dérive génétique
aléatoire entre des allèles • Le but de la génétique des
populations est d’étudier ces
à des locus différents au différents mécanismes et leurs
sein d’une population effets sur l’évolution des fréquences
au sein des populations.
48. Comparaison des approches
Approche QTL (analyse de Génétique d’association
liaison) (déséquilibre de liaison)
- Croisements contrôlés: - Population « naturelles »
⇒ Parents et apparentements ⇒ Parents et apparentements
connus inconnus
- Résolution faible: ⇒ Risque de structuration
⇒ Peu de recombinaisons - Résolution forte
⇒Nb marqueurs faibles ⇒ Bcp de recombinaisons
⇒Nb marqueurs élevés
- Nb allèles faible - Nb allèles élevé
Modèle génétique (analyse simple Modèle génétique:
marqueur): Y=µ+M+ Q+Z+ε
Y=µ+M+ε
M: effet du marqueur
Q: effet de la structure de la population
M: effet du marqueur Z: Effet d’apparentement
49. La SAM s’intéresse à la part génétique du
déterminisme de la variation
X
X
Il faut:
1. Identifier les régions d’intérêt
2. Combiner les meilleurs allèles
50. Mais, avant de lancer un programme de sélection
assistée par marqueurs, il est vivement conseillé
de…
• Prendre la mesure du nombre de déterminants en
cause
• Vérifier l’effet individuel de chaque région d’intérêt
(QTL) et relations d’épistasie
• Vérifier les associations non désirables sur la valeur
agronomique…
51. La sélection assistée par marqueurs
• Exemple: ASI du maïs
(JM Ribaut, 1999)
Différence entre floraison
mâle et femelle
5 QTL identifiés
choix d’un génotype cible
Dans un schéma de rétro-
croisement