Identification in silico des épitopes du sars cov-2
1. 1
Travail élaboré par
Mariem Khalfaoui
Identification in silico des épitopes du SARS-Cov-2 susceptibles d’être
présentés par la molécule HLA classe I
2. Prédire in silico la présence des épitopes appartenant Spike S1 du virus du SARS-cov-2
et susceptibles d’être présentés par les molécules HLA classe I
les deux outils de prédiction Syfpeithi et IEDB
les allèles HLA -A2, A3 et B7 (couvrant 80% de la population humaine)
Objectif
2
3. 3
1.Recherche de la
séquence de la
protéine S1 du Virus
sur NCBI
2.Prédiction
d’épitope sur la base
de données
SYFPEITHI
3.Prédiction
d’épitope sur « The
Immune Epitope
Database » (IEDB)
4. Filtration des
peptides prédits
susceptibles d’être
reconnus comme
peptides du soi
Plan:
4. 1.Recherche de la séquence de la protéine S1 du Virus sur NCBI
2.Prédiction d’épitope sur la base de données SYFPEITHI
2.1 Choix des paramètres de prédiction
2.2 Etapes de prédiction
2.3 Résultats de la prédiction
Affinité à l’allèle HLA-B*07:02
Affinité à l’allèle HLA-A*02:01
Affinité à l’allèle HLA-A*03
3.Prédiction d’épitope sur « The Immune Epitope Database » (IEDB)
3.1. Sélection des paramètres
3.2. Choix des épitopes prédis
3.3.Séqences sélectionnées
4. Filtration des peptides prédits susceptibles d’être reconnus comme peptides du soi ( HLA classe I )
5. Comparaison entre nos résultats de prédiction et les résultats de la littérature
4
5. 1.Recherche de la séquence de la protéine S1 du Virus sur NCBI
2.Prédiction d’épitope sur la base de données SYFPEITHI
2.1 Choix des paramètres de prédiction
2.2 Etapes de prédiction
2.3 Résultats de la prédiction
Affinité à l’allèle HLA-B*07:02
Affinité à l’allèle HLA-A*02:01
Affinité à l’allèle HLA-A*03
3.Prédiction d’épitope sur « The Immune Epitope Database » (IEDB)
3.1. Sélection des paramètres
3.2. Choix des épitopes prédis
3.3.Séqences sélectionnées
4. Filtration des peptides prédits susceptibles d’être reconnus comme peptides du soi ( HLA classe I )
5. Comparaison entre nos résultats de prédiction et les résultats de la littérature
5
6. 1. Recherche de la séquence de la protéine S1 du Virus sur NCBI
6
Parmi 20511 résultats, on choisit une séquence correspondante à la
structure de la chaine A de la protéine S1.
Celle-ci est fixée par un couplage à un anticorps isolé de patients Covid 19
[1] et au fragment Fab de l’anticorps CR3022. En effet, cet anticorps CR3022
ne provient pas d’une personne qui s’est remise de la COVID-19 mais a été
plutôt été obtenu d’une personne qui, il y a près de deux décennies, a survécu
au syndrome respiratoire aigu sévère (SARS). Le virus du SARS, qui a
disparu en 2004 après une brève éclosion chez les humains, est étroitement
lié au nouveau coronavirus qui cause la COVID-19 [2].
https://www.ncbi.nlm.nih.gov/protein/6XC7_A?report=fasta
7. 7
Plus de détails sur l’affinité de cet
anticorps à la protéine Spike S1 figurent sur
l’article cité sur le champ « TITLE » [2]. La
séquence de l’épitope (ci-dessous) est soit copié
directement du lien « FASTA » soit sauvegardé
dans un fichier de format FASTA (Send to).
8. 1.Recherche de la séquence de la protéine S1 du Virus sur NCBI
2.Prédiction d’épitope sur la base de données SYFPEITHI
2.1 Choix des paramètres de prédiction
2.2 Etapes de prédiction
2.3 Résultats de la prédiction
Affinité à l’allèle HLA-B*07:02
Affinité à l’allèle HLA-A*02:01
Affinité à l’allèle HLA-A*03
3.Prédiction d’épitope sur « The Immune Epitope Database » (IEDB)
3.1. Sélection des paramètres
3.2. Choix des épitopes prédis
3.3.Séqences sélectionnées
4. Filtration des peptides prédits susceptibles d’être reconnus comme peptides du soi ( HLA classe I )
5. Comparaison entre nos résultats de prédiction et les résultats de la littérature
8
9. 2.PRÉDICTION D’ÉPITOPE SUR LA BASE DE DONNÉES SYFPEITHI
9
• L’ensemble des gènes HLA sont subdivisés en trois régions du chromosome 6 qui contiennent chacune de nombreux
gènes avec ou sans fonction immunologique. On distingue ainsi la région CMH de classe I, de classe II, et de classe III.
Figure : Présentation schématique des Loci HLA sur le chromosome 6 Humain [3].
• Bien que la longueur des peptides présentés par le HLA I est légèrement affectée par son polymorphisme, les molécules
de HLA I présentent généralement des peptides de 8 à 10 acides aminés de longueur [4]. On choisit ainsi dans notre
approche de rechercher un peptide de 9 acides aminés, spécifique au cluster de différenciation 8 des lymphocytes T.
Notre recherche concerne le sérotype d’antigènes des leucocytes humaines HLA-A*02 :01 et HLA-A*03 :01 du groupe
A et HLA-B*07:02 du groupe B
2.1 Choix des paramètres de prédiction
10. 1.Recherche de la séquence de la protéine S1 du Virus sur NCBI
2.Prédiction d’épitope sur la base de données SYFPEITHI
2.1 Choix des paramètres de prédiction
2.2 Etapes de prédiction
2.3 Résultats de la prédiction
Affinité à l’allèle HLA-B*07:02
Affinité à l’allèle HLA-A*02:01
Affinité à l’allèle HLA-A*03
3.Prédiction d’épitope sur « The Immune Epitope Database » (IEDB)
3.1. Sélection des paramètres
3.2. Choix des épitopes prédis
3.3.Séqences sélectionnées
4. Filtration des peptides prédits susceptibles d’être reconnus comme peptides du soi ( HLA classe I )
5. Comparaison entre nos résultats de prédiction et les résultats de la littérature
10
12. 1.Recherche de la séquence de la protéine S1 du Virus sur NCBI
2.Prédiction d’épitope sur la base de données SYFPEITHI
2.1 Choix des paramètres de prédiction
2.2 Etapes de prédiction
2.3 Résultats de la prédiction
Affinité à l’allèle HLA-B*07:02
Affinité à l’allèle HLA-A*02:01
Affinité à l’allèle HLA-A*03
3.Prédiction d’épitope sur « The Immune Epitope Database » (IEDB)
3.1. Sélection des paramètres
3.2. Choix des épitopes prédis
3.3.Séqences sélectionnées
4. Filtration des peptides prédits susceptibles d’être reconnus comme peptides du soi ( HLA classe I )
5. Comparaison entre nos résultats de prédiction et les résultats de la littérature
12
13. • On peut faire le tri des résultats. (go to top)
• Ainsi seuls les épitopes avec un score supérieur ou égale à 20
(valeur seuil de positivité) seront pris en considération par la suite.
• Les scores sont divisés par 20
• Des histogrammes permettes de visualiser les positions des épitopes
aux meilleurs score
13
2.3. RÉSULTATS DE LA PRÉDICTION:
14. • Pour l’allèle HLA-B*07:02 : Seul un épitope commençant à la
position 93 a montré une affinité à tenir en compte
Affinité à l’allèle HLA-B*07:02
14
15. AFFINITÉ À L’ALLÈLE HLA-A*02:01
15
Le nonamère à la position 99 a le meilleur score suivi par celui à la
position 198. Les autres peptides sont aussi candidats pour la
prédiction
0
0.2
0.4
0.6
0.8
1
1.2
1.4
92 99 115 142 198
1
1.3
1.1
1
1.15
SCORE
(CUTOFF=20)
POSITION DE L'EPITOPE
Scores d'affinité des éventuels épitopes avec l'allèle
HLA-A*02:01
16. AFFINITÉ À L’ALLÈLE HLA-A*03
16
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1 16 31 39 43 48 49 60 76 82 91 136 153 198 199 215
1
1.2
1.05
1.1 1.1 1.1
1.05
1.2
1
1.3
1.35
1.4
1.1
1 1
1.05
SCORE
(CUTOFF=20)
POSITION DE L'EPITOPE
Score d'affinité des épitopes potentiels avec l'alléle
HLA-A*03
Perptides commençant respectivement aux positions 136,91 et
82 possèdent des scores nettement supérieurs au score seuil (
1,4 ; 1,35 ; 1,3)
17. 17
0
0.2
0.4
0.6
0.8
1
1.2
1.4
91 92 93 136 142 198 198
1.35
1 1
1.4
1
0
1
1.15
0
Différents scores des peptides prédits par Sypeithi et susceptibles d’être
présentés par les trois allèles
91
92
93
A03
A02
B07
La position 91, semble être la position du perptide suceptible à être présenté par les 3 allèles
on peut penser à l’augmentation de l’affinité fonctionnelle si on cherche une meilleur représentativité
qu’un meilleur score d’affinité.
18. 18
Possibilité Allèle Position Score
1
HLA-A*03 91 Q I A P G Q T G K 1,35
HLA-A*02:01 92 I A P G Q T G K I 1
HLA-B*07:02 93 A P G Q T G K I A 1
2
HLA-A*03 136 R L F R K S N L K 1,4
HLA-A*02:01 142 N L K P F E R D I 1
3
HLA-A*03 198
E L L H A PA T V
1
HLA-A*02:01 198 1,15
7 aa sont partagés entre les 3 allèles, donc on tranche par le score d’affinité qui est le plus
important avec la position 91 présenté par HLA-A*03
19. 1.Recherche de la séquence de la protéine S1 du Virus sur NCBI
2.Prédiction d’épitope sur la base de données SYFPEITHI
2.1 Choix des paramètres de prédiction
2.2 Etapes de prédiction
2.3 Résultats de la prédiction
Affinité à l’allèle HLA-B*07:02
Affinité à l’allèle HLA-A*02:01
Affinité à l’allèle HLA-A*03
3.Prédiction d’épitope sur « The Immune Epitope Database » (IEDB)
3.1. Sélection des paramètres
3.2. Choix des épitopes prédis
3.3.Séqences sélectionnées
4. Filtration des peptides prédits susceptibles d’être reconnus comme peptides du soi ( HLA classe I )
5. Comparaison entre nos résultats de prédiction et les résultats de la littérature
19
20. 3.PRÉDICTION D’ÉPITOPE SUR « THE IMMUNE EPITOPE
DATABASE » (IEDB)
20
On veille à vérifier les
paramètres suivant ainsi à choisir
le format des données de sortie.
Une sélection multiple est possible
mais dans notre étude, on procède à
une recherche monoallélique.
1. Sélection des paramètres
21. 2. Choix des épitopes prédis
Après tri des scores, on remarques que les 4 premiers
sont de loin plus importants que les restes des scores,
alors on va utiliser par la suite pour le criblage du
meilleur epitope
Pour la prédiction d’épitopes de LT_CMH I, la
sélection des séquences prédits peut être effectuée sur
la base du « Percentile Rank » ou de l'affinité de liaison
au CMH. L'IEDB recommande actuellement de faire
des sélections basées sur un PR <= 1% pour chaque
combinaison (allèle MHC, longueur) pour couvrir la
plupart des réponses immunitaires [6] d’où le choix
des 5 premiers épitopes .
21
22. 2.3. RÉSULTATS DE LA PRÉDICTION
22
Affinité à l’allèle HLA-B*07:02
Allele Start Peptide Score
HLA-
B*07:02
208 GPKKSTN
LV
0.678799
HLA-
B*07:02
3 QPTESIVR
F
0.472976
HLA-
B*07:02
144 KPFERDIS
T
0.328583
HLA-
B*07:02
93 APGQTGKI
A
0.288013
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
3 93 144 208
0.47
0.29
0.33
0.68
Score
93: la position la mieux classée selon
Syfpeithi
23. Allele Start Peptide Score
HLA-
A*02:01
99 KIADYNYKL 0.864611
HLA-
A*02:01
194 VLSFELLHA 0.350734
HLA-
A*02:01
198 ELLHAPATV 0.336419
HLA-
A*02:01
106 KLPDDFTGC 0.334903
HLA-
A*02:01
187 YQPYRVVVL 0.189014
Affinité à l’allèle HLA-A*02:01
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
99 106 187 194 198
0.86
0.33
0.19
0.35 0.34
AXIS
TITLE
AXIS TITLE
iedb
Le Meilleur score obtenu avec Syfpeithi pour cet allèle est aussi pour le peptide à la position 99 .
Son affinité selon ces résultats est beaucoup plus importante que le peptide à la position 198 qui est partagé entre les 3 allèles étudiés
23
24. Allele Start Peptide Score
HLA-A*03:01 136 RLFRKSNLK 0.978678
HLA-A*03:01 91 QIAPGQTGK 0.735412
HLA-A*03:01 31 SVYAWNRKR 0.668534
HLA-A*03:01 60 KCYGVSPTK 0.660274
HLA-A*03:01 211 KSTNLVKNK 0.581593
HLA-A*03:01 52 NSASFSTFK 0.348642
HLA-A*03:01 140 KSNLKPFER 0.256861
HLA-A*03:01 30 ASVYAWNRK 0.224171
HLA-A*03:01 193 VVLSFELLH 0.206719
Affinité à l’allèle HLA-A*03
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
30 31 52 60 91 136 140 193 211
0.22
0.67
0.35
0.66
0.74
0.98
0.26
0.21
0.58
A03
Meilleur affinité avec la position 136: résultats rimant avec ceux obtenus sur la base de données Syfpeithi
24
25. Principaux résultats de la prédiction
Syfpeithi IEDB
Séquence
Position Score Position Score
HLA-A*A02-01
99 1,3 99 1,86 KIADYNYKL
HLA-A*03
136 1,4 136 0,97 RLFRKSNLK
Retenir les résultats confirmés par les 2 Bases De Données
P99: KIADYNYKL
•HLA-A*A02-01
P136: RLFRKSNLK
•HLA-A*03 25
26. 1.Recherche de la séquence de la protéine S1 du Virus sur NCBI
2.Prédiction d’épitope sur la base de données SYFPEITHI
2.1 Choix des paramètres de prédiction
2.2 Etapes de prédiction
2.3 Résultats de la prédiction
Affinité à l’allèle HLA-B*07:02
Affinité à l’allèle HLA-A*02:01
Affinité à l’allèle HLA-A*03
3.Prédiction d’épitope sur « The Immune Epitope Database » (IEDB)
3.1. Sélection des paramètres
3.2. Choix des épitopes prédis
3.3.Séqences sélectionnées
4. Filtration des peptides prédits susceptibles d’être reconnus comme peptides du soi ( HLA classe I )
5. Comparaison entre nos résultats de prédiction et les résultats de la littérature
26
27. 4. Filtration des peptides prédits susceptibles d’être reconnus
comme peptides du soi
Sur Blastn: Vérification
27
29. 29
Tir et sélection des peptides des 2 antigènes prédits
susceptibles d’être présentés par les 2 allèles
Vérification
qu’ils
s’agissent
de « non
soi »
Prédiction
par l’outil
en ligne de
Sypeithi
Prédiction
par l’outil
en ligne de
IEDB
30. Principaux résultats de la prédiction
Syfpeithi IEDB
Séquence
Position Score Position Score
HLA-A*A02-01
99 1,3 99 1,86 KIADYNYKL
HLA-A*03
136 1,4 136 0,97 RLFRKSNLK
Les 2 peptides retenus
P99: KIADYNYKL
•HLA-A*A02-01
P136: RLFRKSNLK
•HLA-A*03 30
31. 1.Recherche de la séquence de la protéine S1 du Virus sur NCBI
2.Prédiction d’épitope sur la base de données SYFPEITHI
2.1 Choix des paramètres de prédiction
2.2 Etapes de prédiction
2.3 Résultats de la prédiction
Affinité à l’allèle HLA-B*07:02
Affinité à l’allèle HLA-A*02:01
Affinité à l’allèle HLA-A*03
3.Prédiction d’épitope sur « The Immune Epitope Database » (IEDB)
3.1. Sélection des paramètres
3.2. Choix des épitopes prédis
3.3.Séqences sélectionnées
4. Filtration des peptides prédits susceptibles d’être reconnus comme peptides du soi ( HLA classe I )
5. Comparaison entre nos résultats de prédiction et les résultats de la littérature
31
32. 32
5. Comparaison entre nos résultats de prédiction et les résultats
de la littérature
Notre Travail Travail publié
HLA-A*A02-01
Séquence Position Séquence Position
KIADYNYKL 99 KIADYNYKL 436 [7]
KIADYNYKL 102 [8]
HLA-A*03
LFRKSNLK 454 [9]
La position est différente puisque dans notre travail on a considéré juste la chaine A alors dans le
travail de Othar et al. a englobé toute la séquence du Spike
34. 34
Conclusion
Des idées :
-déjà criblés dans la literétture
-prouvés non allergène
-can be used as epitope-based peptide vaccines
35. 35
[1] Fagiani, F., Catanzaro, M. & Lanni, C. Molecular features of IGHV3-53-encoded antibodies elicited by SARS-CoV-
2. Sig Transduct Target Ther 5, 170 (2020). https://doi.org/10.1038/s41392-020-00287-4
[2]Yuan, M., Wu, N. C., Zhu, X., Lee, C. D., So, R., Lv, H., Mok, C., & Wilson, I. A. (2020). A highly conserved cryptic
epitope in the receptor binding domains of SARS-CoV-2 and SARS-CoV. Science (New York, N.Y.), 368(6491), 630–
633. https://doi.org/10.1126/science.abb7269
[3] Huo, J., Zhao, Y., Ren, J., Zhou, D., Duyvesteyn, H., Ginn, H. M., Carrique, L., Malinauskas, T., Ruza, R. R., Shah,
P., Tan, T. K., Rijal, P., Coombes, N., Bewley, K. R., Tree, J. A., Radecke, J., Paterson, N. G., Supasa, P.,
Mongkolsapaya, J., Screaton, G. R., … Stuart, D. I. (2020). Neutralization of SARS-CoV-2 by Destruction of the
Prefusion Spike. Cell host & microbe, 28(3), 445–454.e6. https://doi.org/10.1016/j.chom.2020.06.010
[4] Blervaque, R. (2014). Le typage HLA à l’ère du sequence à haut-débit.http://www.biorigami.com/?p=6737
Références (1/3)
36. 36
[5] Rist, M. J., Theodossis, A., Croft, N. P., Neller, M. A., Welland, A., Chen, Z., Sullivan, L. C., Burrows, J. M., Miles, J.
J., Brennan, R. M., Gras, S., Khanna, R., Brooks, A. G., McCluskey, J., Purcell, A. W., Rossjohn, J., & Burrows, S. R.
(2013). HLA peptide length preferences control CD8+ T cell responses. Journal of immunology (Baltimore, Md.:
1950), 191(2), 561–571. https://doi.org/10.4049/jimmunol.1300292
[6] Fleri, W., Selecting thresholds (cut-offs) for MHC class I and II binding predictions https://help.iedb.org/hc/en-
us/articles/114094151811-Selecting-thresholds-cut-offs-for-MHC-class-I-and-II-binding-predictions
[7] Odhar, H. A., Ahjel, S. W., & Humadi, S. S. (2020). Towards the design of epitope candidates for Coronavirus
2. Bioinformation, 16(5), 375–386. https://doi.org/10.6026/97320630016375
[8] Hasan, Mehedi & Shihab, Md Maksudur. (2020). Prediction of B-cell and T-cell epitopes in the spike glycoprotein
of SARS-CoV-2 in Bangladesh: An in-silico approach. 3. 49-56.
Références (2/3)
37. 37
Références (3/3)
[9] Sarkar, B., Ullah, M. A., Johora, F. T., Taniya, M. A., & Araf, Y. (2020). Immunoinformatics-guided designing of
epitope-based subunit vaccines against the SARS Coronavirus-2 (SARS-CoV-2). Immunobiology, 225(3), 151955.
https://doi.org/10.1016/j.imbio.2020.151955
[10] Singh, J., Malik, D., & Raina, A. (2021). Immuno-informatics approach for B-cell and T-cell epitope based
peptide vaccine design against novel COVID-19 virus. Vaccine, 39(7), 1087–1095.
https://doi.org/10.1016/j.vaccine.2021.01.011