Définition et analyse de graphes
d’interactions de gènes pour la qualité de
la viande de porc ; relations avec le PH
Nathal...
Présentation générale
1 Les données
2 Principe général de construction d’un graphe
d’interactions
3 Analyse du graphe d’in...
Les données
Sommaire
1 Les données
2 Principe général de construction d’un graphe
d’interactions
3 Analyse du graphe d’int...
Les données
Production d’animaux F2 avec des fac-
teurs de variation génétique
F0 : 16 ♂ (Piétrain) × 28 ♀ (Synthétique)
F...
Les données
Production d’animaux F2 avec des fac-
teurs de variation génétique
F0 : 16 ♂ (Piétrain) × 28 ♀ (Synthétique)
F...
Les données
Premières extractions des données
1 Les données ont été normalisées et les valeurs manquantes
complétées ;
5 /...
Les données
Premières extractions des données
1 Les données ont été normalisées et les valeurs manquantes
complétées ;
2 U...
Les données
Premières extractions des données
1 Les données ont été normalisées et les valeurs manquantes
complétées ;
2 U...
Les données
Premières extractions des données
1 Les données ont été normalisées et les valeurs manquantes
complétées ;
2 U...
Les données
Premières extractions des données
1 Les données ont été normalisées et les valeurs manquantes
complétées ;
2 U...
Principe général de construction d’un graphe d’interactions
Sommaire
1 Les données
2 Principe général de construction d’un...
Principe général de construction d’un graphe d’interactions
Des gènes aux réseaux de gènes
Intérêt : Détecter et analyser ...
Principe général de construction d’un graphe d’interactions
Des gènes aux réseaux de gènes
Intérêt : Détecter et analyser ...
Principe général de construction d’un graphe d’interactions
Corrélations, corrélations partielles
Problème : Le calcul dir...
Principe général de construction d’un graphe d’interactions
Corrélations, corrélations partielles
Problème : Le calcul dir...
Principe général de construction d’un graphe d’interactions
Corrélations, corrélations partielles
Problème : Le calcul dir...
Principe général de construction d’un graphe d’interactions
Corrélations, corrélations partielles
Problème : Le calcul dir...
Principe général de construction d’un graphe d’interactions
Estimation des corrélations partielles
[Schäfer and Strimmer, ...
Principe général de construction d’un graphe d’interactions
Estimation des corrélations partielles
[Schäfer and Strimmer, ...
Principe général de construction d’un graphe d’interactions
Estimation des corrélations partielles
[Schäfer and Strimmer, ...
Principe général de construction d’un graphe d’interactions
Mise en œuvre de la méthode
La méthode a été mise en œuvre pou...
Principe général de construction d’un graphe d’interactions
Mise en œuvre de la méthode
La méthode a été mise en œuvre pou...
Principe général de construction d’un graphe d’interactions
Mise en œuvre de la méthode
La méthode a été mise en œuvre pou...
Analyse du graphe d’interactions des gènes régulés par un eQTL
Sommaire
1 Les données
2 Principe général de construction d...
Analyse du graphe d’interactions des gènes régulés par un eQTL
Description basique du graphe
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q...
Analyse du graphe d’interactions des gènes régulés par un eQTL
Analyse des degrés des sommets
Degré d’un sommet : Nombre d...
Analyse du graphe d’interactions des gènes régulés par un eQTL
Analyse des degrés des sommets
Degré d’un sommet : Nombre d...
Analyse du graphe d’interactions des gènes régulés par un eQTL
Analyse des indices de centralité
Centralité d’un sommet : ...
Analyse du graphe d’interactions des gènes régulés par un eQTL
Analyse des indices de centralité
Gènes de plus fortes cent...
Analyse du graphe d’interactions des gènes régulés par un eQTL
Comparaison entre les deux listes
8 gènes sont en commun da...
Analyse du graphe d’interactions des gènes régulés par un eQTL
Principe de la classification de sommets
But : Faire des gro...
Analyse du graphe d’interactions des gènes régulés par un eQTL
Principe de la classification de sommets
But : Faire des gro...
Analyse du graphe d’interactions des gènes régulés par un eQTL
Méthodologie et résultats
Plusieurs nombres de classes (de ...
Analyse du graphe d’interactions des gènes régulés par un eQTL
Méthodologie et résultats
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q...
Analyse du graphe d’interactions des gènes régulés par un eQTL
Méthodologie et résultats
q
q
q
qq q
qq
q
q
q
qq
q
q
q
q
q
...
Analyse du graphe d’interactions des gènes régulés par un eQTL
Méthodologie et résultats
q
q
q
qq
q
q q
q
q
q
q
q
q
q
q
q
...
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Sommaire
1 Les données
2 Principe général d...
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Données, but
But : Comprendre si et comment...
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Données, but
But : Comprendre si et comment...
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Relation entre PH et classification
qq
q
q
q...
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Relation entre PH et classification
qq
q
q
q...
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Relation entre PH et classes
Deux exemples ...
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Auto-corrélation spatiale dans le réseau
po...
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Auto-corrélation spatiale dans le réseau
po...
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Auto-corrélation spatiale dans le réseau
po...
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Significativité de I
Il existe un résultat d...
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Significativité de I
Il existe un résultat d...
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Résultat sur les données étudiées
Moran's I...
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Résultat sur les données étudiées
Moran's I...
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Résultat sur les données étudiées
Moran's I...
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Avec la valeur absolue...
Moran's I
Frequen...
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Diagramme de Moran pour mettre en
valeur le...
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Diagramme de Moran pour mettre en
valeur le...
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Où sont les gènes influents ?
q
q
q
q
q
q
q
...
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Où sont les gènes influents ?
q
q
q
qq q
qq
...
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Où sont les gènes influents ?
q
q
q
q
q
q
q
...
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Où sont les gènes influents ?
q
q
q
q
q
q
q
...
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Où sont les gènes influents ?
q
q
q
q
q
q
q
...
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Où sont les gènes influents ?
q
q
q
q
q
q
q
...
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Où sont les gènes influents ?
q
q
q
qq
q
q q...
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Où sont les gènes influents ?
q
q
q
q
q
q
q
...
Moran, P. (1950).
Notes on continuous stochastic phenomena.
Biometrika, 37:17–23.
Schäfer, J. and Strimmer, K. (2005).
An ...
Prochain SlideShare
Chargement dans…5
×

Définition et analyse de graphes d’interactions de gènes pour la qualité de la viande de porc ; relations avec le PH

339 vues

Publié le

January 15th, 2011
Groupe de travail BioPuces, INRA d’Auzeville

Publié dans : Sciences
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
339
Sur SlideShare
0
Issues des intégrations
0
Intégrations
36
Actions
Partages
0
Téléchargements
3
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Définition et analyse de graphes d’interactions de gènes pour la qualité de la viande de porc ; relations avec le PH

  1. 1. Définition et analyse de graphes d’interactions de gènes pour la qualité de la viande de porc ; relations avec le PH Nathalie Villa-Vialaneix http://www.nathalievilla.org IUT de Carcassonne (UPVD) & Institut de Mathématiques de Toulouse Groupe de travail BioPuces, INRA de Castanet 14 Janvier 2011 1 / 27 Nathalie Villa-Vialaneix
  2. 2. Présentation générale 1 Les données 2 Principe général de construction d’un graphe d’interactions 3 Analyse du graphe d’interactions des gènes régulés par un eQTL Analyse descriptive Classification des sommets 4 Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale 2 / 27 Nathalie Villa-Vialaneix
  3. 3. Les données Sommaire 1 Les données 2 Principe général de construction d’un graphe d’interactions 3 Analyse du graphe d’interactions des gènes régulés par un eQTL Analyse descriptive Classification des sommets 4 Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale 3 / 27 Nathalie Villa-Vialaneix
  4. 4. Les données Production d’animaux F2 avec des fac- teurs de variation génétique F0 : 16 ♂ (Piétrain) × 28 ♀ (Synthétique) F1 : 17 ♂ × 62 ♀ F2 : 1200 animaux structurés par lignée de père Prélèvement de tissus (dont longissimus dorsi) Mesures phénotypiques (30) (force de cisaillement, PH ...) 4 / 27 Nathalie Villa-Vialaneix
  5. 5. Les données Production d’animaux F2 avec des fac- teurs de variation génétique F0 : 16 ♂ (Piétrain) × 28 ♀ (Synthétique) F1 : 17 ♂ × 62 ♀ F2 : 1200 animaux structurés par lignée de père Prélèvement de tissus (dont longissimus dorsi) Mesures phénotypiques (30) (force de cisaillement, PH ...) Données retenues : Une famille de 57 individus F2 (plus forte variabilité pour force de cisaillement et PH) ; transcri. 2 464 gènes. 4 / 27 Nathalie Villa-Vialaneix
  6. 6. Les données Premières extractions des données 1 Les données ont été normalisées et les valeurs manquantes complétées ; 5 / 27 Nathalie Villa-Vialaneix
  7. 7. Les données Premières extractions des données 1 Les données ont été normalisées et les valeurs manquantes complétées ; 2 Une nomenclature par défaut pour les gènes (non validée précisément) a été définie sur la base de plusieurs types d’annotations, en plus de la référence au spot ; 5 / 27 Nathalie Villa-Vialaneix
  8. 8. Les données Premières extractions des données 1 Les données ont été normalisées et les valeurs manquantes complétées ; 2 Une nomenclature par défaut pour les gènes (non validée précisément) a été définie sur la base de plusieurs types d’annotations, en plus de la référence au spot ; 3 Les gènes régulés par un eQTL ont été extraits : 272 gènes sont réputés régulés par un eQTL ; 5 / 27 Nathalie Villa-Vialaneix
  9. 9. Les données Premières extractions des données 1 Les données ont été normalisées et les valeurs manquantes complétées ; 2 Une nomenclature par défaut pour les gènes (non validée précisément) a été définie sur la base de plusieurs types d’annotations, en plus de la référence au spot ; 3 Les gènes régulés par un eQTL ont été extraits : 272 gènes sont réputés régulés par un eQTL ; 4 Les gènes différentiellement exprimés pour le PH ont été extraits : 23 gènes sont réuputés différentiellement exprimés pour le PH. 5 / 27 Nathalie Villa-Vialaneix
  10. 10. Les données Premières extractions des données 1 Les données ont été normalisées et les valeurs manquantes complétées ; 2 Une nomenclature par défaut pour les gènes (non validée précisément) a été définie sur la base de plusieurs types d’annotations, en plus de la référence au spot ; 3 Les gènes régulés par un eQTL ont été extraits : 272 gènes sont réputés régulés par un eQTL ; 4 Les gènes différentiellement exprimés pour le PH ont été extraits : 23 gènes sont réuputés différentiellement exprimés pour le PH. Remarque : 2 gènes différentiellement exprimés pour le PH sont régulés par un eQTL ; il s’agit de D04-D07 (BX671434) et de N01-C04 (ZRANB1). 5 / 27 Nathalie Villa-Vialaneix
  11. 11. Principe général de construction d’un graphe d’interactions Sommaire 1 Les données 2 Principe général de construction d’un graphe d’interactions 3 Analyse du graphe d’interactions des gènes régulés par un eQTL Analyse descriptive Classification des sommets 4 Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale 6 / 27 Nathalie Villa-Vialaneix
  12. 12. Principe général de construction d’un graphe d’interactions Des gènes aux réseaux de gènes Intérêt : Détecter et analyser les réseaux de gènes impliqués dans une ou plusieurs fonctions biologiques. 7 / 27 Nathalie Villa-Vialaneix
  13. 13. Principe général de construction d’un graphe d’interactions Des gènes aux réseaux de gènes Intérêt : Détecter et analyser les réseaux de gènes impliqués dans une ou plusieurs fonctions biologiques. Que modélise un réseau de gènes ? Sommets : Gènes Arêtes : Corrélation forte dans l’expression des deux gènes 7 / 27 Nathalie Villa-Vialaneix
  14. 14. Principe général de construction d’un graphe d’interactions Corrélations, corrélations partielles Problème : Le calcul direct des corrélations entre deux gènes peut être perturbé par des relations communes indirectes qui ne sont pas révélatrices d’un phénomène biologique. 8 / 27 Nathalie Villa-Vialaneix
  15. 15. Principe général de construction d’un graphe d’interactions Corrélations, corrélations partielles Problème : Le calcul direct des corrélations entre deux gènes peut être perturbé par des relations communes indirectes qui ne sont pas révélatrices d’un phénomène biologique. Solution courante : Modèle graphique Gaussien H : La matrice d’expression des gènes, X, est issue d’une distribution N(µ, Σ) ; Quantité d’intérêt : Les corrélations partielles, i.e., πij = Cor(Xi , Xj |(Xk )k i,j) ; 8 / 27 Nathalie Villa-Vialaneix
  16. 16. Principe général de construction d’un graphe d’interactions Corrélations, corrélations partielles Problème : Le calcul direct des corrélations entre deux gènes peut être perturbé par des relations communes indirectes qui ne sont pas révélatrices d’un phénomène biologique. Solution courante : Modèle graphique Gaussien H : La matrice d’expression des gènes, X, est issue d’une distribution N(µ, Σ) ; Quantité d’intérêt : Les corrélations partielles, i.e., πij = Cor(Xi , Xj |(Xk )k i,j) ; Sous H, πij = −wij √ wii wjj avec Σ−1 = (wij)i,j. 8 / 27 Nathalie Villa-Vialaneix
  17. 17. Principe général de construction d’un graphe d’interactions Corrélations, corrélations partielles Problème : Le calcul direct des corrélations entre deux gènes peut être perturbé par des relations communes indirectes qui ne sont pas révélatrices d’un phénomène biologique. Solution courante : Modèle graphique Gaussien H : La matrice d’expression des gènes, X, est issue d’une distribution N(µ, Σ) ; Quantité d’intérêt : Les corrélations partielles, i.e., πij = Cor(Xi , Xj |(Xk )k i,j) ; Sous H, πij = −wij √ wii wjj avec Σ−1 = (wij)i,j. Problème important : Estimation et inversion de Σ ! 8 / 27 Nathalie Villa-Vialaneix
  18. 18. Principe général de construction d’un graphe d’interactions Estimation des corrélations partielles [Schäfer and Strimmer, 2005] Estimation des corrélations partielles par boostrap (package R “GeneNet”) : Répéter 1 Générer un échantillon bootstrap b∗ dans les données initiales ; 2 Déterminer la variance empirique sur l’échantillon boostrap, ˆΣb∗ ; 3 Calculer le pseudo-inverse de ˆΣb∗ , ˆWb∗ puis ˆΠb∗ ; 9 / 27 Nathalie Villa-Vialaneix
  19. 19. Principe général de construction d’un graphe d’interactions Estimation des corrélations partielles [Schäfer and Strimmer, 2005] Estimation des corrélations partielles par boostrap (package R “GeneNet”) : Répéter 1 Générer un échantillon bootstrap b∗ dans les données initiales ; 2 Déterminer la variance empirique sur l’échantillon boostrap, ˆΣb∗ ; 3 Calculer le pseudo-inverse de ˆΣb∗ , ˆWb∗ puis ˆΠb∗ ; Estimer Π par la moyenne des ˆΠb∗ . 9 / 27 Nathalie Villa-Vialaneix
  20. 20. Principe général de construction d’un graphe d’interactions Estimation des corrélations partielles [Schäfer and Strimmer, 2005] Estimation des corrélations partielles par boostrap (package R “GeneNet”) : Répéter 1 Générer un échantillon bootstrap b∗ dans les données initiales ; 2 Déterminer la variance empirique sur l’échantillon boostrap, ˆΣb∗ ; 3 Calculer le pseudo-inverse de ˆΣb∗ , ˆWb∗ puis ˆΠb∗ ; Estimer Π par la moyenne des ˆΠb∗ . Combien d’observations pour estimer correctement Π ? 9 / 27 Nathalie Villa-Vialaneix
  21. 21. Principe général de construction d’un graphe d’interactions Mise en œuvre de la méthode La méthode a été mise en œuvre pour définir trois graphes : graphe d’interactions des gènes régulés par un eQTL (272 sommets) ; graphe d’interactions des gènes différentiellement exprimés pour le PH (23 sommets) ; graphe d’interactions des gènes régulés par un eQTL ou différentiellement exprimés pour le PH (293 sommets). 10 / 27 Nathalie Villa-Vialaneix
  22. 22. Principe général de construction d’un graphe d’interactions Mise en œuvre de la méthode La méthode a été mise en œuvre pour définir trois graphes : graphe d’interactions des gènes régulés par un eQTL (272 sommets) ; graphe d’interactions des gènes différentiellement exprimés pour le PH (23 sommets) ; graphe d’interactions des gènes régulés par un eQTL ou différentiellement exprimés pour le PH (293 sommets). Une procédure de bootstrap (4 000 répétitions d’échantillons bootstrap de 20 cochons) a été programmée pour estimer les corrélations partielles (fonction ggm.estimate du package GeneNet). 10 / 27 Nathalie Villa-Vialaneix
  23. 23. Principe général de construction d’un graphe d’interactions Mise en œuvre de la méthode La méthode a été mise en œuvre pour définir trois graphes : graphe d’interactions des gènes régulés par un eQTL (272 sommets) ; graphe d’interactions des gènes différentiellement exprimés pour le PH (23 sommets) ; graphe d’interactions des gènes régulés par un eQTL ou différentiellement exprimés pour le PH (293 sommets). Une procédure de bootstrap (4 000 répétitions d’échantillons bootstrap de 20 cochons) a été programmée pour estimer les corrélations partielles (fonction ggm.estimate du package GeneNet). Un graphe d’interactions est construit dans lequel les arêtes sont les corrélations partielles significatives (test de significativité de la fonction ggm.test.edges, basé sur une approche bayésienne). 10 / 27 Nathalie Villa-Vialaneix
  24. 24. Analyse du graphe d’interactions des gènes régulés par un eQTL Sommaire 1 Les données 2 Principe général de construction d’un graphe d’interactions 3 Analyse du graphe d’interactions des gènes régulés par un eQTL Analyse descriptive Classification des sommets 4 Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale 11 / 27 Nathalie Villa-Vialaneix
  25. 25. Analyse du graphe d’interactions des gènes régulés par un eQTL Description basique du graphe q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q 272 sommets (connexe) ; Densité : 6,4 % ; Transitivité : 25,4 % 12 / 27 Nathalie Villa-Vialaneix
  26. 26. Analyse du graphe d’interactions des gènes régulés par un eQTL Analyse des degrés des sommets Degré d’un sommet : Nombre d’arêtes afférentes au sommet. Histogramme des degrés Degrés Frequency 5 10 15 20 25 30 010203040 13 / 27 Nathalie Villa-Vialaneix
  27. 27. Analyse du graphe d’interactions des gènes régulés par un eQTL Analyse des degrés des sommets Degré d’un sommet : Nombre d’arêtes afférentes au sommet. Gènes de plus forts degrés : 21 gènes identifiés q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q PCBP2_MOUSE RPL7L1 N4BP2TRIAP1 SLA−1 TPM3 SLC39A14 SSR4 BX921641 BX672573AW359912 GPI BX915888 BMPR2 UTP23 SUZ12 FTH1 MGP DGKI PRDX4 BX670979 13 / 27 Nathalie Villa-Vialaneix
  28. 28. Analyse du graphe d’interactions des gènes régulés par un eQTL Analyse des indices de centralité Centralité d’un sommet : Nombre de plus courts chemins entre deux sommets du graphe passant par le sommet d’intérêt ⇒ Mesure de l’importance du sommet dans la connectivité du graphe. Indices de centralité des degrés q q qq qqqqq qqqqqqqqqqqqq qqq qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq 0 50 100 150 200 250 0100200300400500 Rang Indicedecentralité 14 / 27 Nathalie Villa-Vialaneix
  29. 29. Analyse du graphe d’interactions des gènes régulés par un eQTL Analyse des indices de centralité Gènes de plus fortes centralités : 25 gènes identifiés q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q BX922566 BX676386 CCAR1 BX676495 FAM151B TRIAP1 BX922608 SLC39A14 SSR4 CLTA BX921641 BX922995 GPI BI359863 SUZ12 FTH1 MGP BX914936 SON UBE2H FADD ROCK2 PRDX4RNASEK BX924180 14 / 27 Nathalie Villa-Vialaneix
  30. 30. Analyse du graphe d’interactions des gènes régulés par un eQTL Comparaison entre les deux listes 8 gènes sont en commun dans les deux listes : BX921641 ; FTH1 ; TRIAP1 ; SLC9A14 ; GPI ; SUZ12 ; MGP ; PRDX4 Reconnaissez-vous des amis ? 15 / 27 Nathalie Villa-Vialaneix
  31. 31. Analyse du graphe d’interactions des gènes régulés par un eQTL Principe de la classification de sommets But : Faire des groupes de sommets fortement connectés entre eux et faiblement connectés aux autres. 16 / 27 Nathalie Villa-Vialaneix
  32. 32. Analyse du graphe d’interactions des gènes régulés par un eQTL Principe de la classification de sommets But : Faire des groupes de sommets fortement connectés entre eux et faiblement connectés aux autres. Méthode utilisée : Suite au travail d’Adrien, optimisation de la modularité par un algorithme de recuit simulé (comme dans [Villa et al., 2009]) car : la modularité est une mesure de la densité des classes qui tient compte du degré des sommets : il est moins exceptionnel d’être lié à un hub qu’à un sommet de faible degré donc le coût de “couper” une arête connecté à un hub doit être plus faible. l’algorithme de recuit simulé est très facile à mettre en œuvre même si il peut être long. Il est bien adapté à des graphes de cette taille. 16 / 27 Nathalie Villa-Vialaneix
  33. 33. Analyse du graphe d’interactions des gènes régulés par un eQTL Méthodologie et résultats Plusieurs nombres de classes (de 4 à 12) ont été testées et la solution avec plus forte modularité a été conservée. Répartition du nombre de sommets dans les classes Numéro de classe 1 2 3 4 5 6 7 Nombre de sommets 33 44 58 28 41 28 40 modularité = 0,395 17 / 27 Nathalie Villa-Vialaneix
  34. 34. Analyse du graphe d’interactions des gènes régulés par un eQTL Méthodologie et résultats q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q 1 2 3 4 5 6 7 17 / 27 Nathalie Villa-Vialaneix
  35. 35. Analyse du graphe d’interactions des gènes régulés par un eQTL Méthodologie et résultats q q q qq q qq q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q 17 / 27 Nathalie Villa-Vialaneix
  36. 36. Analyse du graphe d’interactions des gènes régulés par un eQTL Méthodologie et résultats q q q qq q q q q q q q q q q q q q q q q q q q q q q q CCDC56 RPL7L1 AGPS BF442271FBXL3 MYH2 N4BP2 BX674324 X91724 CCAR1 SLA−1 TPM3 SSR4 BX672573 AW359912 BX674550 BX915888 BMPR2 UTP23 FTH1 STC1 MGP BX671472 DGKI RPL27A ATP2A1 BX670979 BX674399 28 nodes 294 edges Density: 77.8% Transitivity: 85.6% 17 / 27 Nathalie Villa-Vialaneix
  37. 37. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Sommaire 1 Les données 2 Principe général de construction d’un graphe d’interactions 3 Analyse du graphe d’interactions des gènes régulés par un eQTL Analyse descriptive Classification des sommets 4 Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale 18 / 27 Nathalie Villa-Vialaneix
  38. 38. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Données, but But : Comprendre si et comment un phénotype d’intérêt (le PH de la viande) influence la manière dont des gènes, sélectionnés sur des caractéristiques génétiques, sont organisés entre eux. 19 / 27 Nathalie Villa-Vialaneix
  39. 39. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Données, but But : Comprendre si et comment un phénotype d’intérêt (le PH de la viande) influence la manière dont des gènes, sélectionnés sur des caractéristiques génétiques, sont organisés entre eux. Données : Le réseau de co-expression de gènes étudié précédemment et, pour chacun des 272 sommets, sa corrélation (partielle) avec le PH. q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q 19 / 27 Nathalie Villa-Vialaneix
  40. 40. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Relation entre PH et classification qq q q q q q q q qq q q q q q q 1 2 3 4 5 6 7 −0.02−0.010.000.010.020.03 Cluster PartialcorrelationwithPH 20 / 27 Nathalie Villa-Vialaneix
  41. 41. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Relation entre PH et classification qq q q q q q q q qq q q q q q q 1 2 3 4 5 6 7 −0.02−0.010.000.010.020.03 Cluster PartialcorrelationwithPH ANOVA non significative mais test de Student pour le modèle linéaire donne un niveau de signification élevé pour le coefficient correspondant à la classe 4. 20 / 27 Nathalie Villa-Vialaneix
  42. 42. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Relation entre PH et classes Deux exemples : q q q qq q qq q q q q q q q q q q q q q q q q q q q q q q q q q BX925971 RRAS BX922566 SEC24ABX671434 PATL1 BX671687BX672338 ACOX1 APITD1 BX923543 XRCC6 NUDT21 Neb CLTA BX667801 BX671017 BX674989 BX675907 BX665214 BX675319 CSDE1 BX671545 TACC1 BX915330 ALDH2 HIAT1 scaj0012.o.01 PPIA BX923052 SLA−1 FADD TMEM201 q q q q q q q q q q q q q q q q q q q q q q q q q q q q BX919092 PSMC3IP THRB XIAP ARHGAP8 X91721 BX917912 EAPP LSM2 BX922053 BX922491 H2AFY ENH_RAT LMF1 FTCD BX925690 B2M GPI BX667979 BX920538 BX671131 RNF2 BX673501 KPNA1 BX674063 BX918923 RPS11 UBE2H Classe 1 Classe 4 Remarque : Beaucoup des gènes avec une forte corrélation positive avec le PH se trouvent dans la classe 4. 21 / 27 Nathalie Villa-Vialaneix
  43. 43. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Auto-corrélation spatiale dans le réseau pour la relation avec le PH : I de Moran [Moran, 1950] a introduit une mesure de corrélation spatiale nommée le I (de Moran): I = 1 2m i j wij¯ci¯cj 1 n i ¯c2 i où m = 1 2 i j wij (total des poids dans le réseau), ci est la corrélation partielle du gène i avec le PH et ¯ci = ci − ¯c avec ¯c = 1 n i ci. 22 / 27 Nathalie Villa-Vialaneix
  44. 44. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Auto-corrélation spatiale dans le réseau pour la relation avec le PH : I de Moran [Moran, 1950] a introduit une mesure de corrélation spatiale nommée le I (de Moran): I = 1 2m i j wij¯ci¯cj 1 n i ¯c2 i où m = 1 2 i j wij (total des poids dans le réseau), ci est la corrélation partielle du gène i avec le PH et ¯ci = ci − ¯c avec ¯c = 1 n i ci. Interprétation : Quand I est “grand”, les sommets ont tendance à être reliés à des sommets dont la valeur de ci est similaire; quand I est “petit”, les sommets ont tendance à être reliés à des sommets dont la valeur de ci est très différente. Un I “moyen” signifie qu’il n’y a pas de relation entre les valeurs (ci)i et la structure du réseau. 22 / 27 Nathalie Villa-Vialaneix
  45. 45. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Auto-corrélation spatiale dans le réseau pour la relation avec le PH : I de Moran [Moran, 1950] a introduit une mesure de corrélation spatiale nommée le I (de Moran): I = 1 2m i j wij¯ci¯cj 1 n i ¯c2 i où m = 1 2 i j wij (total des poids dans le réseau), ci est la corrélation partielle du gène i avec le PH et ¯ci = ci − ¯c avec ¯c = 1 n i ci. Interprétation : Quand I est “grand”, les sommets ont tendance à être reliés à des sommets dont la valeur de ci est similaire; quand I est “petit”, les sommets ont tendance à être reliés à des sommets dont la valeur de ci est très différente. Un I “moyen” signifie qu’il n’y a pas de relation entre les valeurs (ci)i et la structure du réseau. 22 / 27 Nathalie Villa-Vialaneix
  46. 46. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Significativité de I Il existe un résultat de normalité asymptotique pour I (mais sous des conditions particulières et pour des réseaux assez grands). On utilise une simulation de Monte Carlo pour estimer la p-value de I. 23 / 27 Nathalie Villa-Vialaneix
  47. 47. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Significativité de I Il existe un résultat de normalité asymptotique pour I (mais sous des conditions particulières et pour des réseaux assez grands). On utilise une simulation de Monte Carlo pour estimer la p-value de I. Méthode : permutation aléatoire des valeurs de ci entre les sommets du graphe, P fois (P grand) ; ⇒ calcul de P valeurs du I de Moran et détermination de la distribution empirique ; comparaison avec la valeur observée. 23 / 27 Nathalie Villa-Vialaneix
  48. 48. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Résultat sur les données étudiées Moran's I Frequency −0.05 0.00 0.05 0.10 0.15 0.20 050100150 Le I de Moran est significativement élevé : les gènes ont tendance à être liés à des gènes pour lesquels la corrélation avec le PH est très similaire. 24 / 27 Nathalie Villa-Vialaneix
  49. 49. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Résultat sur les données étudiées Moran's I Frequency −0.05 0.00 0.05 0.10 0.15 0.20 050100150 Interprétation possible : Les quelques gènes fortement corrélés positivement avec le PH sont tous dans la même classe (i.e., ils sont fortement liés). 24 / 27 Nathalie Villa-Vialaneix
  50. 50. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Résultat sur les données étudiées Moran's I Frequency −0.05 0.00 0.05 0.10 0.15 0.20 050100150 Remarque, question : Peut-être qu’il serait plus pertinent de faire ce test avec (|ci|)i plutôt qu’avec (ci)i ??? 24 / 27 Nathalie Villa-Vialaneix
  51. 51. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Avec la valeur absolue... Moran's I Frequency −0.05 0.00 0.05 0.10 0.15 050100150 Le I de Moran est également significativement élevé : les gènes ont tendance à être liés à des gènes pour lesquels la corrélation (en valeur absolue) avec le PH est très similaire (les gènes très corrélés sont liés à des gènes très corrélés et inversement). 25 / 27 Nathalie Villa-Vialaneix
  52. 52. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Diagramme de Moran pour mettre en valeur les gènes influents pour la cor- rélation avec le PH q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q qqq q q q q q q q q q q q q q q q q q q q q q q qq q q q qq q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q −0.02 −0.01 0.00 0.01 0.02 0.03 −0.0050.0000.0050.010 CorPH AxCorPH H−H H−L L−L L−H Graphique des moyennes de la corrélation avec le PH dans le voisinage en fonction de la corrélation avec le PH. 26 / 27 Nathalie Villa-Vialaneix
  53. 53. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Diagramme de Moran pour mettre en valeur les gènes influents pour la cor- rélation avec le PH q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q qqq q q q q q q q q q q q q q q q q q q q q q q qq q q q qq q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q −0.02 −0.01 0.00 0.01 0.02 0.03 −0.0050.0000.0050.010 CorPH AxCorPH H−H H−L L−L L−H Graphique des moyennes de la corrélation avec le PH dans le voisinage en fonction de la corrélation avec le PH. Tests de significativité pour déterminer les gènes “influents”. 26 / 27 Nathalie Villa-Vialaneix
  54. 54. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Où sont les gènes influents ? q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q H−H H−L L−L L−H Réseau entier 27 / 27 Nathalie Villa-Vialaneix
  55. 55. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Où sont les gènes influents ? q q q qq q qq q q q q q q q q q q q q q q q q q q q q q q q q q BX925971 RRAS BX922566 SEC24ABX671434 PATL1 BX671687BX672338 ACOX1 APITD1 BX923543 XRCC6 NUDT21 Neb CLTA BX667801 BX671017 BX674989 BX675907 BX665214 BX675319 CSDE1 BX671545 TACC1 BX915330 ALDH2 HIAT1 scaj0012.o.01 PPIA BX923052 SLA−1 FADD TMEM201 Cluster 1 27 / 27 Nathalie Villa-Vialaneix
  56. 56. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Où sont les gènes influents ? q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q qq q q q q q q PLOD1 SEP15 CCDC47 C5H22orf32 LOC511599 BX921227 PDLIM7 SPARCL1 LDHA PRKG2 BX667797 B2M CR939574 BE033242 BX673681 OCLN BX915984 BX670104 ZYX BX922075 UBE2M TRIAP1 BX674839 BX926631 CCT2 BX668837 BX669337 BEX1 RPS15BX920987 IL8 BX671117BX665361 BX665356 C2 BI359863 BX665098SUZ12 ZRANB1 KIAA0152 BX920480 NFU1 TNNI1 KCTD1 Cluster 2 27 / 27 Nathalie Villa-Vialaneix
  57. 57. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Où sont les gènes influents ? q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q EIF3C COMMD1 IK BX917871 CR940191 BX676386 C11orf59 BX671424 BX673689 SMARCC2 BX924343 CLPTM1L TRIM33 BX927037 BX917034 SEPW1 BX676495 CDKN2D BX924633 GLRX3 BX920718 PRPF40A SLC16A3 PARD3IL13RA2 SLN BX918744 BX671723 BX669206 ILKAP TREX1 ACTN2 BX668043 BX921641 BSG MTIF2 EMG1 CALM1 CENPE UBAP1 GNAI2 SLA−1 LOC777786 BX668068 SON LOC780405 X91330 PRDX4 BX924187 THYN1 HNRPA1 LOC733592 BX921514 PABPN1 MRPL41 GTF2E1 HSP90B1 BX924180 Cluster 3 27 / 27 Nathalie Villa-Vialaneix
  58. 58. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Où sont les gènes influents ? q q q q q q q q q q q q q q q q q q q q q q q q q q q q BX919092 PSMC3IP THRB XIAP ARHGAP8 X91721 BX917912 EAPP LSM2 BX922053 BX922491 H2AFY ENH_RAT LMF1 FTCD BX925690 B2M GPI BX667979 BX920538 BX671131 RNF2 BX673501 KPNA1 BX674063 BX918923 RPS11 UBE2H Cluster 4 27 / 27 Nathalie Villa-Vialaneix
  59. 59. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Où sont les gènes influents ? q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q APIP PRPF3 CREB3L3 SLC35B2 BX669670 CXCL12 scai0001.d.08 TMEM14C SELH_HUMAN ANXA7 FAM151B BX669689 BX923207 QIL1 BX922608 BX917123 C7H19orf62 TEC DDX3X ANKRD40 XBP1 BX672614 BX922943 CSNK1A1 BX668060 ODC1 PDE4DIP BX665674 LOC616632 BX914936 ARFIP1 DAPK1 CFL2 LPL BX669627 RNASEK SLC25A22 EEF1A1 MGST1_PIG COMT RPS5 Cluster 5 27 / 27 Nathalie Villa-Vialaneix
  60. 60. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Où sont les gènes influents ? q q q qq q q q q q q q q q q q q q q q q q q q q q q q CCDC56 RPL7L1 AGPS BF442271FBXL3 MYH2 N4BP2 BX674324 X91724 CCAR1 SLA−1 TPM3 SSR4 BX672573 AW359912 BX674550 BX915888 BMPR2 UTP23 FTH1 STC1 MGP BX671472 DGKI RPL27A ATP2A1 BX670979 BX674399 Cluster 6 27 / 27 Nathalie Villa-Vialaneix
  61. 61. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Où sont les gènes influents ? q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q BX918989 BX916347 SNW1 PCBP2_MOUSE MTCH1 BG834885 PABPC1 CD81 BX918478 BX924513 BX926921 BX667806 RBM9 EEF1A1 BX926575 BX672767 EEF1A−2 KIAA494 SLA−1 SLC39A14 CCDC56 BX915803 CR939198 B2M FIT1 BX922995 AARS TMEM126B H3F3B SEPP1 GNG10 TJP3 BX915764 IMMT BX918369 ROCK2 BX919942 TYR BX676048 BX920880 Cluster 7 27 / 27 Nathalie Villa-Vialaneix
  62. 62. Moran, P. (1950). Notes on continuous stochastic phenomena. Biometrika, 37:17–23. Schäfer, J. and Strimmer, K. (2005). An empirical bayes approach to inferring large-scale gene association networks. Bioinformatics, 21(6):754–764. Villa, N., Dkaki, T., Gadat, S., Inglebert, J., and Truong, Q. (2009). Recherche et représentation de communautés dans des grands graphes. In Actes du colloque Veille Stratégique, Scientifique et Technologique (VSST 2009), Nancy, France. 27 / 27 Nathalie Villa-Vialaneix

×