SlideShare une entreprise Scribd logo
1  sur  40
Télécharger pour lire hors ligne
Données métabolomiques : apprentissage et
ondelettes
Nathalie Villa-Vialaneix
http://www.nathalievilla.org
Institut de Mathématiques de Toulouse
IUT de Carcassonne (Université de Perpignan)
Groupe de travail BioPuces, INRA de Castanet
12 mars 2010
Présentation générales des données
Les données ont été fournies par Alain Paris (INRA) : il s’agit
d’enregistrements de données metabolomiques (H NMR) d’urine
de souris : 950 variables de 0.50 ppm à 9.99 ppm.
Présentation générales des données
Les données ont été fournies par Alain Paris (INRA) : il s’agit
d’enregistrements de données metabolomiques (H NMR) d’urine
de souris : 950 variables de 0.50 ppm à 9.99 ppm.
Présentation générales des données
Les données ont été fournies par Alain Paris (INRA) : il s’agit
d’enregistrements de données metabolomiques (H NMR) d’urine
de souris : 950 variables de 0.50 ppm à 9.99 ppm.
Par des procédures automatiques, les pics ont été alignés et la
ligne de base (partiellement) corrigée.
Problématique biologique
Etude des effets de l’ingestion de Hypochoeris radicata (HR)
ou pissenlit toxique sur le métabolisme : les fleurs de cette
plante sont en effet responsables d’une maladie mortelle pour les
cheveaux: “Australian stringhalt” (atteinte du système nerveux,
tremblements ...)
Problématique biologique
Etude des effets de l’ingestion de Hypochoeris radicata (HR)
ou pissenlit toxique sur le métabolisme : les fleurs de cette
plante sont en effet responsables d’une maladie mortelle pour les
cheveaux: “Australian stringhalt” (atteinte du système nerveux,
tremblements ...)
Les expériences ont été réalisées sur 72 souris.
Description des expériences
Les souris se répartissent en plusieurs groupes selon :
leurs sexes : 36 mâles ; 36 femelles
Description des expériences
Les souris se répartissent en plusieurs groupes selon :
leurs sexes : 36 mâles ; 36 femelles
la dose quotidienne de HR ingérée : 0 (contrôle) : 24 souris
; 3% : 24 souris ; 9% : 24 souris
Description des expériences
Les souris se répartissent en plusieurs groupes selon :
leurs sexes : 36 mâles ; 36 femelles
la dose quotidienne de HR ingérée : 0 (contrôle) : 24 souris
; 3% : 24 souris ; 9% : 24 souris
3 dates de décès : 8ème jour : 24 souris ; 15ème : 24 souris
; 21ième : 24 souris
Description des expériences
Les souris se répartissent en plusieurs groupes selon :
leurs sexes : 36 mâles ; 36 femelles
la dose quotidienne de HR ingérée : 0 (contrôle) : 24 souris
; 3% : 24 souris ; 9% : 24 souris
3 dates de décès : 8ème jour : 24 souris ; 15ème : 24 souris
; 21ième : 24 souris
⇒ 18 groupes (mais les groupes issus des dates de décès ne sont
pas très pertinent pour la question étudiée).
Jours de mesure
L’urine a été collectée les jours suivants :
Jours 0 1 4 8 11 15 18 21
Nb d’observations 68 68 68 66 46 44 19 18
Jours de mesure
L’urine a été collectée les jours suivants :
Jours 0 1 4 8 11 15 18 21
Nb d’observations 68 68 68 66 46 44 19 18
Pour chaque souris, de 2 à 22 mesures ont été effectuées.
Jours de mesure
L’urine a été collectée les jours suivants :
Jours 0 1 4 8 11 15 18 21
Nb d’observations 68 68 68 66 46 44 19 18
Pour chaque souris, de 2 à 22 mesures ont été effectuées.
Au final, 397 observations de 950 variables.
Principe de base de la décomposition en ondelettes
Pour un entier donné J, le spectre f peut être décomposé au
niveau J par :
f(x) =
k
αk 2−J/2
Ψ(2−J
x − k) +
J
j=1 k
βjk 2−j/2
Φ 2−j
x − k
Principe de base de la décomposition en ondelettes
Pour un entier donné J, le spectre f peut être décomposé au
niveau J par :
f(x) =
k
αk 2−J/2
Ψ(2−J
x − k)
Tendance basée sur l’ondelette père Ψ
+
J
j=1 k
βjk 2−j/2
Φ 2−j
x − k
Principe de base de la décomposition en ondelettes
Pour un entier donné J, le spectre f peut être décomposé au
niveau J par :
f(x) =
k
αk 2−J/2
Ψ(2−J
x − k)
Tendance basée sur l’ondelette père Ψ
+
J
j=1 k
βjk 2−j/2
Φ 2−j
x − k
Détails aux niveaux 1, . . . , J
basés sur l’ondelette mère Φ
Exemple de décomposition hiérarchique sur un spectre
de métabolome
↓
Exemple de décomposition hiérarchique sur un spectre
de métabolome
↓
Exemple de décomposition hiérarchique sur un spectre
de métabolome
↓
Exemple de décomposition hiérarchique sur un spectre
de métabolome
...
Détails 1 à 8
↓
Cas particulier : Les ondelettes de Haar
Partant d’un signal discrétisé (β0,1, . . . , β0,2n ), la transformation
discrète en ondelettes de Haar consiste en le processus itératif :
Coefficients de tendance : βj,k =
βj−1,2k−1+βj−1,2k
√
2
pour
j = 1, . . . , n et k = 1, . . . , 2n−j
;
Coefficients de détails : αj,k =
βj−1,2k −βj−1,2k−1
√
2
pour j = 1, . . . , n
et k = 1, . . . , 2n−j
Cas particulier : Les ondelettes de Haar
Partant d’un signal discrétisé (β0,1, . . . , β0,2n ), la transformation
discrète en ondelettes de Haar consiste en le processus itératif :
Coefficients de tendance : βj,k =
βj−1,2k−1+βj−1,2k
√
2
pour
j = 1, . . . , n et k = 1, . . . , 2n−j
;
Coefficients de détails : αj,k =
βj−1,2k −βj−1,2k−1
√
2
pour j = 1, . . . , n
et k = 1, . . . , 2n−j
Dans la suite, on conserve, les coefficients de détails les plus
fins (α1,k )k et les coefficients de détails les plus fins du spectre
translaté (β0,2, . . . , β0,2n , 0). L’ensemble suffit pour reconstituer le
spectre initial.
Coefficients d’ondelettes retenus
D.1 D.57 D.125 D.297 D.370 D.443 D2.41 D2.120 D2.304 D2.389 D2.474
−40−2002040
Before scaling
D.1 D.57 D.125 D.297 D.370 D.443 D2.41 D2.120 D2.304 D2.389 D2.474
−15−10−5051015
After scaling
Problème de normalisation
q
q
qq
q
q
q q
q
q
q
q
q q
q
q
qq
q
q
qq
q
q
q
q
q
qq
q
q
q
qq
q
q
q
q
q
q
q
q q
q
q
q
q
q
q qq
q
q
q
q q q
q
q
q
q q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
qq
q
q
q
q q
q
q
q
q
q
q
q q
qq q
q
qq
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
qq
q
q
qq
q
−10 −5 0 5 10 15
−10−505
PC1 vs. PC2
PC1
PC2
q
q
q
q
q
q
q
q
Day 0
Day 1
Day 4
Day 8
Day 11
Day 15
Day 18
Day 21
q
q
q
q
q
q
q q
q
q
q
q
q qq
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq q
q
q
qq
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
qq q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q qq
q
q
qq
q q
q
q
q
q
q
q
q
qq
q
q
q
q q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
qq
q
−10 −5 0 5 10 15
−20−10010
PC1 vs. PC3
PC1
PC3
q
q
q
q
q
q
q
q
Day 0
Day 1
Day 4
Day 8
Day 11
Day 15
Day 18
Day 21
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
qq
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
−10 −5 0 5 10 15
−15−505101520
PC1 vs. PC4
PC1
PC4
q
q
q
q
q
q
q
q
Day 0
Day 1
Day 4
Day 8
Day 11
Day 15
Day 18
Day 21
q
q
q
q
q
q
qq
q
q
q
q
qq q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qqq
q
q
q q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
qqq
q
q
qq
q q
q
q
q
q
q
q
q
qq
q
q
q
qq
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
qq
q
−10 −5 0 5
−20−10010
PC2 vs. PC3
PC2
PC3
q
q
q
q
q
q
q
q
Day 0
Day 1
Day 4
Day 8
Day 11
Day 15
Day 18
Day 21
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
qq
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
qq
q
q
q
qq
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
−15−505101520
PC2 vs. PC4
PC4
q
q
q
q
q
q
q
q
Day 0
Day 1
Day 4
Day 8
Day 11
Day 15
Day 18
Day 21
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
qq
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q q
q
q
q
qq
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
−15−505101520
PC3 vs. PC4
PC4
q
q
q
q
q
q
q
q
Day 0
Day 1
Day 4
Day 8
Day 11
Day 15
Day 18
Day 21
ACP des coeffi-
cients : mise en
valeur du jour de
prélèvement pour
le groupe contrôle
Procédure de normalisation choisie
Déterminer la médiane de chaque jour pour chaque
coefficient d’ondelette dans le groupe contrôle.
Utiliser ces valeurs pour normaliser toutes les observations.
Procédure de normalisation choisie
Déterminer la médiane de chaque jour pour chaque
coefficient d’ondelette dans le groupe contrôle.
Utiliser ces valeurs pour normaliser toutes les observations.
Avant normalisation :
q
q
q
q
0 1 4 8 11 15 18 21
−0.20.00.20.40.6
D2.444
Day
Waveletcoefficients
q
q
q
q
q
0 1 4 8 11 15 18 21
−0.20−0.100.000.10
D.78
Waveletcoefficients
q
q
q
0 1 4 8 11 15 18 21
0.00.51.01.52.02.5
D.332
Day
Waveletcoefficients
q
q
q
q
q
q
q
0 1 4 8 11 15 18 21
−1.5−1.0−0.5
D2.289
Waveletcoefficients
Procédure de normalisation choisie
Déterminer la médiane de chaque jour pour chaque
coefficient d’ondelette dans le groupe contrôle.
Utiliser ces valeurs pour normaliser toutes les observations.
Après normalisation :
q
q
q
q
0 1 4 8 11 18
−2−1012
D2.444
Day
Waveletcoefficients
q
q
q
q
q
0 1 4 8 11 18
−3−1012
D.78
Waveletcoefficients
q
q q
0 1 4 8 11 18
−3−10123
D.332
Day
Waveletbcoefficients
q
qq
q
q
q
q
0 1 4 8 11 18
−3−10123
D2.289
Waveletcoefficients
APC après normalisation
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
qq
q
q q
q
qq
q
q
q qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q q
q
q qq
q
qq q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
−10 −5 0 5 10 15
0246810
PC1 vs. PC2
PC1
PC2
q
q
q
q
q
q
q
q
Day 0
Day 1
Day 4
Day 8
Day 11
Day 15
Day 18
Day 21
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
qq
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
qq
q
−10 −5 0 5 10 15
−10−5051015
PC1 vs. PC3
PC1
PC3
q
q
q
q
q
q
q
q
Day 0
Day 1
Day 4
Day 8
Day 11
Day 15
Day 18
Day 21
q
q
q
q
q
q
q
qq
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
qq
q
q
q
q
q
q
qq
qq
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
qq
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
−10 −5 0 5 10 15
−505
PC1 vs. PC4
PC1
PC4
q
q
q
q
q
q
q
q
Day 0
Day 1
Day 4
Day 8
Day 11
Day 15
Day 18
Day 21
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
qq
q
0 2 4 6 8 10 12
−10−5051015
PC2 vs. PC3
PC2
PC3
q
q
q
q
q
q
q
q
Day 0
Day 1
Day 4
Day 8
Day 11
Day 15
Day 18
Day 21
q
q
q
q
q
q
q
q q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q q
q
q
q
q
q
q
q q
qq
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
qq
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
−505
PC2 vs. PC4
PC4
q
q
q
q
q
q
q
q
Day 0
Day 1
Day 4
Day 8
Day 11
Day 15
Day 18
Day 21
q
q
q
q
q
q
q
qq
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q q
q
q
q
q
q
q
qq
q q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
−505
PC3 vs. PC4
PC4
q
q
q
q
q
q
q
q
Day 0
Day 1
Day 4
Day 8
Day 11
Day 15
Day 18
Day 21
ACP des coef-
ficients : mise
en valeur du jour
de prélèvement
pour le groupe
contrôle après
normalisation
Lien entre ACP et dose totale ingérée
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q qq
qq
q
q
q q
q
q
qq
q
q
q
qq
q
qqq
q
q q
q
q
q
q
q q
qq
qq
q
q
q
q
q
qq
qq
q
q
q qq q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
qq
q
q
qq q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
qq
q
q qq
qq
q
q
q
q
qqq
q
q
q
q
q q
q
q
qqq
q
qq
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
qq
q
q
qqq
q
q
q q q
q
q
q
q
q
qq
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
qq
q
q
q
q
q
qqq
qq
q
q q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q q
q
qq
q
q
qq
q
q
q
q
qq
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q q
qq
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
qq
q q
q
q
q
q
q
−10 0 5 15
−30−20−10010
PC1 vs. PC2
PC1
PC2
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
TD 0
TD 3
TD 9
TD 12
TD 24
TD 33
TD 36
TD 45
TD 54
TD 63
TD 72
TD 99
TD 135
TD 162
TD 189 q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
qq q
q
qq
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q qq
q
qq
q
q
q
qq
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q q
q
q
q
q
qqq
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
−10 0 5 15
−100102030
PC1 vs. PC3
PC1
PC3
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
TD 0
TD 3
TD 9
TD 12
TD 24
TD 33
TD 36
TD 45
TD 54
TD 63
TD 72
TD 99
TD 135
TD 162
TD 189
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
qqq
q
q
q
q
q
q
qq
q q
q
q
q
q
q
q qq
q q
q
q
qq
q
q
q q
q
q
q q
q
qqq
qq q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q qq
q
q
q
q
q
q
q
qq
q q
q
q
qq
q
q
q
q
qq
q
q
qq
qq
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
qq
q
qq
q
qqq
qq
q q
q
q
qq
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q q
q
qq
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
qq
qq
q
qq
q
q
q
q
q
q
q
qq
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
qq q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
qq
q
q
q
q
q
qq
q
q
q q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
qq
q
q
q
qq
q
q
q
q
q
q
−10 0 5 15
−20−1001020304050
PC1 vs. PC4
PC1
PC4
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
TD 0
TD 3
TD 9
TD 12
TD 24
TD 33
TD 36
TD 45
TD 54
TD 63
TD 72
TD 99
TD 135
TD 162
TD 189
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
qqq
q
qq
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
qqq
q
qq
q
q
q
qq
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
qq
q
q
q
q
qqq
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
−100102030
PC2 vs. PC3
PC3
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
TD 0
TD 3
TD 9
TD 12
TD 24
TD 33
TD 36
TD 45
TD 54
TD 63
TD 72
TD 99
TD 135
TD 162
TD 189
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q qq
q
q
q
q
q
q
q q
qq
q
q
q
q
q
qqq
qq
q
q
qq
q
q
q q
q
q
qq
q
qqq
qqq
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
qqq
q
q
q
q
q
q
q
qq
qq
q
q
q q
q
q
q
q
qq
q
q
qq
qq
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
qq
q
qq
q
qqq
qq
q q
q
q
qq
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
qq
q
qq
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q q
qq
q
q q
q
q
q
q
q
q
q
qq
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
qqq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
qq
q
q
q
q
q
qq
q
q
qq
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
qq
q
q
q
qq
q
q
q
q
q
q
−20−1001020304050
PC2 vs. PC4
PC4
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
TD 0
TD 3
TD 9
TD 12
TD 24
TD 33
TD 36
TD 45
TD 54
TD 63
TD 72
TD 99
TD 135
TD 162
TD 189
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
qqq
q
q
q
q
q
q
qq
qq
q
q
q
q
q
q q q
q q
q
q
qq
q
q
qq
q
q
qq
q
qqq
q qq
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
qqq
q
q
q
q
q
q
q
q q
qq
q
q
qq
q
q
q
q
qq
q
q
qq
qq
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
qq
q
qq
q
qqq
q q
qq
q
q
qq
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
qq
q
q q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
qq
q q
q
qq
q
q
q
q
q
q
q
qq
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
qqq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
qq
q
q
q
q
q
q q
q
q
qq
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
qq
q
q
q
q q
q
q
q
q
q
q
−20−1001020304050
PC3 vs. PC4
PC4
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
TD 0
TD 3
TD 9
TD 12
TD 24
TD 33
TD 36
TD 45
TD 54
TD 63
TD 72
TD 99
TD 135
TD 162
TD 189
ACP des coef-
ficients : mise
en valeur de
la dose totale
ingérée après
normalisation
Métabolites impliquées dans le phénomène
2 4 6 8 10
05101520
Métabolites impliquées dans le phénomène
2 4 6 8 10
05101520
La plupart correspondent à des métabolites connues et
impliquées dans le processus biologique (selon une étude
préliminaire).
Motivations
L’idée est de valider l’impact de l’ingestion de HR sur le
métabolome en essayant de prédire, à partir des coefficients
d’ondelette normalisés et réduits, la dose totale de HR
ingérée. Si la prédiction s’avère être de bonne qualité, l’impact
n’est pas un artefac des données mais valide la dépendance
biologique.
Motivations
L’idée est de valider l’impact de l’ingestion de HR sur le
métabolome en essayant de prédire, à partir des coefficients
d’ondelette normalisés et réduits, la dose totale de HR
ingérée. Si la prédiction s’avère être de bonne qualité, l’impact
n’est pas un artefac des données mais valide la dépendance
biologique.
Méthodes comparées :
random forest
ridge regression
LASSO
Elasticnet
Partial Least Squares (PLS)
sparse PLS
Méthologie
Séparation des données en apprentissage et test en
respectant l’équilibre des 18 groupes présentés en
introduction ;
Apprentissage des 6 méthodes sur les données
d’apprentissage avec calibration des hyperparamètres par
validation croisée ;
Calcul de l’erreur quadratique moyenne sur les données
de test.
Méthologie
Séparation des données en apprentissage et test en
respectant l’équilibre des 18 groupes présentés en
introduction ;
Apprentissage des 6 méthodes sur les données
d’apprentissage avec calibration des hyperparamètres par
validation croisée ;
Calcul de l’erreur quadratique moyenne sur les données
de test.
Cette procédure a été répétée 250 fois.
Résultats
q
q
q
q qq
q
q
qq
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
qq
q
q
q
Lasso
Ridge
ELN0.1
ELN0.25
ELN0.5
ELN0.75
PLS
SPLS5
SPLS10
SPLS20
RF
14
16
18
20
22
24
ELN : Qualité de prédiction
q
q
q
q
qqq
qqqqqq
q
q
q
qq
q
q
qqqqqqqqqqqq
q
qq
q
qq
q
q
qqqqq
q
q
q
qqq
q
qqqqq
q
qq
qqq
q
qqq
q
q
q
q
q
qqqq
qqq
q
q
q
q
q
q
qq
qqq
qq
qq
q
q
q
qq
q
qq
qq
q
q
q
q
qq
q
q
q
qqq
q
qqq
qqq
q
qq
q
q qq
qqq
qq
q
q
q
q
qqq
q
q
qqqqqqq
q
q
qq
q
q
q
q
qq
q
q
qq
q
qqqq
q
q
q
q
qq
q
qq
qq
q
qqq
q
q
q
q
q
q
qq
qq
q
q
q
q
qqq
q
q
q
q
qq
q
q
q
q
qq
qq
q
q
q
q
qqq
q
qq
q
qq
q
q
q
q
q
qq
q
q
q
q
q
q
q
qqqq
q
q
qq
q
q
qq
qq
q
qq
qq
qq
q
q
q
q
q
q
q
qq
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
qqq
q
q
q
q
q
qq
q
q
q
qqqqqq
q
q
qq
q
q
q
q
q
q
q
qq
q
qqq
q
qq
qq
qq
qq
q
qq
q
q
qqq
q
qq
q
qqq
qqq
q
q
qq
qq
q
q
qq
qq
q
q
q
qqq
q
qq
qqqq
qq
q
q
q
qq
q
qq
qq
q
q
q
q
qq
q
q
0 50 100 150
050100150
Mixing: 10%
True value
Predictedvalue
q
q
q
q
qqq
qqqqqq
q
q
q
qq
q
q
qqq
q
q
qqqq
qqq
q
qq
q
q
q
q
q
qqqqq
q
q
q
qqq
q
qqqqq
q
qq
qqq
q
qqq
q
q
q
q
q
qq
q
q
qqq
q
q
q
q
qqqq
qqq
qq
qq
q
qq
qq
q
qq
qq
q
q
q
q
qq
q
q
q
qqq
q
q
qq
qqq
q
qq
q
q qq
qqq
q
q
q
qqq
q
qq
q
q
qqqqqq
q
qq
qq
q
q
q
q
qq
q
q
qq
q
qqqq
q
q
qq
qq
q
qq
qq
q
qqqq
q
q
q
q
q
qq
qq
q
q
q
q
qqq
q
q
q
q
qq
qq
q
q
qq
qq
q
q
q
q
qqq
q
qq
q
qq
q
q
q
q
q
qqq
q
q
q
q
q
q
qqqq
q
q
q
q
q
q
qq
qq
q
qq
q
q
qq
q
q
q
q
q
q
q
q
q
qq
q
q
q
qq
q
q
q
qq
q
q
q
q
qqq
q
q
q
q
q
qqq
q
q
qqq
qq
q
q
q
qqq
q
q
q
q
q
q
qq
q
qq
q
q
qq
qq
qq
q
q
q
qq
q
q
qqq
q
qq
q
qqq
qqq
q
q
qq
qq
q
q
qq
qq
q
q
q
qqqq
qq
qqqq
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
0 50 100 150
050100150
Mixing: 25%
True value
Predictedvalue
ELN : Coefficients impliqués
2 4 6 8 10
05101520
ppm
ELN : Coefficients impliqués
2 4 6 8 10
05101520
ppm
Certains coefficients sont les mêmes que ceux connus et
précédemment identifés, certains métabolites manquent dans la
liste, certains métabolites de la liste semblent inconnus. ⇒ effet
d’échelle ?
Perspectives et questions
Normalisation actuelle ? Modèle à effets mixtes ?
Qu’est-ce qui est pertinent pour la recherche des coefficients
les plus importants dans ELN ?

Contenu connexe

Similaire à Données métabolomiques, apprentissage et ondelettes

Hasard09 artificiel
Hasard09 artificielHasard09 artificiel
Hasard09 artificielnahdiste
 
La biométrie_étude de la variation des caractèr_231021_115212.pdf
La biométrie_étude de la variation des caractèr_231021_115212.pdfLa biométrie_étude de la variation des caractèr_231021_115212.pdf
La biométrie_étude de la variation des caractèr_231021_115212.pdfAbdennourAmrani
 
Reprogrammation comportementale - FCH
Reprogrammation comportementale - FCHReprogrammation comportementale - FCH
Reprogrammation comportementale - FCHCeliaBianeFourati
 
Les Filtres Numeriques
Les Filtres NumeriquesLes Filtres Numeriques
Les Filtres NumeriquesSAHELAicha
 
Exos genetique des pop
Exos genetique des popExos genetique des pop
Exos genetique des popchrafIssaoui
 
Insomnie tr rythmes circadiens 050122014
Insomnie tr rythmes circadiens 050122014Insomnie tr rythmes circadiens 050122014
Insomnie tr rythmes circadiens 050122014RESEAU MORPHEE
 
Poly genetique-medicale
Poly genetique-medicalePoly genetique-medicale
Poly genetique-medicaleEgn Njeba
 
Quand Internet sera gouvernée par les |chats> de Shrödinger
Quand Internet sera gouvernée par les |chats> de ShrödingerQuand Internet sera gouvernée par les |chats> de Shrödinger
Quand Internet sera gouvernée par les |chats> de ShrödingerNicolas De Loof
 

Similaire à Données métabolomiques, apprentissage et ondelettes (9)

Hasard09 artificiel
Hasard09 artificielHasard09 artificiel
Hasard09 artificiel
 
La biométrie_étude de la variation des caractèr_231021_115212.pdf
La biométrie_étude de la variation des caractèr_231021_115212.pdfLa biométrie_étude de la variation des caractèr_231021_115212.pdf
La biométrie_étude de la variation des caractèr_231021_115212.pdf
 
Reprogrammation comportementale - FCH
Reprogrammation comportementale - FCHReprogrammation comportementale - FCH
Reprogrammation comportementale - FCH
 
Les Filtres Numeriques
Les Filtres NumeriquesLes Filtres Numeriques
Les Filtres Numeriques
 
Exos genetique des pop
Exos genetique des popExos genetique des pop
Exos genetique des pop
 
Insomnie tr rythmes circadiens 050122014
Insomnie tr rythmes circadiens 050122014Insomnie tr rythmes circadiens 050122014
Insomnie tr rythmes circadiens 050122014
 
Poly genetique-medicale
Poly genetique-medicalePoly genetique-medicale
Poly genetique-medicale
 
Quand Internet sera gouvernée par les |chats> de Shrödinger
Quand Internet sera gouvernée par les |chats> de ShrödingerQuand Internet sera gouvernée par les |chats> de Shrödinger
Quand Internet sera gouvernée par les |chats> de Shrödinger
 
TCS 6-1.pdf
TCS 6-1.pdfTCS 6-1.pdf
TCS 6-1.pdf
 

Plus de tuxette

Racines en haut et feuilles en bas : les arbres en maths
Racines en haut et feuilles en bas : les arbres en mathsRacines en haut et feuilles en bas : les arbres en maths
Racines en haut et feuilles en bas : les arbres en mathstuxette
 
Méthodes à noyaux pour l’intégration de données hétérogènes
Méthodes à noyaux pour l’intégration de données hétérogènesMéthodes à noyaux pour l’intégration de données hétérogènes
Méthodes à noyaux pour l’intégration de données hétérogènestuxette
 
Méthodologies d'intégration de données omiques
Méthodologies d'intégration de données omiquesMéthodologies d'intégration de données omiques
Méthodologies d'intégration de données omiquestuxette
 
Projets autour de l'Hi-C
Projets autour de l'Hi-CProjets autour de l'Hi-C
Projets autour de l'Hi-Ctuxette
 
Can deep learning learn chromatin structure from sequence?
Can deep learning learn chromatin structure from sequence?Can deep learning learn chromatin structure from sequence?
Can deep learning learn chromatin structure from sequence?tuxette
 
Multi-omics data integration methods: kernel and other machine learning appro...
Multi-omics data integration methods: kernel and other machine learning appro...Multi-omics data integration methods: kernel and other machine learning appro...
Multi-omics data integration methods: kernel and other machine learning appro...tuxette
 
ASTERICS : une application pour intégrer des données omiques
ASTERICS : une application pour intégrer des données omiquesASTERICS : une application pour intégrer des données omiques
ASTERICS : une application pour intégrer des données omiquestuxette
 
Autour des projets Idefics et MetaboWean
Autour des projets Idefics et MetaboWeanAutour des projets Idefics et MetaboWean
Autour des projets Idefics et MetaboWeantuxette
 
Rserve, renv, flask, Vue.js dans un docker pour intégrer des données omiques ...
Rserve, renv, flask, Vue.js dans un docker pour intégrer des données omiques ...Rserve, renv, flask, Vue.js dans un docker pour intégrer des données omiques ...
Rserve, renv, flask, Vue.js dans un docker pour intégrer des données omiques ...tuxette
 
Apprentissage pour la biologie moléculaire et l’analyse de données omiques
Apprentissage pour la biologie moléculaire et l’analyse de données omiquesApprentissage pour la biologie moléculaire et l’analyse de données omiques
Apprentissage pour la biologie moléculaire et l’analyse de données omiquestuxette
 
Quelques résultats préliminaires de l'évaluation de méthodes d'inférence de r...
Quelques résultats préliminaires de l'évaluation de méthodes d'inférence de r...Quelques résultats préliminaires de l'évaluation de méthodes d'inférence de r...
Quelques résultats préliminaires de l'évaluation de méthodes d'inférence de r...tuxette
 
Intégration de données omiques multi-échelles : méthodes à noyau et autres ap...
Intégration de données omiques multi-échelles : méthodes à noyau et autres ap...Intégration de données omiques multi-échelles : méthodes à noyau et autres ap...
Intégration de données omiques multi-échelles : méthodes à noyau et autres ap...tuxette
 
Journal club: Validation of cluster analysis results on validation data
Journal club: Validation of cluster analysis results on validation dataJournal club: Validation of cluster analysis results on validation data
Journal club: Validation of cluster analysis results on validation datatuxette
 
Overfitting or overparametrization?
Overfitting or overparametrization?Overfitting or overparametrization?
Overfitting or overparametrization?tuxette
 
Selective inference and single-cell differential analysis
Selective inference and single-cell differential analysisSelective inference and single-cell differential analysis
Selective inference and single-cell differential analysistuxette
 
SOMbrero : un package R pour les cartes auto-organisatrices
SOMbrero : un package R pour les cartes auto-organisatricesSOMbrero : un package R pour les cartes auto-organisatrices
SOMbrero : un package R pour les cartes auto-organisatricestuxette
 
Graph Neural Network for Phenotype Prediction
Graph Neural Network for Phenotype PredictionGraph Neural Network for Phenotype Prediction
Graph Neural Network for Phenotype Predictiontuxette
 
A short and naive introduction to using network in prediction models
A short and naive introduction to using network in prediction modelsA short and naive introduction to using network in prediction models
A short and naive introduction to using network in prediction modelstuxette
 
Explanable models for time series with random forest
Explanable models for time series with random forestExplanable models for time series with random forest
Explanable models for time series with random foresttuxette
 
Présentation du projet ASTERICS
Présentation du projet ASTERICSPrésentation du projet ASTERICS
Présentation du projet ASTERICStuxette
 

Plus de tuxette (20)

Racines en haut et feuilles en bas : les arbres en maths
Racines en haut et feuilles en bas : les arbres en mathsRacines en haut et feuilles en bas : les arbres en maths
Racines en haut et feuilles en bas : les arbres en maths
 
Méthodes à noyaux pour l’intégration de données hétérogènes
Méthodes à noyaux pour l’intégration de données hétérogènesMéthodes à noyaux pour l’intégration de données hétérogènes
Méthodes à noyaux pour l’intégration de données hétérogènes
 
Méthodologies d'intégration de données omiques
Méthodologies d'intégration de données omiquesMéthodologies d'intégration de données omiques
Méthodologies d'intégration de données omiques
 
Projets autour de l'Hi-C
Projets autour de l'Hi-CProjets autour de l'Hi-C
Projets autour de l'Hi-C
 
Can deep learning learn chromatin structure from sequence?
Can deep learning learn chromatin structure from sequence?Can deep learning learn chromatin structure from sequence?
Can deep learning learn chromatin structure from sequence?
 
Multi-omics data integration methods: kernel and other machine learning appro...
Multi-omics data integration methods: kernel and other machine learning appro...Multi-omics data integration methods: kernel and other machine learning appro...
Multi-omics data integration methods: kernel and other machine learning appro...
 
ASTERICS : une application pour intégrer des données omiques
ASTERICS : une application pour intégrer des données omiquesASTERICS : une application pour intégrer des données omiques
ASTERICS : une application pour intégrer des données omiques
 
Autour des projets Idefics et MetaboWean
Autour des projets Idefics et MetaboWeanAutour des projets Idefics et MetaboWean
Autour des projets Idefics et MetaboWean
 
Rserve, renv, flask, Vue.js dans un docker pour intégrer des données omiques ...
Rserve, renv, flask, Vue.js dans un docker pour intégrer des données omiques ...Rserve, renv, flask, Vue.js dans un docker pour intégrer des données omiques ...
Rserve, renv, flask, Vue.js dans un docker pour intégrer des données omiques ...
 
Apprentissage pour la biologie moléculaire et l’analyse de données omiques
Apprentissage pour la biologie moléculaire et l’analyse de données omiquesApprentissage pour la biologie moléculaire et l’analyse de données omiques
Apprentissage pour la biologie moléculaire et l’analyse de données omiques
 
Quelques résultats préliminaires de l'évaluation de méthodes d'inférence de r...
Quelques résultats préliminaires de l'évaluation de méthodes d'inférence de r...Quelques résultats préliminaires de l'évaluation de méthodes d'inférence de r...
Quelques résultats préliminaires de l'évaluation de méthodes d'inférence de r...
 
Intégration de données omiques multi-échelles : méthodes à noyau et autres ap...
Intégration de données omiques multi-échelles : méthodes à noyau et autres ap...Intégration de données omiques multi-échelles : méthodes à noyau et autres ap...
Intégration de données omiques multi-échelles : méthodes à noyau et autres ap...
 
Journal club: Validation of cluster analysis results on validation data
Journal club: Validation of cluster analysis results on validation dataJournal club: Validation of cluster analysis results on validation data
Journal club: Validation of cluster analysis results on validation data
 
Overfitting or overparametrization?
Overfitting or overparametrization?Overfitting or overparametrization?
Overfitting or overparametrization?
 
Selective inference and single-cell differential analysis
Selective inference and single-cell differential analysisSelective inference and single-cell differential analysis
Selective inference and single-cell differential analysis
 
SOMbrero : un package R pour les cartes auto-organisatrices
SOMbrero : un package R pour les cartes auto-organisatricesSOMbrero : un package R pour les cartes auto-organisatrices
SOMbrero : un package R pour les cartes auto-organisatrices
 
Graph Neural Network for Phenotype Prediction
Graph Neural Network for Phenotype PredictionGraph Neural Network for Phenotype Prediction
Graph Neural Network for Phenotype Prediction
 
A short and naive introduction to using network in prediction models
A short and naive introduction to using network in prediction modelsA short and naive introduction to using network in prediction models
A short and naive introduction to using network in prediction models
 
Explanable models for time series with random forest
Explanable models for time series with random forestExplanable models for time series with random forest
Explanable models for time series with random forest
 
Présentation du projet ASTERICS
Présentation du projet ASTERICSPrésentation du projet ASTERICS
Présentation du projet ASTERICS
 

Données métabolomiques, apprentissage et ondelettes

  • 1. Données métabolomiques : apprentissage et ondelettes Nathalie Villa-Vialaneix http://www.nathalievilla.org Institut de Mathématiques de Toulouse IUT de Carcassonne (Université de Perpignan) Groupe de travail BioPuces, INRA de Castanet 12 mars 2010
  • 2. Présentation générales des données Les données ont été fournies par Alain Paris (INRA) : il s’agit d’enregistrements de données metabolomiques (H NMR) d’urine de souris : 950 variables de 0.50 ppm à 9.99 ppm.
  • 3. Présentation générales des données Les données ont été fournies par Alain Paris (INRA) : il s’agit d’enregistrements de données metabolomiques (H NMR) d’urine de souris : 950 variables de 0.50 ppm à 9.99 ppm.
  • 4. Présentation générales des données Les données ont été fournies par Alain Paris (INRA) : il s’agit d’enregistrements de données metabolomiques (H NMR) d’urine de souris : 950 variables de 0.50 ppm à 9.99 ppm. Par des procédures automatiques, les pics ont été alignés et la ligne de base (partiellement) corrigée.
  • 5. Problématique biologique Etude des effets de l’ingestion de Hypochoeris radicata (HR) ou pissenlit toxique sur le métabolisme : les fleurs de cette plante sont en effet responsables d’une maladie mortelle pour les cheveaux: “Australian stringhalt” (atteinte du système nerveux, tremblements ...)
  • 6. Problématique biologique Etude des effets de l’ingestion de Hypochoeris radicata (HR) ou pissenlit toxique sur le métabolisme : les fleurs de cette plante sont en effet responsables d’une maladie mortelle pour les cheveaux: “Australian stringhalt” (atteinte du système nerveux, tremblements ...) Les expériences ont été réalisées sur 72 souris.
  • 7. Description des expériences Les souris se répartissent en plusieurs groupes selon : leurs sexes : 36 mâles ; 36 femelles
  • 8. Description des expériences Les souris se répartissent en plusieurs groupes selon : leurs sexes : 36 mâles ; 36 femelles la dose quotidienne de HR ingérée : 0 (contrôle) : 24 souris ; 3% : 24 souris ; 9% : 24 souris
  • 9. Description des expériences Les souris se répartissent en plusieurs groupes selon : leurs sexes : 36 mâles ; 36 femelles la dose quotidienne de HR ingérée : 0 (contrôle) : 24 souris ; 3% : 24 souris ; 9% : 24 souris 3 dates de décès : 8ème jour : 24 souris ; 15ème : 24 souris ; 21ième : 24 souris
  • 10. Description des expériences Les souris se répartissent en plusieurs groupes selon : leurs sexes : 36 mâles ; 36 femelles la dose quotidienne de HR ingérée : 0 (contrôle) : 24 souris ; 3% : 24 souris ; 9% : 24 souris 3 dates de décès : 8ème jour : 24 souris ; 15ème : 24 souris ; 21ième : 24 souris ⇒ 18 groupes (mais les groupes issus des dates de décès ne sont pas très pertinent pour la question étudiée).
  • 11. Jours de mesure L’urine a été collectée les jours suivants : Jours 0 1 4 8 11 15 18 21 Nb d’observations 68 68 68 66 46 44 19 18
  • 12. Jours de mesure L’urine a été collectée les jours suivants : Jours 0 1 4 8 11 15 18 21 Nb d’observations 68 68 68 66 46 44 19 18 Pour chaque souris, de 2 à 22 mesures ont été effectuées.
  • 13. Jours de mesure L’urine a été collectée les jours suivants : Jours 0 1 4 8 11 15 18 21 Nb d’observations 68 68 68 66 46 44 19 18 Pour chaque souris, de 2 à 22 mesures ont été effectuées. Au final, 397 observations de 950 variables.
  • 14. Principe de base de la décomposition en ondelettes Pour un entier donné J, le spectre f peut être décomposé au niveau J par : f(x) = k αk 2−J/2 Ψ(2−J x − k) + J j=1 k βjk 2−j/2 Φ 2−j x − k
  • 15. Principe de base de la décomposition en ondelettes Pour un entier donné J, le spectre f peut être décomposé au niveau J par : f(x) = k αk 2−J/2 Ψ(2−J x − k) Tendance basée sur l’ondelette père Ψ + J j=1 k βjk 2−j/2 Φ 2−j x − k
  • 16. Principe de base de la décomposition en ondelettes Pour un entier donné J, le spectre f peut être décomposé au niveau J par : f(x) = k αk 2−J/2 Ψ(2−J x − k) Tendance basée sur l’ondelette père Ψ + J j=1 k βjk 2−j/2 Φ 2−j x − k Détails aux niveaux 1, . . . , J basés sur l’ondelette mère Φ
  • 17. Exemple de décomposition hiérarchique sur un spectre de métabolome ↓
  • 18. Exemple de décomposition hiérarchique sur un spectre de métabolome ↓
  • 19. Exemple de décomposition hiérarchique sur un spectre de métabolome ↓
  • 20. Exemple de décomposition hiérarchique sur un spectre de métabolome ... Détails 1 à 8 ↓
  • 21. Cas particulier : Les ondelettes de Haar Partant d’un signal discrétisé (β0,1, . . . , β0,2n ), la transformation discrète en ondelettes de Haar consiste en le processus itératif : Coefficients de tendance : βj,k = βj−1,2k−1+βj−1,2k √ 2 pour j = 1, . . . , n et k = 1, . . . , 2n−j ; Coefficients de détails : αj,k = βj−1,2k −βj−1,2k−1 √ 2 pour j = 1, . . . , n et k = 1, . . . , 2n−j
  • 22. Cas particulier : Les ondelettes de Haar Partant d’un signal discrétisé (β0,1, . . . , β0,2n ), la transformation discrète en ondelettes de Haar consiste en le processus itératif : Coefficients de tendance : βj,k = βj−1,2k−1+βj−1,2k √ 2 pour j = 1, . . . , n et k = 1, . . . , 2n−j ; Coefficients de détails : αj,k = βj−1,2k −βj−1,2k−1 √ 2 pour j = 1, . . . , n et k = 1, . . . , 2n−j Dans la suite, on conserve, les coefficients de détails les plus fins (α1,k )k et les coefficients de détails les plus fins du spectre translaté (β0,2, . . . , β0,2n , 0). L’ensemble suffit pour reconstituer le spectre initial.
  • 23. Coefficients d’ondelettes retenus D.1 D.57 D.125 D.297 D.370 D.443 D2.41 D2.120 D2.304 D2.389 D2.474 −40−2002040 Before scaling D.1 D.57 D.125 D.297 D.370 D.443 D2.41 D2.120 D2.304 D2.389 D2.474 −15−10−5051015 After scaling
  • 24. Problème de normalisation q q qq q q q q q q q q q q q q qq q q qq q q q q q qq q q q qq q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q qq q q qq q q q q q q q q q q q q q q q q q q qq q q q q qq q q qq q −10 −5 0 5 10 15 −10−505 PC1 vs. PC2 PC1 PC2 q q q q q q q q Day 0 Day 1 Day 4 Day 8 Day 11 Day 15 Day 18 Day 21 q q q q q q q q q q q q q qq q q q q q q q q qq q q q q q q q q q q q q q q q qq q q q qq q q qq q q q q q q q q q q q q qq q q q q q q q q q q q q q q q qq q q q q q qq q q qq q q q q q q q q q qq q q q q q q q qq q q q q q q q q q q q q q qq q q qq q −10 −5 0 5 10 15 −20−10010 PC1 vs. PC3 PC1 PC3 q q q q q q q q Day 0 Day 1 Day 4 Day 8 Day 11 Day 15 Day 18 Day 21 q q q q q q q q q q q q q q q q q q q q q q q q q q q qq qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q qq q q q q q q q q q q q q q q q q qq q −10 −5 0 5 10 15 −15−505101520 PC1 vs. PC4 PC1 PC4 q q q q q q q q Day 0 Day 1 Day 4 Day 8 Day 11 Day 15 Day 18 Day 21 q q q q q q qq q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q qqq q q q q q q qq q q q q q q q q q q q q q qq q q q q q q q q q q q q q q qq q q q q qqq q q qq q q q q q q q q q qq q q q qq q q qq q q q q q q q q q q q q q qq q q qq q −10 −5 0 5 −20−10010 PC2 vs. PC3 PC2 PC3 q q q q q q q q Day 0 Day 1 Day 4 Day 8 Day 11 Day 15 Day 18 Day 21 q q q q q q q q q q q q q q q q q q q q q q q q q qq qq qq q q q q q q q q q q q q q q q q q q q q q q q q qq q q q qq q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q qq q −15−505101520 PC2 vs. PC4 PC4 q q q q q q q q Day 0 Day 1 Day 4 Day 8 Day 11 Day 15 Day 18 Day 21 q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q qq q q q q q q q q q q q q q q q q qq q −15−505101520 PC3 vs. PC4 PC4 q q q q q q q q Day 0 Day 1 Day 4 Day 8 Day 11 Day 15 Day 18 Day 21 ACP des coeffi- cients : mise en valeur du jour de prélèvement pour le groupe contrôle
  • 25. Procédure de normalisation choisie Déterminer la médiane de chaque jour pour chaque coefficient d’ondelette dans le groupe contrôle. Utiliser ces valeurs pour normaliser toutes les observations.
  • 26. Procédure de normalisation choisie Déterminer la médiane de chaque jour pour chaque coefficient d’ondelette dans le groupe contrôle. Utiliser ces valeurs pour normaliser toutes les observations. Avant normalisation : q q q q 0 1 4 8 11 15 18 21 −0.20.00.20.40.6 D2.444 Day Waveletcoefficients q q q q q 0 1 4 8 11 15 18 21 −0.20−0.100.000.10 D.78 Waveletcoefficients q q q 0 1 4 8 11 15 18 21 0.00.51.01.52.02.5 D.332 Day Waveletcoefficients q q q q q q q 0 1 4 8 11 15 18 21 −1.5−1.0−0.5 D2.289 Waveletcoefficients
  • 27. Procédure de normalisation choisie Déterminer la médiane de chaque jour pour chaque coefficient d’ondelette dans le groupe contrôle. Utiliser ces valeurs pour normaliser toutes les observations. Après normalisation : q q q q 0 1 4 8 11 18 −2−1012 D2.444 Day Waveletcoefficients q q q q q 0 1 4 8 11 18 −3−1012 D.78 Waveletcoefficients q q q 0 1 4 8 11 18 −3−10123 D.332 Day Waveletbcoefficients q qq q q q q 0 1 4 8 11 18 −3−10123 D2.289 Waveletcoefficients
  • 28. APC après normalisation q q q q q q q q q q q q q q q q qq q q q q qq q q q qq q q q q q q q q q q q q q q q q qq q q q q q q q q q qq q qq q q qq q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q −10 −5 0 5 10 15 0246810 PC1 vs. PC2 PC1 PC2 q q q q q q q q Day 0 Day 1 Day 4 Day 8 Day 11 Day 15 Day 18 Day 21 q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q qq q q qq q −10 −5 0 5 10 15 −10−5051015 PC1 vs. PC3 PC1 PC3 q q q q q q q q Day 0 Day 1 Day 4 Day 8 Day 11 Day 15 Day 18 Day 21 q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q qq q q q q q q qq qq q q q q q q q q q q q q q q q q q q q qq q q q q qq q q q q q q q q q q q q q q q q q q q q qq q q q q q q q qq q q q q q q q q q q q q q q q q q q q q −10 −5 0 5 10 15 −505 PC1 vs. PC4 PC1 PC4 q q q q q q q q Day 0 Day 1 Day 4 Day 8 Day 11 Day 15 Day 18 Day 21 q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q qq q q q q q q q q q q q q q q qq q q q q q q qq q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q qq q 0 2 4 6 8 10 12 −10−5051015 PC2 vs. PC3 PC2 PC3 q q q q q q q q Day 0 Day 1 Day 4 Day 8 Day 11 Day 15 Day 18 Day 21 q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q qq q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q −505 PC2 vs. PC4 PC4 q q q q q q q q Day 0 Day 1 Day 4 Day 8 Day 11 Day 15 Day 18 Day 21 q q q q q q q qq q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q qq q q q q q q q q q q q qq q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q qq q q q q q q q qq q q q q q q q q q q q q q q q q q q q q −505 PC3 vs. PC4 PC4 q q q q q q q q Day 0 Day 1 Day 4 Day 8 Day 11 Day 15 Day 18 Day 21 ACP des coef- ficients : mise en valeur du jour de prélèvement pour le groupe contrôle après normalisation
  • 29. Lien entre ACP et dose totale ingérée q q q q q q q q q q q q q q q q q q q q q q q q q q q qq qq q q q q q q qq q q q qq q qqq q q q q q q q q q qq qq q q q q q qq qq q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q qq q q qq q q q q q qq q q q q q q q q q qq q q q q q q q q q qq q q qq qq q q q q qqq q q q q q q q q qqq q qq q q q q q q q q q q q qq q q q q q q q q q q qq q q qqq q q q q q q q q q q qq q q q q q q qq q q q q q q q qq q q q q q qqq qq q q q q q q q q q q q q q q qq q q q q qq q q qq q q q q qq q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q qq q q q q q q q −10 0 5 15 −30−20−10010 PC1 vs. PC2 PC1 PC2 q q q q q q q q q q q q q q q TD 0 TD 3 TD 9 TD 12 TD 24 TD 33 TD 36 TD 45 TD 54 TD 63 TD 72 TD 99 TD 135 TD 162 TD 189 q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q qq q q q q qq q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q qq q q q q q q q q q q q q q q q q q qq q q q qq q qq q q q qq q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qqq q q q q q q q q qq q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q qq q q q q q q q q q q q −10 0 5 15 −100102030 PC1 vs. PC3 PC1 PC3 q q q q q q q q q q q q q q q TD 0 TD 3 TD 9 TD 12 TD 24 TD 33 TD 36 TD 45 TD 54 TD 63 TD 72 TD 99 TD 135 TD 162 TD 189 q q q q q q q q q q q q q q q qqq q q q q q q qq q q q q q q q q qq q q q q qq q q q q q q q q q qqq qq q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q qq q q q q qq q q q q qq q q qq qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q qq q qq q qqq qq q q q q qq q q q q q q q qq q q q q q q q q q q qq q q q q q q qq q q q q q qq q q q q q q q q qq qq q qq q q q q q q q qq q q q q qq q q q q q q q q q q q q q q q q qq qq q q q q q q q q q q q q q q q q qq q q q q q qq q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q qq q q q qq q q q q q q −10 0 5 15 −20−1001020304050 PC1 vs. PC4 PC1 PC4 q q q q q q q q q q q q q q q TD 0 TD 3 TD 9 TD 12 TD 24 TD 33 TD 36 TD 45 TD 54 TD 63 TD 72 TD 99 TD 135 TD 162 TD 189 q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q qqq q qq q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q qq q q q q q q q q q q q qq q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q qq q q q q q q q q q q q q q q q q q qq q q qqq q qq q q q qq q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q qq q q q q qqq q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q qq q q q q q q q q q q q −100102030 PC2 vs. PC3 PC3 q q q q q q q q q q q q q q q TD 0 TD 3 TD 9 TD 12 TD 24 TD 33 TD 36 TD 45 TD 54 TD 63 TD 72 TD 99 TD 135 TD 162 TD 189 q q q qq q q q q q q q q q q q qq q q q q q q q q qq q q q q q qqq qq q q qq q q q q q q qq q qqq qqq qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qqq q q q q q q q qq qq q q q q q q q q qq q q qq qq qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq qq q q q q q q q q q q q q q q qq qq q qq q qqq qq q q q q qq q q q q q q q qq q q q q q q q q q q qq q q q qq q qq q q q q q qq q q q q q q q q q q qq q q q q q q q q q q qq q q q q qq q q q q q q q q q q q q q q q q qq qqq q q q q q q q q q q q q q q q qq q q q q q qq q q q q q qq q q qq q q q q q q qq q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q qq q q q qq q q q q q q −20−1001020304050 PC2 vs. PC4 PC4 q q q q q q q q q q q q q q q TD 0 TD 3 TD 9 TD 12 TD 24 TD 33 TD 36 TD 45 TD 54 TD 63 TD 72 TD 99 TD 135 TD 162 TD 189 q q q qq q q q q q q q q q q qqq q q q q q q qq qq q q q q q q q q q q q q qq q q qq q q qq q qqq q qq qq q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q qqq q q q q q q q q q qq q q qq q q q q qq q q qq qq qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q qq q qq q qqq q q qq q q qq q q q q q q q q q q q q q q q q q q q qq q q q qq q q q q q q q q qq q q q q q q q q qq q q q qq q q q q q q q qq q q q q qq q q q q q q q q q q q q q q q q qq qqq q q q q q q q q q q q q q q q qq q q q q q qq q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q −20−1001020304050 PC3 vs. PC4 PC4 q q q q q q q q q q q q q q q TD 0 TD 3 TD 9 TD 12 TD 24 TD 33 TD 36 TD 45 TD 54 TD 63 TD 72 TD 99 TD 135 TD 162 TD 189 ACP des coef- ficients : mise en valeur de la dose totale ingérée après normalisation
  • 30. Métabolites impliquées dans le phénomène 2 4 6 8 10 05101520
  • 31. Métabolites impliquées dans le phénomène 2 4 6 8 10 05101520 La plupart correspondent à des métabolites connues et impliquées dans le processus biologique (selon une étude préliminaire).
  • 32. Motivations L’idée est de valider l’impact de l’ingestion de HR sur le métabolome en essayant de prédire, à partir des coefficients d’ondelette normalisés et réduits, la dose totale de HR ingérée. Si la prédiction s’avère être de bonne qualité, l’impact n’est pas un artefac des données mais valide la dépendance biologique.
  • 33. Motivations L’idée est de valider l’impact de l’ingestion de HR sur le métabolome en essayant de prédire, à partir des coefficients d’ondelette normalisés et réduits, la dose totale de HR ingérée. Si la prédiction s’avère être de bonne qualité, l’impact n’est pas un artefac des données mais valide la dépendance biologique. Méthodes comparées : random forest ridge regression LASSO Elasticnet Partial Least Squares (PLS) sparse PLS
  • 34. Méthologie Séparation des données en apprentissage et test en respectant l’équilibre des 18 groupes présentés en introduction ; Apprentissage des 6 méthodes sur les données d’apprentissage avec calibration des hyperparamètres par validation croisée ; Calcul de l’erreur quadratique moyenne sur les données de test.
  • 35. Méthologie Séparation des données en apprentissage et test en respectant l’équilibre des 18 groupes présentés en introduction ; Apprentissage des 6 méthodes sur les données d’apprentissage avec calibration des hyperparamètres par validation croisée ; Calcul de l’erreur quadratique moyenne sur les données de test. Cette procédure a été répétée 250 fois.
  • 37. ELN : Qualité de prédiction q q q q qqq qqqqqq q q q qq q q qqqqqqqqqqqq q qq q qq q q qqqqq q q q qqq q qqqqq q qq qqq q qqq q q q q q qqqq qqq q q q q q q qq qqq qq qq q q q qq q qq qq q q q q qq q q q qqq q qqq qqq q qq q q qq qqq qq q q q q qqq q q qqqqqqq q q qq q q q q qq q q qq q qqqq q q q q qq q qq qq q qqq q q q q q q qq qq q q q q qqq q q q q qq q q q q qq qq q q q q qqq q qq q qq q q q q q qq q q q q q q q qqqq q q qq q q qq qq q qq qq qq q q q q q q q qq q q q q q qq q q q q q q q q q qqq q q q q q qq q q q qqqqqq q q qq q q q q q q q qq q qqq q qq qq qq qq q qq q q qqq q qq q qqq qqq q q qq qq q q qq qq q q q qqq q qq qqqq qq q q q qq q qq qq q q q q qq q q 0 50 100 150 050100150 Mixing: 10% True value Predictedvalue q q q q qqq qqqqqq q q q qq q q qqq q q qqqq qqq q qq q q q q q qqqqq q q q qqq q qqqqq q qq qqq q qqq q q q q q qq q q qqq q q q q qqqq qqq qq qq q qq qq q qq qq q q q q qq q q q qqq q q qq qqq q qq q q qq qqq q q q qqq q qq q q qqqqqq q qq qq q q q q qq q q qq q qqqq q q qq qq q qq qq q qqqq q q q q q qq qq q q q q qqq q q q q qq qq q q qq qq q q q q qqq q qq q qq q q q q q qqq q q q q q q qqqq q q q q q q qq qq q qq q q qq q q q q q q q q q qq q q q qq q q q qq q q q q qqq q q q q q qqq q q qqq qq q q q qqq q q q q q q qq q qq q q qq qq qq q q q qq q q qqq q qq q qqq qqq q q qq qq q q qq qq q q q qqqq qq qqqq qq q q q q q q q q q q q q q q qq q q 0 50 100 150 050100150 Mixing: 25% True value Predictedvalue
  • 38. ELN : Coefficients impliqués 2 4 6 8 10 05101520 ppm
  • 39. ELN : Coefficients impliqués 2 4 6 8 10 05101520 ppm Certains coefficients sont les mêmes que ceux connus et précédemment identifés, certains métabolites manquent dans la liste, certains métabolites de la liste semblent inconnus. ⇒ effet d’échelle ?
  • 40. Perspectives et questions Normalisation actuelle ? Modèle à effets mixtes ? Qu’est-ce qui est pertinent pour la recherche des coefficients les plus importants dans ELN ?