Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Application de l’ana...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Introduction
Statist...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Sommaire
1 Généralit...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Sommaire
1 Généralit...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Qu’est-ce qu’une don...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Qu’est-ce qu’une don...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Qu’est-ce qu’une don...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Problèmes posés par ...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Problèmes posés par ...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Problèmes posés par ...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Problèmes posés par ...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Comment traiter ce t...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Comment traiter ce t...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Comment traiter ce t...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Comment traiter ce t...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Sommaire
1 Généralit...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Principe général
Pri...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Principe général
Pri...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Principe général
Pri...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Principe général
Pri...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Principe général
Pri...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Principe général
Pri...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Mise en œuvre pratiq...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Mise en œuvre pratiq...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Mise en œuvre pratiq...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Mise en œuvre pratiq...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Mise en œuvre pratiq...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Conclusion théorique...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Sommaire
1 Généralit...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Présentation des don...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Présentation des don...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Présentation des don...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Présentation des don...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Présentation des don...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Présentation des don...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Présentation des don...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Méthodologie pour év...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Méthodologie pour év...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Méthodologie pour év...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Résultats
Méthodes c...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Résultats
Méthodes c...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Pour comparaison ave...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Conclusions
Résumé d...
Généralités sur l’Analyse des Données Fonctionnelles (ADF)
Analyse par splines de lissage
Application
Conclusions
Résumé d...
Prochain SlideShare
Chargement dans…5
×

Application de l’analyse des données fonctionnelles à l’identification de blé dur fusarié, moucheté et mitadiné

408 vues

Publié le

September 30th, 2009
Journée HélioSPIR 2009, École d’Ingénieurs de Purpan, Toulouse

Publié dans : Sciences
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
408
Sur SlideShare
0
Issues des intégrations
0
Intégrations
20
Actions
Partages
0
Téléchargements
10
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Application de l’analyse des données fonctionnelles à l’identification de blé dur fusarié, moucheté et mitadiné

  1. 1. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Application de l’analyse des données fonctionnelles à l’identification de blé dur fusarié, moucheté et mitadiné Nathalie Villa-Vialaneix http://www.nathalievilla.org En collaboration avec Cécile Levasseur (École d’Ingénieurs de Purpan) & Fabrice Rossi (TELECOM ParisTech) Institut de Mathématiques de Toulouse, France - nathalie.villa@math.univ-toulouse.fr Toulouse, Hélio-SPIR, 30 septembre 2009 Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 1/17
  2. 2. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Introduction Statisticienne spécialisée dans l’analyse des données fonctionnelles : −→ Valeur d’intérêt, Y Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 2/17
  3. 3. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Sommaire 1 Généralités sur l’Analyse des Données Fonctionnelles (ADF) 2 Analyse par splines de lissage 3 Application Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 3/17
  4. 4. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Sommaire 1 Généralités sur l’Analyse des Données Fonctionnelles (ADF) 2 Analyse par splines de lissage 3 Application Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 4/17
  5. 5. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Qu’est-ce qu’une donnée “fonctionnelle” ? En théorie, une donnée fonctionnelle est une fonction, X : [0, 1] → R. Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 5/17
  6. 6. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Qu’est-ce qu’une donnée “fonctionnelle” ? En théorie, une donnée fonctionnelle est une fonction, X : [0, 1] → R. À partir des observations de cette variable et d’une autre variable réelle d’intérêt, Y, on cherche à prédire Y à partir de X. Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 5/17
  7. 7. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Qu’est-ce qu’une donnée “fonctionnelle” ? En théorie, une donnée fonctionnelle est une fonction, X : [0, 1] → R. À partir des observations de cette variable et d’une autre variable réelle d’intérêt, Y, on cherche à prédire Y à partir de X. En pratique, on n’observe jamais la fonction mais une discrétisation de celle-ci : X(t1), . . . , X(td) Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 5/17
  8. 8. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Problèmes posés par ce type de données Du point de vue de la régression : Grande dimension : Le nombre de fonctions observées, n, est souvent plus petit que d (la dimension des données) −→ Problème mal posé ; Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 6/17
  9. 9. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Problèmes posés par ce type de données Du point de vue de la régression : Grande dimension : Le nombre de fonctions observées, n, est souvent plus petit que d (la dimension des données) −→ Problème mal posé ; ⇒ Par ex, le modèle Y = aT X + b + n’a plus une unique solution selon les moindres carrés. Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 6/17
  10. 10. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Problèmes posés par ce type de données Du point de vue de la régression : Grande dimension : Le nombre de fonctions observées, n, est souvent plus petit que d (la dimension des données) −→ Problème mal posé ; ⇒ Par ex, le modèle Y = aT X + b + n’a plus une unique solution selon les moindres carrés. Discrétisations très corrélées entre elles pour une même observation du fait de la structure sous-jacente. Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 6/17
  11. 11. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Problèmes posés par ce type de données Du point de vue de la régression : Grande dimension : Le nombre de fonctions observées, n, est souvent plus petit que d (la dimension des données) −→ Problème mal posé ; ⇒ Par ex, le modèle Y = aT X + b + n’a plus une unique solution selon les moindres carrés. Discrétisations très corrélées entre elles pour une même observation du fait de la structure sous-jacente. Conséquences : Les méthodes statistiques appliquées aux données discrétisées donnent de mauvais résultats et, notamment, se généralisent mal à de nouvelles observations. Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 6/17
  12. 12. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Comment traiter ce type de donnée ? Méthodes de régularisation ou de réduction de dimension. Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 7/17
  13. 13. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Comment traiter ce type de donnée ? Méthodes de régularisation ou de réduction de dimension. Si L2 est l’ensemble des fonctions de carré intégrables, on sait qu’il existe une (des, en fait) base(s) de fonctions (ei)i telles que toute fonction de L2 s’exprime comme combinaison linéaire des (ei)i : X = i αiei Par exemple, la base trigonométrique : e1(t) = cos(t) ; e2(t) = sin(t) ; e3(t) = cos(2t) ; e4(t) = sin(2t) . . . Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 7/17
  14. 14. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Comment traiter ce type de donnée ? Méthodes de régularisation ou de réduction de dimension. Si L2 est l’ensemble des fonctions de carré intégrables, on sait qu’il existe une (des, en fait) base(s) de fonctions (ei)i telles que toute fonction de L2 s’exprime comme combinaison linéaire des (ei)i : X = i αiei q i=1 αiei Par exemple, la base trigonométrique : e1(t) = cos(t) ; e2(t) = sin(t) ; e3(t) = cos(2t) ; e4(t) = sin(2t) . . . Pourquoi ? La dimension nécessaire pour bien représenter les données, q, est souvent très inférieure à d si la base est bien choisie. Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 7/17
  15. 15. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Comment traiter ce type de donnée ? Méthodes de régularisation ou de réduction de dimension. Si L2 est l’ensemble des fonctions de carré intégrables, on sait qu’il existe une (des, en fait) base(s) de fonctions (ei)i telles que toute fonction de L2 s’exprime comme combinaison linéaire des (ei)i : X = i αiei q i=1 αiei Par exemple, la base trigonométrique : e1(t) = cos(t) ; e2(t) = sin(t) ; e3(t) = cos(2t) ; e4(t) = sin(2t) . . . Pourquoi ? La dimension nécessaire pour bien représenter les données, q, est souvent très inférieure à d si la base est bien choisie. Cette représentation permet d’avoir accès à des opérations fonctionnelles comme la dérivée. Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 7/17
  16. 16. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Sommaire 1 Généralités sur l’Analyse des Données Fonctionnelles (ADF) 2 Analyse par splines de lissage 3 Application Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 8/17
  17. 17. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Principe général Principe général : L’hypothèse de base est que la fonction sous-jacente est régulière. Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 9/17
  18. 18. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Principe général Principe général : L’hypothèse de base est que la fonction sous-jacente est régulière. convient pour des spectres infra-rouges Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 9/17
  19. 19. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Principe général Principe général : L’hypothèse de base est que la fonction sous-jacente est régulière. ne convient pas pour la spectrométrie de masse Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 9/17
  20. 20. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Principe général Principe général : L’hypothèse de base est que la fonction sous-jacente est régulière. Dans ce cas, utilisation d’une projection sur des bases d’ondelettes... (Travail en cours avec A. Paris (INRA) et N. Hernandez (CENATAV, Cuba)) Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 9/17
  21. 21. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Principe général Principe général : L’hypothèse de base est que la fonction sous-jacente est régulière. Représentation des spectres dans un espace Hm dans lequel la norme d’un spectre est sensiblement égal à la norme de sa dérivée d’ordre m Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 9/17
  22. 22. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Principe général Principe général : L’hypothèse de base est que la fonction sous-jacente est régulière. Représentation des spectres dans un espace Hm dans lequel la norme d’un spectre est sensiblement égal à la norme de sa dérivée d’ordre m ⇒ régularité et prise en compte de la courbure ! Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 9/17
  23. 23. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Mise en œuvre pratique Les données : x1(t1) . . . x1(td) . . . xn(t1) . . . xn(td) Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 10/17
  24. 24. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Mise en œuvre pratique Les données : x1(t1) . . . x1(td) . . . xn(t1) . . . xn(td) Étape 1 : “Reconstruire”, à partir de xi(t1), . . . , xi(td), la fonction sous-jacente. Elle est approchée par ˆxi telle que d l=1 (xi(tl) − ˆxi(tl))2 est petit et Dm ˆxi 2 est petit Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 10/17
  25. 25. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Mise en œuvre pratique Les données : x1(t1) . . . x1(td) . . . xn(t1) . . . xn(td) Étape 1 : “Reconstruire”, à partir de xi(t1), . . . , xi(td), la fonction sous-jacente. Elle est approchée par ˆxi telle que d l=1 (xi(tl) − ˆxi(tl))2 est petit et Dm ˆxi 2 est petit Fidélité aux données Régularité Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 10/17
  26. 26. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Mise en œuvre pratique Les données : x1(t1) . . . x1(td) . . . xn(t1) . . . xn(td) Étape 1 : “Reconstruire”, à partir de xi(t1), . . . , xi(td), la fonction sous-jacente. Elle est approchée par ˆxi telle que d l=1 (xi(tl) − ˆxi(tl))2 est petit et Dm ˆxi 2 est petit Fidélité aux données Régularité Étape 2 : Utiliser Dmˆxi comme entrée d’une méthode de régression (ici SVM) ⇒ nécessite de savoir calculer Dm ˆxi, Dm ˆxj Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 10/17
  27. 27. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Mise en œuvre pratique Les données : x1(t1) . . . x1(td) . . . xn(t1) . . . xn(td) Étape 1 : “Reconstruire”, à partir de xi(t1), . . . , xi(td), la fonction sous-jacente. Elle est approchée par ˆxi telle que d l=1 (xi(tl) − ˆxi(tl))2 est petit et Dm ˆxi 2 est petit Fidélité aux données Régularité Étape 2 : Utiliser Dmˆxi comme entrée d’une méthode de régression (ici SVM) ⇒ nécessite de savoir calculer Dm ˆxi, Dm ˆxj Qd,m ×   x1(t1) . . . x1(td) . . . xn(t1) . . . xn(td)   Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 10/17
  28. 28. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Conclusion théorique L’utilisation d’une méthode de régression de type SVM (voir Vapnik, The Nature of Statistical Learning Theory) permet de garantir que la méthode atteint asymptotiquement une performance optimale (lorsque n est “suffisamment grand” et d est “suffisamment grand”). Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 11/17
  29. 29. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Sommaire 1 Généralités sur l’Analyse des Données Fonctionnelles (ADF) 2 Analyse par splines de lissage 3 Application Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 12/17
  30. 30. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Présentation des données 953 échantillons de blé dur ont été analysés : spectrométrie infra-rouge : 1049 longueurs d’onde uniformément réparties entre 400 et 2498 nm ; Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 13/17
  31. 31. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Présentation des données 953 échantillons de blé dur ont été analysés : spectrométrie infra-rouge : 1049 longueurs d’onde uniformément réparties entre 400 et 2498 nm ; fusariose : déterminée en % de la masse des grains par triage préalable des grains affectés ; Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 13/17
  32. 32. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Présentation des données 953 échantillons de blé dur ont été analysés : spectrométrie infra-rouge : 1049 longueurs d’onde uniformément réparties entre 400 et 2498 nm ; fusariose : déterminée en % de la masse des grains par triage préalable des grains affectés ; moucheture : déterminé en % de la masse des grains par triage préalable des grains affectés ; Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 13/17
  33. 33. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Présentation des données 953 échantillons de blé dur ont été analysés : spectrométrie infra-rouge : 1049 longueurs d’onde uniformément réparties entre 400 et 2498 nm ; fusariose : déterminée en % de la masse des grains par triage préalable des grains affectés ; moucheture : déterminé en % de la masse des grains par triage préalable des grains affectés ; mitadinage : déterminé en % du nombre de grains affectés par comptage. Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 13/17
  34. 34. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Présentation des données 953 échantillons de blé dur ont été analysés : spectrométrie infra-rouge : 1049 longueurs d’onde uniformément réparties entre 400 et 2498 nm ; fusariose : déterminée en % de la masse des grains par triage préalable des grains affectés ; moucheture : déterminé en % de la masse des grains par triage préalable des grains affectés ; mitadinage : déterminé en % du nombre de grains affectés par comptage. Question : Comment prédire les valeurs de qualité correspondant à la fusariose, à la moucheture et au mitadinage à partir de la collecte des spectres infra-rouge ? Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 13/17
  35. 35. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Présentation des données 953 échantillons de blé dur ont été analysés : spectrométrie infra-rouge : 1049 longueurs d’onde uniformément réparties entre 400 et 2498 nm ; fusariose : déterminée en % de la masse des grains par triage préalable des grains affectés ; moucheture : déterminé en % de la masse des grains par triage préalable des grains affectés ; mitadinage : déterminé en % du nombre de grains affectés par comptage. Question : Comment prédire les valeurs de qualité correspondant à la fusariose, à la moucheture et au mitadinage à partir de la collecte des spectres infra-rouge ? Les méthodes habituelles (PLS, réseau de neurones ...) donnent ici des résultats décevants. Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 13/17
  36. 36. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Présentation des données 953 échantillons de blé dur ont été analysés : spectrométrie infra-rouge : 1049 longueurs d’onde uniformément réparties entre 400 et 2498 nm ; fusariose : déterminée en % de la masse des grains par triage préalable des grains affectés ; moucheture : déterminé en % de la masse des grains par triage préalable des grains affectés ; mitadinage : déterminé en % du nombre de grains affectés par comptage. Question : Comment prédire les valeurs de qualité correspondant à la fusariose, à la moucheture et au mitadinage à partir de la collecte des spectres infra-rouge ? Les méthodes habituelles (PLS, réseau de neurones ...) donnent ici des résultats décevants. ⇒ Présentation des résultats de la mise en œuvre de la méthode sur le mitadinage. Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 13/17
  37. 37. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Méthodologie pour évaluation de la validité de l’approche par splines Séparation aléatoire du jeu de données en apprentissage (pour la définition de la régression) et test (pour évaluer les performances de la régression) : cette séparation est répétée 50 fois pour évaluer la variabilité de la qualité de l’approximation ; Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 14/17
  38. 38. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Méthodologie pour évaluation de la validité de l’approche par splines Séparation aléatoire du jeu de données en apprentissage (pour la définition de la régression) et test (pour évaluer les performances de la régression) : cette séparation est répétée 50 fois pour évaluer la variabilité de la qualité de l’approximation ; Sur les 50 ensembles d’apprentissage, des erreurs de prédiction sont calculées : MSE = 1 |Testk | Testk (Mitadinage−Mitadinage estimé par la régression)2 Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 14/17
  39. 39. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Méthodologie pour évaluation de la validité de l’approche par splines Séparation aléatoire du jeu de données en apprentissage (pour la définition de la régression) et test (pour évaluer les performances de la régression) : cette séparation est répétée 50 fois pour évaluer la variabilité de la qualité de l’approximation ; Sur les 50 ensembles d’apprentissage, des erreurs de prédiction sont calculées : MSE = 1 |Testk | Testk (Mitadinage−Mitadinage estimé par la régression)2 Les divers paramètres du modèle sont évalués par validation croisée sur l’ensemble d’apprentissage. Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 14/17
  40. 40. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Résultats Méthodes comparées : SVM linéaire et non linéaire (Gaussien) sur les données initiales et les dérivées d’ordre 1 à 2 déterminées par splines. Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 15/17
  41. 41. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Résultats Méthodes comparées : SVM linéaire et non linéaire (Gaussien) sur les données initiales et les dérivées d’ordre 1 à 2 déterminées par splines. Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 15/17
  42. 42. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Pour comparaison avec PLS... MSE moyenne (test) Écart type MSE PLS sur données initiales 0.154 0.012 Kernel PLS 0.154 0.013 SVM splines (reg. D2 ) 0.094 0.008 Gain de près de 40 % sur la prédiction moyenne. SVM−D2 KPLS PLS 0.080.100.120.140.160.18 Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 16/17
  43. 43. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Conclusions Résumé des résultats : Les différences sont significatives entre l’utilisation des dérivées d’ordre 2 et d’ordre 1 ; l’utilisation des dérivées et l’utilisation des données initiales ; l’utilisation d’une approche non linéaire et d’une approche linéaire. Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 17/17
  44. 44. Généralités sur l’Analyse des Données Fonctionnelles (ADF) Analyse par splines de lissage Application Conclusions Résumé des résultats : Les différences sont significatives entre l’utilisation des dérivées d’ordre 2 et d’ordre 1 ; l’utilisation des dérivées et l’utilisation des données initiales ; l’utilisation d’une approche non linéaire et d’une approche linéaire. Perspectives : recherche des endroits du spectres impliqués dans la prédiction ; comparaison méthodologique similaire avec les splines combinées avec diverses méthodes : PLS, forêts aléatoires ... Nathalie Villa, Cécile Levasseur, Fabrice Rossi ADF pour spectres IR, Hélio-SPIR 2009 - 17/17

×