Ajustement des données à la Distribution Logistique Multivariée Mohamed El Merouani Département de Statistique et Informat...
Plan <ul><li>Introduction </li></ul><ul><li>Application à la Distribution Logistique Multivariante </li></ul><ul><li>Simul...
Introduction  <ul><li>Nous donnons une généralisation de la méthode proposée par Castillo, Sarabia et Hadi (1997) [1] à pa...
<ul><li>Pour estimer  θ  en se basant sur un échantillon aléatoire observé à partir de  F(X ; θ) ,  nous écrivons en un pr...
<ul><li>Des résultats de simulation indiquent que la méthode généralisée fonctionne bien.  </li></ul><ul><li>Cette méthode...
Application à la Distribution Logistique Multivariante <ul><li>La distribution logistique multivariante  avec  et  a comme...
<ul><li>A partir de cette CDF, on obtient les fonctions de distributions marginales suivantes : </li></ul>
chaque  admet comme fonction de distribution : et un sous-ensemble quelconque  a une CDF conjointe de la même forme.
Les estimateurs de   et   sont obtenus comme suit : (a) On obtient les estimateurs de  en écrivant :   où   est la proport...
<ul><li>Alors, on obtient les solutions suivantes : </li></ul>où   pour tout
<ul><li>Soit  une permutation quelconque de    ; alors l ’estimateur de  peut-être obtenu en prenant les moyennes pondérée...
<ul><li>Ainsi, nous proposons d ’utiliser les équations suivantes pour calculer les valeurs prédits qui sont obtenus en pr...
où si   pour tout     ; et si   pour tout     avec  est une permutation quelconque de   Quand la taille de l ’échantillon ...
<ul><li>(b) En suite, nous minimisons, par rapport à  </li></ul>Soit   quelconque tel que   , alors nous avons
<ul><li>Les dérivées de  par rapport à  et  , sont,  </li></ul>En faisant chacune de ces équations égale à 0,  on obtient ...
<ul><li>Les solutions de ces équations nous </li></ul><ul><li>donnent les composantes de  et  , qui sont </li></ul>avec
Simulation de la Distribution Logistique Standard Multivariante <ul><li>Soient  ,  r  variables aléatoires indépendantes u...
suit une distribution logistique multivariante  avec   et   .
<ul><li>Dans ce paragraphe, nous avons construit une simulation pour évaluer la qualité des estimateurs proposés.  </li></...
<ul><li>Comme les statistiques  et  associées à une distribution logistique multivariante quelconque  avec  et  peuvent êt...
<ul><li>Dans ce cas multi variant, nous avons considéré que toutes les pondérations sont égaux et valent  .  </li></ul><ul...
Conclusion <ul><li>L ’estimation du paramètre de la distribution multivarié par la méthode des quantiles, nous a conduit à...
<ul><li>Ce cas multivarié nécessite encore des études plus détaillées qui considèrent des exemples des applications sur de...
Table 1:  Moyennes et écart-types des statistiques AAE et ASE pour une simulation avec 1000 replications à partir d'une Di...
Table 2:  Moyennes et écart-types des statistiques AAE et ASE pour une simulation avec 1000 replications à partir d'une Di...
Références <ul><li>Castillo, E. and Sarabia, J. M. and Hadi, Ali S. (1997);  Fitting continous biva riate distributions to...
Merci.
Prochain SlideShare
Chargement dans…5
×

Ajustement des données à la Distribution Logistique Multivariée

4 410 vues

Publié le

2ème édition des Journées d’Informatique et Mathématiques Décisionnelles (JIMD’2)
ENSIAS, Rabat, Maroc

Publié dans : Formation
0 commentaire
1 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
4 410
Sur SlideShare
0
Issues des intégrations
0
Intégrations
2 400
Actions
Partages
0
Téléchargements
0
Commentaires
0
J’aime
1
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Ajustement des données à la Distribution Logistique Multivariée

  1. 1. Ajustement des données à la Distribution Logistique Multivariée Mohamed El Merouani Département de Statistique et Informatique Faculté Polydisciplinaire Université Abdelmalek Essaâdi, Tétouan, Maroc. E-mail : [email_address] la 2ème édition des Journées d ’Informatique et Mathématiques Décisionnelles (JIMD’2) ENSIAS, Rabat, Maroc
  2. 2. Plan <ul><li>Introduction </li></ul><ul><li>Application à la Distribution Logistique Multivariante </li></ul><ul><li>Simulation de la Distribution Logistique Standard Multivariante </li></ul><ul><li>Conclusion </li></ul>
  3. 3. Introduction <ul><li>Nous donnons une généralisation de la méthode proposée par Castillo, Sarabia et Hadi (1997) [1] à partir de la bivariante à la multivariante. </li></ul><ul><li>Soit X= ( X 1 , X 2 ,…,X r ) un vecteur de variables aléatoires de fonction de distribution conjointe (CDF) F ( X ; θ )  ; où θ est le paramètre vecteur-valué à estimer. </li></ul>
  4. 4. <ul><li>Pour estimer θ en se basant sur un échantillon aléatoire observé à partir de F(X ; θ) , nous écrivons en un premier lieu les valeurs prédits comme fonction du paramètre θ  ; alors un estimateur de θ est obtenu en minimisant la somme des écarts quadratiques entre les valeurs prédits et observés de l ’échantillon. </li></ul><ul><li>L ’idée est d’utiliser les fonctions de distributions conjointes et marginales CDFs pour calculer les valeurs prédites comme fonctions de θ  ; et cela par généralisation du cas bivariant [1] au cas multivariant. </li></ul>
  5. 5. <ul><li>Des résultats de simulation indiquent que la méthode généralisée fonctionne bien. </li></ul><ul><li>Cette méthode généralisée peut-être aussi appliquée à un exemple de données réelles. </li></ul>
  6. 6. Application à la Distribution Logistique Multivariante <ul><li>La distribution logistique multivariante avec et a comme fonction de distribution conjointe (CDF) : </li></ul>pour
  7. 7. <ul><li>A partir de cette CDF, on obtient les fonctions de distributions marginales suivantes : </li></ul>
  8. 8. chaque admet comme fonction de distribution : et un sous-ensemble quelconque a une CDF conjointe de la même forme.
  9. 9. Les estimateurs de et sont obtenus comme suit : (a) On obtient les estimateurs de en écrivant : où est la proportion des points de l ’échantillon où : avec .
  10. 10. <ul><li>Alors, on obtient les solutions suivantes : </li></ul>où pour tout
  11. 11. <ul><li>Soit une permutation quelconque de   ; alors l ’estimateur de peut-être obtenu en prenant les moyennes pondérées </li></ul>où pour tout
  12. 12. <ul><li>Ainsi, nous proposons d ’utiliser les équations suivantes pour calculer les valeurs prédits qui sont obtenus en prenant les moyennes pondérées sur toutes les valeurs possibles de dans des équations de type antérieur et en remplaçant les par   ; </li></ul>
  13. 13. où si pour tout   ; et si pour tout   avec est une permutation quelconque de Quand la taille de l ’échantillon est finie, il est possible d’avoir pour quelques valeurs de l ’échantillon.
  14. 14. <ul><li>(b) En suite, nous minimisons, par rapport à </li></ul>Soit quelconque tel que , alors nous avons
  15. 15. <ul><li>Les dérivées de par rapport à et , sont, </li></ul>En faisant chacune de ces équations égale à 0, on obtient le système des équations suivantes :
  16. 16. <ul><li>Les solutions de ces équations nous </li></ul><ul><li>donnent les composantes de et , qui sont </li></ul>avec
  17. 17. Simulation de la Distribution Logistique Standard Multivariante <ul><li>Soient , r variables aléatoires indépendantes uniformes U ( 0,1 ). Alors, la variable définie par : </li></ul>
  18. 18. suit une distribution logistique multivariante avec et .
  19. 19. <ul><li>Dans ce paragraphe, nous avons construit une simulation pour évaluer la qualité des estimateurs proposés. </li></ul><ul><li>Pour juger la qualité globale d ’ajustement, nous utilisons l’erreur absolue moyenne ( AAE ), </li></ul><ul><li>et l ’erreur quadratique moyenne ( ASE ), </li></ul><ul><li>où sont les valeurs prédits de l ’échantillon. </li></ul>
  20. 20. <ul><li>Comme les statistiques et associées à une distribution logistique multivariante quelconque avec et peuvent être obtenues en fonction des statistiques correspondantes pour une distribution avec et , il suffit de simuler seulement une distribution avec et . </li></ul>
  21. 21. <ul><li>Dans ce cas multi variant, nous avons considéré que toutes les pondérations sont égaux et valent . </li></ul><ul><li>Nous avons calculé les moyennes et les écart-types des statistiques ( ASE ) et ( AAE ) pour une simulation avec 1000 réplications à partir d ’une population logistique multivariante avec et pour et </li></ul>
  22. 22. Conclusion <ul><li>L ’estimation du paramètre de la distribution multivarié par la méthode des quantiles, nous a conduit à l’utilisation des permutations pour trouver toutes les valeurs possibles des estimateurs. </li></ul><ul><li>Ensuite, des moyennes pondérées ont été prises. Ce qui a impliqué des difficultés dans l ’étude pratique. </li></ul>
  23. 23. <ul><li>Ce cas multivarié nécessite encore des études plus détaillées qui considèrent des exemples des applications sur des données réelles. </li></ul><ul><li>La simulation elle-même a demandé l ’utilisation des matrices de grandes tailles. </li></ul><ul><li>Par ailleurs, nous avons planifié de développer tous ces questions dans des travaux futurs. </li></ul>
  24. 24. Table 1: Moyennes et écart-types des statistiques AAE et ASE pour une simulation avec 1000 replications à partir d'une Distribution Logistique Bivanriante BL(0,1,0, τ ) pour différents valeurs de τ et pour β=0,5 Moyennes et écart-types pour τ τ=1 τ=0,5 τ=0,25 Taille de l'échantillon Statistiques Moyenne Ecart-type Moyenne Ecart-type Moyenne Ecart-type 50 AAE 0,793 0,263 0,591 0,196 0,49 0,166 100 0,615 0,188 0,46 0,142 0,382 0,122 200 0,481 0,138 0,391 0,105 0,301 0,091 500 0,357 0,101 0,27 0,078 0,227 0,068 50 ASE 0,676 0,595 0,385 0,303 0,312 0,237 100 0,433 0,319 0,245 0,163 0,198 0,129 200 0,283 0,183 0,161 0,096 0,131 0,077 500 0,177 0,097 0,102 0,054 0,083 0,045
  25. 25. Table 2: Moyennes et écart-types des statistiques AAE et ASE pour une simulation avec 1000 replications à partir d'une Distribution Logistique Bivanriante BL(0,1,0,1) pour β=0,5; β=0,9 et β=1 Moyennes et écart-types pour β β =0,5 β =0,9 β =1 Taille de l'échantillon Statistiques Moyenne Ecart-type Moyenne Ecart-type Moyenne Ecart-type 50 AAE 0,793 0,263 0,947 0,311 0,989 0,323 100 0,615 0,188 0,769 0,235 0,811 0,247 200 0,481 0,138 0,631 0,184 0,671 0,196 500 0,357 0,101 0,504 0,144 0,543 0,155 50 ASE 0,676 0,595 0,914 0,689 0,991 0,722 100 0,433 0,319 0,64 0,402 0,708 0,432 200 0,283 0,183 0,49 0,255 0,519 0,281 500 0,177 0,097 0,324 0,156 0,374 0,176
  26. 26. Références <ul><li>Castillo, E. and Sarabia, J. M. and Hadi, Ali S. (1997); Fitting continous biva riate distributions to data ; The Statistician, 46, N°3, pp. 355-369. </li></ul>
  27. 27. Merci.

×