SlideShare une entreprise Scribd logo
1  sur  71
Télécharger pour lire hors ligne
La Régression de poisson
La Régression de poisson
Exemple1:
-Exemple relatif à l’étude d’un portefeuille d’assurance automobile: on se
dispose d’un échantillon de 54 conducteurs pour qui on observe les variables
suivantes:
 genre: 1=femme, 2=homme;
 région: 1=rurale, 2=autre, 3=urbaine;
 type de la voiture: 1=petite, 2= moyenne, 3= grande;
 emploi: 1=fonctionnaire/autres…, 2=entre-deux, 3=dynamique
 npol: nombre total d’assurés dans cette cellule;
 n: nombre total de sinistres observés durant l’année précédente.
La Régression de poisson
Le nombre de sinistres et les facteurs de risque: pour un individu ayant la
combinaison (genre=1, région=3, type=1 et emploi=1), aura en moyenne exp(-
2.8401+0.2742)*100=7.68% plus de sinistres qu’un individu ayant la meilleure
combinaison (genre=1, region=1, type =1 et emploi=1)
La Régression de poisson
Exemple2:
La Régression de poisson
Exemple2:
La Régression de poisson
Exemple2:
La Régression de poisson
Exemple2:
La Régression de poisson
Exemple2:
La Régression de poisson
Exemple2:
La Régression de poisson
Exemple2:
La Régression de poisson
Exemple2:
La Régression de poisson
Exemple3:
 The number of awards earned by students at one high school. Predictors of the
number of awards earned include the type of program in which the student was
enrolled (e.g., vocational, general or academic) and the score on their final exam
in math.
 num_awards is the outcome variable and indicates the number of awards
earned by students at a high school in a year,
 math is a continuous predictor variable and represents students’ scores on their
math final exam
 prog is a categorical predictor variable with three levels indicating the type of
program in which the students were enrolled. It is coded as 1 = “General”, 2 =
“Academic” and 3 = “Vocational”.
Régression de Poisson: Modèle de comptage
Régression de Poisson: Modèle de comptage
Régression de Poisson: Modèle de comptage
La Régression de poisson:
Ajustement par variable de décalage (offset)
Loi de Poisson avec offset: biodiversité des
fourmis
 Le but de l’étude est d’étudier la biodiversité des fourmis en forêt tropicale
dans différents milieux, en comparant leur richesse.
 Quatre type de milieux sont étudiés: la forêt de plateau (GPWT), la forêt
de liane (FLWT), la forêt de transition (FTWT) et la forêt D’Inselberg
(INWT)
 Une observation est la donnée du nombre d’espèces de fournis présentes
dans 1 m2 de litière récolté dans un milieu donné.
 Les échantillons de litière récoltés sont pesés (variable Poids exprimé
en kilogramme) et le poids est considéré comme un proxy (un
indicateur) de l’épaisseur de la litière. 50 points d’échantillonnage distants
d’au moins 10m ont été choisis dans chaque milieu, sauf pour la forêt
d’Inselberg, pour laquelle seuls 20 points d’échantillonnage ont été
sélectionnés en raison de sa relative petite taille.
Loi de Poisson avec offset: biodiversité des fourmis
Les graphiques illustrent la variabilité des poids de litière récoltés en fonction
du site, ainsi que la variabilité du nombre d’espèces de fourmis présentes dans
chaque échantillon pour chacun des sites.
Loi de Poisson avec offset: biodiversité des fourmis
 La variable Y que l’on cherche à expliquer est un nombre d’espèces de fourmis présentes dans
1m2 de litière sur un site donné.
En supposant que les différentes espèces de fourmis se répartissent au hasard et de façon homogène
dans la litière, il est naturel de modéliser le nombre d’espèces de fourmis présentes par une loi de
Poisson. Le paramètre de la loi de Poisson représente le nombre moyen d’espèces de fourmis attendu
pour chaque observation.
Pour que les différents prélèvements soient comparables, il faudrait que les volumes de litière prélevés
soient identiques, lambdai désignerait alors un nombre d’espèces de fourmis moyen par unité de
volume, c’est-à-dire une densité. Puisque ce n’est pas le cas dans l’expérience, il est nécessaire de
prendre en compte la différence de volume des observations.
Loi de Poisson avec offset: biodiversité des fourmis
- En utilisant la fonction de lien naturel de la loi de Poisson, le modèle final est donné par:
- Vij désignant le volume de litière prélevé pour l’observation j sur le site i. cette information
n’étant pas disponible, le poids de litière va être utilisé comme indicateur de ce volume.
-Wij désignant le poids de litière prélevée pour l’observation j sur le site i. lambdai désigne
donc le nombre d’espèces de fourmis par unité de poids.
Loi de Poisson avec offset: biodiversité des fourmis
-En appliquant l’algorithme de Newton-Raphson, on obtient les estimations pour les paramètres du
modèle.
- Les valeurs prédites pour 1 kg de litère sont donc lambda(FLWT)=31,0; lambda(FTWT)=21,0;
lambda(GPWT)=26,9; lambda(INWT)=27,8.
Loi de Poisson avec offset: biodiversité des fourmis
 Pour étudier les différences de richesse entre les différents sites, on est
amené à tester l’effet Site.
La table donne les déviances du modèle nul (sous l’hypothèse H0) et du
modèle complet, ainsi que la valeur critique du test de rapport de
vraisemblance.
 La déviance diminue de 432.2 à 389.3 avec l’introduction de l’effet site et la
valeur critique du test du rapport de vraisemblance est très faible: le milieu
a un effet significatif sur la richesse spécifique.
Loi de Poisson avec offset: biodiversité des fourmis
 Pour comparer les richesses de deux sites (l’égalité des densités
moyennes des deux sites ou l’égalité de leur logarithme):
-la table donne pour chaque paire de sites la valeur critique du test d’égalité
des richesses spécifiques.
- Les différences de richesse spécifique sont donc significatives pour chaque
paire de sites au risque de 5%.
Régression de Poisson: Modèle de comptage
Régression de Poisson: Modèle de comptage
Régression de Poisson: Qualité d’ajustement
La Régression de poisson:
Adéquation du modèle estimé
La Régression de poisson:
Adéquation du modèle estimé
La Régression de poisson:
Adéquation du modèle estimé
Régression de Poisson: Inférence statistique
Régression de Poisson: Inférence statistique
Régression de Poisson: Interprétation des coefficients
Régression de Poisson: Interprétation des coefficients
Régression de Poisson: Sélection des variables
Régression de Poisson: Etudes des résidus
Régression de Poisson: Etudes des résidus
Régression de Poisson: Points Levier
Régression de Poisson: Surdispersion
Régression de Poisson: Surdispersion
La Régression de poisson:
La sur-dispersion
La Régression de poisson:
La sur-dispersion: Exemple
La Régression de poisson:
La sur-dispersion: Exemple
La Régression de poisson:
La sur-dispersion: Exemple
La Régression de poisson:
Modèles à inflation de zéros
La Régression de poisson:
Modèles à inflation de zéros
La Régression de poisson:
La régression Binomiale négative
La Régression de poisson:
La régression Binomiale négative
La Régression de poisson:
La régression Binomiale négative
La Régression de poisson:
La régression Binomiale négative
La Régression de poisson:
La régression Binomiale négative
La Régression de poisson:
La régression Binomiale négative
Poisson tronquée en 0: portées d’agneaux
 On s’intéresse à l’influence du génotype sur la taille des portées chez la
brebis. Pour n=161 brebis qui ont mis bas, on a noté la taille de leur portée
ainsi que leur génotype: BC, BG et CG pour 4 générations de croisements
BG.
Cette table donne les nombres des
portées de tailles allant de 1 à 5 petits
pour chaque génotype.
Cette table donne pour chaque
génotype et pour tous génotypes
confondus: le nombre de portées,
le nombre total de petits et le
nombre moyen de petits par
portée.
L’examen de cette table montre qu’il semble y avoir une différence de taille
des portées selon le génotype, la question est de savoir si elle est
significative.
Poisson tronquée en 0: portées d’agneaux
 la variable Y que l’on cherche à expliquer est le nombre de petits qu'il est naturel
de modéliser par une distribution de Poisson. Cependant, ici on ne retient que la
taille des portées des brebis qui ont mis bas, et la valeur 0 ne sera jamais
observée.
 Pour prendre en compte cette information dans la modélisation, on va supposer
que le nombre de petits est distribué selon une loi de Poisson tronquée en 0.
 La loi de Poisson tronquée est donc un cas de sous-dispersion.
Poisson tronquée en 0: portées d’agneaux
Effet du génotype (rapport de vraisemblance)
Comparaison des génotypes
-la table donne les estimations des paramètres du maximum de vraisemblance
obtenues par l’algorithme de Newton-Raphson. On en déduit
-omega1= mu+alpah1= 0.191, omega2=mu+alpha2=0.975
omega3=mu+alpha3=0.894,
-d’où lambda1=1.21, lambda2=2.65 et lambda3=2.44
Poisson tronquée en 0: portées d’agneaux
Comparaison des génotypes
Poisson tronquée en 0: portées d’agneaux
Comparaison des génotypes
Loi Gamma: roulements à billes, durées de vie
Contexte général
La variable réponse est la durée de vie en heures. On soupçonne que 3 facteurs,
notés A, B et C, peuvent avoir un effet sur la fiabilité. Un plan factoriel complet 2
puissance 3 a été mis en place, et on a obtenu les résultats de la table:
Un modèle usuel pour ce type de données est la loi de probabilité gamma de densité.
Cette loi pour des données positives (comme les durées de vie) permet de prendre en
compte une forte dissymétrie fréquente pour ces données. La fonction de lien
canonique est la fonction inverse 1/mu qui représente le nombre de pannes à l’heure.
Loi Gamma: roulements à billes, durées de vie
Contexte général
Le modèle additif avec les facteurs A et B
suffit pour prédire correctement la durée
de vie. Le facteur et les interactions ne
sont pas significatives.
Pour augmenter la durée de vie (diminuer le nombre de pannes à la minute), il
faut mettre les facteurs A et B au niveau haut. Si on utlise un lien linéaire, l’effet C
et l’interaction AB sont significatives.
La Régression de poisson
-Présenter des analyses de régression appropriées lorsque la variable
dépendante prend uniquement des valeurs entières non négatives (0,1, 2,…)
et que les grandes valeurs représentent des événements rares.
-Analyse de régression:
 Régression de Poisson;
 Régression de Poisson ajustée pour la sur dispersion;
 Régression binomiale négative.
- Ces modèles font parties des modèles linéaires généralisés (procédure glm
de R pour l’estimation de ce type de modèle).
La Régression de poisson
-La variable à modéliser est un nombre d’événements.
-Exemple:
 Nombre d’actes violents;
Nombre de sinistre;
Nombre de clients servis aujourd’hui;
Nombre d’infections de l’oreille de jeunes nageurs;
Nombre d’appels téléphonique.
-Plusieurs solutions:
 Catégoriser la variable dépendante (ex: 0 et 1, 2 à 7, 8 et plus) ou même
dichotomiser afin d’utiliser la régression logistique;
 Utiliser la régression linéaire multiple;
 Transformer la variable dépendante et modéliser la variable
transformée.
La Régression de poisson
-Plusieurs désavantages:
 Désavanatges de la catégorisation: La perte d’information, les résultats
sont affectés par le choix des points de césure.
 Désavantages de la régression linéaire multiple: Les postulats de la
régression linéaire multiple ne seront pas respectés (normalité des
résidus), les valeurs estimées par le modèle ne seront pas
nécessairement des valeurs entières et positives.
 Désavanatges de la transformation logarithme: la VD pouvant prendre
la valeur 0, pour calculer son logarithme, il faut ajouter une constante
y_tran= ln (y+1)
La Régression de poisson
La loi de Poisson décrit la distribution d’événements (rares) survenant dans un
intervalle de temps de façon aléatoire et indépendante.
La Régression de poisson
La Régression de poisson
La Régression de poisson
La Régression de poisson
La Régression de poisson
La Régression de poisson
 beta0 représente le logarithme népérien de l’espérance de la variable
dépendante Y lorsque les p variables exogènes prennent simultanément la valeur
0: beta0= ln( mui).
 si on augmente xij d’une unité et que l’on maintient constante la valeur des
autres exogènes, alors la valeur moyenne de Yi est multipliée par exp(betaj).
 Betaj représente le facteur selon lequel le nombre moyen mui de Yi augmente ou
diminue selon le signe de betaj, lorsque xij augmente d’une unité toute en
laissant les autres valeurs explicatives inchangées.
La Régression de poisson
La Régression de poisson
La Régression de poisson

Contenu connexe

En vedette

Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsPixeldarts
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Applitools
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at WorkGetSmarter
 

En vedette (20)

Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 

la régression de poisson slide..........

  • 2. La Régression de poisson Exemple1: -Exemple relatif à l’étude d’un portefeuille d’assurance automobile: on se dispose d’un échantillon de 54 conducteurs pour qui on observe les variables suivantes:  genre: 1=femme, 2=homme;  région: 1=rurale, 2=autre, 3=urbaine;  type de la voiture: 1=petite, 2= moyenne, 3= grande;  emploi: 1=fonctionnaire/autres…, 2=entre-deux, 3=dynamique  npol: nombre total d’assurés dans cette cellule;  n: nombre total de sinistres observés durant l’année précédente.
  • 3. La Régression de poisson Le nombre de sinistres et les facteurs de risque: pour un individu ayant la combinaison (genre=1, région=3, type=1 et emploi=1), aura en moyenne exp(- 2.8401+0.2742)*100=7.68% plus de sinistres qu’un individu ayant la meilleure combinaison (genre=1, region=1, type =1 et emploi=1)
  • 4. La Régression de poisson Exemple2:
  • 5. La Régression de poisson Exemple2:
  • 6. La Régression de poisson Exemple2:
  • 7. La Régression de poisson Exemple2:
  • 8. La Régression de poisson Exemple2:
  • 9. La Régression de poisson Exemple2:
  • 10. La Régression de poisson Exemple2:
  • 11. La Régression de poisson Exemple2:
  • 12. La Régression de poisson Exemple3:  The number of awards earned by students at one high school. Predictors of the number of awards earned include the type of program in which the student was enrolled (e.g., vocational, general or academic) and the score on their final exam in math.  num_awards is the outcome variable and indicates the number of awards earned by students at a high school in a year,  math is a continuous predictor variable and represents students’ scores on their math final exam  prog is a categorical predictor variable with three levels indicating the type of program in which the students were enrolled. It is coded as 1 = “General”, 2 = “Academic” and 3 = “Vocational”.
  • 13. Régression de Poisson: Modèle de comptage
  • 14. Régression de Poisson: Modèle de comptage
  • 15. Régression de Poisson: Modèle de comptage
  • 16. La Régression de poisson: Ajustement par variable de décalage (offset)
  • 17. Loi de Poisson avec offset: biodiversité des fourmis  Le but de l’étude est d’étudier la biodiversité des fourmis en forêt tropicale dans différents milieux, en comparant leur richesse.  Quatre type de milieux sont étudiés: la forêt de plateau (GPWT), la forêt de liane (FLWT), la forêt de transition (FTWT) et la forêt D’Inselberg (INWT)  Une observation est la donnée du nombre d’espèces de fournis présentes dans 1 m2 de litière récolté dans un milieu donné.  Les échantillons de litière récoltés sont pesés (variable Poids exprimé en kilogramme) et le poids est considéré comme un proxy (un indicateur) de l’épaisseur de la litière. 50 points d’échantillonnage distants d’au moins 10m ont été choisis dans chaque milieu, sauf pour la forêt d’Inselberg, pour laquelle seuls 20 points d’échantillonnage ont été sélectionnés en raison de sa relative petite taille.
  • 18. Loi de Poisson avec offset: biodiversité des fourmis Les graphiques illustrent la variabilité des poids de litière récoltés en fonction du site, ainsi que la variabilité du nombre d’espèces de fourmis présentes dans chaque échantillon pour chacun des sites.
  • 19. Loi de Poisson avec offset: biodiversité des fourmis  La variable Y que l’on cherche à expliquer est un nombre d’espèces de fourmis présentes dans 1m2 de litière sur un site donné. En supposant que les différentes espèces de fourmis se répartissent au hasard et de façon homogène dans la litière, il est naturel de modéliser le nombre d’espèces de fourmis présentes par une loi de Poisson. Le paramètre de la loi de Poisson représente le nombre moyen d’espèces de fourmis attendu pour chaque observation. Pour que les différents prélèvements soient comparables, il faudrait que les volumes de litière prélevés soient identiques, lambdai désignerait alors un nombre d’espèces de fourmis moyen par unité de volume, c’est-à-dire une densité. Puisque ce n’est pas le cas dans l’expérience, il est nécessaire de prendre en compte la différence de volume des observations.
  • 20. Loi de Poisson avec offset: biodiversité des fourmis - En utilisant la fonction de lien naturel de la loi de Poisson, le modèle final est donné par: - Vij désignant le volume de litière prélevé pour l’observation j sur le site i. cette information n’étant pas disponible, le poids de litière va être utilisé comme indicateur de ce volume. -Wij désignant le poids de litière prélevée pour l’observation j sur le site i. lambdai désigne donc le nombre d’espèces de fourmis par unité de poids.
  • 21. Loi de Poisson avec offset: biodiversité des fourmis -En appliquant l’algorithme de Newton-Raphson, on obtient les estimations pour les paramètres du modèle. - Les valeurs prédites pour 1 kg de litère sont donc lambda(FLWT)=31,0; lambda(FTWT)=21,0; lambda(GPWT)=26,9; lambda(INWT)=27,8.
  • 22. Loi de Poisson avec offset: biodiversité des fourmis  Pour étudier les différences de richesse entre les différents sites, on est amené à tester l’effet Site. La table donne les déviances du modèle nul (sous l’hypothèse H0) et du modèle complet, ainsi que la valeur critique du test de rapport de vraisemblance.  La déviance diminue de 432.2 à 389.3 avec l’introduction de l’effet site et la valeur critique du test du rapport de vraisemblance est très faible: le milieu a un effet significatif sur la richesse spécifique.
  • 23. Loi de Poisson avec offset: biodiversité des fourmis  Pour comparer les richesses de deux sites (l’égalité des densités moyennes des deux sites ou l’égalité de leur logarithme): -la table donne pour chaque paire de sites la valeur critique du test d’égalité des richesses spécifiques. - Les différences de richesse spécifique sont donc significatives pour chaque paire de sites au risque de 5%.
  • 24. Régression de Poisson: Modèle de comptage
  • 25. Régression de Poisson: Modèle de comptage
  • 26. Régression de Poisson: Qualité d’ajustement
  • 27. La Régression de poisson: Adéquation du modèle estimé
  • 28. La Régression de poisson: Adéquation du modèle estimé
  • 29. La Régression de poisson: Adéquation du modèle estimé
  • 30. Régression de Poisson: Inférence statistique
  • 31. Régression de Poisson: Inférence statistique
  • 32. Régression de Poisson: Interprétation des coefficients
  • 33. Régression de Poisson: Interprétation des coefficients
  • 34. Régression de Poisson: Sélection des variables
  • 35. Régression de Poisson: Etudes des résidus
  • 36. Régression de Poisson: Etudes des résidus
  • 37. Régression de Poisson: Points Levier
  • 38. Régression de Poisson: Surdispersion
  • 39. Régression de Poisson: Surdispersion
  • 40. La Régression de poisson: La sur-dispersion
  • 41. La Régression de poisson: La sur-dispersion: Exemple
  • 42. La Régression de poisson: La sur-dispersion: Exemple
  • 43. La Régression de poisson: La sur-dispersion: Exemple
  • 44. La Régression de poisson: Modèles à inflation de zéros
  • 45. La Régression de poisson: Modèles à inflation de zéros
  • 46. La Régression de poisson: La régression Binomiale négative
  • 47. La Régression de poisson: La régression Binomiale négative
  • 48. La Régression de poisson: La régression Binomiale négative
  • 49. La Régression de poisson: La régression Binomiale négative
  • 50. La Régression de poisson: La régression Binomiale négative
  • 51. La Régression de poisson: La régression Binomiale négative
  • 52. Poisson tronquée en 0: portées d’agneaux  On s’intéresse à l’influence du génotype sur la taille des portées chez la brebis. Pour n=161 brebis qui ont mis bas, on a noté la taille de leur portée ainsi que leur génotype: BC, BG et CG pour 4 générations de croisements BG. Cette table donne les nombres des portées de tailles allant de 1 à 5 petits pour chaque génotype. Cette table donne pour chaque génotype et pour tous génotypes confondus: le nombre de portées, le nombre total de petits et le nombre moyen de petits par portée. L’examen de cette table montre qu’il semble y avoir une différence de taille des portées selon le génotype, la question est de savoir si elle est significative.
  • 53. Poisson tronquée en 0: portées d’agneaux  la variable Y que l’on cherche à expliquer est le nombre de petits qu'il est naturel de modéliser par une distribution de Poisson. Cependant, ici on ne retient que la taille des portées des brebis qui ont mis bas, et la valeur 0 ne sera jamais observée.  Pour prendre en compte cette information dans la modélisation, on va supposer que le nombre de petits est distribué selon une loi de Poisson tronquée en 0.  La loi de Poisson tronquée est donc un cas de sous-dispersion.
  • 54. Poisson tronquée en 0: portées d’agneaux Effet du génotype (rapport de vraisemblance) Comparaison des génotypes -la table donne les estimations des paramètres du maximum de vraisemblance obtenues par l’algorithme de Newton-Raphson. On en déduit -omega1= mu+alpah1= 0.191, omega2=mu+alpha2=0.975 omega3=mu+alpha3=0.894, -d’où lambda1=1.21, lambda2=2.65 et lambda3=2.44
  • 55. Poisson tronquée en 0: portées d’agneaux Comparaison des génotypes
  • 56. Poisson tronquée en 0: portées d’agneaux Comparaison des génotypes
  • 57. Loi Gamma: roulements à billes, durées de vie Contexte général La variable réponse est la durée de vie en heures. On soupçonne que 3 facteurs, notés A, B et C, peuvent avoir un effet sur la fiabilité. Un plan factoriel complet 2 puissance 3 a été mis en place, et on a obtenu les résultats de la table: Un modèle usuel pour ce type de données est la loi de probabilité gamma de densité. Cette loi pour des données positives (comme les durées de vie) permet de prendre en compte une forte dissymétrie fréquente pour ces données. La fonction de lien canonique est la fonction inverse 1/mu qui représente le nombre de pannes à l’heure.
  • 58. Loi Gamma: roulements à billes, durées de vie Contexte général Le modèle additif avec les facteurs A et B suffit pour prédire correctement la durée de vie. Le facteur et les interactions ne sont pas significatives. Pour augmenter la durée de vie (diminuer le nombre de pannes à la minute), il faut mettre les facteurs A et B au niveau haut. Si on utlise un lien linéaire, l’effet C et l’interaction AB sont significatives.
  • 59. La Régression de poisson -Présenter des analyses de régression appropriées lorsque la variable dépendante prend uniquement des valeurs entières non négatives (0,1, 2,…) et que les grandes valeurs représentent des événements rares. -Analyse de régression:  Régression de Poisson;  Régression de Poisson ajustée pour la sur dispersion;  Régression binomiale négative. - Ces modèles font parties des modèles linéaires généralisés (procédure glm de R pour l’estimation de ce type de modèle).
  • 60. La Régression de poisson -La variable à modéliser est un nombre d’événements. -Exemple:  Nombre d’actes violents; Nombre de sinistre; Nombre de clients servis aujourd’hui; Nombre d’infections de l’oreille de jeunes nageurs; Nombre d’appels téléphonique. -Plusieurs solutions:  Catégoriser la variable dépendante (ex: 0 et 1, 2 à 7, 8 et plus) ou même dichotomiser afin d’utiliser la régression logistique;  Utiliser la régression linéaire multiple;  Transformer la variable dépendante et modéliser la variable transformée.
  • 61. La Régression de poisson -Plusieurs désavantages:  Désavanatges de la catégorisation: La perte d’information, les résultats sont affectés par le choix des points de césure.  Désavantages de la régression linéaire multiple: Les postulats de la régression linéaire multiple ne seront pas respectés (normalité des résidus), les valeurs estimées par le modèle ne seront pas nécessairement des valeurs entières et positives.  Désavanatges de la transformation logarithme: la VD pouvant prendre la valeur 0, pour calculer son logarithme, il faut ajouter une constante y_tran= ln (y+1)
  • 62. La Régression de poisson La loi de Poisson décrit la distribution d’événements (rares) survenant dans un intervalle de temps de façon aléatoire et indépendante.
  • 63. La Régression de poisson
  • 64. La Régression de poisson
  • 65. La Régression de poisson
  • 66. La Régression de poisson
  • 67. La Régression de poisson
  • 68. La Régression de poisson  beta0 représente le logarithme népérien de l’espérance de la variable dépendante Y lorsque les p variables exogènes prennent simultanément la valeur 0: beta0= ln( mui).  si on augmente xij d’une unité et que l’on maintient constante la valeur des autres exogènes, alors la valeur moyenne de Yi est multipliée par exp(betaj).  Betaj représente le facteur selon lequel le nombre moyen mui de Yi augmente ou diminue selon le signe de betaj, lorsque xij augmente d’une unité toute en laissant les autres valeurs explicatives inchangées.
  • 69. La Régression de poisson
  • 70. La Régression de poisson
  • 71. La Régression de poisson