SlideShare une entreprise Scribd logo
1  sur  34
AVALIAÇÃO DA SUPOSIÇÃO DE NORMALIDADE Ref.: Johnson e Wichern, Cap. 4
Alguns métodos de Inferência Estatística partem do pressuposto de normalidade dos dados. A qualidade das inferências feitas por estes métodos depende de quão próxima é a população em estudo da normal multivariada. Procedimentos para verificação de dados que apresentam desvios da suposição de normalidade se fazem necessários.
PROBLEMA: As observações Xi parecem violar a suposição de normalidade? Sugestão: verificar se as distribuições marginais do vetor aleatório parecem normais; se os diagramas de dispersão das variáveis tomadas duas a duas têm uma aparência elíptica; se existem observações discrepantes (outliers) que mereçam ser verificadas.
Avaliação da normalidade das distribuições marginais ,[object Object]
Se o histograma para a j-ésima componente do vetor de observações parece razoavelmente simétrico, podemos verificar a normalidade calculando a proporção de valores que caem em determinados intervalos comparando-a com a proporção esperada sob normalidade.,[object Object]
Q-Q plots ,[object Object]
São de fato um gráfico do quantil amostral versus quantil esperado sob normalidade (podem ser usados para validar outras distribuições diferentes da normal).
Quando a configuração de pontos no gráfico se aproxima de uma reta, a suposição de normalidade é sustentável.
A normalidade é suspeita se houver pontos que se desviam do comportamento linear.
A forma como os pontos se desviam do comportamento linear pode fornecer pistas sobre a natureza da não normalidade das observações.
Conhecida a razão da não normalidade dos dados, ações corretivas podem ser tomadas (transformações visando normalizar os dados ou uso de técnicas  para dados não normais).,[object Object]
PASSOS NA CONSTRUÇÃO DO Q-Q plot Para uma distribuição normal padrão, podemos obter os quantis q(i)tais que P(Z≤ q(i))=(i-0,5)/n. A idéia será olhar os pontos (q(i),x(i)) com a mesma probabilidade acumulada (i-0,5)/n. Se os dados, de fato, provêm de uma normal, os pares serão aproximadamente linearmente relacionados, pois o quantil esperado sob normalidade é aproximadamente σ q(i)+μ, com σ representando o desvio-padrão e μ a média da distribuição.
Usando o R para a construção do Q-Q plot No R temos a função ppoints(n) que gera o vetor de valores (i-0,5)/n, para i variando de 1 a n. Para gerar os quantis esperados sob normalidade usaremos a função qnorm(p), que retorna o quantil cuja probabilidade acumulada é p. (Quando não especificamos nada além de p, o R retorna quantis da N(0,1)). A função usada para ordenar um vetor de números no R é a função sort(x).
Construção do Q-Q plot das medidas do conjunto de dados crabs do pacote MASS ,[object Object]
Digite data(crabs).
Os dados estão organizados de tal modo que as colunas de 4 a 8 representam medidas morfológicas de caranguejos de duas espécies (linha 1 a 100 uma espécie e de 101 a 200 a outra).
Também há a divisão por gênero (macho e fêmea) tal que as 50 primeiras linhas de cada espécie são do gênero macho e, as restantes, do gênero fêmea.
Vamos construir 20 QQ-plots representando cada uma das 5 medidas dos 4 grupos caracterizados por espécie e gênero.,[object Object]
Avaliação da normalidade das distribuições marginais Uma medida quantitativa para auxiliar na avaliação do Q-Q plot é calcular a correlação rQ entre os quantis esperados e o vetor observado ordenado.  A hipótese de normalidade é rejeitada ao nível de significância α se rQobtido for menor que um valor apropriado. Por exemplo, ao nível de significância de 5% amostras de tamanho 50, a hipótese deve ser rejeitada se rQ  for inferiro a 0,9768.
Correlações obtidas na base de dados crabs ,[object Object]
grupo 2:0,99010,99390,99310,99400,9924
grupo 3:0,99020,99430,99070,99030,9893
grupo 4:0,99190,99030,99150,99120,9939
Limiar: 0,9768.
Logo, verifica-se que nenhuma das correlações fica abaixo do limiar especificado pelo nível de significância de 5%, evidenciando a não rejeição da hipótese nula de normalidade das distribuições marginais.,[object Object]
[object Object]
data:  x1 --> W = 0.9817, p-value = 0.6268
data:  x2 --> W = 0.9771, p-value = 0.4361
data:  x3 --> W = 0.9815, p-value = 0.6179
data:  x4 --> W = 0.9817, p-value = 0.6234
data:  x5 --> W = 0.9777, p-value = 0.4592
data:  y1 --> W = 0.9793, p-value = 0.5233
data:  y2 --> w = 0.9846, p-value = 0.7538

Contenu connexe

Tendances

Aula 6 - Funções Exponenciais e Logarítmicas
Aula 6 - Funções Exponenciais e LogarítmicasAula 6 - Funções Exponenciais e Logarítmicas
Aula 6 - Funções Exponenciais e Logarítmicas
Turma1NC
 
Estatística (exercícios resolvidos - Gráficos, amplitude, médio, desvio padrã...
Estatística (exercícios resolvidos - Gráficos, amplitude, médio, desvio padrã...Estatística (exercícios resolvidos - Gráficos, amplitude, médio, desvio padrã...
Estatística (exercícios resolvidos - Gráficos, amplitude, médio, desvio padrã...
wilkerfilipel
 
Conceitos basicos-shst
Conceitos basicos-shstConceitos basicos-shst
Conceitos basicos-shst
fcanico
 
Questões de ergonomia
Questões de ergonomiaQuestões de ergonomia
Questões de ergonomia
Gabriela Bruno
 
Análise ergonômica de postos de trabalho
Análise ergonômica de postos de trabalhoAnálise ergonômica de postos de trabalho
Análise ergonômica de postos de trabalho
Daniel Ferrari
 

Tendances (20)

Aula 6 - Funções Exponenciais e Logarítmicas
Aula 6 - Funções Exponenciais e LogarítmicasAula 6 - Funções Exponenciais e Logarítmicas
Aula 6 - Funções Exponenciais e Logarítmicas
 
Analise Ergonomica do Trabalho
Analise Ergonomica do TrabalhoAnalise Ergonomica do Trabalho
Analise Ergonomica do Trabalho
 
Estatística aplicada à gestão empresarial
Estatística aplicada à gestão empresarialEstatística aplicada à gestão empresarial
Estatística aplicada à gestão empresarial
 
Tópico 05 - Funções Exponenciais e Logarítmicas
Tópico 05 - Funções Exponenciais e LogarítmicasTópico 05 - Funções Exponenciais e Logarítmicas
Tópico 05 - Funções Exponenciais e Logarítmicas
 
Riscos psicossociais
Riscos psicossociaisRiscos psicossociais
Riscos psicossociais
 
Estatística (exercícios resolvidos - Gráficos, amplitude, médio, desvio padrã...
Estatística (exercícios resolvidos - Gráficos, amplitude, médio, desvio padrã...Estatística (exercícios resolvidos - Gráficos, amplitude, médio, desvio padrã...
Estatística (exercícios resolvidos - Gráficos, amplitude, médio, desvio padrã...
 
Conceitos basicos-shst
Conceitos basicos-shstConceitos basicos-shst
Conceitos basicos-shst
 
Questões de ergonomia
Questões de ergonomiaQuestões de ergonomia
Questões de ergonomia
 
Análise ergonômica de postos de trabalho
Análise ergonômica de postos de trabalhoAnálise ergonômica de postos de trabalho
Análise ergonômica de postos de trabalho
 
Checklist de hudson couto
Checklist de hudson couto Checklist de hudson couto
Checklist de hudson couto
 
Sobre 5S e 10S
Sobre 5S e 10SSobre 5S e 10S
Sobre 5S e 10S
 
Riscos do ruído e da luminosidade
Riscos do ruído e da luminosidadeRiscos do ruído e da luminosidade
Riscos do ruído e da luminosidade
 
Distribuição normal
Distribuição normalDistribuição normal
Distribuição normal
 
Ruido
RuidoRuido
Ruido
 
Aula 4.1- Ergonomia
Aula 4.1- ErgonomiaAula 4.1- Ergonomia
Aula 4.1- Ergonomia
 
Percepção das Cores
Percepção das CoresPercepção das Cores
Percepção das Cores
 
Tecnicas de analise de risco ruido
Tecnicas de analise de risco   ruidoTecnicas de analise de risco   ruido
Tecnicas de analise de risco ruido
 
2 - A relação entre ergonomia, antropometria e design
2 - A relação entre ergonomia, antropometria e design2 - A relação entre ergonomia, antropometria e design
2 - A relação entre ergonomia, antropometria e design
 
Intervenção ergonômica
Intervenção ergonômicaIntervenção ergonômica
Intervenção ergonômica
 
Segurança do trabalho
Segurança do trabalhoSegurança do trabalho
Segurança do trabalho
 

En vedette

Rs cenetec junio
Rs cenetec junioRs cenetec junio
Rs cenetec junio
mdelaov
 
OSRAM - LED Technologie und Produktion
OSRAM - LED Technologie und ProduktionOSRAM - LED Technologie und Produktion
OSRAM - LED Technologie und Produktion
ineltec 2011
 

En vedette (20)

My speed
My speedMy speed
My speed
 
Arduino para Programadores .NET
Arduino para Programadores .NETArduino para Programadores .NET
Arduino para Programadores .NET
 
Suporte para tv lcd led plasma e convencional na Cirilo Cabos
Suporte para tv lcd led plasma e convencional na Cirilo CabosSuporte para tv lcd led plasma e convencional na Cirilo Cabos
Suporte para tv lcd led plasma e convencional na Cirilo Cabos
 
Ventiladores de Techo Faro 2015 - ILUMINABLE.COM
Ventiladores de Techo Faro 2015 - ILUMINABLE.COMVentiladores de Techo Faro 2015 - ILUMINABLE.COM
Ventiladores de Techo Faro 2015 - ILUMINABLE.COM
 
Rs cenetec junio
Rs cenetec junioRs cenetec junio
Rs cenetec junio
 
Présentation 10 03 11
Présentation 10 03 11Présentation 10 03 11
Présentation 10 03 11
 
Lumitis ppt
Lumitis pptLumitis ppt
Lumitis ppt
 
Seminario 5
Seminario 5Seminario 5
Seminario 5
 
GAIKWAD NAGAR
GAIKWAD NAGARGAIKWAD NAGAR
GAIKWAD NAGAR
 
Matlab2009b -clase2
Matlab2009b  -clase2Matlab2009b  -clase2
Matlab2009b -clase2
 
Introduccion a core plot
Introduccion a core plotIntroduccion a core plot
Introduccion a core plot
 
LEDs in der Außenbeleuchtung
LEDs in der AußenbeleuchtungLEDs in der Außenbeleuchtung
LEDs in der Außenbeleuchtung
 
Ranking de los mejores Colegios de Colombia en el 2013
Ranking de los mejores Colegios de Colombia en el 2013Ranking de los mejores Colegios de Colombia en el 2013
Ranking de los mejores Colegios de Colombia en el 2013
 
Soccer Analytics - After 10 Games
Soccer Analytics - After 10 GamesSoccer Analytics - After 10 Games
Soccer Analytics - After 10 Games
 
Woodside Bali - Luxury Villas and plots in Mangaon
Woodside Bali - Luxury Villas and plots in MangaonWoodside Bali - Luxury Villas and plots in Mangaon
Woodside Bali - Luxury Villas and plots in Mangaon
 
(2) Curso sobre el software estadístico R: La librería googleVis
(2) Curso sobre el software estadístico R: La librería googleVis(2) Curso sobre el software estadístico R: La librería googleVis
(2) Curso sobre el software estadístico R: La librería googleVis
 
Mini curso-prof-peternelli
Mini curso-prof-peternelliMini curso-prof-peternelli
Mini curso-prof-peternelli
 
Plots
PlotsPlots
Plots
 
OSRAM - LED Technologie und Produktion
OSRAM - LED Technologie und ProduktionOSRAM - LED Technologie und Produktion
OSRAM - LED Technologie und Produktion
 
Lixo eletro eletronico no brasil
Lixo eletro eletronico no brasilLixo eletro eletronico no brasil
Lixo eletro eletronico no brasil
 

Similaire à Qq plot

AMD - Aula n.º 8 - regressão linear simples.pptx
AMD - Aula n.º 8 - regressão linear simples.pptxAMD - Aula n.º 8 - regressão linear simples.pptx
AMD - Aula n.º 8 - regressão linear simples.pptx
NunoSilva599593
 
Apostila regressao linear
Apostila regressao linearApostila regressao linear
Apostila regressao linear
coelhojmm
 
Modelo de regressão linear: aspectos teóricos e computacionais
Modelo de regressão linear: aspectos teóricos e computacionais Modelo de regressão linear: aspectos teóricos e computacionais
Modelo de regressão linear: aspectos teóricos e computacionais
Rodrigo Rodrigues
 
Implementação mód4
Implementação   mód4 Implementação   mód4
Implementação mód4
inechidias
 
Implementação mód4 -
Implementação   mód4 - Implementação   mód4 -
Implementação mód4 -
inechidias
 

Similaire à Qq plot (20)

Aula13-15.pdf
Aula13-15.pdfAula13-15.pdf
Aula13-15.pdf
 
AMD - Aula n.º 8 - regressão linear simples.pptx
AMD - Aula n.º 8 - regressão linear simples.pptxAMD - Aula n.º 8 - regressão linear simples.pptx
AMD - Aula n.º 8 - regressão linear simples.pptx
 
Análise multivariada aplicada à pesquisa
Análise multivariada aplicada à pesquisaAnálise multivariada aplicada à pesquisa
Análise multivariada aplicada à pesquisa
 
Estatística - Aula 2
Estatística - Aula 2Estatística - Aula 2
Estatística - Aula 2
 
Regressão Linear I
Regressão Linear IRegressão Linear I
Regressão Linear I
 
Apostila regressao linear
Apostila regressao linearApostila regressao linear
Apostila regressao linear
 
Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...
Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...
Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...
 
Metódos de Pesquisa em C
Metódos de Pesquisa em CMetódos de Pesquisa em C
Metódos de Pesquisa em C
 
Revisao 2 2019.pdf
Revisao 2 2019.pdfRevisao 2 2019.pdf
Revisao 2 2019.pdf
 
Analise de componentes principais
Analise de componentes principaisAnalise de componentes principais
Analise de componentes principais
 
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
 
Unidade 5 - estastitica
Unidade 5 - estastiticaUnidade 5 - estastitica
Unidade 5 - estastitica
 
Decomposições de matrizes utilizando conceitos de Auto Vetores e Auto Valores
Decomposições de matrizes utilizando conceitos de Auto Vetores e Auto ValoresDecomposições de matrizes utilizando conceitos de Auto Vetores e Auto Valores
Decomposições de matrizes utilizando conceitos de Auto Vetores e Auto Valores
 
Regressao linear
Regressao linearRegressao linear
Regressao linear
 
Atps estatistica
Atps estatisticaAtps estatistica
Atps estatistica
 
Pesquisa sequencial
Pesquisa sequencialPesquisa sequencial
Pesquisa sequencial
 
Modelo de regressão linear: aspectos teóricos e computacionais
Modelo de regressão linear: aspectos teóricos e computacionais Modelo de regressão linear: aspectos teóricos e computacionais
Modelo de regressão linear: aspectos teóricos e computacionais
 
Regressão aula
Regressão aulaRegressão aula
Regressão aula
 
Implementação mód4
Implementação   mód4 Implementação   mód4
Implementação mód4
 
Implementação mód4 -
Implementação   mód4 - Implementação   mód4 -
Implementação mód4 -
 

Dernier

Considerando as pesquisas de Gallahue, Ozmun e Goodway (2013) os bebês até an...
Considerando as pesquisas de Gallahue, Ozmun e Goodway (2013) os bebês até an...Considerando as pesquisas de Gallahue, Ozmun e Goodway (2013) os bebês até an...
Considerando as pesquisas de Gallahue, Ozmun e Goodway (2013) os bebês até an...
azulassessoria9
 
ATIVIDADE 2 - DESENVOLVIMENTO E APRENDIZAGEM MOTORA - 52_2024
ATIVIDADE 2 - DESENVOLVIMENTO E APRENDIZAGEM MOTORA - 52_2024ATIVIDADE 2 - DESENVOLVIMENTO E APRENDIZAGEM MOTORA - 52_2024
ATIVIDADE 2 - DESENVOLVIMENTO E APRENDIZAGEM MOTORA - 52_2024
azulassessoria9
 
A EDUCAÇÃO FÍSICA NO NOVO ENSINO MÉDIO: IMPLICAÇÕES E TENDÊNCIAS PROMOVIDAS P...
A EDUCAÇÃO FÍSICA NO NOVO ENSINO MÉDIO: IMPLICAÇÕES E TENDÊNCIAS PROMOVIDAS P...A EDUCAÇÃO FÍSICA NO NOVO ENSINO MÉDIO: IMPLICAÇÕES E TENDÊNCIAS PROMOVIDAS P...
A EDUCAÇÃO FÍSICA NO NOVO ENSINO MÉDIO: IMPLICAÇÕES E TENDÊNCIAS PROMOVIDAS P...
PatriciaCaetano18
 
ATIVIDADE 2 - DESENVOLVIMENTO E APRENDIZAGEM MOTORA - 52_2024
ATIVIDADE 2 - DESENVOLVIMENTO E APRENDIZAGEM MOTORA - 52_2024ATIVIDADE 2 - DESENVOLVIMENTO E APRENDIZAGEM MOTORA - 52_2024
ATIVIDADE 2 - DESENVOLVIMENTO E APRENDIZAGEM MOTORA - 52_2024
azulassessoria9
 
atividade-de-portugues-paronimos-e-homonimos-4º-e-5º-ano-respostas.pdf
atividade-de-portugues-paronimos-e-homonimos-4º-e-5º-ano-respostas.pdfatividade-de-portugues-paronimos-e-homonimos-4º-e-5º-ano-respostas.pdf
atividade-de-portugues-paronimos-e-homonimos-4º-e-5º-ano-respostas.pdf
Autonoma
 

Dernier (20)

Aula 25 - A america espanhola - colonização, exploraçãp e trabalho (mita e en...
Aula 25 - A america espanhola - colonização, exploraçãp e trabalho (mita e en...Aula 25 - A america espanhola - colonização, exploraçãp e trabalho (mita e en...
Aula 25 - A america espanhola - colonização, exploraçãp e trabalho (mita e en...
 
Questões de Língua Portuguesa - gincana da LP
Questões de Língua Portuguesa - gincana da LPQuestões de Língua Portuguesa - gincana da LP
Questões de Língua Portuguesa - gincana da LP
 
Considerando as pesquisas de Gallahue, Ozmun e Goodway (2013) os bebês até an...
Considerando as pesquisas de Gallahue, Ozmun e Goodway (2013) os bebês até an...Considerando as pesquisas de Gallahue, Ozmun e Goodway (2013) os bebês até an...
Considerando as pesquisas de Gallahue, Ozmun e Goodway (2013) os bebês até an...
 
Polígonos, Diagonais de um Polígono, SOMA DOS ANGULOS INTERNOS DE UM POLÍGON...
Polígonos, Diagonais de um Polígono, SOMA DOS ANGULOS INTERNOS DE UM  POLÍGON...Polígonos, Diagonais de um Polígono, SOMA DOS ANGULOS INTERNOS DE UM  POLÍGON...
Polígonos, Diagonais de um Polígono, SOMA DOS ANGULOS INTERNOS DE UM POLÍGON...
 
INTERTEXTUALIDADE atividade muito boa para
INTERTEXTUALIDADE   atividade muito boa paraINTERTEXTUALIDADE   atividade muito boa para
INTERTEXTUALIDADE atividade muito boa para
 
Slides Lição 06, Central Gospel, O Anticristo, 1Tr24.pptx
Slides Lição 06, Central Gospel, O Anticristo, 1Tr24.pptxSlides Lição 06, Central Gospel, O Anticristo, 1Tr24.pptx
Slides Lição 06, Central Gospel, O Anticristo, 1Tr24.pptx
 
Tema de redação - As dificuldades para barrar o casamento infantil no Brasil ...
Tema de redação - As dificuldades para barrar o casamento infantil no Brasil ...Tema de redação - As dificuldades para barrar o casamento infantil no Brasil ...
Tema de redação - As dificuldades para barrar o casamento infantil no Brasil ...
 
ATIVIDADE 2 - DESENVOLVIMENTO E APRENDIZAGEM MOTORA - 52_2024
ATIVIDADE 2 - DESENVOLVIMENTO E APRENDIZAGEM MOTORA - 52_2024ATIVIDADE 2 - DESENVOLVIMENTO E APRENDIZAGEM MOTORA - 52_2024
ATIVIDADE 2 - DESENVOLVIMENTO E APRENDIZAGEM MOTORA - 52_2024
 
tensoes-etnicas-na-europa-template-1.pptx
tensoes-etnicas-na-europa-template-1.pptxtensoes-etnicas-na-europa-template-1.pptx
tensoes-etnicas-na-europa-template-1.pptx
 
O desenvolvimento é um conceito mais amplo, pode ter um contexto biológico ou...
O desenvolvimento é um conceito mais amplo, pode ter um contexto biológico ou...O desenvolvimento é um conceito mais amplo, pode ter um contexto biológico ou...
O desenvolvimento é um conceito mais amplo, pode ter um contexto biológico ou...
 
Missa catequese para o dia da mãe 2025.pdf
Missa catequese para o dia da mãe 2025.pdfMissa catequese para o dia da mãe 2025.pdf
Missa catequese para o dia da mãe 2025.pdf
 
A EDUCAÇÃO FÍSICA NO NOVO ENSINO MÉDIO: IMPLICAÇÕES E TENDÊNCIAS PROMOVIDAS P...
A EDUCAÇÃO FÍSICA NO NOVO ENSINO MÉDIO: IMPLICAÇÕES E TENDÊNCIAS PROMOVIDAS P...A EDUCAÇÃO FÍSICA NO NOVO ENSINO MÉDIO: IMPLICAÇÕES E TENDÊNCIAS PROMOVIDAS P...
A EDUCAÇÃO FÍSICA NO NOVO ENSINO MÉDIO: IMPLICAÇÕES E TENDÊNCIAS PROMOVIDAS P...
 
Quiz | Dia da Europa 2024 (comemoração)
Quiz | Dia da Europa 2024  (comemoração)Quiz | Dia da Europa 2024  (comemoração)
Quiz | Dia da Europa 2024 (comemoração)
 
ATIVIDADE 2 - DESENVOLVIMENTO E APRENDIZAGEM MOTORA - 52_2024
ATIVIDADE 2 - DESENVOLVIMENTO E APRENDIZAGEM MOTORA - 52_2024ATIVIDADE 2 - DESENVOLVIMENTO E APRENDIZAGEM MOTORA - 52_2024
ATIVIDADE 2 - DESENVOLVIMENTO E APRENDIZAGEM MOTORA - 52_2024
 
Monoteísmo, Politeísmo, Panteísmo 7 ANO2.pptx
Monoteísmo, Politeísmo, Panteísmo 7 ANO2.pptxMonoteísmo, Politeísmo, Panteísmo 7 ANO2.pptx
Monoteísmo, Politeísmo, Panteísmo 7 ANO2.pptx
 
Caderno de exercícios Revisão para o ENEM (1).pdf
Caderno de exercícios Revisão para o ENEM (1).pdfCaderno de exercícios Revisão para o ENEM (1).pdf
Caderno de exercícios Revisão para o ENEM (1).pdf
 
atividade-de-portugues-paronimos-e-homonimos-4º-e-5º-ano-respostas.pdf
atividade-de-portugues-paronimos-e-homonimos-4º-e-5º-ano-respostas.pdfatividade-de-portugues-paronimos-e-homonimos-4º-e-5º-ano-respostas.pdf
atividade-de-portugues-paronimos-e-homonimos-4º-e-5º-ano-respostas.pdf
 
Aula 1 - Psicologia Cognitiva, aula .ppt
Aula 1 - Psicologia Cognitiva, aula .pptAula 1 - Psicologia Cognitiva, aula .ppt
Aula 1 - Psicologia Cognitiva, aula .ppt
 
Historia de Portugal - Quarto Ano - 2024
Historia de Portugal - Quarto Ano - 2024Historia de Portugal - Quarto Ano - 2024
Historia de Portugal - Quarto Ano - 2024
 
AULÃO de Língua Portuguesa para o Saepe 2022
AULÃO de Língua Portuguesa para o Saepe 2022AULÃO de Língua Portuguesa para o Saepe 2022
AULÃO de Língua Portuguesa para o Saepe 2022
 

Qq plot

  • 1. AVALIAÇÃO DA SUPOSIÇÃO DE NORMALIDADE Ref.: Johnson e Wichern, Cap. 4
  • 2. Alguns métodos de Inferência Estatística partem do pressuposto de normalidade dos dados. A qualidade das inferências feitas por estes métodos depende de quão próxima é a população em estudo da normal multivariada. Procedimentos para verificação de dados que apresentam desvios da suposição de normalidade se fazem necessários.
  • 3. PROBLEMA: As observações Xi parecem violar a suposição de normalidade? Sugestão: verificar se as distribuições marginais do vetor aleatório parecem normais; se os diagramas de dispersão das variáveis tomadas duas a duas têm uma aparência elíptica; se existem observações discrepantes (outliers) que mereçam ser verificadas.
  • 4.
  • 5.
  • 6.
  • 7. São de fato um gráfico do quantil amostral versus quantil esperado sob normalidade (podem ser usados para validar outras distribuições diferentes da normal).
  • 8. Quando a configuração de pontos no gráfico se aproxima de uma reta, a suposição de normalidade é sustentável.
  • 9. A normalidade é suspeita se houver pontos que se desviam do comportamento linear.
  • 10. A forma como os pontos se desviam do comportamento linear pode fornecer pistas sobre a natureza da não normalidade das observações.
  • 11.
  • 12. PASSOS NA CONSTRUÇÃO DO Q-Q plot Para uma distribuição normal padrão, podemos obter os quantis q(i)tais que P(Z≤ q(i))=(i-0,5)/n. A idéia será olhar os pontos (q(i),x(i)) com a mesma probabilidade acumulada (i-0,5)/n. Se os dados, de fato, provêm de uma normal, os pares serão aproximadamente linearmente relacionados, pois o quantil esperado sob normalidade é aproximadamente σ q(i)+μ, com σ representando o desvio-padrão e μ a média da distribuição.
  • 13. Usando o R para a construção do Q-Q plot No R temos a função ppoints(n) que gera o vetor de valores (i-0,5)/n, para i variando de 1 a n. Para gerar os quantis esperados sob normalidade usaremos a função qnorm(p), que retorna o quantil cuja probabilidade acumulada é p. (Quando não especificamos nada além de p, o R retorna quantis da N(0,1)). A função usada para ordenar um vetor de números no R é a função sort(x).
  • 14.
  • 16. Os dados estão organizados de tal modo que as colunas de 4 a 8 representam medidas morfológicas de caranguejos de duas espécies (linha 1 a 100 uma espécie e de 101 a 200 a outra).
  • 17. Também há a divisão por gênero (macho e fêmea) tal que as 50 primeiras linhas de cada espécie são do gênero macho e, as restantes, do gênero fêmea.
  • 18.
  • 19.
  • 20. Avaliação da normalidade das distribuições marginais Uma medida quantitativa para auxiliar na avaliação do Q-Q plot é calcular a correlação rQ entre os quantis esperados e o vetor observado ordenado. A hipótese de normalidade é rejeitada ao nível de significância α se rQobtido for menor que um valor apropriado. Por exemplo, ao nível de significância de 5% amostras de tamanho 50, a hipótese deve ser rejeitada se rQ for inferiro a 0,9768.
  • 21.
  • 26.
  • 27.
  • 28. data: x1 --> W = 0.9817, p-value = 0.6268
  • 29. data: x2 --> W = 0.9771, p-value = 0.4361
  • 30. data: x3 --> W = 0.9815, p-value = 0.6179
  • 31. data: x4 --> W = 0.9817, p-value = 0.6234
  • 32. data: x5 --> W = 0.9777, p-value = 0.4592
  • 33. data: y1 --> W = 0.9793, p-value = 0.5233
  • 34. data: y2 --> w = 0.9846, p-value = 0.7538
  • 35. data: y3 --> W = 0.9843, p-value = 0.7395
  • 36. data: y4 --> W = 0.9866, p-value = 0.8386
  • 37. data: y5 --> W = 0.9824, p-value = 0.6565
  • 38. data: z1 --> W = 0.9758, p-value = 0.3918
  • 39. data: z2 --> W = 0.9869, p-value = 0.8496
  • 40. data: z3 --> W = 0.9771, p-value = 0.4366
  • 41. data: z4 --> W = 0.9765, p-value = 0.4142
  • 42. data: z5 --> W = 0.9742, p-value = 0.3411
  • 43. data: w1 --> W = 0.9802, p-value = 0.5612
  • 44. data: w2 --> W = 0.9804, p-value = 0.5683
  • 45. data: w3 --> W = 0.9799, p-value = 0.5474
  • 46. data: w4 --> W = 0.9801, p-value = 0.5568
  • 47.
  • 48. Avaliando compostos lineares Para avaliar os compostos sugeridos no slide anterior, primeiro devemos obter os n valores correspondentes a tais compostos. Por simplicidade, consideraremos apenas o primeiro grupo. A verificação para os demais grupos fica como um exercício. Primeiro vamos obter a decomposição espectral de S1 fazendo DES1=eigen(S1). DES1 receberá dois objetos: o vetor de autovalores em ordem decrescente de magnitude e a matriz ortogonal na qual as colunas são os autovetores correspondentes.
  • 49.
  • 50. Faça e1=matrix(0,1,5) e e5=matrix(0,1,5)
  • 51. Depois faça for (i in 1:5){e1[i]=DES1$vectors[i,1]} e
  • 52. for (i in 1:5){e5[i]=DES1$vectors[i,5]}
  • 53. Defina xc=matrix(0,50,2), matriz que receberá em cada coluna um dos compostos a serem analisados.
  • 54. Finalmente, obtenha os compostos: (x1 representa a matriz de dados do grupo 1) for (i in 1:50){xc[i,1]=e1%*%x1[i,]} e
  • 55.
  • 56.
  • 58. W = 0.9812, p-value = 0.6055
  • 62.
  • 63. Avaliação da Normalidade bivariada Além disso, vimos que se , então A grosso modo, devemos esperar que cerca de 50% das observações caiam na região (no elipsóide) Assim um procedimento útil, embora não exato, é comparar as proporções de pontos dentro de um contorno com a proba- bilidade teórica correspondente.
  • 64. Avaliação da Normalidade bivariada Um método um pouco mais formal para julgar a normalidade bivariada é baseado no quadrado da distância generalizada Esse procedimento não é limitado ao caso p=2, pode ser usado. para p>2.
  • 65. Avaliação da Normalidade bivariada Quando a população é de fato normal multivariada e ambos n e n-p são maiores que 25 ou 30, cada uma das distâncias generalizadas quadradas devem comportar-se segundo uma distribuição de qui-quadrado com p graus de liberdade. Apesar dessas distâncias não serem independentes ou terem distribuição exata de Qui-quadrado, é útil construir um gráfico como se fossem. O gráfico resultante é chamado gráfico qui-quadrado.
  • 66. Construção do gráfico qui-quadrado 1. Ordene as distâncias quadradas amostrais obtendo 2. Construa o gráfico de dispersão dos pontos: representando o 100(i-0,5)/n quantil da distribuição de qui-quadrado com p graus de liberdade. A nuvem de pontos deve se ajustar a uma reta. Um padrão diferente sugere falta de normalidade
  • 67. Verificando a normalidade bivariada dos dados em crabs Para começar devemos calcular as distâncias quadradas. Para isso vamos definir a matriz de dados x=matrix(0,200,5) e fazer x1=x[1:50,1:5]. Em seguida vamos calcular o vetor de médias m1=matrix(0,1,5) // for (i in 1:5){m1[i]=mean(x1[,i])} e a matriz de covariância amostral S1=cov(x1). Defina o vetor que receberá as distâncias quadradas: dquad1=matrix(0,50) e faça for (i in 1:50){dquad1[i]=(x1[i,]-m1)%*%solve(S1)%*%t(x1[i,]-m1)}
  • 68.
  • 69. Agora é só construir o gráfico.
  • 70. A figura a seguir mostra os gráficos obtidos para os quatro grupos.
  • 71.
  • 72.
  • 73. 1) Usar técnicas estatísticas apropriadas para dados não-normais, após verificar a distribuição plausível para os dados (Poisson, Gamma,etc.)
  • 74.
  • 75.
  • 76.
  • 77.
  • 78.
  • 79. Porém, não há garantias de que mesmo a melhor escolha de λ produzirá um conjunto de dados transformados que seja adequado à suposição de normalidade.
  • 80. Os resultados obtidos por uma transformação selecionada de acordo com esse procedimento devem ser cuidadosamente examinados para possíveis violações da suposição de normalidade.
  • 81. Essa recomendação de fato vale para qualquer transformação usada.