SlideShare une entreprise Scribd logo
1  sur  34
AVALIAÇÃO DA SUPOSIÇÃO DE NORMALIDADE Ref.: Johnson e Wichern, Cap. 4
Alguns métodos de Inferência Estatística partem do pressuposto de normalidade dos dados. A qualidade das inferências feitas por estes métodos depende de quão próxima é a população em estudo da normal multivariada. Procedimentos para verificação de dados que apresentam desvios da suposição de normalidade se fazem necessários.
PROBLEMA: As observações Xi parecem violar a suposição de normalidade? Sugestão: verificar se as distribuições marginais do vetor aleatório parecem normais; se os diagramas de dispersão das variáveis tomadas duas a duas têm uma aparência elíptica; se existem observações discrepantes (outliers) que mereçam ser verificadas.
Avaliação da normalidade das distribuições marginais ,[object Object]
Se o histograma para a j-ésima componente do vetor de observações parece razoavelmente simétrico, podemos verificar a normalidade calculando a proporção de valores que caem em determinados intervalos comparando-a com a proporção esperada sob normalidade.,[object Object]
Q-Q plots ,[object Object]
São de fato um gráfico do quantil amostral versus quantil esperado sob normalidade (podem ser usados para validar outras distribuições diferentes da normal).
Quando a configuração de pontos no gráfico se aproxima de uma reta, a suposição de normalidade é sustentável.
A normalidade é suspeita se houver pontos que se desviam do comportamento linear.
A forma como os pontos se desviam do comportamento linear pode fornecer pistas sobre a natureza da não normalidade das observações.
Conhecida a razão da não normalidade dos dados, ações corretivas podem ser tomadas (transformações visando normalizar os dados ou uso de técnicas  para dados não normais).,[object Object]
PASSOS NA CONSTRUÇÃO DO Q-Q plot Para uma distribuição normal padrão, podemos obter os quantis q(i)tais que P(Z≤ q(i))=(i-0,5)/n. A idéia será olhar os pontos (q(i),x(i)) com a mesma probabilidade acumulada (i-0,5)/n. Se os dados, de fato, provêm de uma normal, os pares serão aproximadamente linearmente relacionados, pois o quantil esperado sob normalidade é aproximadamente σ q(i)+μ, com σ representando o desvio-padrão e μ a média da distribuição.
Usando o R para a construção do Q-Q plot No R temos a função ppoints(n) que gera o vetor de valores (i-0,5)/n, para i variando de 1 a n. Para gerar os quantis esperados sob normalidade usaremos a função qnorm(p), que retorna o quantil cuja probabilidade acumulada é p. (Quando não especificamos nada além de p, o R retorna quantis da N(0,1)). A função usada para ordenar um vetor de números no R é a função sort(x).
Construção do Q-Q plot das medidas do conjunto de dados crabs do pacote MASS ,[object Object]
Digite data(crabs).
Os dados estão organizados de tal modo que as colunas de 4 a 8 representam medidas morfológicas de caranguejos de duas espécies (linha 1 a 100 uma espécie e de 101 a 200 a outra).
Também há a divisão por gênero (macho e fêmea) tal que as 50 primeiras linhas de cada espécie são do gênero macho e, as restantes, do gênero fêmea.
Vamos construir 20 QQ-plots representando cada uma das 5 medidas dos 4 grupos caracterizados por espécie e gênero.,[object Object]
Avaliação da normalidade das distribuições marginais Uma medida quantitativa para auxiliar na avaliação do Q-Q plot é calcular a correlação rQ entre os quantis esperados e o vetor observado ordenado.  A hipótese de normalidade é rejeitada ao nível de significância α se rQobtido for menor que um valor apropriado. Por exemplo, ao nível de significância de 5% amostras de tamanho 50, a hipótese deve ser rejeitada se rQ  for inferiro a 0,9768.
Correlações obtidas na base de dados crabs ,[object Object]
grupo 2:0,99010,99390,99310,99400,9924
grupo 3:0,99020,99430,99070,99030,9893
grupo 4:0,99190,99030,99150,99120,9939
Limiar: 0,9768.
Logo, verifica-se que nenhuma das correlações fica abaixo do limiar especificado pelo nível de significância de 5%, evidenciando a não rejeição da hipótese nula de normalidade das distribuições marginais.,[object Object]
[object Object]
data:  x1 --> W = 0.9817, p-value = 0.6268
data:  x2 --> W = 0.9771, p-value = 0.4361
data:  x3 --> W = 0.9815, p-value = 0.6179
data:  x4 --> W = 0.9817, p-value = 0.6234
data:  x5 --> W = 0.9777, p-value = 0.4592
data:  y1 --> W = 0.9793, p-value = 0.5233
data:  y2 --> w = 0.9846, p-value = 0.7538

Contenu connexe

Tendances

Aula 6 probabilidade condicional
Aula 6   probabilidade condicionalAula 6   probabilidade condicional
Aula 6 probabilidade condicional
Ariel Rennó Chaves
 
Redes neurais com matlab
Redes neurais com matlabRedes neurais com matlab
Redes neurais com matlab
Renato Vicente
 
bioestatística - 1 parte
bioestatística - 1 partebioestatística - 1 parte
bioestatística - 1 parte
Robson Odé
 
Fundamentos de estruturas teoria 01_parte 2
Fundamentos de estruturas teoria 01_parte 2Fundamentos de estruturas teoria 01_parte 2
Fundamentos de estruturas teoria 01_parte 2
Carlos Elson Cunha
 
Hidrologia+estatística
Hidrologia+estatísticaHidrologia+estatística
Hidrologia+estatística
Níkolas Paes
 
Correlacao
CorrelacaoCorrelacao
Correlacao
jon024
 

Tendances (20)

Aula 6 probabilidade condicional
Aula 6   probabilidade condicionalAula 6   probabilidade condicional
Aula 6 probabilidade condicional
 
Introdução ao modelo clássico de regressão linear
Introdução ao modelo clássico de regressão linearIntrodução ao modelo clássico de regressão linear
Introdução ao modelo clássico de regressão linear
 
Estatistica inferencial
Estatistica inferencial Estatistica inferencial
Estatistica inferencial
 
Redes neurais com matlab
Redes neurais com matlabRedes neurais com matlab
Redes neurais com matlab
 
bioestatística - 1 parte
bioestatística - 1 partebioestatística - 1 parte
bioestatística - 1 parte
 
Aula 1 - Bioestatística
Aula 1 - BioestatísticaAula 1 - Bioestatística
Aula 1 - Bioestatística
 
Fundamentos de estruturas teoria 01_parte 2
Fundamentos de estruturas teoria 01_parte 2Fundamentos de estruturas teoria 01_parte 2
Fundamentos de estruturas teoria 01_parte 2
 
Tópico 2 Intervalo de Confiança
Tópico 2   Intervalo de ConfiançaTópico 2   Intervalo de Confiança
Tópico 2 Intervalo de Confiança
 
Regressão Linear I
Regressão Linear IRegressão Linear I
Regressão Linear I
 
Introducão ao arcgis
Introducão ao arcgisIntroducão ao arcgis
Introducão ao arcgis
 
Assimetria e Curtose da Poisson (Parte 1)
Assimetria e Curtose da Poisson (Parte 1)Assimetria e Curtose da Poisson (Parte 1)
Assimetria e Curtose da Poisson (Parte 1)
 
Dados espaciais
Dados espaciaisDados espaciais
Dados espaciais
 
Hidrologia+estatística
Hidrologia+estatísticaHidrologia+estatística
Hidrologia+estatística
 
A seleção-do-teste-estatístico
A seleção-do-teste-estatísticoA seleção-do-teste-estatístico
A seleção-do-teste-estatístico
 
distribuição-t-student
distribuição-t-studentdistribuição-t-student
distribuição-t-student
 
Probabilidade e Estatística - Aula 01
Probabilidade e Estatística - Aula 01Probabilidade e Estatística - Aula 01
Probabilidade e Estatística - Aula 01
 
Aula 3 testes de hipóteses e anova
Aula 3   testes de hipóteses e anovaAula 3   testes de hipóteses e anova
Aula 3 testes de hipóteses e anova
 
Correlacao
CorrelacaoCorrelacao
Correlacao
 
Estatística Descritiva
Estatística DescritivaEstatística Descritiva
Estatística Descritiva
 
Estatística e Probabilidade 8 - Medidas de Assimetria e Boxplot
Estatística e Probabilidade 8 - Medidas de Assimetria e BoxplotEstatística e Probabilidade 8 - Medidas de Assimetria e Boxplot
Estatística e Probabilidade 8 - Medidas de Assimetria e Boxplot
 

En vedette

Rs cenetec junio
Rs cenetec junioRs cenetec junio
Rs cenetec junio
mdelaov
 
OSRAM - LED Technologie und Produktion
OSRAM - LED Technologie und ProduktionOSRAM - LED Technologie und Produktion
OSRAM - LED Technologie und Produktion
ineltec 2011
 

En vedette (20)

My speed
My speedMy speed
My speed
 
Arduino para Programadores .NET
Arduino para Programadores .NETArduino para Programadores .NET
Arduino para Programadores .NET
 
Suporte para tv lcd led plasma e convencional na Cirilo Cabos
Suporte para tv lcd led plasma e convencional na Cirilo CabosSuporte para tv lcd led plasma e convencional na Cirilo Cabos
Suporte para tv lcd led plasma e convencional na Cirilo Cabos
 
Ventiladores de Techo Faro 2015 - ILUMINABLE.COM
Ventiladores de Techo Faro 2015 - ILUMINABLE.COMVentiladores de Techo Faro 2015 - ILUMINABLE.COM
Ventiladores de Techo Faro 2015 - ILUMINABLE.COM
 
Rs cenetec junio
Rs cenetec junioRs cenetec junio
Rs cenetec junio
 
Présentation 10 03 11
Présentation 10 03 11Présentation 10 03 11
Présentation 10 03 11
 
Lumitis ppt
Lumitis pptLumitis ppt
Lumitis ppt
 
Seminario 5
Seminario 5Seminario 5
Seminario 5
 
GAIKWAD NAGAR
GAIKWAD NAGARGAIKWAD NAGAR
GAIKWAD NAGAR
 
Matlab2009b -clase2
Matlab2009b  -clase2Matlab2009b  -clase2
Matlab2009b -clase2
 
Introduccion a core plot
Introduccion a core plotIntroduccion a core plot
Introduccion a core plot
 
LEDs in der Außenbeleuchtung
LEDs in der AußenbeleuchtungLEDs in der Außenbeleuchtung
LEDs in der Außenbeleuchtung
 
Ranking de los mejores Colegios de Colombia en el 2013
Ranking de los mejores Colegios de Colombia en el 2013Ranking de los mejores Colegios de Colombia en el 2013
Ranking de los mejores Colegios de Colombia en el 2013
 
Soccer Analytics - After 10 Games
Soccer Analytics - After 10 GamesSoccer Analytics - After 10 Games
Soccer Analytics - After 10 Games
 
Woodside Bali - Luxury Villas and plots in Mangaon
Woodside Bali - Luxury Villas and plots in MangaonWoodside Bali - Luxury Villas and plots in Mangaon
Woodside Bali - Luxury Villas and plots in Mangaon
 
(2) Curso sobre el software estadístico R: La librería googleVis
(2) Curso sobre el software estadístico R: La librería googleVis(2) Curso sobre el software estadístico R: La librería googleVis
(2) Curso sobre el software estadístico R: La librería googleVis
 
Mini curso-prof-peternelli
Mini curso-prof-peternelliMini curso-prof-peternelli
Mini curso-prof-peternelli
 
Plots
PlotsPlots
Plots
 
OSRAM - LED Technologie und Produktion
OSRAM - LED Technologie und ProduktionOSRAM - LED Technologie und Produktion
OSRAM - LED Technologie und Produktion
 
Lixo eletro eletronico no brasil
Lixo eletro eletronico no brasilLixo eletro eletronico no brasil
Lixo eletro eletronico no brasil
 

Similaire à Qq plot

AMD - Aula n.º 8 - regressão linear simples.pptx
AMD - Aula n.º 8 - regressão linear simples.pptxAMD - Aula n.º 8 - regressão linear simples.pptx
AMD - Aula n.º 8 - regressão linear simples.pptx
NunoSilva599593
 
Apostila regressao linear
Apostila regressao linearApostila regressao linear
Apostila regressao linear
coelhojmm
 
Modelo de regressão linear: aspectos teóricos e computacionais
Modelo de regressão linear: aspectos teóricos e computacionais Modelo de regressão linear: aspectos teóricos e computacionais
Modelo de regressão linear: aspectos teóricos e computacionais
Rodrigo Rodrigues
 
Implementação mód4
Implementação   mód4 Implementação   mód4
Implementação mód4
inechidias
 
Implementação mód4
Implementação   mód4 Implementação   mód4
Implementação mód4
inechidias
 
Implementação mód4 -
Implementação   mód4 - Implementação   mód4 -
Implementação mód4 -
inechidias
 

Similaire à Qq plot (20)

Aula13-15.pdf
Aula13-15.pdfAula13-15.pdf
Aula13-15.pdf
 
AMD - Aula n.º 8 - regressão linear simples.pptx
AMD - Aula n.º 8 - regressão linear simples.pptxAMD - Aula n.º 8 - regressão linear simples.pptx
AMD - Aula n.º 8 - regressão linear simples.pptx
 
Análise multivariada aplicada à pesquisa
Análise multivariada aplicada à pesquisaAnálise multivariada aplicada à pesquisa
Análise multivariada aplicada à pesquisa
 
Estatística - Aula 2
Estatística - Aula 2Estatística - Aula 2
Estatística - Aula 2
 
Apostila regressao linear
Apostila regressao linearApostila regressao linear
Apostila regressao linear
 
Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...
Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...
Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...
 
Metódos de Pesquisa em C
Metódos de Pesquisa em CMetódos de Pesquisa em C
Metódos de Pesquisa em C
 
Revisao 2 2019.pdf
Revisao 2 2019.pdfRevisao 2 2019.pdf
Revisao 2 2019.pdf
 
Analise de componentes principais
Analise de componentes principaisAnalise de componentes principais
Analise de componentes principais
 
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
 
Unidade 5 - estastitica
Unidade 5 - estastiticaUnidade 5 - estastitica
Unidade 5 - estastitica
 
Decomposições de matrizes utilizando conceitos de Auto Vetores e Auto Valores
Decomposições de matrizes utilizando conceitos de Auto Vetores e Auto ValoresDecomposições de matrizes utilizando conceitos de Auto Vetores e Auto Valores
Decomposições de matrizes utilizando conceitos de Auto Vetores e Auto Valores
 
Regressao linear
Regressao linearRegressao linear
Regressao linear
 
Atps estatistica
Atps estatisticaAtps estatistica
Atps estatistica
 
Pesquisa sequencial
Pesquisa sequencialPesquisa sequencial
Pesquisa sequencial
 
Modelo de regressão linear: aspectos teóricos e computacionais
Modelo de regressão linear: aspectos teóricos e computacionais Modelo de regressão linear: aspectos teóricos e computacionais
Modelo de regressão linear: aspectos teóricos e computacionais
 
Regressão aula
Regressão aulaRegressão aula
Regressão aula
 
Implementação mód4
Implementação   mód4 Implementação   mód4
Implementação mód4
 
Implementação mód4
Implementação   mód4 Implementação   mód4
Implementação mód4
 
Implementação mód4 -
Implementação   mód4 - Implementação   mód4 -
Implementação mód4 -
 

Dernier

PPP6_ciencias final 6 ano ano de 23/24 final
PPP6_ciencias final 6 ano ano de 23/24 finalPPP6_ciencias final 6 ano ano de 23/24 final
PPP6_ciencias final 6 ano ano de 23/24 final
carlaOliveira438
 

Dernier (20)

análise obra Nós matamos o cão Tinhoso.pdf
análise obra Nós matamos o cão Tinhoso.pdfanálise obra Nós matamos o cão Tinhoso.pdf
análise obra Nós matamos o cão Tinhoso.pdf
 
Nós Propomos! Infraestruturas em Proença-a-Nova
Nós Propomos! Infraestruturas em Proença-a-NovaNós Propomos! Infraestruturas em Proença-a-Nova
Nós Propomos! Infraestruturas em Proença-a-Nova
 
Slides Lição 8, Central Gospel, Os 144 Mil Que Não Se Curvarão Ao Anticristo....
Slides Lição 8, Central Gospel, Os 144 Mil Que Não Se Curvarão Ao Anticristo....Slides Lição 8, Central Gospel, Os 144 Mil Que Não Se Curvarão Ao Anticristo....
Slides Lição 8, Central Gospel, Os 144 Mil Que Não Se Curvarão Ao Anticristo....
 
livro para educação infantil conceitos sensorial
livro para educação infantil conceitos sensoriallivro para educação infantil conceitos sensorial
livro para educação infantil conceitos sensorial
 
O que é, de facto, a Educação de Infância
O que é, de facto, a Educação de InfânciaO que é, de facto, a Educação de Infância
O que é, de facto, a Educação de Infância
 
"Nós Propomos! Escola Secundária em Pedrógão Grande"
"Nós Propomos! Escola Secundária em Pedrógão Grande""Nós Propomos! Escola Secundária em Pedrógão Grande"
"Nós Propomos! Escola Secundária em Pedrógão Grande"
 
Produção de poemas - Reciclar é preciso
Produção  de  poemas  -  Reciclar é precisoProdução  de  poemas  -  Reciclar é preciso
Produção de poemas - Reciclar é preciso
 
Livro infantil: A onda da raiva. pdf-crianças
Livro infantil: A onda da raiva. pdf-criançasLivro infantil: A onda da raiva. pdf-crianças
Livro infantil: A onda da raiva. pdf-crianças
 
PPP6_ciencias final 6 ano ano de 23/24 final
PPP6_ciencias final 6 ano ano de 23/24 finalPPP6_ciencias final 6 ano ano de 23/24 final
PPP6_ciencias final 6 ano ano de 23/24 final
 
o-homem-que-calculava-malba-tahan-1_123516.pdf
o-homem-que-calculava-malba-tahan-1_123516.pdfo-homem-que-calculava-malba-tahan-1_123516.pdf
o-homem-que-calculava-malba-tahan-1_123516.pdf
 
Semana Interna de Prevenção de Acidentes SIPAT/2024
Semana Interna de Prevenção de Acidentes SIPAT/2024Semana Interna de Prevenção de Acidentes SIPAT/2024
Semana Interna de Prevenção de Acidentes SIPAT/2024
 
TIPOS DE CALOR CALOR LATENTE E CALOR SENSIVEL.pptx
TIPOS DE CALOR CALOR LATENTE E CALOR SENSIVEL.pptxTIPOS DE CALOR CALOR LATENTE E CALOR SENSIVEL.pptx
TIPOS DE CALOR CALOR LATENTE E CALOR SENSIVEL.pptx
 
O que é uma Revolução Solar. tecnica preditiva
O que é uma Revolução Solar. tecnica preditivaO que é uma Revolução Solar. tecnica preditiva
O que é uma Revolução Solar. tecnica preditiva
 
CONCORDÂNCIA NOMINAL atividade ensino médio ead.pptx
CONCORDÂNCIA NOMINAL atividade ensino médio  ead.pptxCONCORDÂNCIA NOMINAL atividade ensino médio  ead.pptx
CONCORDÂNCIA NOMINAL atividade ensino médio ead.pptx
 
EBPAL_Serta_Caminhos do Lixo final 9ºD (1).pptx
EBPAL_Serta_Caminhos do Lixo final 9ºD (1).pptxEBPAL_Serta_Caminhos do Lixo final 9ºD (1).pptx
EBPAL_Serta_Caminhos do Lixo final 9ºD (1).pptx
 
Enunciado_da_Avaliacao_1__Sociedade_Cultura_e_Contemporaneidade_(ED70200).pdf
Enunciado_da_Avaliacao_1__Sociedade_Cultura_e_Contemporaneidade_(ED70200).pdfEnunciado_da_Avaliacao_1__Sociedade_Cultura_e_Contemporaneidade_(ED70200).pdf
Enunciado_da_Avaliacao_1__Sociedade_Cultura_e_Contemporaneidade_(ED70200).pdf
 
Aula 5 - Fluxo de matéria e energia nos ecossistemas.ppt
Aula 5 - Fluxo de matéria e energia nos ecossistemas.pptAula 5 - Fluxo de matéria e energia nos ecossistemas.ppt
Aula 5 - Fluxo de matéria e energia nos ecossistemas.ppt
 
Descrever e planear atividades imersivas estruturadamente
Descrever e planear atividades imersivas estruturadamenteDescrever e planear atividades imersivas estruturadamente
Descrever e planear atividades imersivas estruturadamente
 
Atividade do poema sobre mãe de mário quintana.pdf
Atividade do poema sobre mãe de mário quintana.pdfAtividade do poema sobre mãe de mário quintana.pdf
Atividade do poema sobre mãe de mário quintana.pdf
 
HISTORIA DA XILOGRAVURA A SUA IMPORTANCIA
HISTORIA DA XILOGRAVURA A SUA IMPORTANCIAHISTORIA DA XILOGRAVURA A SUA IMPORTANCIA
HISTORIA DA XILOGRAVURA A SUA IMPORTANCIA
 

Qq plot

  • 1. AVALIAÇÃO DA SUPOSIÇÃO DE NORMALIDADE Ref.: Johnson e Wichern, Cap. 4
  • 2. Alguns métodos de Inferência Estatística partem do pressuposto de normalidade dos dados. A qualidade das inferências feitas por estes métodos depende de quão próxima é a população em estudo da normal multivariada. Procedimentos para verificação de dados que apresentam desvios da suposição de normalidade se fazem necessários.
  • 3. PROBLEMA: As observações Xi parecem violar a suposição de normalidade? Sugestão: verificar se as distribuições marginais do vetor aleatório parecem normais; se os diagramas de dispersão das variáveis tomadas duas a duas têm uma aparência elíptica; se existem observações discrepantes (outliers) que mereçam ser verificadas.
  • 4.
  • 5.
  • 6.
  • 7. São de fato um gráfico do quantil amostral versus quantil esperado sob normalidade (podem ser usados para validar outras distribuições diferentes da normal).
  • 8. Quando a configuração de pontos no gráfico se aproxima de uma reta, a suposição de normalidade é sustentável.
  • 9. A normalidade é suspeita se houver pontos que se desviam do comportamento linear.
  • 10. A forma como os pontos se desviam do comportamento linear pode fornecer pistas sobre a natureza da não normalidade das observações.
  • 11.
  • 12. PASSOS NA CONSTRUÇÃO DO Q-Q plot Para uma distribuição normal padrão, podemos obter os quantis q(i)tais que P(Z≤ q(i))=(i-0,5)/n. A idéia será olhar os pontos (q(i),x(i)) com a mesma probabilidade acumulada (i-0,5)/n. Se os dados, de fato, provêm de uma normal, os pares serão aproximadamente linearmente relacionados, pois o quantil esperado sob normalidade é aproximadamente σ q(i)+μ, com σ representando o desvio-padrão e μ a média da distribuição.
  • 13. Usando o R para a construção do Q-Q plot No R temos a função ppoints(n) que gera o vetor de valores (i-0,5)/n, para i variando de 1 a n. Para gerar os quantis esperados sob normalidade usaremos a função qnorm(p), que retorna o quantil cuja probabilidade acumulada é p. (Quando não especificamos nada além de p, o R retorna quantis da N(0,1)). A função usada para ordenar um vetor de números no R é a função sort(x).
  • 14.
  • 16. Os dados estão organizados de tal modo que as colunas de 4 a 8 representam medidas morfológicas de caranguejos de duas espécies (linha 1 a 100 uma espécie e de 101 a 200 a outra).
  • 17. Também há a divisão por gênero (macho e fêmea) tal que as 50 primeiras linhas de cada espécie são do gênero macho e, as restantes, do gênero fêmea.
  • 18.
  • 19.
  • 20. Avaliação da normalidade das distribuições marginais Uma medida quantitativa para auxiliar na avaliação do Q-Q plot é calcular a correlação rQ entre os quantis esperados e o vetor observado ordenado. A hipótese de normalidade é rejeitada ao nível de significância α se rQobtido for menor que um valor apropriado. Por exemplo, ao nível de significância de 5% amostras de tamanho 50, a hipótese deve ser rejeitada se rQ for inferiro a 0,9768.
  • 21.
  • 26.
  • 27.
  • 28. data: x1 --> W = 0.9817, p-value = 0.6268
  • 29. data: x2 --> W = 0.9771, p-value = 0.4361
  • 30. data: x3 --> W = 0.9815, p-value = 0.6179
  • 31. data: x4 --> W = 0.9817, p-value = 0.6234
  • 32. data: x5 --> W = 0.9777, p-value = 0.4592
  • 33. data: y1 --> W = 0.9793, p-value = 0.5233
  • 34. data: y2 --> w = 0.9846, p-value = 0.7538
  • 35. data: y3 --> W = 0.9843, p-value = 0.7395
  • 36. data: y4 --> W = 0.9866, p-value = 0.8386
  • 37. data: y5 --> W = 0.9824, p-value = 0.6565
  • 38. data: z1 --> W = 0.9758, p-value = 0.3918
  • 39. data: z2 --> W = 0.9869, p-value = 0.8496
  • 40. data: z3 --> W = 0.9771, p-value = 0.4366
  • 41. data: z4 --> W = 0.9765, p-value = 0.4142
  • 42. data: z5 --> W = 0.9742, p-value = 0.3411
  • 43. data: w1 --> W = 0.9802, p-value = 0.5612
  • 44. data: w2 --> W = 0.9804, p-value = 0.5683
  • 45. data: w3 --> W = 0.9799, p-value = 0.5474
  • 46. data: w4 --> W = 0.9801, p-value = 0.5568
  • 47.
  • 48. Avaliando compostos lineares Para avaliar os compostos sugeridos no slide anterior, primeiro devemos obter os n valores correspondentes a tais compostos. Por simplicidade, consideraremos apenas o primeiro grupo. A verificação para os demais grupos fica como um exercício. Primeiro vamos obter a decomposição espectral de S1 fazendo DES1=eigen(S1). DES1 receberá dois objetos: o vetor de autovalores em ordem decrescente de magnitude e a matriz ortogonal na qual as colunas são os autovetores correspondentes.
  • 49.
  • 50. Faça e1=matrix(0,1,5) e e5=matrix(0,1,5)
  • 51. Depois faça for (i in 1:5){e1[i]=DES1$vectors[i,1]} e
  • 52. for (i in 1:5){e5[i]=DES1$vectors[i,5]}
  • 53. Defina xc=matrix(0,50,2), matriz que receberá em cada coluna um dos compostos a serem analisados.
  • 54. Finalmente, obtenha os compostos: (x1 representa a matriz de dados do grupo 1) for (i in 1:50){xc[i,1]=e1%*%x1[i,]} e
  • 55.
  • 56.
  • 58. W = 0.9812, p-value = 0.6055
  • 62.
  • 63. Avaliação da Normalidade bivariada Além disso, vimos que se , então A grosso modo, devemos esperar que cerca de 50% das observações caiam na região (no elipsóide) Assim um procedimento útil, embora não exato, é comparar as proporções de pontos dentro de um contorno com a proba- bilidade teórica correspondente.
  • 64. Avaliação da Normalidade bivariada Um método um pouco mais formal para julgar a normalidade bivariada é baseado no quadrado da distância generalizada Esse procedimento não é limitado ao caso p=2, pode ser usado. para p>2.
  • 65. Avaliação da Normalidade bivariada Quando a população é de fato normal multivariada e ambos n e n-p são maiores que 25 ou 30, cada uma das distâncias generalizadas quadradas devem comportar-se segundo uma distribuição de qui-quadrado com p graus de liberdade. Apesar dessas distâncias não serem independentes ou terem distribuição exata de Qui-quadrado, é útil construir um gráfico como se fossem. O gráfico resultante é chamado gráfico qui-quadrado.
  • 66. Construção do gráfico qui-quadrado 1. Ordene as distâncias quadradas amostrais obtendo 2. Construa o gráfico de dispersão dos pontos: representando o 100(i-0,5)/n quantil da distribuição de qui-quadrado com p graus de liberdade. A nuvem de pontos deve se ajustar a uma reta. Um padrão diferente sugere falta de normalidade
  • 67. Verificando a normalidade bivariada dos dados em crabs Para começar devemos calcular as distâncias quadradas. Para isso vamos definir a matriz de dados x=matrix(0,200,5) e fazer x1=x[1:50,1:5]. Em seguida vamos calcular o vetor de médias m1=matrix(0,1,5) // for (i in 1:5){m1[i]=mean(x1[,i])} e a matriz de covariância amostral S1=cov(x1). Defina o vetor que receberá as distâncias quadradas: dquad1=matrix(0,50) e faça for (i in 1:50){dquad1[i]=(x1[i,]-m1)%*%solve(S1)%*%t(x1[i,]-m1)}
  • 68.
  • 69. Agora é só construir o gráfico.
  • 70. A figura a seguir mostra os gráficos obtidos para os quatro grupos.
  • 71.
  • 72.
  • 73. 1) Usar técnicas estatísticas apropriadas para dados não-normais, após verificar a distribuição plausível para os dados (Poisson, Gamma,etc.)
  • 74.
  • 75.
  • 76.
  • 77.
  • 78.
  • 79. Porém, não há garantias de que mesmo a melhor escolha de λ produzirá um conjunto de dados transformados que seja adequado à suposição de normalidade.
  • 80. Os resultados obtidos por uma transformação selecionada de acordo com esse procedimento devem ser cuidadosamente examinados para possíveis violações da suposição de normalidade.
  • 81. Essa recomendação de fato vale para qualquer transformação usada.