Arquivo referente a primeira da disciplina métodos estatísticos multivariados. Nele contém uma breve descrição de exemplos multivariados segundo o livro do Bryan j. F. Manly.
2. Disciplina: Métodos estatı́sticos
multivariados
Ministrante:
I Carlos Tadeu dos Santos Dias
I Adriele Giaretta Biase
I Maria Joseane Cruz da Silva
I Tatiana Assis
Inı́cio do curso: 26/01/2015
Fim do curso: 13/02/2015
Livro de referência: Bryan J. F. Manly (Métodos estatı́sticos multivariados, uma
introdução, 3a edição)
URL1: http://www.lce.esalq.usp.br/tadeu.html
URL2: https://sites.google.com/site/carlostadeudossantosdias/
3. Métodos estatı́sticos multivariados
Objetivo
I Introduzir os métodos multivariados de forma simples por meio de exemplos
práticos;
I Seguir como um guia prático;
I Capacitar o aluno na análise de experimentos agronômicos bem como na
interpretação de dados obtidos.
4. Métodos estatı́sticos multivariados
Objetivo
I Introduzir os métodos multivariados de forma simples por meio de exemplos
práticos;
I Seguir como um guia prático;
I Capacitar o aluno na análise de experimentos agronômicos bem como na
interpretação de dados obtidos.
Pré-requisitos
I Conhecimento prático de estatı́stica elementar;
I Testes de significância usando a distribuição normal, t, qui-quadrado e F.
I Análise de variância e regressão linear;
I Álgebra matricial;
I Acesso a algum pacote computacional (SAS, R, Excel, ...).
5. Métodos estatı́sticos multivariados −→ Exemplos
1 - Pardais sobreviventes de uma tempestade
I Após uma tempestade pardais foram levados a um determinado laboratório
biológico (Hermon Bumpus na Universidade de Brown em Rhode Island);
I Metade dos pássaros morreram;
I Foram feitas 8 medidas morfológicas em cada pássaro e também verificou seu
peso;
I Foram disponı́veis, no livro, apenas 5 das variáveis medidas (X1 - Comprimento
total, X2 - extensão alar, X3 - Comprimento do bico e cabeça, X4 - comprimento
do úmero, X5 - comprimento da quilha do esterno);
I Temos dois grupos: grupo 1 caracterizado pelos pássaros vivos (de 1 à 21) e
grupo 2 caracterizado pelos pássaros mortos (de 22 à 49).
6. Métodos estatı́sticos multivariados −→ Exemplos
1 - Pardais sobreviventes de uma tempestade
I Após uma tempestade pardais foram levados a um determinado laboratório
biológico (Hermon Bumpus na Universidade de Brown em Rhode Island);
I Metade dos pássaros morreram;
I Foram feitas 8 medidas morfológicas em cada pássaro e também verificou seu
peso;
I Foram disponı́veis, no livro, apenas 5 das variáveis medidas (X1 - Comprimento
total, X2 - extensão alar, X3 - Comprimento do bico e cabeça, X4 - comprimento
do úmero, X5 - comprimento da quilha do esterno);
I Temos dois grupos: grupo 1 caracterizado pelos pássaros vivos (de 1 à 21) e
grupo 2 caracterizado pelos pássaros mortos (de 22 à 49).
Tabela 1: Medidas do corpo de pardocas
7. Métodos estatı́sticos multivariados −→ Exemplos
1 - Pardais sobreviventes de uma tempestade
Questões
1- Será que um valor grande para uma determinada variável será grande para as
demais variáveis?
2- Os pássaros sobreviventes e não-sobreviventes têm diferenças estatisticamente
significantes para os valores médios das variáveis consideradas? Que método
estatı́stico usar?
3- Existe variação similar entre os grupos nas diferentes variáveis medidas? Que
método estatı́stico usar para verificar este problema?
4- Se os grupos diferem em termos das distribuições das variáveis é possı́vel
construir alguma função dessas variáveis que separe os dois grupos?
8. Métodos estatı́sticos multivariados −→ Exemplos
1 - Pardais sobreviventes de uma tempestade
Questões
1- Será que um valor grande para uma determinada variável será grande para as
demais variáveis?
2- Os pássaros sobreviventes e não-sobreviventes têm diferenças estatisticamente
significantes para os valores médios das variáveis consideradas? Que método
estatı́stico usar?
3- Existe variação similar entre os grupos nas diferentes variáveis medidas? Que
método estatı́stico usar para verificar este problema?
4- Se os grupos diferem em termos das distribuições das variáveis é possı́vel
construir alguma função dessas variáveis que separe os dois grupos?
Questão 2:
I Caso univariado −→ Teste t;
I Caso multivariado −→ T2-Hotteling.
9. Métodos estatı́sticos multivariados −→ Exemplos
1 - Pardais sobreviventes de uma tempestade
Questões
1- Será que um valor grande para uma determinada variável será grande para as
demais variáveis?
2- Os pássaros sobreviventes e não-sobreviventes têm diferenças estatisticamente
significantes para os valores médios das variáveis consideradas? Que método
estatı́stico usar?
3- Existe variação similar entre os grupos nas diferentes variáveis medidas? Que
método estatı́stico usar para verificar este problema?
4- Se os grupos diferem em termos das distribuições das variáveis é possı́vel
construir alguma função dessas variáveis que separe os dois grupos?
Questão 2:
I Caso univariado −→ Teste t;
I Caso multivariado −→ T2-Hotteling.
Questão 3:
I Caso univariado −→ Teste F, Teste de Levene (1960);
I Caso multivariado −→ Teste de M-Box, Teste de Van Valen (1978).
10. Métodos estatı́sticos multivariados −→ Exemplos
1 - Pardais sobreviventes de uma tempestade
Outros métodos:
I Análise discriminante −→ verificar o quão bem os pardais sobreviventes e
não-sobreviventes podem ser separados usando suas medidas;
11. Métodos estatı́sticos multivariados −→ Exemplos
2 - Crânios egı́pcios
I Medidas de crânios masculinos da área de Tebas no Egito foram obtidas (X1 -
largura máxima, X2 - altura basibregramática, X3 - comprimento basilveolar, X4 -
altura nasal);
I 5 amostras de 30 crâncios foram escolhidas (perı́odo pré-dinástico primitivo
(cerca de 4000 a.C), pré-dinástico antigo (cerca de 3300 a.C), 12o e 13o
dinastias (cerca de 1850 a.C), perı́odo Romano (cerca de 150 d.C)).
Tabela 2: Medidas de crânios egı́pcios masculinos (mm)
12. Métodos estatı́sticos multivariados −→ Exemplos
2 - Crânios egı́pcios
Questões
I Como estão relacionadas as quatro medidas?
I Existe diferença estatisticamente significantes nas médias amostrais ao longo
do tempo na forma e tamanho dos crânios? Que estatı́stica usar?
I Existe diferença significantes nos desvios padrão amostrais para as variáveis, e
se existem, essas diferenças refletem mudanças graduais ao longo do tempo na
quantidade de variação? Que estatı́stica usar?
I É possı́vel construir uma função das quatro variáveis que, em algum sentido,
que descreva as mudanças ao longo do tempo?
13. Métodos estatı́sticos multivariados −→ Exemplos
2 - Crânios egı́pcios
Questões
I Como estão relacionadas as quatro medidas?
I Existe diferença estatisticamente significantes nas médias amostrais ao longo
do tempo na forma e tamanho dos crânios? Que estatı́stica usar?
I Existe diferença significantes nos desvios padrão amostrais para as variáveis, e
se existem, essas diferenças refletem mudanças graduais ao longo do tempo na
quantidade de variação? Que estatı́stica usar?
I É possı́vel construir uma função das quatro variáveis que, em algum sentido,
que descreva as mudanças ao longo do tempo?
Questão 2:
I Caso univariado −→ Teste F (ANOVA);
I Caso multivariado −→ Teste de lambda Wilks, Estatı́stica de Pillai, Traço de
Lawley-Hotelling (ANOVA multivariada).
14. Métodos estatı́sticos multivariados −→ Exemplos
2 - Crânios egı́pcios
Questões
I Como estão relacionadas as quatro medidas?
I Existe diferença estatisticamente significantes nas médias amostrais ao longo
do tempo na forma e tamanho dos crânios? Que estatı́stica usar?
I Existe diferença significantes nos desvios padrão amostrais para as variáveis, e
se existem, essas diferenças refletem mudanças graduais ao longo do tempo na
quantidade de variação? Que estatı́stica usar?
I É possı́vel construir uma função das quatro variáveis que, em algum sentido,
que descreva as mudanças ao longo do tempo?
Questão 2:
I Caso univariado −→ Teste F (ANOVA);
I Caso multivariado −→ Teste de lambda Wilks, Estatı́stica de Pillai, Traço de
Lawley-Hotelling (ANOVA multivariada).
Questão 3:
I Caso univariado −→ Teste de M-Box;
I Caso multivariado −→ Teste de M-Box.
15. Métodos estatı́sticos multivariados −→ Exemplos
2 - Crânios egı́pcios
Outros métodos:
I Análise discriminante −→ verificar como os crânios de diferentes épocas podem
ser separados usando medidas de tamanho.
3 - Distribuição de uma borboleta (Colônias de borboletas)
I Os dados contém 16 colônias de borboletas;
I Quatro ambientais (altitude, precipitação anual, temperatura máxima,
temperatura mı́nima);
I Seis variáveis genéticas (frequências percentuais para diferentes genes (fósforo
glucoxisomerase)).
16. Métodos estatı́sticos multivariados −→ Exemplos
2 - Crânios egı́pcios
Outros métodos:
I Análise discriminante −→ verificar como os crânios de diferentes épocas podem
ser separados usando medidas de tamanho.
3 - Distribuição de uma borboleta (Colônias de borboletas)
I Os dados contém 16 colônias de borboletas;
I Quatro ambientais (altitude, precipitação anual, temperatura máxima,
temperatura mı́nima);
I Seis variáveis genéticas (frequências percentuais para diferentes genes (fósforo
glucoxisomerase)).
Tabela 3: Variáveis ambientais e frequências gênicas
17. Métodos estatı́sticos multivariados −→ Exemplos
3 - Distribuição de uma borboleta (Colônias de borboletas)
Questões
1 - As frequências Pgi são similiares para as colônias que estão próximas no
espaço?
2 - O quanto as frequências Pgi estão relacionadas as variáveis ambientais?
18. Métodos estatı́sticos multivariados −→ Exemplos
3 - Distribuição de uma borboleta (Colônias de borboletas)
Questões
1 - As frequências Pgi são similiares para as colônias que estão próximas no
espaço?
2 - O quanto as frequências Pgi estão relacionadas as variáveis ambientais?
Questão 1:
I Pode usar o escalonamento multidimensional para verificar o quão distante
estão os pares de colônias conforme as variáveis em questão.
19. Métodos estatı́sticos multivariados −→ Exemplos
3 - Distribuição de uma borboleta (Colônias de borboletas)
Questões
1 - As frequências Pgi são similiares para as colônias que estão próximas no
espaço?
2 - O quanto as frequências Pgi estão relacionadas as variáveis ambientais?
Questão 1:
I Pode usar o escalonamento multidimensional para verificar o quão distante
estão os pares de colônias conforme as variáveis em questão.
Questão 2:
I Caso de duas variáveis −→ Correlação de Person;
I Caso multivariado −→ Correlação canônica.
20. Métodos estatı́sticos multivariados −→ Exemplos
3 - Distribuição de uma borboleta (Colônias de borboletas)
Questões
1 - As frequências Pgi são similiares para as colônias que estão próximas no
espaço?
2 - O quanto as frequências Pgi estão relacionadas as variáveis ambientais?
Questão 1:
I Pode usar o escalonamento multidimensional para verificar o quão distante
estão os pares de colônias conforme as variáveis em questão.
Questão 2:
I Caso de duas variáveis −→ Correlação de Person;
I Caso multivariado −→ Correlação canônica.
Outro método:
I Análise de agrupamento −→ identificar grupos de colônias que são similares
conforme as variáveis ambientais ou frequências Pgi;
21. Métodos estatı́sticos multivariados −→ Exemplos
4 - Cães pré-históricos da Tailândia
I Neste exemplo temos informações de ossos encontrados em locais
pré-históricos no nordeste da Tailândia;
I Não se sabe a origem dos cães pré-históricos;
I Foram feitas medidas da mandı́bula dos espécimes disponı́veis de sete grupos
(cão moderno, chacal dourado, lobo chinês, lobo indiano, cuan, Dingo, Cão
pré-histórico);
I Os dados referem-se aos valores médios para as seis medidas de mandı́bulas
(X1 = largura da mandı́bula, X2 = altura da mandı́bula abaixo do primeiro molar,
X3 = comprimento do primeiro molar, X4 = largura do primeiro molar, X5 =
comprimento do primeiro ao terceiro molar, X1 = comprimento do primeiro ao
quarto molar).
Tabela 4: Medidas de mandı́bulas para sete grupos caninos
22. Métodos estatı́sticos multivariados −→ Exemplos
4 - Cães pré-históricos da Tailândia
Questões
I O que as medidas sugerem sobre o relacionamento entre os grupos?
I Como os cães pré-hitóricos parecem se relacionar com os outros grupos?
23. Métodos estatı́sticos multivariados −→ Exemplos
4 - Cães pré-históricos da Tailândia
Questões
I O que as medidas sugerem sobre o relacionamento entre os grupos?
I Como os cães pré-hitóricos parecem se relacionar com os outros grupos?
Métodos estatı́sticos
I Análise de agrupamento −→ verificar a similaridade entre os cães pré-históricos
tailandeses e demais animais;
I Escalonamento multidimensional −→ verificar como os grupos de cães estão
relacionados por meio de um mapa.
24. Métodos estatı́sticos multivariados −→ Exemplos
5 - Emprego em paı́ses europeus
I Dados de diferentes porcentagens de força de trabalho em 9 diferentes tipos de
indústrias para 30 paı́ses europeus;
I Métodos multivariados podem ser úteis para isolar grupos de paı́ses com
padrões similares de emprego;
I O métodos multivariados também podem ajudar a entender o relacionamento
entre os paı́ses.
Tabela 5: Porcentagem de força de trabalho de empregados em diferentes grupos de
indústrias
Métodos estatı́sticos
25. Métodos estatı́sticos multivariados −→ Exemplos
5 - Emprego em paı́ses europeus
I Dados de diferentes porcentagens de força de trabalho em 9 diferentes tipos de
indústrias para 30 paı́ses europeus;
I Métodos multivariados podem ser úteis para isolar grupos de paı́ses com
padrões similares de emprego;
I O métodos multivariados também podem ajudar a entender o relacionamento
entre os paı́ses.
Tabela 5: Porcentagem de força de trabalho de empregados em diferentes grupos de
indústrias
Métodos estatı́sticos
I Análise de componentes principais −→ verificar a existência de grupos de
paı́ses padrões similares de emprego;
I Análise de Fatores −→ verificar a importância das variáveis em cada paı́s
Europeu;
I Análise de agrupamento −→ verificar os grupos de paı́ses que são similares de
acordo com padrão de emprego.
26. Métodos estatı́sticos multivariados
I Análise de componentes principais;
I Análise de Fatores;
I Análise de função discriminante;
I Análise de Agrupamento;
I Correlação Canônica;
I Escalonamento multidimensional;
I Análise de correspondência.
27. Métodos estatı́sticos multivariados −→ Distribuição normal multivariada
Univariado
I Tem uma curva de frequências na forma de sino;
I Muitos métodos univariados padrão tem por base a suposição de que os dados
são normalmente distribuı́dos (ANOVA);
Multivariado
28. Métodos estatı́sticos multivariados −→ Distribuição normal multivariada
Univariado
I Tem uma curva de frequências na forma de sino;
I Muitos métodos univariados padrão tem por base a suposição de que os dados
são normalmente distribuı́dos (ANOVA);
Multivariado
I Várias variáveis;
I Os dados tenham distribuição normal multivariada;
I Se todas as variáveis parecerem ser normalmente distribuı́das então assume-se
que a distribuição conjunta é normal multivariada;
I Se uma das variáveis apresentarem distribuição assimétrica com vários valores
baixos ou muito altos, pode haver muitos valores repetidos. Este tipo de
problema pode ser superado por uma transformação de dados apropriada;
I A distribuição normal multivariada é caracterizada por um vetor de médias e
uma matriz de covariâncias.