O documento apresenta um estudo de caso sobre poluição nos EUA utilizando análise de componentes principais (PCA). A PCA foi aplicada a dados de várias variáveis como emissão de SO2, temperatura, número de empresas, população, velocidade do vento e precipitação de várias cidades americanas. A PCA identificou três componentes principais que explicam a maior parte da variância dos dados e que podem estar relacionadas a fatores como umidade, qualidade de vida e clima.
More than Just Lines on a Map: Best Practices for U.S Bike Routes
Análise de Componentes Principais (ACP, PCA)
1. UNIVERSIDADE ESTADUAL DE GOIÁS
UNIDADE UNIVERSITÁRIA DE CIÊNCIAS EXATAS E TECNOLÓGICAS
PROGRAMA DE PÓS GRADUAÇÃO STRICTO SENSU EM CIÊNCIAS
MOLECULARES
ANALISE DE COMPONENTES PRINCIPAIS
Estudo de caso: Poluição nos EUA
Disciplina: Quimiometria
Professor: Diego Palmirez
Acadêmicos: Eduardo Andrade
Thiago Almeida
Anápolis – Goiás
2013
2. Analises de Dados Multivariados
As p variaveis dependentes, de natureza
similar e que nenhuma delas têm, em
principio, uma importancia superior as
demais.
Simplificação da Estrutura de Dados
Classificação
Analise da Interdependência
Analise de Dependência
Formulação de Hipóteses
3. Analise das Variáveis
Relação entre as Variáveis
Variáveis Métricas
Analise de Componentes Principais
Analises de Dados Multivariados
4. Transformar um conjunto de variáveis
(originais) em um novo conjunto de variáveis
(componentes principais), que não são
correlacionadas entre si.
Fenômenos com muitas variáveis.
Reduzir a dimensão do numero de variáveis significativas.
Novas variáveis se ordenam de acordo com a informação que
carregam.
Matriz de Correlação e Matriz de Covariância.
PCA
5. Dados quantitativos com distribuição normal
N~(0,1).
Variáveis originais devem estar correlacionadas.
Informação incorporada em cada componente.
Variância (б).
O novo conjunto de variáveis é igual ao numero de
variáveis originais.
PCA
6. Redução do tamanho, representação
mais compacta.
X
Super simplificação: perda de
informação relevante.
PCA
7. Variáveis não correlacionadas.
Todas as variaveis devem estar nas mesmas
unidades ou, no mínimo, em unidades
comparaveis.
As variables devem ter variancias que sejam
de tamanhos aproximadamente igual.
ADVERTÊNCIAS
8. Critério sobre as porcentagens.
Critério de maior peso.
Escolha das CP’s
10. Não diferencia entre variáveis independentes
e dependentes.
O valor da correlação não muda ao se alterar
a unidade de mensuração das variáveis.
O coeficiente tem um caráter adimensional.
Coeficiente de Correlação
11. Variáveis deve ser quantitativas
(contínuas ou discretas).
Análise de outliers.
Faz-se necessária a independência
das observações.
Coeficiente de Correlação
13. VARIÁVEIS
• Quantidade de S02.
• Temperatura (F).
• Número de Empresas.
• População (milhares).
• Velocidade do Vento.
• Precipitação.
• Dias chuvosos.