SlideShare une entreprise Scribd logo
1  sur  40
Télécharger pour lire hors ligne
UNIVERSIDADE ESTADUAL DE GOIÁS
UNIDADE UNIVERSITÁRIA DE CIÊNCIAS EXATAS E TECNOLÓGICAS
PROGRAMA DE PÓS GRADUAÇÃO STRICTO SENSU EM CIÊNCIAS
MOLECULARES
ANALISE DE COMPONENTES PRINCIPAIS
Estudo de caso: Poluição nos EUA
Disciplina: Quimiometria
Professor: Diego Palmirez
Acadêmicos: Eduardo Andrade
Thiago Almeida
Anápolis – Goiás
2013
Analises de Dados Multivariados
As p variaveis dependentes, de natureza
similar e que nenhuma delas têm, em
principio, uma importancia superior as
demais.
Simplificação da Estrutura de Dados
Classificação
Analise da Interdependência
Analise de Dependência
Formulação de Hipóteses
Analise das Variáveis
Relação entre as Variáveis
Variáveis Métricas
Analise de Componentes Principais
Analises de Dados Multivariados
Transformar um conjunto de variáveis
(originais) em um novo conjunto de variáveis
(componentes principais), que não são
correlacionadas entre si.
 Fenômenos com muitas variáveis.
 Reduzir a dimensão do numero de variáveis significativas.
 Novas variáveis se ordenam de acordo com a informação que
carregam.
Matriz de Correlação e Matriz de Covariância.
PCA
 Dados quantitativos com distribuição normal
N~(0,1).
 Variáveis originais devem estar correlacionadas.
 Informação incorporada em cada componente.
Variância (б).
 O novo conjunto de variáveis é igual ao numero de
variáveis originais.
PCA
Redução do tamanho, representação
mais compacta.
X
Super simplificação: perda de
informação relevante.
PCA
 Variáveis não correlacionadas.
 Todas as variaveis devem estar nas mesmas
unidades ou, no mínimo, em unidades
comparaveis.
 As variables devem ter variancias que sejam
de tamanhos aproximadamente igual.
ADVERTÊNCIAS
Critério sobre as porcentagens.
Critério de maior peso.
Escolha das CP’s
Análise de Componentes Principais (ACP, PCA)
Não diferencia entre variáveis independentes
e dependentes.
O valor da correlação não muda ao se alterar
a unidade de mensuração das variáveis.
O coeficiente tem um caráter adimensional.
Coeficiente de Correlação
Variáveis deve ser quantitativas
(contínuas ou discretas).
Análise de outliers.
Faz-se necessária a independência
das observações.
Coeficiente de Correlação
ESTUDO DE CASO:
Determinação dos fatores
significantes para a Poluição
nos EUA utilizando PCA.
VARIÁVEIS
• Quantidade de S02.
• Temperatura (F).
• Número de Empresas.
• População (milhares).
• Velocidade do Vento.
• Precipitação.
• Dias chuvosos.
Planilha de Dados (1/2)
CIDADE [SO2] TEMP. EMPRESAS POBLACION VIENTO PRECIP. DIAS
Phoenix 10,00 70,30 213,00 582,00 6,00 7,05 36,00
Little Rock 13,00 61,00 91,00 132,00 8,20 48,52 100,00
San Francisco 12,00 56,70 453,00 716,00 8,70 20,66 67,00
Denver 17,00 51,90 454,00 515,00 9,00 12,95 86,00
Hartford 56,00 49,10 412,00 158,00 9,00 43,37 127,00
Wilmington 36,00 54,00 80,00 80,00 9,00 40,25 114,00
Washington 29,00 57,30 434,00 757,00 9,30 38,89 111,00
Jacksonville 14,00 68,40 136,00 529,00 8,80 54,47 116,00
Miami 10,00 75,50 207,00 335,00 9,00 59,80 128,00
Atlanta 24,00 61,50 368,00 497,00 9,10 48,34 115,00
Chicago 110,00 50,60 3344,00 3369,00 10,40 34,44 122,00
Indianapolis 28,00 52,30 361,00 746,00 9,70 38,74 121,00
Des Moines 17,00 49,00 104,00 201,00 11,20 30,85 103,00
Wichita 8,00 56,60 125,00 277,00 12,70 30,58 82,00
Louisville 30,00 55,60 291,00 593,00 8,30 43,11 123,00
New Orleans 9,00 68,30 204,00 361,00 8,40 56,77 113,00
Baltimore 47,00 55,00 625,00 905,00 9,60 41,31 111,00
Detroit 35,00 49,90 1064,00 1513,00 10,10 30,96 129,00
Minneapolis-St. Paul 29,00 43,50 699,00 744,00 10,60 25,94 137,00
Kansas City 14,00 54,50 381,00 507,00 10,00 37,00 99,00
St. Louis 56,00 55,90 775,00 622,00 9,50 35,89 105,00
Omaha 14,00 51,50 181,00 347,00 10,90 30,18 98,00
Alburquerque 11,00 56,80 46,00 244,00 8,90 7,77 58,00
Albany 46,00 47,60 44,00 116,00 8,80 33,36 135,00
Buffalo 11,00 47,10 391,00 463,00 12,40 36,11 166,00
Cincinnati 23,00 54,00 462,00 453,00 7,10 39,04 132,00
Cleveland 65,00 49,70 1007,00 751,00 10,90 34,99 155,00
Columbus 26,00 51,50 266,00 540,00 8,60 37,01 134,00
Philadelphia 69,00 54,60 1692,00 1950,00 9,60 39,93 115,00
Pittsburgh 61,00 50,40 347,00 520,00 9,40 36,22 147,00
Providence 94,00 50,00 343,00 179,00 10,60 42,75 125,00
Memphis 10,00 61,60 337,00 624,00 9,20 49,10 105,00
Nashville 18,00 59,40 275,00 448,00 7,90 46,00 119,00
Dallas 9,00 66,20 641,00 844,00 10,90 35,94 78,00
Houston 10,00 68,90 721,00 1233,00 10,80 48,19 103,00
Salt Lake City 28,00 51,00 137,00 176,00 8,70 15,17 89,00
Norfolk 31,00 59,30 96,00 308,00 10,60 44,68 116,00
Richmond 26,00 57,80 197,00 299,00 7,60 42,59 115,00
Seattle 29,00 51,10 379,00 531,00 9,40 38,79 164,00
Charleston 31,00 55,20 35,00 71,00 6,50 40,75 148,00
Milwaukee 16,00 45,70 569,00 717,00 11,80 29,07 123,00
Planilha de Dados (2/2)
Software Utilizado
Planilha de Dados no
Statística®
Normalização das Variáveis
Normalização das Variáveis
Gráficos de Correlação
Análise de Componentes Principais (ACP, PCA)
Matriz de Correlação
Determinaçãodos
ComponentesPrinipais
Gráfico de Variabilidade
Explicada
Análise de Componentes Principais (ACP, PCA)
Matriz de
Componentes
Representação
em 3D das
variáveis
PresençadeOutliers
Análise de Componentes Principais (ACP, PCA)
Análise de Componentes Principais (ACP, PCA)
Análise de Componentes Principais (ACP, PCA)
Análise de Componentes Principais (ACP, PCA)
Umidade
Qualidade de Vida
Clima
Regressão Múltipla da
Quantidade de S02 com as
componentes significativas
(CP1, CP 2 e CP 3)
Análise de Componentes Principais (ACP, PCA)
Todos os dados esquematizados
Análise de Componentes Principais (ACP, PCA)
Sem os Outliers
Com os Outliers
Thanks for
Attetion.
Obrigado pela
atenção .
Gracias por su
atencion .

Contenu connexe

En vedette

AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Applitools
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at WorkGetSmarter
 

En vedette (20)

AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 
ChatGPT webinar slides
ChatGPT webinar slidesChatGPT webinar slides
ChatGPT webinar slides
 
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike RoutesMore than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
 

Análise de Componentes Principais (ACP, PCA)

  • 1. UNIVERSIDADE ESTADUAL DE GOIÁS UNIDADE UNIVERSITÁRIA DE CIÊNCIAS EXATAS E TECNOLÓGICAS PROGRAMA DE PÓS GRADUAÇÃO STRICTO SENSU EM CIÊNCIAS MOLECULARES ANALISE DE COMPONENTES PRINCIPAIS Estudo de caso: Poluição nos EUA Disciplina: Quimiometria Professor: Diego Palmirez Acadêmicos: Eduardo Andrade Thiago Almeida Anápolis – Goiás 2013
  • 2. Analises de Dados Multivariados As p variaveis dependentes, de natureza similar e que nenhuma delas têm, em principio, uma importancia superior as demais. Simplificação da Estrutura de Dados Classificação Analise da Interdependência Analise de Dependência Formulação de Hipóteses
  • 3. Analise das Variáveis Relação entre as Variáveis Variáveis Métricas Analise de Componentes Principais Analises de Dados Multivariados
  • 4. Transformar um conjunto de variáveis (originais) em um novo conjunto de variáveis (componentes principais), que não são correlacionadas entre si.  Fenômenos com muitas variáveis.  Reduzir a dimensão do numero de variáveis significativas.  Novas variáveis se ordenam de acordo com a informação que carregam. Matriz de Correlação e Matriz de Covariância. PCA
  • 5.  Dados quantitativos com distribuição normal N~(0,1).  Variáveis originais devem estar correlacionadas.  Informação incorporada em cada componente. Variância (б).  O novo conjunto de variáveis é igual ao numero de variáveis originais. PCA
  • 6. Redução do tamanho, representação mais compacta. X Super simplificação: perda de informação relevante. PCA
  • 7.  Variáveis não correlacionadas.  Todas as variaveis devem estar nas mesmas unidades ou, no mínimo, em unidades comparaveis.  As variables devem ter variancias que sejam de tamanhos aproximadamente igual. ADVERTÊNCIAS
  • 8. Critério sobre as porcentagens. Critério de maior peso. Escolha das CP’s
  • 10. Não diferencia entre variáveis independentes e dependentes. O valor da correlação não muda ao se alterar a unidade de mensuração das variáveis. O coeficiente tem um caráter adimensional. Coeficiente de Correlação
  • 11. Variáveis deve ser quantitativas (contínuas ou discretas). Análise de outliers. Faz-se necessária a independência das observações. Coeficiente de Correlação
  • 12. ESTUDO DE CASO: Determinação dos fatores significantes para a Poluição nos EUA utilizando PCA.
  • 13. VARIÁVEIS • Quantidade de S02. • Temperatura (F). • Número de Empresas. • População (milhares). • Velocidade do Vento. • Precipitação. • Dias chuvosos.
  • 14. Planilha de Dados (1/2) CIDADE [SO2] TEMP. EMPRESAS POBLACION VIENTO PRECIP. DIAS Phoenix 10,00 70,30 213,00 582,00 6,00 7,05 36,00 Little Rock 13,00 61,00 91,00 132,00 8,20 48,52 100,00 San Francisco 12,00 56,70 453,00 716,00 8,70 20,66 67,00 Denver 17,00 51,90 454,00 515,00 9,00 12,95 86,00 Hartford 56,00 49,10 412,00 158,00 9,00 43,37 127,00 Wilmington 36,00 54,00 80,00 80,00 9,00 40,25 114,00 Washington 29,00 57,30 434,00 757,00 9,30 38,89 111,00 Jacksonville 14,00 68,40 136,00 529,00 8,80 54,47 116,00 Miami 10,00 75,50 207,00 335,00 9,00 59,80 128,00 Atlanta 24,00 61,50 368,00 497,00 9,10 48,34 115,00 Chicago 110,00 50,60 3344,00 3369,00 10,40 34,44 122,00 Indianapolis 28,00 52,30 361,00 746,00 9,70 38,74 121,00 Des Moines 17,00 49,00 104,00 201,00 11,20 30,85 103,00 Wichita 8,00 56,60 125,00 277,00 12,70 30,58 82,00 Louisville 30,00 55,60 291,00 593,00 8,30 43,11 123,00 New Orleans 9,00 68,30 204,00 361,00 8,40 56,77 113,00 Baltimore 47,00 55,00 625,00 905,00 9,60 41,31 111,00 Detroit 35,00 49,90 1064,00 1513,00 10,10 30,96 129,00 Minneapolis-St. Paul 29,00 43,50 699,00 744,00 10,60 25,94 137,00 Kansas City 14,00 54,50 381,00 507,00 10,00 37,00 99,00
  • 15. St. Louis 56,00 55,90 775,00 622,00 9,50 35,89 105,00 Omaha 14,00 51,50 181,00 347,00 10,90 30,18 98,00 Alburquerque 11,00 56,80 46,00 244,00 8,90 7,77 58,00 Albany 46,00 47,60 44,00 116,00 8,80 33,36 135,00 Buffalo 11,00 47,10 391,00 463,00 12,40 36,11 166,00 Cincinnati 23,00 54,00 462,00 453,00 7,10 39,04 132,00 Cleveland 65,00 49,70 1007,00 751,00 10,90 34,99 155,00 Columbus 26,00 51,50 266,00 540,00 8,60 37,01 134,00 Philadelphia 69,00 54,60 1692,00 1950,00 9,60 39,93 115,00 Pittsburgh 61,00 50,40 347,00 520,00 9,40 36,22 147,00 Providence 94,00 50,00 343,00 179,00 10,60 42,75 125,00 Memphis 10,00 61,60 337,00 624,00 9,20 49,10 105,00 Nashville 18,00 59,40 275,00 448,00 7,90 46,00 119,00 Dallas 9,00 66,20 641,00 844,00 10,90 35,94 78,00 Houston 10,00 68,90 721,00 1233,00 10,80 48,19 103,00 Salt Lake City 28,00 51,00 137,00 176,00 8,70 15,17 89,00 Norfolk 31,00 59,30 96,00 308,00 10,60 44,68 116,00 Richmond 26,00 57,80 197,00 299,00 7,60 42,59 115,00 Seattle 29,00 51,10 379,00 531,00 9,40 38,79 164,00 Charleston 31,00 55,20 35,00 71,00 6,50 40,75 148,00 Milwaukee 16,00 45,70 569,00 717,00 11,80 29,07 123,00 Planilha de Dados (2/2)
  • 17. Planilha de Dados no Statística®
  • 34. Clima
  • 35. Regressão Múltipla da Quantidade de S02 com as componentes significativas (CP1, CP 2 e CP 3)
  • 37. Todos os dados esquematizados
  • 39. Sem os Outliers Com os Outliers
  • 40. Thanks for Attetion. Obrigado pela atenção . Gracias por su atencion .