SlideShare une entreprise Scribd logo
1  sur  15
Télécharger pour lire hors ligne
Correlação e Regressão Linear


Mede o grau de dependência entre duas
variáveis X e Y
Cov(X,Y)=E
Cov(X,Y)=          -       .   =



Se X e Y são independentes, então
cov(X,Y) = 0.
Coeficiente de correlação linear de
Pearson:




  =            e       =           →
Exemplo:
Calcular o coeficiente r para os dados:
Pessoa     Altura (cm)   Peso (kg)
   1          174           73
   2          161           66
   3          170           64
   4          180           94
   5          182           79
   6          164           72
   7          156           62
   8          168           64
   9          176           90
  10          175           81
Testes do Coeficiente de Correlação
  :       =
  :       ≠
Este teste pode ser feito através da
estatística :

      =       ,

Exemplo:
Verificar, ao nível de 5% de significância,
se existe a correlação positiva entre a
altura e o peso das pessoas na população
do exemplo anterior.
Para testar valor não nulo de :
Fisher sugere a transformação :

£=         Esta transformação faz com que
os valores de £ tenham distribuição
bastante próxima da normal com média:

μ(£)=         e σ(£)=



Exemplo:
Considerando o exemplo anterior, construir
um intervalo de 95% de confiança para o
coeficiente de correlação populacional
entre a altura e o peso das pessoas
consideradas.
Regressão Linear Simples
A linha teórica de regressão:
               .
Os parâmetros e serão estimados
através dos pontos experimentais
fornecidos pela amostra, obtendo-se uma
reta estimativa na forma:
  = a + bx onde a é a estimativa do
parâmetro e b, também conhecido como
coeficiente de regressão linear, é a
estimativa do parâmetro . O símbolo é
utilizado para uma conveniente distinção
dos valores dados pela reta estimativa, em
relação às ordenadas dos pontos amostrais
Método de mínimos quadrados



Os valores a e b que minimizam esta
expressão serão aqueles que anulam suas
derivadas parciais

      =0   e         =0   →




→




→
Algumas vezes é interessante fazer
codificações lineares nos valores das
variáveis para simplificar os cálculos. Por
exemplo, se fizermos as transformações
            e               . Obteremos a
reta na forma
            →
→
Exemplo
Obter a equação da reta de mínimos quadrados
para os seguintes pontos experimentais:
X 1      2 3 4 5           6    7    8
Y 0,5 0,6 0,9 0,8 1,2 1,5 1,7        2,0
Calcular o coeficiente de correlação linear.
Reta passando pela origem
O modelo é da forma:
                A reta estimativa será
→                              →
                  →
→                 →
Exemplo :
Se considerássemos que a reta de
regressão devesse passar pela origem no
exemplo anterior, o coeficiente seria:

Funções linearizáveis
Exemplo:

Teste de β

H0 :     or
H1 :     or ,       or ,      or
Pode-se demonstrar que:

           e          ,    Variância
Residual
Como não conhecemos               , usamos
             ,

       → Teste de uma média
populacional com variância desconhecida
→ usa-se a estatística

p/       →


O mesmo vale para
         e                        →
e o teste do          fica:
                 p/           →
Exemplo do teste de β
Verificar se podemos afirmar, ao nível de
5% de significância, que a reta teórica do
exemplo anterior tem uma inclinação
superior a 10%. Caso afirmativo, construir
um intervalo de confiança de 95% para o
coeficiente angular da reta real da
regressão. Ainda, ao nível de 5% de
significância, verificar se podemos eliminar
a possibilidade de a reta teórica passar
pela origem.


I.C. para         e
Exemplo:
Construir Intervalos de 95% de confiança
para o valor médio de y e para a previsão
  , quando         , para exemplo anterior.
Regressão Polinomial
Exemplo
Ajustar a parábola de mínimos quadrados
aos dados do exemplo anterior.




Regressão Linear Multipla
Exemplo
Uma reação química foi realizada sob seis
pares de condições de pressão e
temperatura. Em cada caso, foi medido o
tempo necessário para que a reação se
completasse. Os resultados obtidos foram:
Condição Temp. Press. tempo
   1       20       1,5     9,4
   2       30       1,5    8,2
   3       30       1,2    9,7
   4       40       1,0    9,5
5        60       1,0    6,9
   6        80       0,8    6,5
Obter a equação da regressão linear do
tempo em função da Temp. e Pressão.
Correlação Linear Multipla
Coeficiente de Correlação Linear Multipla é
definida como:




A Variância residual :



É n-k-1 pois foram estimados k+1 variáveis.
Exemplo
Calcular o coeficiente de correlação linear
múltipla de y em relação a e      no
exemplo anterior. Calcular também a
variância residual em torno da regressão.
Correlação Parcial
Diferença entre manter     constante ou
ignorar .
    ignora   enquanto       definida como
coeficiente de correlação parcial entre  e
   com respeito a



Exemplo
Analisar as correlações totais e parciais no
exemplo anterior.
Problema
1)Oito alunos sorteados entre os da
segunda série de um curso de engenharia
obtiveram as seguintes notas nos exames
de Cálculo e Física
Aluno 1     2   3   4    5     6    7   8
Cálc 4,5 6,0 3,0 2,5 5,0 5,5 1,5 7,0
Fis.   3,5 4,5 3,0 2,0 5,5 5,0 1,5      6,0
Com base nestes dados, pode-se ter
praticamente 99% de certeza de que os
alunos mais bem preparados em Cálculo
também o sejam em Física?
2) Dados os valores a seguir de t (horas de
tratamento térmico) e de R (resistência à
tração de um aço em kg/mm2), a)pode-se
afirmar, ao nível de 2% de significância,
que R depende de t? b)Admitida uma
dependência linear, qual seria a equação
da reta de regressão de R em função de t?
c)Construir intervalos de 90% de confiança
para o valor médio de R e para a previsão
R’, quando t=9.
3)Um banco possui oito agências em certa
praça. Desejando verificar a afirmação de
que um maior número de funcionários leva
a uma ineficiência maior no serviço, o
gerente geral relacionou o número de
funcionários por agencia (x) e a
classificação das agências segundo sua
eficiência dentre todas as agências do
banco (y). Ao nível de 5% de significância,
qual a conclusão?
x 9 15 12 12 13 20 22 17
y 8 13 6 22 15 36 29 31
4)Numa determinada experiência, foram
obtidos os seguintes pares de valores (x,y):
a)escreva a equação da melhor reta de
regressão de y em relação a x.
b)verifique, ao nível de 5% de significância,
se existe evidência suficiente a partir dos
dados experimentais para contradizer a
hipótese de que a reta de (a) é paralela à
reta y = 1,5 – 0,45x.

Contenu connexe

Tendances

Unidade 04 - Estatística - Medidas de dispersão.ppt
Unidade 04 - Estatística - Medidas de dispersão.pptUnidade 04 - Estatística - Medidas de dispersão.ppt
Unidade 04 - Estatística - Medidas de dispersão.ppt
CrobelEtiquetas
 
Aula de distribuição de frequencia
Aula de distribuição de frequenciaAula de distribuição de frequencia
Aula de distribuição de frequencia
Linduart Tavares
 
Conceito e exercícios de matemática financeira
Conceito e exercícios de matemática financeiraConceito e exercícios de matemática financeira
Conceito e exercícios de matemática financeira
arpetry
 
Economia aula 3 – a elasticidade e suas aplicações
Economia   aula 3 – a elasticidade e suas aplicaçõesEconomia   aula 3 – a elasticidade e suas aplicações
Economia aula 3 – a elasticidade e suas aplicações
Felipe Leo
 

Tendances (20)

Tópico 2 Intervalo de Confiança
Tópico 2   Intervalo de ConfiançaTópico 2   Intervalo de Confiança
Tópico 2 Intervalo de Confiança
 
Econometria
EconometriaEconometria
Econometria
 
Unidade 04 - Estatística - Medidas de dispersão.ppt
Unidade 04 - Estatística - Medidas de dispersão.pptUnidade 04 - Estatística - Medidas de dispersão.ppt
Unidade 04 - Estatística - Medidas de dispersão.ppt
 
Prática de Regressão no SPSS
Prática de Regressão no SPSSPrática de Regressão no SPSS
Prática de Regressão no SPSS
 
Aula de distribuição de frequencia
Aula de distribuição de frequenciaAula de distribuição de frequencia
Aula de distribuição de frequencia
 
Correlação Estatística
Correlação EstatísticaCorrelação Estatística
Correlação Estatística
 
Testes hipot parametricos_pressupostos
Testes hipot parametricos_pressupostosTestes hipot parametricos_pressupostos
Testes hipot parametricos_pressupostos
 
Matematica Financeira
Matematica FinanceiraMatematica Financeira
Matematica Financeira
 
03 tópico 2 - regressão multipla
03   tópico 2 - regressão multipla03   tópico 2 - regressão multipla
03 tópico 2 - regressão multipla
 
Aula 02 população amostra e dados
Aula 02   população amostra e dadosAula 02   população amostra e dados
Aula 02 população amostra e dados
 
Conceito e exercícios de matemática financeira
Conceito e exercícios de matemática financeiraConceito e exercícios de matemática financeira
Conceito e exercícios de matemática financeira
 
distribuição-t-student
distribuição-t-studentdistribuição-t-student
distribuição-t-student
 
Estatistica descritiva
Estatistica descritiva Estatistica descritiva
Estatistica descritiva
 
06 tópico 5 - heterocedasticidade
06   tópico 5 - heterocedasticidade06   tópico 5 - heterocedasticidade
06 tópico 5 - heterocedasticidade
 
Matemática Financeira - Juros Simples
Matemática Financeira - Juros SimplesMatemática Financeira - Juros Simples
Matemática Financeira - Juros Simples
 
Aula 05 Espectrofotometria Uv Vis
Aula 05   Espectrofotometria Uv VisAula 05   Espectrofotometria Uv Vis
Aula 05 Espectrofotometria Uv Vis
 
Economia aula 3 – a elasticidade e suas aplicações
Economia   aula 3 – a elasticidade e suas aplicaçõesEconomia   aula 3 – a elasticidade e suas aplicações
Economia aula 3 – a elasticidade e suas aplicações
 
Conceitos Básicos de Estatística II
Conceitos Básicos de Estatística IIConceitos Básicos de Estatística II
Conceitos Básicos de Estatística II
 
Função Afim e Linear.ppt
Função Afim e Linear.pptFunção Afim e Linear.ppt
Função Afim e Linear.ppt
 
07 tópico 6 - autocorrelação
07   tópico 6 - autocorrelação07   tópico 6 - autocorrelação
07 tópico 6 - autocorrelação
 

Similaire à 12 correlação e regressão

Modelo de regressão linear: aspectos teóricos e computacionais
Modelo de regressão linear: aspectos teóricos e computacionais Modelo de regressão linear: aspectos teóricos e computacionais
Modelo de regressão linear: aspectos teóricos e computacionais
Rodrigo Rodrigues
 
Razão e proporção1
Razão e proporção1Razão e proporção1
Razão e proporção1
Luccy Crystal
 
O TriâNgulo RetâNgulo E Suas RelaçõEs MéTricas
O TriâNgulo RetâNgulo E Suas RelaçõEs MéTricasO TriâNgulo RetâNgulo E Suas RelaçõEs MéTricas
O TriâNgulo RetâNgulo E Suas RelaçõEs MéTricas
Tiburcindio
 
Apostila de metodos_quantitativos_-_prof._joao_furtado
Apostila de metodos_quantitativos_-_prof._joao_furtadoApostila de metodos_quantitativos_-_prof._joao_furtado
Apostila de metodos_quantitativos_-_prof._joao_furtado
Wannessa Souza
 
Cap9 - Parte 5 - Teste De Coeficientes
Cap9 - Parte 5 - Teste De CoeficientesCap9 - Parte 5 - Teste De Coeficientes
Cap9 - Parte 5 - Teste De Coeficientes
Regis Andrade
 
Testes hp
Testes hpTestes hp
Testes hp
Carlos
 

Similaire à 12 correlação e regressão (20)

Modelo de regressão linear: aspectos teóricos e computacionais
Modelo de regressão linear: aspectos teóricos e computacionais Modelo de regressão linear: aspectos teóricos e computacionais
Modelo de regressão linear: aspectos teóricos e computacionais
 
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
 
Razão e proporção1
Razão e proporção1Razão e proporção1
Razão e proporção1
 
O TriâNgulo RetâNgulo E Suas RelaçõEs MéTricas
O TriâNgulo RetâNgulo E Suas RelaçõEs MéTricasO TriâNgulo RetâNgulo E Suas RelaçõEs MéTricas
O TriâNgulo RetâNgulo E Suas RelaçõEs MéTricas
 
Cap 2 - MRLS.ppt
Cap 2 - MRLS.pptCap 2 - MRLS.ppt
Cap 2 - MRLS.ppt
 
Apostila de metodos_quantitativos_-_prof._joao_furtado
Apostila de metodos_quantitativos_-_prof._joao_furtadoApostila de metodos_quantitativos_-_prof._joao_furtado
Apostila de metodos_quantitativos_-_prof._joao_furtado
 
Exercicios de estatistica resolvido.4
Exercicios de estatistica resolvido.4Exercicios de estatistica resolvido.4
Exercicios de estatistica resolvido.4
 
Apostila física exp ii
Apostila física exp iiApostila física exp ii
Apostila física exp ii
 
Regressao
RegressaoRegressao
Regressao
 
Tópico 3 testes de hípoteses - 1 amostra
Tópico 3   testes de hípoteses - 1 amostraTópico 3   testes de hípoteses - 1 amostra
Tópico 3 testes de hípoteses - 1 amostra
 
Cap9 - Parte 5 - Teste De Coeficientes
Cap9 - Parte 5 - Teste De CoeficientesCap9 - Parte 5 - Teste De Coeficientes
Cap9 - Parte 5 - Teste De Coeficientes
 
Capitulo 8 gujarati resumo
Capitulo 8 gujarati resumoCapitulo 8 gujarati resumo
Capitulo 8 gujarati resumo
 
Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...
Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...
Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...
 
Testes de hipoteses
Testes de hipotesesTestes de hipoteses
Testes de hipoteses
 
Reproducao sp-matematica-1-unidade-2-capitulo-4
Reproducao sp-matematica-1-unidade-2-capitulo-4Reproducao sp-matematica-1-unidade-2-capitulo-4
Reproducao sp-matematica-1-unidade-2-capitulo-4
 
Teorema do Valor Médio
Teorema do Valor MédioTeorema do Valor Médio
Teorema do Valor Médio
 
Unidade 5 - estastitica
Unidade 5 - estastiticaUnidade 5 - estastitica
Unidade 5 - estastitica
 
Aula6-TestesdeHipoteses2 (1).pptx
Aula6-TestesdeHipoteses2 (1).pptxAula6-TestesdeHipoteses2 (1).pptx
Aula6-TestesdeHipoteses2 (1).pptx
 
Testes hp
Testes hpTestes hp
Testes hp
 
Tópico 4 regressão linear simples 02
Tópico 4   regressão linear simples 02Tópico 4   regressão linear simples 02
Tópico 4 regressão linear simples 02
 

Plus de Fernando Lucas (20)

Termoquímica
TermoquímicaTermoquímica
Termoquímica
 
Forca e movimento_-_prof._wagner_roberto_batista
Forca e movimento_-_prof._wagner_roberto_batistaForca e movimento_-_prof._wagner_roberto_batista
Forca e movimento_-_prof._wagner_roberto_batista
 
Momento linear e impulso
Momento linear e impulsoMomento linear e impulso
Momento linear e impulso
 
Aula4 introbusto
Aula4 introbustoAula4 introbusto
Aula4 introbusto
 
Teoria ácido base
Teoria ácido baseTeoria ácido base
Teoria ácido base
 
A equação de bernoulli
A equação de bernoulliA equação de bernoulli
A equação de bernoulli
 
As regras da cadeia
As regras da cadeiaAs regras da cadeia
As regras da cadeia
 
Hipérbole
HipérboleHipérbole
Hipérbole
 
Elipse
ElipseElipse
Elipse
 
Parábola
ParábolaParábola
Parábola
 
Movimento em 1_dimensao_-_prof_romero_tavares
Movimento em 1_dimensao_-_prof_romero_tavaresMovimento em 1_dimensao_-_prof_romero_tavares
Movimento em 1_dimensao_-_prof_romero_tavares
 
Eletro relat - brett
Eletro relat - brettEletro relat - brett
Eletro relat - brett
 
A equação de bernoulli
A equação de bernoulliA equação de bernoulli
A equação de bernoulli
 
Polimeros
PolimerosPolimeros
Polimeros
 
Petroleo3
Petroleo3Petroleo3
Petroleo3
 
Petroleo2
Petroleo2Petroleo2
Petroleo2
 
Petroleo
PetroleoPetroleo
Petroleo
 
Organica completa
Organica completaOrganica completa
Organica completa
 
Nitrilas acidos sulfonicos
Nitrilas acidos sulfonicosNitrilas acidos sulfonicos
Nitrilas acidos sulfonicos
 
Lipidios
LipidiosLipidios
Lipidios
 

12 correlação e regressão

  • 1. Correlação e Regressão Linear Mede o grau de dependência entre duas variáveis X e Y Cov(X,Y)=E Cov(X,Y)= - . = Se X e Y são independentes, então cov(X,Y) = 0. Coeficiente de correlação linear de Pearson: = e = →
  • 2. Exemplo: Calcular o coeficiente r para os dados: Pessoa Altura (cm) Peso (kg) 1 174 73 2 161 66 3 170 64 4 180 94 5 182 79 6 164 72 7 156 62 8 168 64 9 176 90 10 175 81
  • 3. Testes do Coeficiente de Correlação : = : ≠ Este teste pode ser feito através da estatística : = , Exemplo: Verificar, ao nível de 5% de significância, se existe a correlação positiva entre a altura e o peso das pessoas na população do exemplo anterior.
  • 4. Para testar valor não nulo de : Fisher sugere a transformação : £= Esta transformação faz com que os valores de £ tenham distribuição bastante próxima da normal com média: μ(£)= e σ(£)= Exemplo: Considerando o exemplo anterior, construir um intervalo de 95% de confiança para o coeficiente de correlação populacional entre a altura e o peso das pessoas consideradas.
  • 5. Regressão Linear Simples A linha teórica de regressão: . Os parâmetros e serão estimados através dos pontos experimentais fornecidos pela amostra, obtendo-se uma reta estimativa na forma: = a + bx onde a é a estimativa do parâmetro e b, também conhecido como coeficiente de regressão linear, é a estimativa do parâmetro . O símbolo é utilizado para uma conveniente distinção dos valores dados pela reta estimativa, em relação às ordenadas dos pontos amostrais
  • 6. Método de mínimos quadrados Os valores a e b que minimizam esta expressão serão aqueles que anulam suas derivadas parciais =0 e =0 → → →
  • 7. Algumas vezes é interessante fazer codificações lineares nos valores das variáveis para simplificar os cálculos. Por exemplo, se fizermos as transformações e . Obteremos a reta na forma → → Exemplo Obter a equação da reta de mínimos quadrados para os seguintes pontos experimentais: X 1 2 3 4 5 6 7 8 Y 0,5 0,6 0,9 0,8 1,2 1,5 1,7 2,0 Calcular o coeficiente de correlação linear. Reta passando pela origem O modelo é da forma: A reta estimativa será
  • 8. → → → → Exemplo : Se considerássemos que a reta de regressão devesse passar pela origem no exemplo anterior, o coeficiente seria: Funções linearizáveis Exemplo: Teste de β H0 : or H1 : or , or , or Pode-se demonstrar que: e , Variância Residual
  • 9. Como não conhecemos , usamos , → Teste de uma média populacional com variância desconhecida → usa-se a estatística p/ → O mesmo vale para e → e o teste do fica: p/ →
  • 10. Exemplo do teste de β Verificar se podemos afirmar, ao nível de 5% de significância, que a reta teórica do exemplo anterior tem uma inclinação superior a 10%. Caso afirmativo, construir um intervalo de confiança de 95% para o coeficiente angular da reta real da regressão. Ainda, ao nível de 5% de significância, verificar se podemos eliminar a possibilidade de a reta teórica passar pela origem. I.C. para e Exemplo: Construir Intervalos de 95% de confiança para o valor médio de y e para a previsão , quando , para exemplo anterior.
  • 11. Regressão Polinomial Exemplo Ajustar a parábola de mínimos quadrados aos dados do exemplo anterior. Regressão Linear Multipla Exemplo Uma reação química foi realizada sob seis pares de condições de pressão e temperatura. Em cada caso, foi medido o tempo necessário para que a reação se completasse. Os resultados obtidos foram: Condição Temp. Press. tempo 1 20 1,5 9,4 2 30 1,5 8,2 3 30 1,2 9,7 4 40 1,0 9,5
  • 12. 5 60 1,0 6,9 6 80 0,8 6,5 Obter a equação da regressão linear do tempo em função da Temp. e Pressão. Correlação Linear Multipla Coeficiente de Correlação Linear Multipla é definida como: A Variância residual : É n-k-1 pois foram estimados k+1 variáveis. Exemplo Calcular o coeficiente de correlação linear múltipla de y em relação a e no exemplo anterior. Calcular também a variância residual em torno da regressão. Correlação Parcial
  • 13. Diferença entre manter constante ou ignorar . ignora enquanto definida como coeficiente de correlação parcial entre e com respeito a Exemplo Analisar as correlações totais e parciais no exemplo anterior. Problema 1)Oito alunos sorteados entre os da segunda série de um curso de engenharia obtiveram as seguintes notas nos exames de Cálculo e Física Aluno 1 2 3 4 5 6 7 8 Cálc 4,5 6,0 3,0 2,5 5,0 5,5 1,5 7,0 Fis. 3,5 4,5 3,0 2,0 5,5 5,0 1,5 6,0
  • 14. Com base nestes dados, pode-se ter praticamente 99% de certeza de que os alunos mais bem preparados em Cálculo também o sejam em Física? 2) Dados os valores a seguir de t (horas de tratamento térmico) e de R (resistência à tração de um aço em kg/mm2), a)pode-se afirmar, ao nível de 2% de significância, que R depende de t? b)Admitida uma dependência linear, qual seria a equação da reta de regressão de R em função de t? c)Construir intervalos de 90% de confiança para o valor médio de R e para a previsão R’, quando t=9. 3)Um banco possui oito agências em certa praça. Desejando verificar a afirmação de que um maior número de funcionários leva a uma ineficiência maior no serviço, o gerente geral relacionou o número de funcionários por agencia (x) e a
  • 15. classificação das agências segundo sua eficiência dentre todas as agências do banco (y). Ao nível de 5% de significância, qual a conclusão? x 9 15 12 12 13 20 22 17 y 8 13 6 22 15 36 29 31 4)Numa determinada experiência, foram obtidos os seguintes pares de valores (x,y): a)escreva a equação da melhor reta de regressão de y em relação a x. b)verifique, ao nível de 5% de significância, se existe evidência suficiente a partir dos dados experimentais para contradizer a hipótese de que a reta de (a) é paralela à reta y = 1,5 – 0,45x.