Este documento discute o relaxamento das hipóteses da regressão linear clássica, especificamente multicolinearidade, heterocedasticidade e autocorrelação. O autor analisa cada uma dessas violações das hipóteses e apresenta métodos para detectá-las e corrigi-las.
1. Análise de
Regressão:
Relaxando as
hipóteses
Rodrigo de
Análise de Regressão:
Sá
Relaxando as hipóteses
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício Rodrigo de Sá
Fundação de Economia e Estatística, 2011
2. Livro texto
Análise de
Regressão:
Relaxando as
hipóteses
Rodrigo de
Sá
Multicolin.
Heterocedast. Damodar Gujarati
Autocorrel. Econometria Básica
Dummies
3ª ed. 2005.
Exercício
3. Multicolinearidade
Análise de
Regressão:
Relaxando as
hipóteses
Uma das hipóteses do modelo clássico de regressão linear é
Rodrigo de
Sá
a ausência de multicolinearidade entre as variáveis
Multicolin.
explicativas.
Heterocedast.
Autocorrel.
Dummies
Exercício
4. Multicolinearidade
Análise de
Regressão:
Relaxando as
hipóteses
Uma das hipóteses do modelo clássico de regressão linear é
Rodrigo de
Sá
a ausência de multicolinearidade entre as variáveis
Multicolin.
explicativas.
X1 = a + bX2 .
Heterocedast.
Autocorrel.
Multicolinearidade perfeita:
Dummies Variáveis correlacionadas, mas não perfeitamente:
Exercício
X1 = a + bX2 + u .
5. Multicolinearidade
Análise de
Regressão:
Relaxando as
hipóteses
Uma das hipóteses do modelo clássico de regressão linear é
Rodrigo de
Sá
a ausência de multicolinearidade entre as variáveis
Multicolin.
explicativas.
X1 = a + bX2 .
Heterocedast.
Autocorrel.
Multicolinearidade perfeita:
Dummies Variáveis correlacionadas, mas não perfeitamente:
Exercício
X1 = a + bX2 + u .
Consequências da multicolinearidade perfeita:
O valor dos coecientes da regressão é indeterminado;
A variância desses estimadores é innita.
6. Multicolinearidade
Análise de
Regressão:
Relaxando as
hipóteses
Rodrigo de
Sá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Figura: Multicolinearidade Diagramas de Venn
7. Possíveis fontes de multicolinearidade
Análise de
Regressão:
Relaxando as
hipóteses
Método de coleta de dados: uma amostra que cubra uma
Rodrigo de
Sá pequena parte dos valores possíveis de X.
Restrições presentes no modelo ou na população: se as
Multicolin.
Heterocedast.
variáveis explicativas forem renda e consumo de energia
Autocorrel. elétrica, na amostra elas serão altamente correlacionadas
Dummies por que pessoas com maior renda em geral consomem uma
Exercício quantidade maior de energia elétrica.
Especicação do modelo: regressão polinomial quando o
intervalo a que pertence o X é pequeno.
Em séries temporais, tendência comum: todas as variáveis
explicativas crescem ou decrescem com o passar do tempo.
8. Estimação na presença de multicolinearidade perfeita
Análise de
Regressão:
Relaxando as
hipóteses
Rodrigo de
Seja um modelo de regressão linear com duas variáveis
Sá
explicativas.
Multicolin.
β1 mede em quantas unidades a esperança condicional de
Heterocedast.
Y muda em função da variação de uma unidade em X1 ,
Autocorrel.
mantendo constante X2 .
X1 e X2 são perfeitamente correlacionados,
Dummies
Mas se
X2 = λX1 , então NÃO É POSSÍVEL que X1 aumente em
Exercício
uma unidade e X2 se mantenha constante - X2 variará λ.
Isto é, não se tem como se separar os efeitos de X1 e X2
sobre o Y .
9. Consequências práticas da multicolinearidade
Análise de
Regressão:
Relaxando as
hipóteses
Rodrigo de
Sá
Os estimadores de MQO continuam sendo MELNV.
Multicolin.
Apesar disso, apresentam variância e covariância altas,
Heterocedast.
dicultando estimações precisas.
Autocorrel.
Dummies
Fator de inação da variância
Exercício
1
=
− r12
FIV
1
2
10. Fator de inação da variância
Análise de
Regressão:
Relaxando as
hipóteses
Rodrigo de
Sá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Figura: Efeito do crescimento da correlação sobre a variância
11. Consequências práticas da multicolinearidade
Análise de
Regressão:
Relaxando as
hipóteses
Rodrigo de
Sá
Os intervalos de conança tendem a ser maiores, levando à
Multicolin. aceitação da hipótese nula zero mais facilmente.
Heterocedast.
Autocorrel.
A estatística t de um ou mais estimadores tende a ser
insignicativa.
t baixas, o R 2 tende a ser alto.
Dummies
Exercício
Apesar das estatísticas
Os estimadores de MQO e suas variâncias tendem a car
mais sensível a mudanças na amostra.
12. Detecção da multicolinearidade
Análise de
Regressão:
Relaxando as
hipóteses
Rodrigo de
Sá
Multicolin.
Heterocedast.
R 2 alto mas poucas estatísticas t signicativas.
Autocorrel.
Correlação entre pares de regressores alta. (Condição
Dummies suciente mas não necessária, exceto no caso de apenas
Exercício dois regressores.)
13. Detecção da multicolinearidade
Análise de
Regressão:
Relaxando as
hipóteses
Regressões auxiliares.
Rodrigo de
Sá
Regressões auxiliares
Multicolin.
Regride-se cada uma das variáveis explicativas Xi contra as
Heterocedast.
demais, Xj , j = i , e computa-se o Ri2 da regressão (Por
exemplo, para i = 2,
Autocorrel.
X2 = a0 + a1 X1 + a2 X2 + a3 X3 + ...ak Xk + u
Dummies
Exercício
Usa-se o seguinte teste F com a hipótese nula que a variável
explicativa i não é correlacionada com as demais.
Fi = Ri2 / (k − 2)
1 − Ri / (n − k + 1)
2
14. Algumas medidas corretivas
Análise de
Regressão:
Relaxando as
hipóteses Informação a priori. Por exemplo, suponha que saibamos
Rodrigo de que β1 = λβ2 ; então utilizamos essa informação para
Sá
reescrever a regressão.
Multicolin.
Eliminação de uma ou mais variáveis. Por exemplo, excluir
Heterocedast.
a variável riqueza da regressão consumo-renda-riqueza.
Autocorrel.
Deve-se tomar cuidado para não se incorrer em viés de
Dummies
especicação.
Exercício
Transformação das variáveis. Em séries temporais, utilizar
a primeira diferença das variáveis.
Aumento da amostra.
Reduzir a colinearidade em regressões polinomiais,
expressando as variáveis na forma de desvio.
15. Heterocedasticidade
Análise de
Regressão:
Relaxando as
hipóteses
Rodrigo de
Sá
Multicolin. A homoscedasticidade é uma das hipóteses do modelo
Heterocedast.
clássico de regressão linear.
Autocorrel.
Dummies
Exercício
16. Heterocedasticidade
Análise de
Regressão:
Relaxando as
hipóteses
Rodrigo de
Sá
Multicolin. A homoscedasticidade é uma das hipóteses do modelo
Heterocedast.
clássico de regressão linear.
Autocorrel.
Dummies
Homoscedasticidade: E ui2 = σ2 para todo i = 1, 2, ..., n.
Exercício
Heterocedasticidade: E ui2 = σi2 .
17. Homoscedasticidade e heterocedasticidade
Análise de
Regressão:
Relaxando as
hipóteses
Rodrigo de
Sá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Figura: Comparação
18. Possíveis causas da heterocedasticidade
Análise de
Regressão:
Relaxando as
hipóteses
Rodrigo de
Modelos de aprendizagem e erro. À medida que as pessoas
Sá
aprendem, diminuem seus erros, assim como a sua
Multicolin.
variabilidade.
Heterocedast.
À medida que a renda aumenta, as pessoas têm maior
Autocorrel.
renda discricionária e, consequentemente, maior liberdade
Dummies
Exercício
para decidir como dispor sua renda, fazendo com que σi2
seja positivamente correlacionado com a renda.
Erro de especicação.
Observações aberrantes (outliers).
19. Observações aberrantes
Análise de
Regressão:
Relaxando as
hipóteses
Rodrigo de
Sá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Figura: Relação entre preço das ações e preços ao consumidor
20. Consequências da heterocedasticidade
Análise de
Regressão:
Relaxando as
hipóteses
Rodrigo de
Sá O estimadores dos β 's continuam sendo não viesados.
Multicolin. Porém, a fórmula da variância do estimador da inclinação é
Heterocedast. diferente, var ˆ
β1 = xi2 σi2 / xi2 2
.
Autocorrel.
Os estimadores de MQO deixam de ser ecientes, isto é,
Dummies
existe outro estimador não viesado com menor variância: o
Exercício
Método dos Mínimos Quadrados Generalizados (MQG).
Assim, os testes de hipótese tendem a aceitar a hipótese
nula zero mas facilmente.
21. Método dos Mínimos Quadrados Generalizados
(MQG)
Análise de
Regressão: MQG
Relaxando as
hipóteses
Supondo que as variâncias σi2 sejam CONHECIDAS, pondera-se
Rodrigo de cada observação inversamente ao seu desvio-padrão, chegando
Sá
a uma regressão do tipo MQO.
Multicolin.
Heterocedast.
Autocorrel.
Yi = β0 + β1 Xi + ui
Dummies
Yi = β0
1
+ β1
Xi +
ui
Exercício
σi σi σi σi
Yi∗
= β0 X0i + β1 Xi + ui∗
∗ ∗ ∗ ∗
u∗
Pode-se mostrar que var ( i ) = 1, ou seja, os resíduos
tornam-se homocedásticos com esta transformação. Note que a
regressão a ser estimada tem uma variável explicativa adicional
(1/σi ) e não tem intercepto.
22. MQG - exemplo
Análise de
Regressão:
Relaxando as
hipóteses
Rodrigo de
Sá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Figura: Ilustração de MQG
23. Métodos informais de detecção
Análise de
Regressão:
Relaxando as
hipóteses
Rodrigo de
Sá
Natureza do problema. Novamente, o exemplo
consumo-renda.
Multicolin.
Métodos grácos. Os resíduos da regressão original
Heterocedast.
Autocorrel.
apresentam algum padrão?
Dummies Alguns métodos formais:
Teste de Park;
Exercício
Teste de Glejser;
Teste de Goldfeld-Quandt;
Teste de Breusch-Pagan-Godfrey.
24. Métodos grácos
Análise de
Regressão:
Relaxando as
hipóteses
Rodrigo de
Sá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Figura: Padrões hipotéticos dos resíduos ao quadrado estimados
25. Teste geral de heterocedasticidade de White
Análise de
Regressão:
Relaxando as
hipóteses
Teste de White
Rodrigo de
Sá
Com os resíduos da regressão estimada rodamos a seguinte
Multicolin. regressão auxiliar:
Heterocedast.
Autocorrel.
Dummies ui2 = α1 + α2 X2i + α3 X3i + α4 X2i + α5 X3i + α6 X2i X3i + vi
ˆ 2 2
Exercício
A variável nR 2 ∼ χ2 , com gl
gl igual ao número de regressores na
regressão auxiliar.
Se o teste exceder o valor crítico, a conclusão é de que há
heterocedasticidade.
26. Medidas quando σi2 não é conhecida
Análise de
Regressão:
Relaxando as
hipóteses
Variâncias e erros padrão consistentes em
Rodrigo de
Sá heterocedasticidade segundo White.
Multicolin.
Hipóteses plausíveis a respeito do padrão de
Heterocedast. heteroscedasticidade:
Autocorrel.
Dummies
E ui2 = σ 2 Xi2 =⇒ modelo /Xi
E ui2 σ 2 Xi =⇒ modelo / Xi
Exercício
=
E ui2 = σ 2 [E (Yi )]2 =⇒ modelo /Yi
ˆ
Estimar o modelo com as variáveis em escala logaritma.
27. E ui2 = σ 2 Xi2
Análise de
Regressão:
Relaxando as
hipóteses
Rodrigo de
Sá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Figura: Variância proporcional a X2
i
28. E ui2 = σ 2 Xi
Análise de
Regressão:
Relaxando as
hipóteses
Rodrigo de
Sá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Figura: Variância proporcional a X
i
29. Autocorrelação
Análise de
Regressão:
Relaxando as
hipóteses
Rodrigo de
Sá
Multicolin. A ausência de AUTOCORRELAÇÃO entre os resíduos é
Heterocedast.
uma das hipóteses do modelo clássico de regressão.
Autocorrel.
É usual o termo CORRELAÇÃO SERIAL para designar a
Dummies
autocorrelação entre os resíduos em um modelo de séries
Exercício
de tempo.
30. Padrões de autocorrelação
Análise de
Regressão:
Relaxando as
hipóteses
Rodrigo de
Sá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Figura: Padrões de autocorrelação
31. Possíveis causas da autocorrelação
Análise de
Regressão:
Relaxando as
hipóteses
Inércia ou rigidez das séries temporais.
Rodrigo de
Sá
Viés de especicação:
Multicolin.
Exclusão de variável;
Heterocedast. Forma funcional incorreta.
Autocorrel.
Fenômeno da teia de aranha. Exemplo clássico da oferta
Dummies
de produtos agrícolas, onde a decisão da área plantada
Exercício
(oferta) depende do preço do ano anterior.
Defasagens. Um exemplo é a suavização do consumo, onde
o consumo atual depende do passado.
Manipulação de dados, como interpolação ou extrapolação.
32. Estimativa por MQO desconsiderando a
autocorrelação
Análise de
Regressão:
Relaxando as
hipóteses
Rodrigo de
Sá Os estimadores dos βs continuam não viesados e
Multicolin.
consistentes, mas deixam de ser ecientes (variância
Heterocedast.
mínima).
Autocorrel. A variância dos resíduos σ2
ˆ provavelmente irá superestimar
Dummies 2
o verdadeiro σ .
Exercício
Provavelmente o R 2 será superestimado.
Os testes de signicância usuais tendem a levar a
conclusões errôneas.
33. Método gráco para detecção
Análise de
Regressão:
Relaxando as
hipóteses
Rodrigo de
Sá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Figura: Resíduos com autocorrelação
34. Teste d de Durbin-Watson
Análise de
Regressão:
Relaxando as
d
hipóteses
Rodrigo de
Estatística
t =n
u u 2
Sá
t =2 (ˆt − ˆt −1 )
d=
Multicolin.
Heterocedast.
u
t =n 2
t =2 ˆt
Autocorrel.
Dummies
Exercício
35. Teste d de Durbin-Watson
Análise de
Regressão:
Relaxando as
d
hipóteses
Rodrigo de
Estatística
t =n
u u 2
Sá
t =2 (ˆt − ˆt −1 )
d=
Multicolin.
Heterocedast.
t =n 2
u
t =2 ˆt
Autocorrel.
Dummies Hipóteses fundamentais:
Exercício
A regressão inclui o intercepto.
As perturbações u são geradas pelo esquema
t
auto-regressivo de primeira ordem, u = ρu −1 + .
t t t
O modelo de regressão não inclui termos defasados da
variável dependente (Y −1 ).
t
36. Teste d de Durbin-Watson
Análise de
Regressão:
Relaxando as
hipóteses
Rodrigo de
Sá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Figura: Estatística d
37. Teste d de Durbin-Watson
Análise de
Regressão:
Relaxando as
hipóteses
Rodrigo de
Sá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Figura: Regras de decisão
38. Método de Cochrane-Orcutt em duas etapas
Análise de
Regressão:
Relaxando as
hipóteses
Rodrigo de Cochrane-Orcutt
Sá
Seja a regressão Yt = β0 + β1 Xt + ut , onde se supõe que os
Multicolin.
resíduos seguem ut = ρut −1 + t .
Heterocedast.
Autocorrel.
Dummies
Exercício
39. Método de Cochrane-Orcutt em duas etapas
Análise de
Regressão:
Relaxando as
hipóteses
Rodrigo de Cochrane-Orcutt
Sá
Seja a regressão Yt = β0 + β1 Xt + ut , onde se supõe que os
Multicolin.
resíduos seguem ut = ρut −1 + t .
Heterocedast.
Autocorrel.
Estime a regressão pela rotina usual do MQO e obtenha os
ut .
Dummies
Exercício
resíduos ˆ
Usando os resíduos estimados, rode ut = ρut −1 + vt .
ˆ ˆˆ
Usando o ρ estimado,
ˆ estime
(Yt − ρYt −1 ) = [β0 (1 − ρ)] + β1 [Xt − ρXt −1 ] + [ut − ρut −1 ] .
ˆ ˆ ˆ ˆ
40. Exemplo - salários
Análise de Seja o seguinte modelo
Regressão:
Y = α1 + α2 D + β X + u ,
Relaxando as
hipóteses i i i i
Rodrigo de onde Y i é o salário de um professor(a) universitário(a), X i são os anos de
Sá
experiência de ensino e D i é uma variável qualitativa tal que
Multicolin.
Heterocedast.
D i = 1 se homem
Autocorrel.
= 0 se mulher.
Dummies
Exercício Assim, o salário médio de um professor(a) será
E ( Y |X , D
i i i = 0) = α1 + β X i
E ( Y |X , D
i i i = 1) = (α1 + α2 ) + β X . i
Este modelo postula que as inclinações da função salário de homens e
mulheres são iguais, mas que o seu intercepto é diferente (o intercepto do
grupo masculino é maior do que o feminino se α2 0, e o oposto caso
α2 0).
41. Possíveis representações
Análise de
Regressão:
Relaxando as
hipóteses
Rodrigo de
Sá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Figura: Regressões plausíveis
42. Possíveis representações
Análise de
Regressão:
Relaxando as
Regressões coincidentes: nenhuma dummy.
hipóteses
Rodrigo de Regressões paralelas: mesma inclinação e interceptos
Sá
diferentes.
Multicolin.
Heterocedast.
Yi = α1 + α2 Di + β Xi + ui
Autocorrel.
Regressões convergentes: mesmo intercepto e inclinações
Dummies
diferentes.
Exercício
Yi = α + β1 Xi + β2 Xi Di + ui
Regressões dissimilares: interceptos e inclinações
diferentes.
Yi = α1 + α2 Di + β1 Xi + β2 Xi Di + ui
43. Exercício
Análise de
Regressão:
Escolhe um modelo econômico que possa ser estimado por
Relaxando as MQO e estime-o. O modelo deve ter duas ou mais variáveis
hipóteses
explicativas.
Rodrigo de
Sá Teste o modelo quanto a presença de multicolinearidade,
heterocedasticidade e autocorrelação, corrigindo-o se necessário.
Multicolin.
Faça um relatório que contemple os seguintes pontos:
Heterocedast.
Explique o modelo econômico.
Descreva as variáveis.
Autocorrel.
Mostre os resultados da estimação (coecientes, testes de
Dummies
Exercício
signicância, teste F, R 2 , gráco da estimação, etc.)
Mostre os testes das hipóteses do modelo
(multicolinearidade, heterocedasticidade e autocorrelação)
e as correções, caso feitas.
Interprete os resultados economicamente. Os resultados
diferiram dos resultados esperados antes da estimação do
modelo?
Data da entrega: até dia 2 de dezembro.