1. Correlação e Regressão Linear
Mede o grau de dependência entre duas
variáveis X e Y
Cov(X,Y)=E
Cov(X,Y)= - . =
Se X e Y são independentes, então
cov(X,Y) = 0.
Coeficiente de correlação linear de
Pearson:
= e = →
3. Testes do Coeficiente de Correlação
: =
: ≠
Este teste pode ser feito através da
estatística :
= ,
Exemplo:
Verificar, ao nível de 5% de significância,
se existe a correlação positiva entre a
altura e o peso das pessoas na população
do exemplo anterior.
4. Para testar valor não nulo de :
Fisher sugere a transformação :
£= Esta transformação faz com que
os valores de £ tenham distribuição
bastante próxima da normal com média:
μ(£)= e σ(£)=
Exemplo:
Considerando o exemplo anterior, construir
um intervalo de 95% de confiança para o
coeficiente de correlação populacional
entre a altura e o peso das pessoas
consideradas.
5. Regressão Linear Simples
A linha teórica de regressão:
.
Os parâmetros e serão estimados
através dos pontos experimentais
fornecidos pela amostra, obtendo-se uma
reta estimativa na forma:
= a + bx onde a é a estimativa do
parâmetro e b, também conhecido como
coeficiente de regressão linear, é a
estimativa do parâmetro . O símbolo é
utilizado para uma conveniente distinção
dos valores dados pela reta estimativa, em
relação às ordenadas dos pontos amostrais
6. Método de mínimos quadrados
Os valores a e b que minimizam esta
expressão serão aqueles que anulam suas
derivadas parciais
=0 e =0 →
→
→
7. Algumas vezes é interessante fazer
codificações lineares nos valores das
variáveis para simplificar os cálculos. Por
exemplo, se fizermos as transformações
e . Obteremos a
reta na forma
→
→
Exemplo
Obter a equação da reta de mínimos quadrados
para os seguintes pontos experimentais:
X 1 2 3 4 5 6 7 8
Y 0,5 0,6 0,9 0,8 1,2 1,5 1,7 2,0
Calcular o coeficiente de correlação linear.
Reta passando pela origem
O modelo é da forma:
A reta estimativa será
8. → →
→
→ →
Exemplo :
Se considerássemos que a reta de
regressão devesse passar pela origem no
exemplo anterior, o coeficiente seria:
Funções linearizáveis
Exemplo:
Teste de β
H0 : or
H1 : or , or , or
Pode-se demonstrar que:
e , Variância
Residual
9. Como não conhecemos , usamos
,
→ Teste de uma média
populacional com variância desconhecida
→ usa-se a estatística
p/ →
O mesmo vale para
e →
e o teste do fica:
p/ →
10. Exemplo do teste de β
Verificar se podemos afirmar, ao nível de
5% de significância, que a reta teórica do
exemplo anterior tem uma inclinação
superior a 10%. Caso afirmativo, construir
um intervalo de confiança de 95% para o
coeficiente angular da reta real da
regressão. Ainda, ao nível de 5% de
significância, verificar se podemos eliminar
a possibilidade de a reta teórica passar
pela origem.
I.C. para e
Exemplo:
Construir Intervalos de 95% de confiança
para o valor médio de y e para a previsão
, quando , para exemplo anterior.
11. Regressão Polinomial
Exemplo
Ajustar a parábola de mínimos quadrados
aos dados do exemplo anterior.
Regressão Linear Multipla
Exemplo
Uma reação química foi realizada sob seis
pares de condições de pressão e
temperatura. Em cada caso, foi medido o
tempo necessário para que a reação se
completasse. Os resultados obtidos foram:
Condição Temp. Press. tempo
1 20 1,5 9,4
2 30 1,5 8,2
3 30 1,2 9,7
4 40 1,0 9,5
12. 5 60 1,0 6,9
6 80 0,8 6,5
Obter a equação da regressão linear do
tempo em função da Temp. e Pressão.
Correlação Linear Multipla
Coeficiente de Correlação Linear Multipla é
definida como:
A Variância residual :
É n-k-1 pois foram estimados k+1 variáveis.
Exemplo
Calcular o coeficiente de correlação linear
múltipla de y em relação a e no
exemplo anterior. Calcular também a
variância residual em torno da regressão.
Correlação Parcial
13. Diferença entre manter constante ou
ignorar .
ignora enquanto definida como
coeficiente de correlação parcial entre e
com respeito a
Exemplo
Analisar as correlações totais e parciais no
exemplo anterior.
Problema
1)Oito alunos sorteados entre os da
segunda série de um curso de engenharia
obtiveram as seguintes notas nos exames
de Cálculo e Física
Aluno 1 2 3 4 5 6 7 8
Cálc 4,5 6,0 3,0 2,5 5,0 5,5 1,5 7,0
Fis. 3,5 4,5 3,0 2,0 5,5 5,0 1,5 6,0
14. Com base nestes dados, pode-se ter
praticamente 99% de certeza de que os
alunos mais bem preparados em Cálculo
também o sejam em Física?
2) Dados os valores a seguir de t (horas de
tratamento térmico) e de R (resistência à
tração de um aço em kg/mm2), a)pode-se
afirmar, ao nível de 2% de significância,
que R depende de t? b)Admitida uma
dependência linear, qual seria a equação
da reta de regressão de R em função de t?
c)Construir intervalos de 90% de confiança
para o valor médio de R e para a previsão
R’, quando t=9.
3)Um banco possui oito agências em certa
praça. Desejando verificar a afirmação de
que um maior número de funcionários leva
a uma ineficiência maior no serviço, o
gerente geral relacionou o número de
funcionários por agencia (x) e a
15. classificação das agências segundo sua
eficiência dentre todas as agências do
banco (y). Ao nível de 5% de significância,
qual a conclusão?
x 9 15 12 12 13 20 22 17
y 8 13 6 22 15 36 29 31
4)Numa determinada experiência, foram
obtidos os seguintes pares de valores (x,y):
a)escreva a equação da melhor reta de
regressão de y em relação a x.
b)verifique, ao nível de 5% de significância,
se existe evidência suficiente a partir dos
dados experimentais para contradizer a
hipótese de que a reta de (a) é paralela à
reta y = 1,5 – 0,45x.