SlideShare une entreprise Scribd logo
1  sur  32
 
Introdução A finalidade de uma equação de regressão seria então estimar valores de uma variável, com base em valores conhecidos da outra; Um economista pode tentar explicar as variações na procura de automóveis usados em termos de desemprego; Um agricultor pode suspeitar que a quantidade de fertilizante por ele  usada tenha influenciado a safra; Dentro desse contexto, o objetivo desta monografia foi demonstrar as técnicas de análise de regressão dentro de uma abordagem teórica e computacional, utilizando o software estatístico R.
Modelo Matemático ,[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],Modelo Estatístico
Se apenas uma variável explicativa é observada, temos: Os erros também podem ser devido a erros obtidos no processo de  Mensuração da variável dependente.  Modelo Estatístico Assim, o modelo ficaria:
[object Object],[object Object],[object Object],Regressão Linear Simples Modelo de Regressão Linear Simples
X Y    Coeficiente angular Regressão Linear Simples Inclinação populacional Intercepto populacional Erro Aleatório Variável  Independente Variável  Dependente
Ao estabelecer o modelo de regressão linear simples, pressupomos que: A relação entre  X  e  Y  é Linear; Os valores de X são fixos, isto é, X não é uma variável aleatória; A média dos erros é nula, isto é: Para um dado valor x de X, a variância dos erros  é sempre denotada variância residual, dizemos que o erro é  homocedástico;   O erro em uma observação é não correlacionado com o erro em qualquer  outra observação; Os erros têm distribuição normal. Suposições do modelo
Os estimadores de  e  Uma vez que o modelo foi especificado e as suposições foram feitas, devemos estimar os parâmetros da regressão,  e  . Dados n pares de observações  das var. X e Y, i=1,2,...,n,  queremos encontrar uma equação do tipo:  onde  e  são os estimadores de  ,  e  .  Para cada par  observado podemos estabelecer a seguinte relação:  Resíduo
Os estimadores de  e  Na estimação por mínimos quadrados, queremos encontrar  e  que minimizam a soma dos quadrados dos resíduos. Ou seja, queremos  tornar mínima a expressão:  Para minimizar esta expressão em  e  , temos as derivadas em  relação a  e  :
Somas de quadrados  Onde: e
Coeficiente de Determinação  O  coeficiente de determinação  ou simplesmente  . É uma medida da proporção da variabilidade em uma variável que é explicada pela variabilidade da outra.  Definimos o coeficiente de determinação ou explicação do modelo, que é  dado por: O coeficiente está entre  logo, quanto mais próximo de 1  Estiver o valor de  , melhor será o ajuste do modelo e quanto mais  Próximo de 0 (zero), pior é o ajuste.
Coeficiente de Determinação Corrigido  É importante enfatizar que a medida  depende do número de observações  da amostra, sendo que tende a aumentar a medida que  n  diminui; Especialmente, para n=2 temos  , já que dois pontos determinam uma única reta;  Para contornar este problema, definimos o C.D.C para G.L; Dividindo as somas de quadrados pelos graus de liberdade temos:
Análise de Variância ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Assim, a estatística F é uma estatística para testar  contra  quanto maior o valor de F, maior evidência a favor de
Análise de Variância A partir daí, procedemos à análise de variância do modelo linear,  dado pela tabela a seguir: se  H 0   verdadeiro   (Não existe relação linear) se  H 0   falso   (existe relação linear)
Testes de Hipóteses Entretanto, ainda existe outra maneira de se testar  :  Lembremos que, sob as suposições usuais do modelo de regressão linear  simples, temos que: Porém, não conhecemos o verdadeiro valor de  e usamos o estimador. Logo: onde
Intervalos de Confiança Outra forma para se avaliar a significância dos resultados obtidos para  b , que é o estimador de  , é através da utilização de intervalos de confiança (IC's). Para construir um  I.C  para  com  de confiança, temos que encontrar um valor  ,tal que:
Ajuste do Modelo Muitas vezes, podemos encontrar problemas na especificação da função que relaciona as variáveis (não linearidade); Pode ser verificado através de um gráfico de dispersão entre X e Y; Existem funções que podem ser transformadas em modelos lineares; Existem vários tipos de funções que podemos transformar, tais como: ,[object Object],[object Object],[object Object]
Função Potência  Esta função é dada pela expressão: O gráfico desta função é esboçado como: Aplicando o log em ambos os lados da igualdade podemos linearizar a função: e então, temos um modelo: com:
Análises de Resíduos ,[object Object],[object Object],[object Object],[object Object]
Análises de Resíduos “ ideal”  2   não constante não linearidade não independência tempo “ outlier”
Aplicação
Software Estatístico R O Software R é um conjunto integrado de pacotes ou bibliotecas para manipulação de dados, cálculo e visualização gráfica. Entre outras características, ele permite: Uma facilidade efetiva para manipulação e armazenagem de dados; Um conjunto de operadores para cálculos sobre quadros de dados, em particular as matrizes; Uma grande e coerente coleção integrada de ferramentas para análise de dados; Facilidades gráficas com capacidade de visualização na tela ou impressora; Uma linguagem de programação bem desenvolvida, simples e eficiente.
Sobre o banco de dados ,[object Object],[object Object],[object Object]
Estimando o modelo linear (lm()) > gfit = lm(Species ~ Endemics, data=gala) > gfit Call: lm(formula = Species ~ Endemics, data = gala) Coefficients: (Intercept)  Endemics -21.048  4.072 ,[object Object],[object Object]
Plotando o gráfico de dispersão > plot(Species,Endemics) > abline(gfit)
Teste de significância (summary) >summary (gfit) Call: lm(formula = Species ~ Endemics, data = gala) Residuals: Min  1Q  Median  3Q  Max  -71.791  -15.894  3.507  12.088  78.200  Coefficients: Estimate  Std. Error  t value  Pr >  | t |  (Intercept)  -21.0480  7.1138  -2.959  0.00622 **  Endemics  4.0721  0.1899  21.443  < 2e-16 *** --- Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1}  Residual standard error: 27.95 on 28 degrees of freedom Multiple R-squared: 0.9426, Adjusted R-squared: 0.9406 F-statistic: 459.8 on 1 and 28 DF,  p-value: < 2.2e-16
Intervalos de Confiança O intervalo de confiança para o coeficiente de regressão pode ser construído a partir do erro associado ao mesmo, usando a distribuição  t ,  por exemplo, o valor crítico do  t  para os 28 graus de liberdade residuais do modelo, associado ao intervalo de confiança de 95% será: > qt(0.975,28) [1] 2.048407 E os limites de confiança para o coeficiente de regressão podem ser calculados como: > c(4.0721-2.048407*0.1899, 4.0721+2.048407*0.1899) [1] 3.683108  4.461092
Resíduos e testes diagnósticos ,[object Object],[object Object],[object Object]
Resíduos e testes diagnósticos ,[object Object],> padronizados = rstandard(gfit) ,[object Object],> plot(Species,padronizados) > abline(h=0) ,[object Object],> gqtest(gfit) Goldfeld-Quand test Data: modelo GQ=  p-value = 0.2960 ,[object Object]
Resíduos e testes diagnósticos ,[object Object],> qqnorm(padronizados) > qqline(padronizados) ,[object Object],> shapiro.test(padronizados) Shapiro-Wilk normality test data:  padronizados  W = 0.9268, p-value = 0.06041
Conclusão ,[object Object],[object Object],[object Object]

Contenu connexe

Tendances

Distribuição Amostral da Média
Distribuição Amostral da MédiaDistribuição Amostral da Média
Distribuição Amostral da Média
Anderson Pinho
 
Aula sistema de amortização
Aula   sistema de amortizaçãoAula   sistema de amortização
Aula sistema de amortização
Thaiane Oliveira
 
Distribuição de frequencia
Distribuição de frequenciaDistribuição de frequencia
Distribuição de frequencia
Asafe Salomao
 

Tendances (20)

Introdução à Regressão Linear Simples e Múltipla
Introdução à Regressão Linear Simples e MúltiplaIntrodução à Regressão Linear Simples e Múltipla
Introdução à Regressão Linear Simples e Múltipla
 
Aula 01 introdução a estatística
Aula 01   introdução a estatísticaAula 01   introdução a estatística
Aula 01 introdução a estatística
 
Distribuição Amostral da Média
Distribuição Amostral da MédiaDistribuição Amostral da Média
Distribuição Amostral da Média
 
Amostragem - estatistica
Amostragem - estatisticaAmostragem - estatistica
Amostragem - estatistica
 
Física experimental - Aula 1.pptx
Física experimental - Aula 1.pptxFísica experimental - Aula 1.pptx
Física experimental - Aula 1.pptx
 
Análise de regressão linear
Análise de regressão linearAnálise de regressão linear
Análise de regressão linear
 
Conceitos Básicos de Estatística II
Conceitos Básicos de Estatística IIConceitos Básicos de Estatística II
Conceitos Básicos de Estatística II
 
Aula 22 probabilidade - parte 1
Aula 22   probabilidade - parte 1Aula 22   probabilidade - parte 1
Aula 22 probabilidade - parte 1
 
Exercícios Resolvidos: Distribuição Binomial
Exercícios Resolvidos: Distribuição BinomialExercícios Resolvidos: Distribuição Binomial
Exercícios Resolvidos: Distribuição Binomial
 
Probabilidade e estatística - Variáveis Aleatórias
Probabilidade e estatística - Variáveis AleatóriasProbabilidade e estatística - Variáveis Aleatórias
Probabilidade e estatística - Variáveis Aleatórias
 
Aula sistema de amortização
Aula   sistema de amortizaçãoAula   sistema de amortização
Aula sistema de amortização
 
Análise exploratória de dados no SPSS
Análise exploratória de dados no SPSSAnálise exploratória de dados no SPSS
Análise exploratória de dados no SPSS
 
6 teste de hipótese
6   teste de hipótese6   teste de hipótese
6 teste de hipótese
 
Estatistica conceitos
Estatistica conceitosEstatistica conceitos
Estatistica conceitos
 
Aula 3 testes de hipóteses e anova
Aula 3   testes de hipóteses e anovaAula 3   testes de hipóteses e anova
Aula 3 testes de hipóteses e anova
 
Aula 1 introdução e estatística descritiva
Aula 1   introdução e  estatística descritivaAula 1   introdução e  estatística descritiva
Aula 1 introdução e estatística descritiva
 
Distribuição normal
Distribuição normalDistribuição normal
Distribuição normal
 
Amostragem inferencial
Amostragem inferencialAmostragem inferencial
Amostragem inferencial
 
Aula de Estatística Básica -Aula 4
Aula de Estatística Básica -Aula  4Aula de Estatística Básica -Aula  4
Aula de Estatística Básica -Aula 4
 
Distribuição de frequencia
Distribuição de frequenciaDistribuição de frequencia
Distribuição de frequencia
 

En vedette

Regressão Linear Simples
Regressão Linear SimplesRegressão Linear Simples
Regressão Linear Simples
monica_lima
 
Cap9 - Parte 4 - Regressão Linear
Cap9 - Parte 4 - Regressão LinearCap9 - Parte 4 - Regressão Linear
Cap9 - Parte 4 - Regressão Linear
Regis Andrade
 
Regressão - aula 02/04
Regressão - aula 02/04Regressão - aula 02/04
Regressão - aula 02/04
Rodrigo de Sá
 
Cap9 - Parte 2 - Correlação De Pearson
Cap9 - Parte 2 - Correlação De PearsonCap9 - Parte 2 - Correlação De Pearson
Cap9 - Parte 2 - Correlação De Pearson
Regis Andrade
 
Variáveis em investigação
Variáveis em investigaçãoVariáveis em investigação
Variáveis em investigação
MinvC
 
Apostila de estatística
Apostila de  estatística Apostila de  estatística
Apostila de estatística
Cidinha Santos
 

En vedette (19)

Regressão Linear Simples
Regressão Linear SimplesRegressão Linear Simples
Regressão Linear Simples
 
Cap9 - Parte 4 - Regressão Linear
Cap9 - Parte 4 - Regressão LinearCap9 - Parte 4 - Regressão Linear
Cap9 - Parte 4 - Regressão Linear
 
Analise estatistica excel
Analise estatistica excelAnalise estatistica excel
Analise estatistica excel
 
07 tópico 6 - autocorrelação
07   tópico 6 - autocorrelação07   tópico 6 - autocorrelação
07 tópico 6 - autocorrelação
 
Regressão - aula 02/04
Regressão - aula 02/04Regressão - aula 02/04
Regressão - aula 02/04
 
Exercicio de Regressao Linear Simples
Exercicio de Regressao Linear SimplesExercicio de Regressao Linear Simples
Exercicio de Regressao Linear Simples
 
02 tópico 1 - regressão linear simples 02 - Econometria - Graduação - UFPA
02   tópico 1 - regressão linear simples 02 - Econometria - Graduação - UFPA02   tópico 1 - regressão linear simples 02 - Econometria - Graduação - UFPA
02 tópico 1 - regressão linear simples 02 - Econometria - Graduação - UFPA
 
05 tópico 4 - multicolinearidade
05   tópico 4 - multicolinearidade05   tópico 4 - multicolinearidade
05 tópico 4 - multicolinearidade
 
Cap9 - Parte 2 - Correlação De Pearson
Cap9 - Parte 2 - Correlação De PearsonCap9 - Parte 2 - Correlação De Pearson
Cap9 - Parte 2 - Correlação De Pearson
 
06 tópico 5 - heterocedasticidade
06   tópico 5 - heterocedasticidade06   tópico 5 - heterocedasticidade
06 tópico 5 - heterocedasticidade
 
02 tópico 1 - regressão linear simples 01 - Econometria - Graduação - UFPA
02   tópico 1 - regressão linear simples 01 - Econometria - Graduação - UFPA02   tópico 1 - regressão linear simples 01 - Econometria - Graduação - UFPA
02 tópico 1 - regressão linear simples 01 - Econometria - Graduação - UFPA
 
Tópico 4 regressão linear simples 02
Tópico 4   regressão linear simples 02Tópico 4   regressão linear simples 02
Tópico 4 regressão linear simples 02
 
03 tópico 2 - regressão multipla
03   tópico 2 - regressão multipla03   tópico 2 - regressão multipla
03 tópico 2 - regressão multipla
 
Regressão Linear Simples
Regressão Linear SimplesRegressão Linear Simples
Regressão Linear Simples
 
Variáveis em investigação
Variáveis em investigaçãoVariáveis em investigação
Variáveis em investigação
 
Apostila de estatística
Apostila de  estatística Apostila de  estatística
Apostila de estatística
 
Prática de Regressão no SPSS
Prática de Regressão no SPSSPrática de Regressão no SPSS
Prática de Regressão no SPSS
 
Funções
FunçõesFunções
Funções
 
Tópico 4 regressão linear simples 01
Tópico 4   regressão linear simples 01Tópico 4   regressão linear simples 01
Tópico 4 regressão linear simples 01
 

Similaire à Modelo de regressão linear: aspectos teóricos e computacionais

Cap9 - Parte 5 - Teste De Coeficientes
Cap9 - Parte 5 - Teste De CoeficientesCap9 - Parte 5 - Teste De Coeficientes
Cap9 - Parte 5 - Teste De Coeficientes
Regis Andrade
 
Apostila regressao linear
Apostila regressao linearApostila regressao linear
Apostila regressao linear
coelhojmm
 
12 correlação e regressão
12   correlação e regressão12   correlação e regressão
12 correlação e regressão
Fernando Lucas
 
AMD - Aula n.º 9 - regressão linear múltipla.pptx
AMD - Aula n.º 9 - regressão linear múltipla.pptxAMD - Aula n.º 9 - regressão linear múltipla.pptx
AMD - Aula n.º 9 - regressão linear múltipla.pptx
NunoSilva599593
 

Similaire à Modelo de regressão linear: aspectos teóricos e computacionais (20)

A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
 
Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...
Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...
Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...
 
Cap9 - Parte 5 - Teste De Coeficientes
Cap9 - Parte 5 - Teste De CoeficientesCap9 - Parte 5 - Teste De Coeficientes
Cap9 - Parte 5 - Teste De Coeficientes
 
Apostila regressao linear
Apostila regressao linearApostila regressao linear
Apostila regressao linear
 
12 correlação e regressão
12   correlação e regressão12   correlação e regressão
12 correlação e regressão
 
Regressao linear
Regressao linearRegressao linear
Regressao linear
 
Aula13-15.pdf
Aula13-15.pdfAula13-15.pdf
Aula13-15.pdf
 
Analise exploratório de dados
Analise exploratório de dadosAnalise exploratório de dados
Analise exploratório de dados
 
Introdução à Regressão Linear
Introdução à Regressão LinearIntrodução à Regressão Linear
Introdução à Regressão Linear
 
AMD - Aula n.º 9 - regressão linear múltipla.pptx
AMD - Aula n.º 9 - regressão linear múltipla.pptxAMD - Aula n.º 9 - regressão linear múltipla.pptx
AMD - Aula n.º 9 - regressão linear múltipla.pptx
 
Apostila física exp ii
Apostila física exp iiApostila física exp ii
Apostila física exp ii
 
Análise de Regressão: aspectos teóricos e computacionais
Análise de Regressão: aspectos teóricos e computacionaisAnálise de Regressão: aspectos teóricos e computacionais
Análise de Regressão: aspectos teóricos e computacionais
 
econometria
 econometria econometria
econometria
 
Reproducao sp-matematica-1-unidade-2-capitulo-4
Reproducao sp-matematica-1-unidade-2-capitulo-4Reproducao sp-matematica-1-unidade-2-capitulo-4
Reproducao sp-matematica-1-unidade-2-capitulo-4
 
TUTORIAL_GRÁFICO DE CONTROLE.pdf
TUTORIAL_GRÁFICO DE CONTROLE.pdfTUTORIAL_GRÁFICO DE CONTROLE.pdf
TUTORIAL_GRÁFICO DE CONTROLE.pdf
 
analise estatistica: Correlacao canonica
analise estatistica: Correlacao canonicaanalise estatistica: Correlacao canonica
analise estatistica: Correlacao canonica
 
Aula3.pdf
Aula3.pdfAula3.pdf
Aula3.pdf
 
Gustavo relatorio
Gustavo relatorioGustavo relatorio
Gustavo relatorio
 
Regressão aula
Regressão aulaRegressão aula
Regressão aula
 
Trabalho2
Trabalho2Trabalho2
Trabalho2
 

Plus de Rodrigo Rodrigues

Introdução sobre desenvolvimento web
Introdução sobre desenvolvimento webIntrodução sobre desenvolvimento web
Introdução sobre desenvolvimento web
Rodrigo Rodrigues
 
Componentes do Sistema operacional
Componentes do Sistema operacional Componentes do Sistema operacional
Componentes do Sistema operacional
Rodrigo Rodrigues
 
Infraestrutura de Software - Introdução
Infraestrutura de Software - IntroduçãoInfraestrutura de Software - Introdução
Infraestrutura de Software - Introdução
Rodrigo Rodrigues
 

Plus de Rodrigo Rodrigues (20)

Aula 7 análise fatorial
Aula 7  análise fatorialAula 7  análise fatorial
Aula 7 análise fatorial
 
Aula 6 análise de conglomerados
Aula 6  análise de conglomeradosAula 6  análise de conglomerados
Aula 6 análise de conglomerados
 
Aula 5 modelo de regressão loística
Aula 5   modelo de regressão loísticaAula 5   modelo de regressão loística
Aula 5 modelo de regressão loística
 
Aula 4 modelos de regressão linear
Aula 4   modelos de regressão linearAula 4   modelos de regressão linear
Aula 4 modelos de regressão linear
 
Aula 2 prática computacional de estatística descritiva
Aula 2   prática computacional de estatística descritivaAula 2   prática computacional de estatística descritiva
Aula 2 prática computacional de estatística descritiva
 
Desenvolvimento de um Assistente Virtual Integrado ao Moodle para Suporte a A...
Desenvolvimento de um Assistente Virtual Integrado ao Moodle para Suporte a A...Desenvolvimento de um Assistente Virtual Integrado ao Moodle para Suporte a A...
Desenvolvimento de um Assistente Virtual Integrado ao Moodle para Suporte a A...
 
Pesquisa Quantitativa: aspectos teóricos e computacionais
Pesquisa Quantitativa: aspectos teóricos e computacionaisPesquisa Quantitativa: aspectos teóricos e computacionais
Pesquisa Quantitativa: aspectos teóricos e computacionais
 
Teste de hipóteses - paramétricos
Teste de hipóteses - paramétricosTeste de hipóteses - paramétricos
Teste de hipóteses - paramétricos
 
Modelo de Regressão Linear aplicado à previsão de desempenho de estudantes em...
Modelo de Regressão Linear aplicado à previsão de desempenho de estudantes em...Modelo de Regressão Linear aplicado à previsão de desempenho de estudantes em...
Modelo de Regressão Linear aplicado à previsão de desempenho de estudantes em...
 
Jogos Educativos - Nativos Digitais
Jogos Educativos - Nativos DigitaisJogos Educativos - Nativos Digitais
Jogos Educativos - Nativos Digitais
 
Introdução sobre desenvolvimento web
Introdução sobre desenvolvimento webIntrodução sobre desenvolvimento web
Introdução sobre desenvolvimento web
 
Gerência de dispositivos
Gerência de dispositivosGerência de dispositivos
Gerência de dispositivos
 
Memória virtual
Memória virtualMemória virtual
Memória virtual
 
Memória virtual
Memória virtualMemória virtual
Memória virtual
 
Gerenciamento de memória
Gerenciamento de memóriaGerenciamento de memória
Gerenciamento de memória
 
Aula revisão ok
Aula revisão       okAula revisão       ok
Aula revisão ok
 
Gerência de memória
Gerência de memóriaGerência de memória
Gerência de memória
 
Escalonamento de processos
Escalonamento de processosEscalonamento de processos
Escalonamento de processos
 
Componentes do Sistema operacional
Componentes do Sistema operacional Componentes do Sistema operacional
Componentes do Sistema operacional
 
Infraestrutura de Software - Introdução
Infraestrutura de Software - IntroduçãoInfraestrutura de Software - Introdução
Infraestrutura de Software - Introdução
 

Modelo de regressão linear: aspectos teóricos e computacionais

  • 1.  
  • 2. Introdução A finalidade de uma equação de regressão seria então estimar valores de uma variável, com base em valores conhecidos da outra; Um economista pode tentar explicar as variações na procura de automóveis usados em termos de desemprego; Um agricultor pode suspeitar que a quantidade de fertilizante por ele usada tenha influenciado a safra; Dentro desse contexto, o objetivo desta monografia foi demonstrar as técnicas de análise de regressão dentro de uma abordagem teórica e computacional, utilizando o software estatístico R.
  • 3.
  • 4.
  • 5. Se apenas uma variável explicativa é observada, temos: Os erros também podem ser devido a erros obtidos no processo de Mensuração da variável dependente. Modelo Estatístico Assim, o modelo ficaria:
  • 6.
  • 7. X Y  Coeficiente angular Regressão Linear Simples Inclinação populacional Intercepto populacional Erro Aleatório Variável Independente Variável Dependente
  • 8. Ao estabelecer o modelo de regressão linear simples, pressupomos que: A relação entre X e Y é Linear; Os valores de X são fixos, isto é, X não é uma variável aleatória; A média dos erros é nula, isto é: Para um dado valor x de X, a variância dos erros é sempre denotada variância residual, dizemos que o erro é homocedástico; O erro em uma observação é não correlacionado com o erro em qualquer outra observação; Os erros têm distribuição normal. Suposições do modelo
  • 9. Os estimadores de e Uma vez que o modelo foi especificado e as suposições foram feitas, devemos estimar os parâmetros da regressão, e . Dados n pares de observações das var. X e Y, i=1,2,...,n, queremos encontrar uma equação do tipo: onde e são os estimadores de , e . Para cada par observado podemos estabelecer a seguinte relação: Resíduo
  • 10. Os estimadores de e Na estimação por mínimos quadrados, queremos encontrar e que minimizam a soma dos quadrados dos resíduos. Ou seja, queremos tornar mínima a expressão: Para minimizar esta expressão em e , temos as derivadas em relação a e :
  • 12. Coeficiente de Determinação O coeficiente de determinação ou simplesmente . É uma medida da proporção da variabilidade em uma variável que é explicada pela variabilidade da outra. Definimos o coeficiente de determinação ou explicação do modelo, que é dado por: O coeficiente está entre logo, quanto mais próximo de 1 Estiver o valor de , melhor será o ajuste do modelo e quanto mais Próximo de 0 (zero), pior é o ajuste.
  • 13. Coeficiente de Determinação Corrigido É importante enfatizar que a medida depende do número de observações da amostra, sendo que tende a aumentar a medida que n diminui; Especialmente, para n=2 temos , já que dois pontos determinam uma única reta; Para contornar este problema, definimos o C.D.C para G.L; Dividindo as somas de quadrados pelos graus de liberdade temos:
  • 14.
  • 15. Análise de Variância A partir daí, procedemos à análise de variância do modelo linear, dado pela tabela a seguir: se H 0 verdadeiro (Não existe relação linear) se H 0 falso (existe relação linear)
  • 16. Testes de Hipóteses Entretanto, ainda existe outra maneira de se testar : Lembremos que, sob as suposições usuais do modelo de regressão linear simples, temos que: Porém, não conhecemos o verdadeiro valor de e usamos o estimador. Logo: onde
  • 17. Intervalos de Confiança Outra forma para se avaliar a significância dos resultados obtidos para b , que é o estimador de , é através da utilização de intervalos de confiança (IC's). Para construir um I.C para com de confiança, temos que encontrar um valor ,tal que:
  • 18.
  • 19. Função Potência Esta função é dada pela expressão: O gráfico desta função é esboçado como: Aplicando o log em ambos os lados da igualdade podemos linearizar a função: e então, temos um modelo: com:
  • 20.
  • 21. Análises de Resíduos “ ideal”  2 não constante não linearidade não independência tempo “ outlier”
  • 23. Software Estatístico R O Software R é um conjunto integrado de pacotes ou bibliotecas para manipulação de dados, cálculo e visualização gráfica. Entre outras características, ele permite: Uma facilidade efetiva para manipulação e armazenagem de dados; Um conjunto de operadores para cálculos sobre quadros de dados, em particular as matrizes; Uma grande e coerente coleção integrada de ferramentas para análise de dados; Facilidades gráficas com capacidade de visualização na tela ou impressora; Uma linguagem de programação bem desenvolvida, simples e eficiente.
  • 24.
  • 25.
  • 26. Plotando o gráfico de dispersão > plot(Species,Endemics) > abline(gfit)
  • 27. Teste de significância (summary) >summary (gfit) Call: lm(formula = Species ~ Endemics, data = gala) Residuals: Min 1Q Median 3Q Max -71.791 -15.894 3.507 12.088 78.200 Coefficients: Estimate Std. Error t value Pr > | t | (Intercept) -21.0480 7.1138 -2.959 0.00622 ** Endemics 4.0721 0.1899 21.443 < 2e-16 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1} Residual standard error: 27.95 on 28 degrees of freedom Multiple R-squared: 0.9426, Adjusted R-squared: 0.9406 F-statistic: 459.8 on 1 and 28 DF, p-value: < 2.2e-16
  • 28. Intervalos de Confiança O intervalo de confiança para o coeficiente de regressão pode ser construído a partir do erro associado ao mesmo, usando a distribuição t , por exemplo, o valor crítico do t para os 28 graus de liberdade residuais do modelo, associado ao intervalo de confiança de 95% será: > qt(0.975,28) [1] 2.048407 E os limites de confiança para o coeficiente de regressão podem ser calculados como: > c(4.0721-2.048407*0.1899, 4.0721+2.048407*0.1899) [1] 3.683108 4.461092
  • 29.
  • 30.
  • 31.
  • 32.