SlideShare uma empresa Scribd logo
1 de 34
MEDIDAS DE ASSOCIAÇÃO E
CORRELAÇÃO
 Mostrar a importância dos conceitos de associação e
correlação para o entendimentos dos fatos sociais.
 Apresentar as medidas de associação e correlação mais
utilizadas.
OBJETIVOS
população amostra
uma variável
aleatória: ex.
peso
Estatísticas:
média,
variância
desvio padrão,
etc.
população amostra
duas variáveis
aleatórias:
peso e altura,
etc
 Análise de dados estatísticos na engenharia é a busca
de relações entre duas variáveis de uma mesma
população.
CONSIDERAÇÕES
Regressão e Correlação são duas técnicas
estreitamente relacionadas, que envolvem uma forma
de estimação.
Correlação: Mede a força e direção de
relacionamento (linear) entre duas variáveis.
Regressão: Estabelece uma equação que descreve o
relacionamento em termos matemáticos.
CONCEITOS
 Comprimento (variável X) e largura (variável Y) de crânios de pessoas da
população;
 Altura (variável X) do pai e altura (variável Y) da filha;
 Idade (variável X) e a resistência física (variável Y);
 Comprimento (variável X) e peso dos ursos (variável Y);
 Gastos em publicidade (variável X) e o faturamento da empresa (variável Y);
Idade (variável X) e altura (variável Y) das crianças;
Tempo de prática de esportes e ritmo cardíaco;
Tempo de estudo e nota na prova;
Taxa de desemprego e taxa de criminalidade;
Expectativa de vida e taxa de analfabetismo.
A esta relação é dado o nome de correlação
Qual a relação entre:
Dados quantitativos
- contínuos
- discretos
Coeficiente de
correlação de
Pearson
Dados qualitativos
- ordinais - nominais
(categorias)
Coeficiente de
Spearman
Coeficiente de
contingência
( qui-quadrado)
Coeficientes de correlação
COEFICIENTES
Relação entre duas ou mais variáveis aleatórias -
correlação
Gráfico de dispersão Medida de correlação
(coeficiente de correlação)
+
Correlação
entre duas variáveis
aleatórias
Linear (uma reta)
Não linear (parábola, exponencial
{
Estudaremo
s apenas a
correlação
linear
Estudaremos apenas
correlação de duas
variáveis
Comprimento X (polegadas) 53,0 67,5 75,0 73,5 68,5 73,0 37,0
Peso Y (libras) 80 344 416 416 262 360 34
Comprimento e peso de ursos machos
Os dados acima, casados em conjunto são conhecidos como dados
emparelhados ou bivariados ( no mesmo instante);
Existe correlação entre duas variáveis quando uma delas está, de
alguma forma, relacionada com a outra;
A correlação é uma técnica estatística que tem por objetivo investigar
se há ou não correlação linear entre duas ou mais variáveis;
EXEMPLO
Pré requisitos para o estudo de correlação
A amostra de dados emparelhados (x, y) deve ser
aleatória.
Os pares de dados (x, y) deve ter uma distribuição normal
bivariada.
Os dados devem provir de observações emparelhadas em
condições semelhantes
 altura e peso de um grupo de crianças, por exemplo, o peso de
uma criança deve ser medido e registrado no mesmo instante em
que é medida e registrada a altura.
PRÉ REQUISITOS
CORRELAÇÃO LINEAR
 Coeficiente de correlação (produto-momento) de
Pearson (r).
 O coeficiente de Pearson avalia o quanto duas séries
numéricas repousam sobre uma linha reta, indicando
assim o grau de sua associação linear.
se existe ou não alguma associação (relação) entre as
variáveis em estudo;
a direção da correlação (como valores de Y aumenta ou diminui em
função do aumento ou redução de X)
a força da correlação (em que “taxa” os valores de Y aumentam ou
diminuem em função de X)
 e a natureza da correlação (reta, parábola, exponencial,
etc.)
y
x
...
.
.
. .
Não há correlação entre x e y
. .
. .
.
.
.
. ..
y
x
..
Correlação não linear entre x e y
...
.....
....
.. .....
.
correlação não
linear – não será
estudado
MÉTODO GRÁFICO QUE AJUDA A AVALIAR:
y
x
.........
...
.
.
.
Correlação positiva entre x e y
y
x
.........
...
.
.... ..
.
.
.
Forte Correlação positiva entre x e y
y
x
Correlação positiva perfeita entre x e y
............
.
Correlação positiva:
x cresce y cresce
x diminui y diminui
Correlação linear:
uma reta pode ajustar aos
dados
r = 1
Admite-se r > 0,7
CONSIDERAÇÕES
y
x
..
Correlação negativa entre x e y
. .
. .. .. ..
.
y
x
..
Forte Correlação negativa entre x e y
.. .. ...
..
..
.
.
.
y
x
Correlação negativa perfeita entre x e y
.........
.
...
.
Correlação negativa:
x cresce y diminui
x diminui y cresce
Correlação linear:
uma reta pode ajustar aos
dados
r = -1
Admite-se r < - 0,7
É conhecido como coeficiente de correlação linear de Pearson
ou coeficiente momento- produto de Pearson (em homenagem a Karl
Pearson, 1857 – 1936)
yx
n
i
ii
yx ss
n
yyxx
ss
YXCov
r
.
1
))((
.
),(
1
−
−−
==
∑=
xi = valores de x
yi = valores de y
x barra = média dos valores xi
y barra = média dos valores yi
n = número de pares de dados
presentes
sx = desvio padrão dos valores xi
sy = desvio padrão dos valores yi
Cov(x,y) = covariância dos valores de
x e y
COEFICIENTE DE CORRELAÇÃO LINEAR DE PEARSON R:
∑ ∑∑ ∑
∑ ∑ ∑
−−
−
=
2222
)()(*)()(
))((
yynxxn
yxxyn
r
Notação para o coeficiente de correlação linear
n representa o número de pares de dados presentes;
∑ denota a adição dos itens indicados;
∑x denota a soma de todos os valores de x;
∑x2
indica que devemos elevar ao quadrado cada valor de x e soma os
resultados;
(∑x)2
indica que devemos somar os valores de x e elevar o total ao
quadrado. Não confundir ∑x2
com (∑x)2
;
∑xy indicar que devemos multiplicar cada valor de x pelo valor
correspondente de y e somar então todos esses produtos
r representa o coeficiente de correlação linear para uma amostra
ρ representa o coeficiente de correlação linear para uma população
Arredondamento no meios dos
cálculos pode causar erros
sérios. Use a memória de sua
calculadora para armazenar os
resultados intermediários,
fazendo o arredondamento
somente no final.
Cálculo do coeficiente de correlação linear
n
y
ys
n
x
xs
n
yx
xys
ss
s
r
yy
xx
xy
yyxx
xy
2
2
2
2
)(
)(
.
∑
∑
∑∑
∑∑∑
−=
−=
−=
=
FÓRMULA ALTERNATIVA PARA r
-1 0 +1
r = -1
há correlação linear
negativa perfeita entre
as variáveis x e y.
r = +1
há correlação linear
positiva perfeita entre
as variáveis x e y.
r =0
não há correlação linear
entre as variáveis x e y.
O coeficiente de PEARSON varia de -1 a +1.
INTERPRETAÇÃO DO COEFICIENTE DE CORRELAÇÃO
Exemplo: Calcule o coeficiente de correlação linear para os dados
emparelhados de pesos e comprimentos dos ursos.
Comprimento X (polegadas) 53,0 67,5 72,0 72,0 73,5 68,5 73,0 37,0
Peso Y (libras) 80 344 416 348 262 360 332 34
Comprimento (in) peso (lb)
x y x.y x2
y2
53,0 80 4240 2809,00 6400
67,5 344 23220 4556,25 118336
72,0 416 29952 5184,00 173056
72,0 348 25056 5184,00 121104
73,5 262 19257 5402,25 68644
68,5 360 24660 4692,25 129600
73,0 332 24236 5329,00 110224
37,0 34 1258 1369,00 1156
total 516,5 2176 151879 34525,75 728520
∑x ∑y ∑xy ∑x2
∑y2
897,0
897,0
109318475,9433
91128
)2176)728520(8)5,516()75,34525(8
)2176)(5,516()151879(8
22
=
==
−−
−
=
r
r
r
O resultado indica uma forte e positiva (próximo de 1)
correlação entre o peso e o comprimento dos Ursos.
CALCULANDO r
Gráfico de Dispersão
0
200
400
600
30 40 50 60 70 80
comprimento dos ursos
pesodosursosREPRESENTAÇÃO GRÁFICA
Avalie a correlação entre as médias de 15 estudantes no 2º grau
(ensino médio), relacionando com os índices dos mesmos estudantes
no seus cursos universitários. As médias no 2º grau podem variar de 0
a 100, e os índices universitários de 0 a 4. Construa o diagrama de
dispersão e calcule o coeficiente de correlação de Pearson.
Média no 2º
grau
Índice na
Universidade
Média no 2º
grau
Índice na
Universidade
80 1,0 90 3,1
82 1,0 91 2,4
84 2,1 91 2,7
85 1,4 92 3,0
87 2,1 94 3,9
88 1,7 96 3,6
88 2,0 98 4,0
89 3,5
EXEMPLO
Média no 2º
grau X
Índice na
Universidade Y
X2
Y2
XY
80,0 1,0 6400 1,0 80,0
82,0 1,0 6724 1,0 82,0
81,0 2,1 7056 4,41 176,4
85,0 1,4 7225 1,96 119,0
87,0 2,1 7569 4,41 182,7
88,0 1,7 7744 2,89 149,6
88,0 2,0 7744 4,0 176,0
89,0 3,5 7921 12,25 311,5
90,0 3,1 8100 9,61 279,0
91,0 2,4 8281 5,76 218,4
91,0 2,7 8281 7,29 245,7
92,0 3,0 8464 9,0 276,0
94,0 3,9 8836 15,21 366,6
96,0 3,6 9216 12,96 345,6
98,0 4,0 9604 16,0 392,0
1335,0 37,5 119165,0 107,8 3400,5
∑x ∑y ∑x2
∑y2
∑xy
9,0
)8,37()8,107.(15.)1335()119165.(15
)50,37).(91335()5,3400.(15
)()(.)()(
))((
22
2222
=
−−
−
=
−−
−
=
∑ ∑∑ ∑
∑ ∑ ∑
r
r
yynxxn
yxxyn
r
1335,0 37,5 119165,0 107,8 3400,5
∑x ∑y ∑x2
∑y2
∑xy
O resultado indica uma forte e positiva (próximo de 1)
correlação entre as médias do 2º grau e os índices na
Universidade.
Gráfico de dispersão
0
1
2
3
4
5
60 70 80 90 100 110
Médias do 2ºgrau
Índicesna
Universidade
REPRESENTAÇÃO GRÁFICA
Quando se constatam correlações entre variáveis, podem ocorrer
resultados interessantes, surpreendentes e úteis. Vários estudos
científicos sugerem a existência de uma correlação entre a exposição a
campos eletromagnéticos e a incidência de câncer. Os epidemiologistas
do Instituto Korolisnka da Suécia pesquisaram 500.000 suecos que
viviam a 300 metros de uma linha de alta tensão, por um período de 25
anos, e constataram que as crianças apresentavam maior incidência de
leucemia. Essas conclusões levaram o governo da Suécia a elaborar
regulamentos que reduzissem o número de residências nas
proximidades das linhas de energia de alta tensão. Em um artigo sobre
esse estudo, a revista “Times” escreveu: “Embora a pesquisa não prove
a relação de causa e efeito, mostra uma correlação indiscutível entre o
grau de exposição e o risco de leucemia infantil”.
Interessante
CORRELAÇÃO ENTRE LINHAS DE ENERGIA E CÂNCER
1 – o valor de r está sempre entre -1 e 1. Isto é -1≤ r ≤ 1.
2 – o valor de r não varia se todos os valores de qualquer
uma das variáveis são convertidos para uma escala
diferente. Por exemplo, se os pesos dos ursos são dados
em quilogramas em vez de libras, o valor de r não se
modificará.
3 – o valor de r não é afetado pela escolha de x ou y.
Permutando todos os valores de x e y, r permanecerá
inalterado.
4 – r mede a intensidade, ou grau, de um relacionamento
linear. Não se serve para medir a intensidade de um
relacionamento não-linear.
PROPRIEDADES DO COEFICIENTE DE CORRELAÇÃO LINEAR R
1 – Devemos evitar a conclusão de que a correlação implica a
causalidade. Um estudo mostrou uma correlação entre os salários dos professores
de estatística e o consumo individual de cerveja; mas essas duas variáveis são afetadas
pelas condições econômicas, uma terceira variável oculta. (Defini-se formalmente uma
variável oculta como uma variável que afeta as variáveis em estudo, mas não está
incluída no estudo.)
2 – Surge outra fonte potencial de erros quando os dados são
baseados em taxas ou médias. Quando utilizamos taxas ou médias para os
dados, suprimimos a variação entre os indivíduos ou elementos, e isto pode levar a um
coeficiente de correlação inflacionado.Um estudo acusou um coeficiente de correlação
linear de 0,4 para dados emparelhados relativos a renda e educação entre indivíduos,
mas aquele coeficiente passou para 0,7 quando foram consideradas médias regionais.
3 – Um terceiro erro diz respeito à propriedade de linearidade. A
conclusão de que não há correlação linear significativa, não quer dizer que x e y não
estejam correlacionados de alguma forma. Pode ocorrer casos onde r = 0 indicando
ausência total de correlação linear entre as duas variáveis, mas elas podem estar
fortemente relacionados por uma correlação não-linear.
ERROS COMUNS QUE ENVOLVEM A CORRELAÇÃO
4 - Quantidade insuficiente de dados podem levar a
conclusões errôneas.
- Podemos descartar a correlação entre as variáveis embora ela realmente
exista, porque os dados foram insuficientes para mostrá-la;
- Podemos concluir que exista correlação, que na realidade não é significativa,
porque os dados mostraram apenas uma pequena parte do conjunto total,
talvez por acaso a correlação exista.
∙∙
∙ ∙∙
∙
∙
∙ ∙∙ ∙
∙
∙∙
∙
∙
∙ ∙
∙ ∙
∙
∙
∙
∙
∙
∙∙
∙
∙
∙∙ ∙ ∙
∙ ∙
∙
∙ ∙∙
∙∙
∙∙
∙
∙
∙
∙
∙
∙
∙ ∙∙
∙
amostra
∙
∙ ∙
∙
∙
∙
∙
∙∙∙ ∙
Erros comuns que envolvem a correlação
COEFICIENTE DE CORRELAÇÃO
r de SPEARMAN
Dados preferenciais (ordinais) são muito comuns em
áreas de teste de alimentos, eventos competitivos
(concursos de beleza, exibições artísticas, competições
atléticas) e estudos de atitudes
O objetivo do cálculo de um coeficiente de correlação
nesses casos é determinar até que ponto dois conjuntos
de dados ordinais concordam ou discordam
)1(
6
1 2
2
−
−=
∑
nn
d
rsp
n = nº de observações
d = diferença entre os julgamentos ou ordens
COEFICIENTE DE CORRELAÇÃO R DE SPEARMAN (DADOS ORDINAIS)
COEFICIENTE DE CORRELAÇÃO R DE SPEARMAN (DADOS ORDINAIS)
Exemplo: Dois provadores devem julgar 12 vinhos. Cada um atribuirá notas
(ordem) denotando a preferência, desde 1 (mais alta) até 12 (mais baixa).
Vinho preferências diferenças (diferença)2
1 1 3 +2 4
2 5 4 -1 1
3 2 1 -1 1
4 7 5 -2 4
5 4 2 -2 4
6 8 9 +1 1
7 3 7 +4 16
8 6 6 0 0
9 9 8 -1 1
10 12 10 -2 4
11 11 11 0 0
12 10 12 +2 4
totais 0 40
∑d ∑d2
86,0
1716
240
1
)112(12
40*6
1 2
=
−=
−
−=
sp
sp
sp
r
r
r
O resultado indica uma forte correlação entre as
preferências entre os dois juízes, isto é, os julgamentos
são concordantes.
CALCULANDO r
INTERPRETAÇÃO DO COEFICIENTE DE CORRELAÇÃO
-1 0 +1
rsp próximo de -1
os julgamentos
não são
semelhantes, são
discordantes ou
bastante
diferentes
rsp próximo de +1
os julgamentos
são semelhantes,
concordantes
rsp próximo de 0
Sugere
ausência de
relacionamento
entre os dois
conjuntos
O coeficiente de SPEARMAN varia de -1 a +1.

Mais conteúdo relacionado

Mais procurados

Distribuição normal
Distribuição normalDistribuição normal
Distribuição normal
joseagrosa
 
Regressão Linear Simples
Regressão Linear SimplesRegressão Linear Simples
Regressão Linear Simples
monica_lima
 
Teste do Qui quadrado
Teste do Qui quadradoTeste do Qui quadrado
Teste do Qui quadrado
Fabiane Paim
 
Correlacao
CorrelacaoCorrelacao
Correlacao
jon024
 
Aula bioestatistica
Aula bioestatisticaAula bioestatistica
Aula bioestatistica
AleNiv
 
Distribuição Amostral da Média
Distribuição Amostral da MédiaDistribuição Amostral da Média
Distribuição Amostral da Média
Anderson Pinho
 

Mais procurados (20)

Regressao linear
Regressao linearRegressao linear
Regressao linear
 
Pesquisa de marketing online - Aula 1 - Aula de 19/03/2011
Pesquisa de marketing online - Aula 1 - Aula de 19/03/2011Pesquisa de marketing online - Aula 1 - Aula de 19/03/2011
Pesquisa de marketing online - Aula 1 - Aula de 19/03/2011
 
Análise de regressão linear
Análise de regressão linearAnálise de regressão linear
Análise de regressão linear
 
Distribuição normal
Distribuição normalDistribuição normal
Distribuição normal
 
Aula 1 - Bioestatística
Aula 1 - BioestatísticaAula 1 - Bioestatística
Aula 1 - Bioestatística
 
Regressao linear multipla
Regressao linear multiplaRegressao linear multipla
Regressao linear multipla
 
Aula 7 variáveis aleatórias
Aula 7   variáveis aleatóriasAula 7   variáveis aleatórias
Aula 7 variáveis aleatórias
 
Aula 01: Conceitos básicos de Estatística
Aula 01: Conceitos básicos de EstatísticaAula 01: Conceitos básicos de Estatística
Aula 01: Conceitos básicos de Estatística
 
Probabilidade e estatística - Variáveis Aleatórias
Probabilidade e estatística - Variáveis AleatóriasProbabilidade e estatística - Variáveis Aleatórias
Probabilidade e estatística - Variáveis Aleatórias
 
Regressão Linear Simples
Regressão Linear SimplesRegressão Linear Simples
Regressão Linear Simples
 
Teste do Qui quadrado
Teste do Qui quadradoTeste do Qui quadrado
Teste do Qui quadrado
 
Teste de hipóteses - paramétricos
Teste de hipóteses - paramétricosTeste de hipóteses - paramétricos
Teste de hipóteses - paramétricos
 
Correlacao
CorrelacaoCorrelacao
Correlacao
 
Aula bioestatistica
Aula bioestatisticaAula bioestatistica
Aula bioestatistica
 
Distribuição Amostral da Média
Distribuição Amostral da MédiaDistribuição Amostral da Média
Distribuição Amostral da Média
 
Conceitos Básicos de Estatística II
Conceitos Básicos de Estatística IIConceitos Básicos de Estatística II
Conceitos Básicos de Estatística II
 
Estatistica inferencial
Estatistica inferencial Estatistica inferencial
Estatistica inferencial
 
Probabilidade e Estatística - Aula 04
Probabilidade e Estatística - Aula 04Probabilidade e Estatística - Aula 04
Probabilidade e Estatística - Aula 04
 
Aula 1 introdução e estatística descritiva
Aula 1   introdução e  estatística descritivaAula 1   introdução e  estatística descritiva
Aula 1 introdução e estatística descritiva
 
Aula - Inferência Estatística (Estimação)
Aula - Inferência Estatística (Estimação)Aula - Inferência Estatística (Estimação)
Aula - Inferência Estatística (Estimação)
 

Destaque (6)

6 JĖGOS GAMTOJE
6 JĖGOS GAMTOJE6 JĖGOS GAMTOJE
6 JĖGOS GAMTOJE
 
Regressão Multipla - Análise Multivariada
Regressão Multipla - Análise MultivariadaRegressão Multipla - Análise Multivariada
Regressão Multipla - Análise Multivariada
 
Introdução à Análise Estatística Multivariada
Introdução à Análise Estatística MultivariadaIntrodução à Análise Estatística Multivariada
Introdução à Análise Estatística Multivariada
 
Ufal 2015 - estatística e probabilidade - 16 correlação e regressão linear
Ufal   2015 - estatística e probabilidade - 16 correlação e regressão linearUfal   2015 - estatística e probabilidade - 16 correlação e regressão linear
Ufal 2015 - estatística e probabilidade - 16 correlação e regressão linear
 
Análise de correlação
Análise de correlaçãoAnálise de correlação
Análise de correlação
 
Introdução à Regressão Linear Simples e Múltipla
Introdução à Regressão Linear Simples e MúltiplaIntrodução à Regressão Linear Simples e Múltipla
Introdução à Regressão Linear Simples e Múltipla
 

Semelhante a 5.1 correlaoduasvariaveis 1_20151006145332

Apostila de metodos_quantitativos_-_prof._joao_furtado
Apostila de metodos_quantitativos_-_prof._joao_furtadoApostila de metodos_quantitativos_-_prof._joao_furtado
Apostila de metodos_quantitativos_-_prof._joao_furtado
Wannessa Souza
 
AMD - Aula n.º 8 - regressão linear simples.pptx
AMD - Aula n.º 8 - regressão linear simples.pptxAMD - Aula n.º 8 - regressão linear simples.pptx
AMD - Aula n.º 8 - regressão linear simples.pptx
NunoSilva599593
 
Apostila regressao linear
Apostila regressao linearApostila regressao linear
Apostila regressao linear
coelhojmm
 
Coeficiente%20de%20 correla%c3%a7%c3%a3o%20r%c3%b3%20de%20spearman
Coeficiente%20de%20 correla%c3%a7%c3%a3o%20r%c3%b3%20de%20spearmanCoeficiente%20de%20 correla%c3%a7%c3%a3o%20r%c3%b3%20de%20spearman
Coeficiente%20de%20 correla%c3%a7%c3%a3o%20r%c3%b3%20de%20spearman
Wendel Freire
 

Semelhante a 5.1 correlaoduasvariaveis 1_20151006145332 (20)

Apostila de metodos_quantitativos_-_prof._joao_furtado
Apostila de metodos_quantitativos_-_prof._joao_furtadoApostila de metodos_quantitativos_-_prof._joao_furtado
Apostila de metodos_quantitativos_-_prof._joao_furtado
 
Unidade 5 - estastitica
Unidade 5 - estastiticaUnidade 5 - estastitica
Unidade 5 - estastitica
 
Regressao
RegressaoRegressao
Regressao
 
IESB Logística Empresarial - Métodos Quantitativos - Volume III (incompleta)
IESB Logística Empresarial - Métodos Quantitativos - Volume III (incompleta)IESB Logística Empresarial - Métodos Quantitativos - Volume III (incompleta)
IESB Logística Empresarial - Métodos Quantitativos - Volume III (incompleta)
 
Ap 6 Correlação Linear.pdf
Ap 6 Correlação Linear.pdfAp 6 Correlação Linear.pdf
Ap 6 Correlação Linear.pdf
 
Correlação
CorrelaçãoCorrelação
Correlação
 
AMD - Aula n.º 8 - regressão linear simples.pptx
AMD - Aula n.º 8 - regressão linear simples.pptxAMD - Aula n.º 8 - regressão linear simples.pptx
AMD - Aula n.º 8 - regressão linear simples.pptx
 
Aula13-15.pdf
Aula13-15.pdfAula13-15.pdf
Aula13-15.pdf
 
Regressão aula
Regressão aulaRegressão aula
Regressão aula
 
Universidade Privada de Angola bioestatistica.pdf
Universidade Privada de Angola bioestatistica.pdfUniversidade Privada de Angola bioestatistica.pdf
Universidade Privada de Angola bioestatistica.pdf
 
Coeficiente de correlação linear
Coeficiente de correlação linearCoeficiente de correlação linear
Coeficiente de correlação linear
 
Apostila regressao linear
Apostila regressao linearApostila regressao linear
Apostila regressao linear
 
Pesquisa Correlacional
Pesquisa CorrelacionalPesquisa Correlacional
Pesquisa Correlacional
 
Cap 2 gujarati alunos
Cap 2 gujarati   alunosCap 2 gujarati   alunos
Cap 2 gujarati alunos
 
Correlação Estatística
Correlação EstatísticaCorrelação Estatística
Correlação Estatística
 
Correlacao
CorrelacaoCorrelacao
Correlacao
 
Coeficiente%20de%20 correla%c3%a7%c3%a3o%20r%c3%b3%20de%20spearman
Coeficiente%20de%20 correla%c3%a7%c3%a3o%20r%c3%b3%20de%20spearmanCoeficiente%20de%20 correla%c3%a7%c3%a3o%20r%c3%b3%20de%20spearman
Coeficiente%20de%20 correla%c3%a7%c3%a3o%20r%c3%b3%20de%20spearman
 
Proporcionalidade 19032013
Proporcionalidade 19032013Proporcionalidade 19032013
Proporcionalidade 19032013
 
Distribuições bidimensionais animador sociocultural 1
Distribuições bidimensionais animador sociocultural 1Distribuições bidimensionais animador sociocultural 1
Distribuições bidimensionais animador sociocultural 1
 
analise estatistica: Correlacao canonica
analise estatistica: Correlacao canonicaanalise estatistica: Correlacao canonica
analise estatistica: Correlacao canonica
 

Último

pgr programa de gerenciamento de risco posto de gasolina
pgr programa de gerenciamento de risco posto  de gasolinapgr programa de gerenciamento de risco posto  de gasolina
pgr programa de gerenciamento de risco posto de gasolina
mikhaelbaptista
 
SEG NR 18 - SEGURANÇA E SAÚDE O TRABALHO NA INDUSTRIA DA COSTRUÇÃO CIVIL.pptx
SEG NR 18 - SEGURANÇA E SAÚDE O TRABALHO NA INDUSTRIA DA COSTRUÇÃO CIVIL.pptxSEG NR 18 - SEGURANÇA E SAÚDE O TRABALHO NA INDUSTRIA DA COSTRUÇÃO CIVIL.pptx
SEG NR 18 - SEGURANÇA E SAÚDE O TRABALHO NA INDUSTRIA DA COSTRUÇÃO CIVIL.pptx
avaseg
 

Último (8)

Normas Técnicas para aparelho de solda oxi-acetileno.pdf
Normas Técnicas para aparelho de solda oxi-acetileno.pdfNormas Técnicas para aparelho de solda oxi-acetileno.pdf
Normas Técnicas para aparelho de solda oxi-acetileno.pdf
 
ATIVIDADE 1 - FSCE - FORMAÇÃO SOCIOCULTURAL E ÉTICA II - 52_2024.pdf
ATIVIDADE 1 - FSCE - FORMAÇÃO SOCIOCULTURAL E ÉTICA II - 52_2024.pdfATIVIDADE 1 - FSCE - FORMAÇÃO SOCIOCULTURAL E ÉTICA II - 52_2024.pdf
ATIVIDADE 1 - FSCE - FORMAÇÃO SOCIOCULTURAL E ÉTICA II - 52_2024.pdf
 
Planejamento e controle da Produção_Lustosa.pdf
Planejamento e controle da Produção_Lustosa.pdfPlanejamento e controle da Produção_Lustosa.pdf
Planejamento e controle da Produção_Lustosa.pdf
 
ST 2024 Apresentação Comercial - VF.ppsx
ST 2024 Apresentação Comercial - VF.ppsxST 2024 Apresentação Comercial - VF.ppsx
ST 2024 Apresentação Comercial - VF.ppsx
 
pgr programa de gerenciamento de risco posto de gasolina
pgr programa de gerenciamento de risco posto  de gasolinapgr programa de gerenciamento de risco posto  de gasolina
pgr programa de gerenciamento de risco posto de gasolina
 
apostila de eletricidade básica Werther serralheiro
apostila de eletricidade básica Werther serralheiroapostila de eletricidade básica Werther serralheiro
apostila de eletricidade básica Werther serralheiro
 
CONCEITOS BÁSICOS DE CONFIABILIDADE COM EMBASAMENTO DE QUALIDADE
CONCEITOS BÁSICOS DE CONFIABILIDADE COM EMBASAMENTO DE QUALIDADECONCEITOS BÁSICOS DE CONFIABILIDADE COM EMBASAMENTO DE QUALIDADE
CONCEITOS BÁSICOS DE CONFIABILIDADE COM EMBASAMENTO DE QUALIDADE
 
SEG NR 18 - SEGURANÇA E SAÚDE O TRABALHO NA INDUSTRIA DA COSTRUÇÃO CIVIL.pptx
SEG NR 18 - SEGURANÇA E SAÚDE O TRABALHO NA INDUSTRIA DA COSTRUÇÃO CIVIL.pptxSEG NR 18 - SEGURANÇA E SAÚDE O TRABALHO NA INDUSTRIA DA COSTRUÇÃO CIVIL.pptx
SEG NR 18 - SEGURANÇA E SAÚDE O TRABALHO NA INDUSTRIA DA COSTRUÇÃO CIVIL.pptx
 

5.1 correlaoduasvariaveis 1_20151006145332

  • 1. MEDIDAS DE ASSOCIAÇÃO E CORRELAÇÃO
  • 2.  Mostrar a importância dos conceitos de associação e correlação para o entendimentos dos fatos sociais.  Apresentar as medidas de associação e correlação mais utilizadas. OBJETIVOS
  • 3. população amostra uma variável aleatória: ex. peso Estatísticas: média, variância desvio padrão, etc. população amostra duas variáveis aleatórias: peso e altura, etc
  • 4.  Análise de dados estatísticos na engenharia é a busca de relações entre duas variáveis de uma mesma população. CONSIDERAÇÕES
  • 5. Regressão e Correlação são duas técnicas estreitamente relacionadas, que envolvem uma forma de estimação. Correlação: Mede a força e direção de relacionamento (linear) entre duas variáveis. Regressão: Estabelece uma equação que descreve o relacionamento em termos matemáticos. CONCEITOS
  • 6.  Comprimento (variável X) e largura (variável Y) de crânios de pessoas da população;  Altura (variável X) do pai e altura (variável Y) da filha;  Idade (variável X) e a resistência física (variável Y);  Comprimento (variável X) e peso dos ursos (variável Y);  Gastos em publicidade (variável X) e o faturamento da empresa (variável Y); Idade (variável X) e altura (variável Y) das crianças; Tempo de prática de esportes e ritmo cardíaco; Tempo de estudo e nota na prova; Taxa de desemprego e taxa de criminalidade; Expectativa de vida e taxa de analfabetismo. A esta relação é dado o nome de correlação Qual a relação entre:
  • 7. Dados quantitativos - contínuos - discretos Coeficiente de correlação de Pearson Dados qualitativos - ordinais - nominais (categorias) Coeficiente de Spearman Coeficiente de contingência ( qui-quadrado) Coeficientes de correlação COEFICIENTES
  • 8. Relação entre duas ou mais variáveis aleatórias - correlação Gráfico de dispersão Medida de correlação (coeficiente de correlação) + Correlação entre duas variáveis aleatórias Linear (uma reta) Não linear (parábola, exponencial { Estudaremo s apenas a correlação linear Estudaremos apenas correlação de duas variáveis
  • 9. Comprimento X (polegadas) 53,0 67,5 75,0 73,5 68,5 73,0 37,0 Peso Y (libras) 80 344 416 416 262 360 34 Comprimento e peso de ursos machos Os dados acima, casados em conjunto são conhecidos como dados emparelhados ou bivariados ( no mesmo instante); Existe correlação entre duas variáveis quando uma delas está, de alguma forma, relacionada com a outra; A correlação é uma técnica estatística que tem por objetivo investigar se há ou não correlação linear entre duas ou mais variáveis; EXEMPLO
  • 10. Pré requisitos para o estudo de correlação A amostra de dados emparelhados (x, y) deve ser aleatória. Os pares de dados (x, y) deve ter uma distribuição normal bivariada. Os dados devem provir de observações emparelhadas em condições semelhantes  altura e peso de um grupo de crianças, por exemplo, o peso de uma criança deve ser medido e registrado no mesmo instante em que é medida e registrada a altura. PRÉ REQUISITOS
  • 11. CORRELAÇÃO LINEAR  Coeficiente de correlação (produto-momento) de Pearson (r).  O coeficiente de Pearson avalia o quanto duas séries numéricas repousam sobre uma linha reta, indicando assim o grau de sua associação linear.
  • 12. se existe ou não alguma associação (relação) entre as variáveis em estudo; a direção da correlação (como valores de Y aumenta ou diminui em função do aumento ou redução de X) a força da correlação (em que “taxa” os valores de Y aumentam ou diminuem em função de X)  e a natureza da correlação (reta, parábola, exponencial, etc.) y x ... . . . . Não há correlação entre x e y . . . . . . . . .. y x .. Correlação não linear entre x e y ... ..... .... .. ..... . correlação não linear – não será estudado MÉTODO GRÁFICO QUE AJUDA A AVALIAR:
  • 13. y x ......... ... . . . Correlação positiva entre x e y y x ......... ... . .... .. . . . Forte Correlação positiva entre x e y y x Correlação positiva perfeita entre x e y ............ . Correlação positiva: x cresce y cresce x diminui y diminui Correlação linear: uma reta pode ajustar aos dados r = 1 Admite-se r > 0,7 CONSIDERAÇÕES
  • 14. y x .. Correlação negativa entre x e y . . . .. .. .. . y x .. Forte Correlação negativa entre x e y .. .. ... .. .. . . . y x Correlação negativa perfeita entre x e y ......... . ... . Correlação negativa: x cresce y diminui x diminui y cresce Correlação linear: uma reta pode ajustar aos dados r = -1 Admite-se r < - 0,7
  • 15. É conhecido como coeficiente de correlação linear de Pearson ou coeficiente momento- produto de Pearson (em homenagem a Karl Pearson, 1857 – 1936) yx n i ii yx ss n yyxx ss YXCov r . 1 ))(( . ),( 1 − −− == ∑= xi = valores de x yi = valores de y x barra = média dos valores xi y barra = média dos valores yi n = número de pares de dados presentes sx = desvio padrão dos valores xi sy = desvio padrão dos valores yi Cov(x,y) = covariância dos valores de x e y COEFICIENTE DE CORRELAÇÃO LINEAR DE PEARSON R:
  • 16. ∑ ∑∑ ∑ ∑ ∑ ∑ −− − = 2222 )()(*)()( ))(( yynxxn yxxyn r Notação para o coeficiente de correlação linear n representa o número de pares de dados presentes; ∑ denota a adição dos itens indicados; ∑x denota a soma de todos os valores de x; ∑x2 indica que devemos elevar ao quadrado cada valor de x e soma os resultados; (∑x)2 indica que devemos somar os valores de x e elevar o total ao quadrado. Não confundir ∑x2 com (∑x)2 ; ∑xy indicar que devemos multiplicar cada valor de x pelo valor correspondente de y e somar então todos esses produtos r representa o coeficiente de correlação linear para uma amostra ρ representa o coeficiente de correlação linear para uma população Arredondamento no meios dos cálculos pode causar erros sérios. Use a memória de sua calculadora para armazenar os resultados intermediários, fazendo o arredondamento somente no final. Cálculo do coeficiente de correlação linear
  • 18. -1 0 +1 r = -1 há correlação linear negativa perfeita entre as variáveis x e y. r = +1 há correlação linear positiva perfeita entre as variáveis x e y. r =0 não há correlação linear entre as variáveis x e y. O coeficiente de PEARSON varia de -1 a +1. INTERPRETAÇÃO DO COEFICIENTE DE CORRELAÇÃO
  • 19. Exemplo: Calcule o coeficiente de correlação linear para os dados emparelhados de pesos e comprimentos dos ursos. Comprimento X (polegadas) 53,0 67,5 72,0 72,0 73,5 68,5 73,0 37,0 Peso Y (libras) 80 344 416 348 262 360 332 34 Comprimento (in) peso (lb) x y x.y x2 y2 53,0 80 4240 2809,00 6400 67,5 344 23220 4556,25 118336 72,0 416 29952 5184,00 173056 72,0 348 25056 5184,00 121104 73,5 262 19257 5402,25 68644 68,5 360 24660 4692,25 129600 73,0 332 24236 5329,00 110224 37,0 34 1258 1369,00 1156 total 516,5 2176 151879 34525,75 728520 ∑x ∑y ∑xy ∑x2 ∑y2
  • 20. 897,0 897,0 109318475,9433 91128 )2176)728520(8)5,516()75,34525(8 )2176)(5,516()151879(8 22 = == −− − = r r r O resultado indica uma forte e positiva (próximo de 1) correlação entre o peso e o comprimento dos Ursos. CALCULANDO r
  • 21. Gráfico de Dispersão 0 200 400 600 30 40 50 60 70 80 comprimento dos ursos pesodosursosREPRESENTAÇÃO GRÁFICA
  • 22. Avalie a correlação entre as médias de 15 estudantes no 2º grau (ensino médio), relacionando com os índices dos mesmos estudantes no seus cursos universitários. As médias no 2º grau podem variar de 0 a 100, e os índices universitários de 0 a 4. Construa o diagrama de dispersão e calcule o coeficiente de correlação de Pearson. Média no 2º grau Índice na Universidade Média no 2º grau Índice na Universidade 80 1,0 90 3,1 82 1,0 91 2,4 84 2,1 91 2,7 85 1,4 92 3,0 87 2,1 94 3,9 88 1,7 96 3,6 88 2,0 98 4,0 89 3,5 EXEMPLO
  • 23. Média no 2º grau X Índice na Universidade Y X2 Y2 XY 80,0 1,0 6400 1,0 80,0 82,0 1,0 6724 1,0 82,0 81,0 2,1 7056 4,41 176,4 85,0 1,4 7225 1,96 119,0 87,0 2,1 7569 4,41 182,7 88,0 1,7 7744 2,89 149,6 88,0 2,0 7744 4,0 176,0 89,0 3,5 7921 12,25 311,5 90,0 3,1 8100 9,61 279,0 91,0 2,4 8281 5,76 218,4 91,0 2,7 8281 7,29 245,7 92,0 3,0 8464 9,0 276,0 94,0 3,9 8836 15,21 366,6 96,0 3,6 9216 12,96 345,6 98,0 4,0 9604 16,0 392,0 1335,0 37,5 119165,0 107,8 3400,5 ∑x ∑y ∑x2 ∑y2 ∑xy
  • 24. 9,0 )8,37()8,107.(15.)1335()119165.(15 )50,37).(91335()5,3400.(15 )()(.)()( ))(( 22 2222 = −− − = −− − = ∑ ∑∑ ∑ ∑ ∑ ∑ r r yynxxn yxxyn r 1335,0 37,5 119165,0 107,8 3400,5 ∑x ∑y ∑x2 ∑y2 ∑xy O resultado indica uma forte e positiva (próximo de 1) correlação entre as médias do 2º grau e os índices na Universidade.
  • 25. Gráfico de dispersão 0 1 2 3 4 5 60 70 80 90 100 110 Médias do 2ºgrau Índicesna Universidade REPRESENTAÇÃO GRÁFICA
  • 26. Quando se constatam correlações entre variáveis, podem ocorrer resultados interessantes, surpreendentes e úteis. Vários estudos científicos sugerem a existência de uma correlação entre a exposição a campos eletromagnéticos e a incidência de câncer. Os epidemiologistas do Instituto Korolisnka da Suécia pesquisaram 500.000 suecos que viviam a 300 metros de uma linha de alta tensão, por um período de 25 anos, e constataram que as crianças apresentavam maior incidência de leucemia. Essas conclusões levaram o governo da Suécia a elaborar regulamentos que reduzissem o número de residências nas proximidades das linhas de energia de alta tensão. Em um artigo sobre esse estudo, a revista “Times” escreveu: “Embora a pesquisa não prove a relação de causa e efeito, mostra uma correlação indiscutível entre o grau de exposição e o risco de leucemia infantil”. Interessante CORRELAÇÃO ENTRE LINHAS DE ENERGIA E CÂNCER
  • 27. 1 – o valor de r está sempre entre -1 e 1. Isto é -1≤ r ≤ 1. 2 – o valor de r não varia se todos os valores de qualquer uma das variáveis são convertidos para uma escala diferente. Por exemplo, se os pesos dos ursos são dados em quilogramas em vez de libras, o valor de r não se modificará. 3 – o valor de r não é afetado pela escolha de x ou y. Permutando todos os valores de x e y, r permanecerá inalterado. 4 – r mede a intensidade, ou grau, de um relacionamento linear. Não se serve para medir a intensidade de um relacionamento não-linear. PROPRIEDADES DO COEFICIENTE DE CORRELAÇÃO LINEAR R
  • 28. 1 – Devemos evitar a conclusão de que a correlação implica a causalidade. Um estudo mostrou uma correlação entre os salários dos professores de estatística e o consumo individual de cerveja; mas essas duas variáveis são afetadas pelas condições econômicas, uma terceira variável oculta. (Defini-se formalmente uma variável oculta como uma variável que afeta as variáveis em estudo, mas não está incluída no estudo.) 2 – Surge outra fonte potencial de erros quando os dados são baseados em taxas ou médias. Quando utilizamos taxas ou médias para os dados, suprimimos a variação entre os indivíduos ou elementos, e isto pode levar a um coeficiente de correlação inflacionado.Um estudo acusou um coeficiente de correlação linear de 0,4 para dados emparelhados relativos a renda e educação entre indivíduos, mas aquele coeficiente passou para 0,7 quando foram consideradas médias regionais. 3 – Um terceiro erro diz respeito à propriedade de linearidade. A conclusão de que não há correlação linear significativa, não quer dizer que x e y não estejam correlacionados de alguma forma. Pode ocorrer casos onde r = 0 indicando ausência total de correlação linear entre as duas variáveis, mas elas podem estar fortemente relacionados por uma correlação não-linear. ERROS COMUNS QUE ENVOLVEM A CORRELAÇÃO
  • 29. 4 - Quantidade insuficiente de dados podem levar a conclusões errôneas. - Podemos descartar a correlação entre as variáveis embora ela realmente exista, porque os dados foram insuficientes para mostrá-la; - Podemos concluir que exista correlação, que na realidade não é significativa, porque os dados mostraram apenas uma pequena parte do conjunto total, talvez por acaso a correlação exista. ∙∙ ∙ ∙∙ ∙ ∙ ∙ ∙∙ ∙ ∙ ∙∙ ∙ ∙ ∙ ∙ ∙ ∙ ∙ ∙ ∙ ∙ ∙ ∙∙ ∙ ∙ ∙∙ ∙ ∙ ∙ ∙ ∙ ∙ ∙∙ ∙∙ ∙∙ ∙ ∙ ∙ ∙ ∙ ∙ ∙ ∙∙ ∙ amostra ∙ ∙ ∙ ∙ ∙ ∙ ∙ ∙∙∙ ∙ Erros comuns que envolvem a correlação
  • 31. Dados preferenciais (ordinais) são muito comuns em áreas de teste de alimentos, eventos competitivos (concursos de beleza, exibições artísticas, competições atléticas) e estudos de atitudes O objetivo do cálculo de um coeficiente de correlação nesses casos é determinar até que ponto dois conjuntos de dados ordinais concordam ou discordam )1( 6 1 2 2 − −= ∑ nn d rsp n = nº de observações d = diferença entre os julgamentos ou ordens COEFICIENTE DE CORRELAÇÃO R DE SPEARMAN (DADOS ORDINAIS)
  • 32. COEFICIENTE DE CORRELAÇÃO R DE SPEARMAN (DADOS ORDINAIS) Exemplo: Dois provadores devem julgar 12 vinhos. Cada um atribuirá notas (ordem) denotando a preferência, desde 1 (mais alta) até 12 (mais baixa). Vinho preferências diferenças (diferença)2 1 1 3 +2 4 2 5 4 -1 1 3 2 1 -1 1 4 7 5 -2 4 5 4 2 -2 4 6 8 9 +1 1 7 3 7 +4 16 8 6 6 0 0 9 9 8 -1 1 10 12 10 -2 4 11 11 11 0 0 12 10 12 +2 4 totais 0 40 ∑d ∑d2
  • 33. 86,0 1716 240 1 )112(12 40*6 1 2 = −= − −= sp sp sp r r r O resultado indica uma forte correlação entre as preferências entre os dois juízes, isto é, os julgamentos são concordantes. CALCULANDO r
  • 34. INTERPRETAÇÃO DO COEFICIENTE DE CORRELAÇÃO -1 0 +1 rsp próximo de -1 os julgamentos não são semelhantes, são discordantes ou bastante diferentes rsp próximo de +1 os julgamentos são semelhantes, concordantes rsp próximo de 0 Sugere ausência de relacionamento entre os dois conjuntos O coeficiente de SPEARMAN varia de -1 a +1.