O documento discute a distribuição t de Student e como comparar médias de duas amostras. A distribuição t de Student é usada quando a variância populacional é desconhecida e a amostra é pequena. Para comparar médias, testes t podem ser usados para dados emparelhados ou não emparelhados, dependendo de como as amostras foram coletadas. Vários exemplos ilustram como aplicar os testes t para testar hipóteses.
1. Distribuição t de Student
A variável Z = tem distribuição normal.
Quando a variância é desconhecida,
usamos como estimador de .
= - )2 e = =
A variável = deixa de ter distribuição
normal. A distribuição desta variável é
denominada t de Student. É uma variável
simétrica com média 0 (mais achatada que
a curva normal). Para amostras grandes (n
> 30 costuma-se aproximar pela normal.
Podemos notar que esta estatística tem n-1
grau de liberdade → pode ser representada
por .
Dado que = A variável pode ser
escrita (multiplicando e dividindo por σ) :
2. = = . =z
Exemplos
1. De uma população normal com
parâmetros desconhecidos, retirou-se
uma amostra de 25 elementos para se
estimar , obtendo-se = 15 e = 36.
Determinar um IC para a média ao nível
de 5%.
2. A vida média das lâmpadas elétricas
produzidas por uma empresa era de
1120 horas. Uma amostra de 8
lâmpadas extraída recentemente
apresentou a vida média de 1070 horas,
com desvio padrão de 125h e
distribuição normal para a vida útil.
Testar a hipótese de que a vida média
das lâmpadas não se alterou ao nível
de 1%.
3. 3. Querendo determinar o peso médio
de nicotina dos cigarros de sua
produção, um fabricante recolheu uma
amostra de 25 cigarros obtendo
2
= 950mg e = 36106 mg2
Supondo a distribuição normal para o
peso de nicotina, construir um IC para
ao nível de 5%. Ao mesmo nível, testar
se o peso médio de nicotina é inferior a
40 mg.
4. Uma máquina é projetada para fazer
esferas de aço de 1cm de raio. Uma
amostra de 10 esferas é produzida e
tem o raio médio de 1,004cm, com
s=0,003. Há razões para suspeitar que
a máquina esteja produzindo esferas
com raio maior que 1cm, ao nível de
10%?
4. Comparação de Duas Médias
Dois casos:
1. Dados emparelhados;
2. Dados não emparelhados.
Dados emparelhados acontecem quando
os resultados de duas amostras são
relacionados dois a dois. (ex: pesos de
pacientes antes e depois de uma dieta;
notas dos alunos no ENEM antes e depois
de fazerem um curso especial, etc.)
Os testes que poderemos fazer:
: μ1 - μ2 = μd = 0
: μd > 0 ou μd < 0 ou μd ≠
5. Assumindo:
: média da amostra das diferenças
μd : valor das diferenças entre médias
sd : desvio padrão da amostra das
diferenças
n : tamanho da amostra das diferenças
Usamos:
onde =
Exemplo:
Um grupo de 10 pessoas é submetido a um
tipo de dieta por 10 dias, estando os pesos
do início e do final da dieta marcados na
tabela abaixo. Ao nível de 5%, podemos
concluir que houve diminuição do peso
médio pela aplicação da dieta?
6. Pessoas xi yi di di2
A 120 116 4 16
B 104 102 2 4
C 93 90 3 9
D 87 83 4 16
E 85 86 -1 1
F 98 97 1 1
G 102 98 4 16
H 106 108 -2 4
I 88 82 6 36
J 90 85 5 25
26 128
Dados Não Emparelhados
Se os dados não são emparelhados, não
calcularemos diferenças entre os
respectivos valores de duas amostras. O
teste será baseado na diferença entre as
duas médias das amostras ( - ). Neste
caso as amostras podem ter tamanhos
diferentes (n1≠n2). Três casos: 1)variâncias
7. conhecidas; 2)variâncias desconhecidas e
iguais; 3)variâncias desconhecidas e
diferentes.
1o caso:
H0 : μ1 – μ2 = Δ
μ( - ) = μ( ) - μ( ) = μ1 – μ2 = Δ
sabemos que
σ2( ) = e σ2( )= e
σ2( - )= + →
σ( - )=
z= se = = σ2 →
z=
8. Exemplos: De duas populações normais X1
e X2 com variâncias 25, levantou-se duas
amostras de tamanho n1=9 e n2=16,
obtendo-se:
= 27 e = 32
Ao nível de 10%, testar as hipóteses:
: μ1 - μ2 = 0
: μ1 - μ2 ≠
2ocaso(variâncias desconhecidas e
iguais):
= = .
Para determinarmos usaremos
Que é uma média ponderada das variáveis
amostrais
9. Se σ fosse conhecido, testaríamos usando
z=
Como não temos σ devemos usar o de
Student relacionado com o . O grau de
liberdade deste é de .
Da relação vista na definição do :
= = . = →
= = .
O teste será realizado através da
estatística
=
10. Exemplo: 1)As medições de resistência de
dois tipos de concreto resultaram:
a)concreto tipo A: 54, 55, 58, 51, 57;
b)concreto tipo B: 50, 54, 56, 52, 53. Ao
nível de 5% de significância há evidencia
de que o concreto A seja mais resistente
que o concreto B?
2)Um supermercado não sabe se deve
comprar lâmpadas da marca A ou B, de
mesmo preço. Testa uma amostra de 100
lâmpadas de cada marca obtendo;
= 1160h e SA = 90h
= 1140h e SB = 80h
Ao nível de 2,5%, testar a hipótese de que
as marcas serem igualmente boas contra a
hipótese de as da marca A serem melhores
que as da marca B.
11. 3ocaso(variâncias desconhecidas e
diferentes):
Se as amostras forem suficientemente
grandes, uma aproximação razoável pode
ser obtida simplesmente substituindo-se as
variâncias das populações pelas suas
estimativas e resultando na
estatística = com grau de
liberdade = –
Onde = e =
Exemplo:
Deseja-se saber se duas máquinas de
empacotar café fornecem o mesmo peso
médio por pacote. Como uma máquina é
mais nova que outra, pode-se supor que as
12. suas variabilidades sejam distintas. As
amostras disponíveis resultaram em:
Máquina nova:
0,82; 0,83; 0,79; 0,81; 0,81; 0,80
Máquina velha:
0,79; 0,82; 0,73; 0,74; 0,80; 0,77; 0,75;
0,84; 0,78. Qual a conclusão ao nível 5%
de significância?
Problemas:
1)Uma turma de 10 alunos é separada dos
demais para ser testada. Aplica-se uma
prova de matemática e as notas são: 4,5;
5,0; 5,5; 6,0; 3,5; 4,0; 5,0; 6,5; 7,0; 8,0. Um
novo método de ensino é introduzido, e a
turma é re-testada numa prova de mesma
dificuldade e as novas notas são: 5,0; 5,0;
6,0; 7,0; 3,0; 4,5; 4,0; 7,0; 7,5; 9,0. Há
13. razões para crer que o novo processo
aumentou o nível de aprendizagem a 5%?
2)Duas amostras de 10 alunos de duas
turmas distintas de um mesmo curso
apresentam as seguintes notas numa
prova.
X1: 51; 47; 75; 35; 72; 84; 45; 11; 52; 57.
X2: 27; 75; 49; 69;73; 63; 79; 37; 84; 32.
Ao nível de 10%, testar as hipóteses de
que as turmas tenham aproveitamentos
diferentes. Admitir populações normais com
mesma variância.
3)Duas amostras de 10 elementos
forneceram respectivamente:
= 29,5 = 5,24
= 31,2 = 3,90
14. Testar a hipótese de que a primeira
amostra provenha de uma população cuja
média seja inferior à da segunda, ao nível
de 5%.