1) UMA REVISÃO SOBRE GRÁFICOS E TABELAS E SUAS APLICAÇÕES PARA APRESENTAÇÃO DE DADOS ESTATÍSTICOS. 2) AS TABELAS DE FREQUÊNCIA SÃO IMPORTANTES PARA ORGANIZAR E RESUMIR DADOS. 3) HÁ DIFERENTES TIPOS DE VARÍAVEIS QUE PODEM SER APRESENTADAS EM TABELAS, COMO QUALITATIVAS E QUANTITATIVAS.
2.
Medidas de tendência central e dispersão
Variáveis contínuas: distribuição normal
Amostra
Variabilidade amostral
3. Categóricas
(ou qualitativas)
Dicotômicas
“CONTAGENS”
Nº filhos, anos
de estudo...
Sexo, raça, Politômicas
estado civil,
religião...
Nominais
(ordem não importa)
Ordinais
(tem uma ordem lógica)
Numéricas
(ou quantitativas)
“MEDIDAS”
Peso, altura,
Discretas
(números inteiros) pressão.
Renda
familiar (R$)
Contínuas
(aceitam decimais)
NSE, IMC categ,
avaliação
qualitativa...
4. Categórica
(ou qualitativa)
Medidas de ocorrência
FREQUÊNCIA ou
PORCENTAGEM
Incidência
Prevalência
Odds
Medida de precisão
INTERVALO DE CONFIANÇA
Numérica
(ou quantitativa)
Medidas tendência central
MODA
MÉDIA
MEDIANA
Medidas de dispersão
AMPLITUDE
VARIÂNCIA
DESVIO PADRÃO
ERRO PADRÃO
5.
Descrição de uma variável qualitativas ou
categóricas
Dicotômicas ou binárias
Politômicas
Cálculo de proporções
Divisão de um número
numerador está contido
denominador
por outro, onde o
(é subconjunto) no
Exemplo: Desnutrição: sim /não
Em 100 crianças, 20 estão desnutridas (20%)
6. Dados da coorte de nascimentos de 2004. Pelotas, RS (n=6000)
Número
Peso ao nascer
(g)
Número de
gravidez
1
750
1
2
1500
3
3
1520
2
4
2450
4
5
1790
1
6
3000
2
7
1930
2
.....
.....
...
5999
3510
1
6000
2900
1
7.
Descrição de uma variável numérica
Tabela que mostra um número de
observações ou valores dentro de certos
intervalos
8. Número de gravidezes das mães da coorte de 2004. Pelotas, RS
(n=6000)
Número de gravidez
Frequência (n)
%
1
2092
34,9
2
1644
27,4
3
970
16,1
4
544
9,1
5
282
4,7
6
168
2,8
7
105
1,8
8
69
1,2
9
48
0,8
10
39
0,7
11
20
0,3
12
11
0,1
13
8
0,1
9. Número de gravidez das mães da coorte de 2004. Pelotas, RS
(n=6000)
Número de gravidezes
Frequência (n)
%
1
2092
34,9
2
1644
27,4
3
970
16,1
≥4
1294
21,6
10. Peso ao nascer das crianças da coorte de 2004. Pelotas, RS (n=4555)
Peso ao nascer (gramas)
Frequência
%
<1000
52
1,1
1000-1499
43
0,9
1500-1999
98
2,2
2000-2499
305
6,7
2500-2999
1112
24,4
3000-3499
1747
38,3
3500-3999
976
21,5
222
4,9
4000
11.
... mas para variáveis contínuas queremos
descrever os dados de forma ainda mais
sucinta!
◦ Medidas de tendência central
◦ Medidas de posição
◦ Medidas de dispersão
12. MEDIDAS DE
TENDÊNCIA CENTRAL
MEDIDAS DE
POSIÇÃO
MÉDIA
MEDIANA
MODA
MEDIDAS DE
POSIÇÃO
MEDIDAS DE DISPERSÃO
TERCIL
QUARTIL
QUINTIL
DECIL
PERCENTIL
AMPLITUDE
INTERVALO
INTERQUARTIL
VARIÂNCIA
DESVIO PADRÃO
13.
Utilizadas para variáveis:
◦ Quantitativas ou numéricas
Discreta
Contínua
São valores calculados com o objetivo de
descrever os dados de forma ainda mais
resumida do que usando uma tabela
15.
Média
n
xi
x
i 1
n
◦ xi: valor de cada indivíduo
◦ ∑: somatória
◦ n: total de indivíduos
Vantagem:
Utiliza TODOS os
valores da
distribuição
Desvantagem:
É influenciada por
valores extremos
16.
Moda
◦ Valor que mais se repete na amostra (na
distribuição)
1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 4, 8, 9, 9
Moda: 2
◦ Quando mais de um valor se repete o mesmo
número de vezes BIMODAL
17.
Mediana
Valor que divide a distribuição ao meio
1º passo: ordenar os dados de menor a maior
2º passo: ver qual valor ocupa o “meio” da
distribuição
Se...
Número ímpar de dados: valor do meio
1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 4, 8, 9, 9
Número par de dados: média dos dois do meio
1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 8, 9, 9
Fórmula:
(n + 1)/2
18.
Semelhantes para distribuições simétricas:
Peso ao nascer
◦ Média: 3131 g
◦ Mediana: 3180 g
Distantes para distribuições assimétricas:
Renda familiar
◦ Média: R$ 791
◦ Mediana: R$ 500
22.
Percentis (dividem os dados em 100 partes
iguais)
◦ Percentil 10, percentil 50, percentil 99...
Quartis
◦ Primeiro, segundo, terceiro, quarto quartil
Quintil
◦ Primeiro, segundo, terceiro, quarto, quinto quintil
23. . su peson,d
peso ao nascer em gramas
------------------------------------------------------------Percentiles
Smallest
1%
1950
1100
5%
2340
1490
10%
2570
1550
Obs
962
25%
2870
1570
Sum of Wgt.
962
50%
75%
90%
95%
99%
3180
3510
3830
4050
4450
Largest
4690
4700
4700
4880
Mean
Std. Dev.
3200.639
511.0475
Variance
Skewness
Kurtosis
261169.5
-.1061833
3.579037
24.
Várias maneiras de medir a dispersão
◦
◦
◦
◦
Amplitude (maior - menor)
Amplitude interquartil (p75 - p25)
Variância
Desvio padrão
25.
Amplitude
◦ Valor maior – valor menor
◦ Apenas considera os valores extremos
◦ Ex: 5 medidas de glicemia em mmol/l
80; 85; 88; 90; 500
Amplitude: 500-80=480
◦ Medidas que se distanciam muito das demais
influenciam muito a amplitude
26.
Amplitude interquartil
◦ Percentil 75 – percentil 25
◦ Considera apenas a parte central dos valores de
um conjunto de dados
◦ Joga fora os valores mais altos e os mais baixos
Não influenciada pelos valores discrepantes
27.
Variância (S2)
◦ Boas propriedades estatísticas
◦ Usa todas as observações
◦ É uma medida dos “desvios” (ao quadrado) de
cada observação em relação à média
Pq ao quadrado?
Unidade de medida ao quadrado difícil interpretação
28.
Desvio padrão (S)
◦ É a raiz quadrada da variância
◦ Quanto mais próximos os valores individuais
estiverem de sua média, < a dispersão e < o
desvio-padrão
◦ Muito útil para distribuições dos dados
aproximadamente normais
29.
Ou Gaussiana
Simétrica
Forma de “sino”
É uma distribuição contínua
Descreve bem fenômenos biológicos
Percentagem
18
16
14
12
10
8
6
4
S td . D e v = 5 5 7 .3 8
2
M ean = 31 52
N
0
600
1 40 0
1000
2200
1800
3 00 0
26 0 0
3800
3 4 00
Peso ao nascer
4 60 0
4200
5400
5 0 00
= 5 2 5 8 .0 0
30.
31. 1) UMA REVISÂO SOBRE GRÀFICOS E TABELAS E SUAS
APLICAÇÔES.
32. População (universo) = conjunto de todos os
possíveis valores de uma variável ou
característica.
• Amostra = conjunto de observações extraída
de uma população.
•
33. Em Estatística, variável é atribuição de um número a
cada característica da unidade experimental de uma
amostra ou população.
Vários tipos de variáveis são encontradas no dia-a-dia,
sendo importante a distinção entre as mesmas.
Quando uma característica ou variável é não-numérica,
denomina-se variável qualitativa ou atributo.
34. Exemplos de variável qualitativa
a) Sexo
b) Religião
c) Cor de olhos
d) Faixa etária
Uma variável qualitativa é expressa em categorias
35. Quando a variável é expressa numericamente, denomina-se
variável quantitativa.
Exemplos de variável quantitativa
a) Peso dos órgãos
b) Idade
c) Número de filhos
d) Altura
Uma variável quantitativa pode ser discreta ou contínua.
36.
37. Uma etapa importante no trabalho científico é a
divulgação à comunidade dos resultados obtidos.
É assim que a contribuição do trabalho ao
patrimônio científico da humanidade é colocada
à disposição de todos. Essa divulgação é feita
principalmente
em
revistas
científicas
especializadas de circulação nacional e
internacional e obedece a certos padrões na sua
apresentação.
38. Durante os cursos de graduação e pós-graduação (não
importa a carreira escolhida), muitos, provavelmente,
terão alguma bolsa de pesquisa, farão algum estágio e
principalmente publicarão trabalhos em revistas
científicas. Tais atividades requerem do aluno a
apresentação de seu trabalho (resultados) de forma
compatível com os padrões acadêmicos nacionais e
internacionais. Além disso, na atividade profissional de
cada um, certamente haverá a necessidade de apresentar
relatórios, projetos e estudos desenvolvidos para seus
clientes.
39. Conteúdo de hoje:
• Tabelas de Frequência;
• Gráficos;
•Exercícios de Fixação valendo nota.
40. Os dados são registrados em fichas, com várias informações.
Para obter apenas os dados é preciso fazer uma apuração.
Variável qualitativa – apuração é a simples contagem
Exemplo: número de nascidos vivos para cada sexo
Variável quantitativa – anotar cada valor observado
Exemplo: número do prontuário e peso ao nascer
41. Após a apuração, há necessidade dos dados serem dispostos de
uma forma ordenada, quando possível, e resumida, a fim de
auxiliar o pesquisador na sua análise e facilitar a compreensão
das conclusões apresentadas ao leitor. Os dados podem estão
serem apresentados na forma de tabelas estatísticas. Essas
devem ser auto-suficientes, isto é, devem ter significado próprio,
de modo a prescindir, quando isoladas, de consultas ao texto.
Uma tabela estatística deve conter o número, o título, o corpo e
o rodapé (fonte, notas e notas específicas).
42. Componentes mais importantes de uma tabela:
Título – explica o que a tabela contém
Corpo – formado pelo cabeçalho, pela coluna indicadora e pelas linhas e
colunas de dados:
Cabeçalho – especifica o conteúdo das colunas
Coluna indicadora – especifica o conteúdo das linhas
44. Tabela de contingência: os elementos da amostra ou
população são classificados de acordo com dois ou mais
fatores (diferentes anos de arrecadação).
52. Como definir o número de classes?
- poucas: perde-se muita informação
- muitas: pode-se ter pormenores desnecessários
O número adequado de classes é definido pelo
pesquisador.
Na escolha, é conveniente usar extremos de classes fáceis
de trabalhar.
53. Exemplo - Tabela de variáveis contínuas
Informações sobre peso de recém-nascidos medidos
ao longo de um ano. Como fazer uma tabela com essa
informação?
1)Definir as faixas de pesos (classes)
1,0 – 1,5
1,5 – 2,0
2,0 – 2,5
2,5 – 3,0
3,0 – 3,5
3,5 – 4,0
4,0 – 4,5
4,5 – 5,0
Intervalo de classe: 0,5 kg
(escolha pessoal)
54. 2) Contar quantos dados existem em cada classe
1,0 |– 1,5 --->
1
1,5 |– 2,0 --->
3
2,0 |– 2,5 --->
16
2,5 |– 3,0 ---> 31
3,0 |– 3,5 ---> 34
3,5 |– 4,0 ---> 11
4,0 |– 4,5 ---> 4
4,5 |– 5,0 ---> 2
extremos de classe:
valores limites dos intervalos
de classe
podem pertencer ou não à
classe
1,5
fechado
(pertence)
2,0
aberto
(não pertence)
55. 3) Determinar o Ponto médio de cada classe: a metade de cada
intervalo considerado. PM1= (1,5 + 2,0)/2 = 1,75.
4) Somar a freqüência total das classes e determinar a freqüência
relativa fR(i)= f(i)/ftotal
Tabela 01 – Peso de Recém-nascidos*
Peso (kg)
f(i)
fR
1,25
1
1%
1,75
2
2%
2,25
16
16%
2,75
31
31%
3,25
34
34%
3,75
11
11%
4,25
4
4%
5,25
1
1%
Total
100
100%
* Medido até 5 horas do nascimento
56. Gráfico que fornece os intervalos de classe ao longo do eixo
horizontal e as frequências (absolutas ou relativas) no eixo
vertical.
Peso de Recém-nascidos
40
35
freq
Frequência
30
25
20
15
10
5
0
1 1,25
1,75 2
2,25
2,75 3 3,25
3,75 4
Peso (Kg)
4,25
4,75 5
5,25
59.
Neste tipo de gráfico considera-se apenas
uma variável, devendo-se tomar cuidado
com a quantidade de categorias a
representar, afim de não prejudicar a
visualização do gráfico.
60.
Tabelas:
◦ São convenientes quando há necessidade ou
relevância em explicitar todos os valores.
◦ Quando
deseja-se
que
os
parâmetros
apresentados sejam conhecidos para fins de
aplicação, reprodução etc.
◦ Quando a comparação entre diferentes colunas
de uma mesma linha não correlacionam-se,
diretamente, com as demais linhas da tabela.
Exemplo de tabela
61.
Gráficos:
◦ Para um grande número de dados, quando não
há relevância na apresentação dos valores, é mais
conveniente agrupar os dados e, se possível,
grafa-los diretamente. Caso contrário, pode-se
gerar uma nova tabela (enxugada).
◦ Quando
deseja-se
avaliar
o
comportamento,tendências ou a relação entre
duas colunas de uma tabela.
◦ Comparar duas ou mais colunas em relação a
uma determinada variável. Neste caso, a
apresentação em um único gráfico permite uma
rápida comparação.
62.
Cabeçalhos de tabelas devem ser curtos para evitar
colunas com largura desproporcional aos seus dados.
Em tais casos, é conveniente a criação de uma legenda
logo abaixo da tabela. O tamanho efetivo da tabela pode
neste caso ser bastante reduzido.
Quando há muitas linhas numa tabela, e a largura entre
elas é estreita, convém separar com traços para evitar a
descontinuidade do leitor ao comparar diferentes
colunas de uma mesma linha.
O uso de continuidade de colunas deve ser avaliado
quando principalmente há espaços suficientes para que
todas as diferentes colunas da tabela sejam repetidas
em cada linha.
Tabelas
envolvendo
matrizes
simétricas
podem
dispensar repetições de valores e, conseqüentemente,
economizar a metade do espaço.
63. Alguns pontos devem ser respeitados na construção de um gráfico,
a saber:
deve propiciar uma visualização rápida do fenômeno e para
isso, conter apenas o essencial para sua execução;
o tamanho deve ser adequado à sua publicação em
trabalhos técnico-científicos, revistas, periódicos, cartazes
ou livros;
deve sempre ter um título e a fonte dos dados originais e,
se necessário, números e notas explicativas;
deve ser construído em uma escala que não desfigure os
fatos ou as relações que se deseja destacar;
atenção ao comparar diferentes gráficos - verificar a
possibilidade de manter as escalas na mesma proporção;
64. 2) (FUVEST) Sabe-se que a média aritmética de 5 números inteiros distintos, estritamente
positivos, é 16. O maior valor que um desses inteiros pode assumir é:
a) 16
b) 20
c) 50
d) 70
e) 100
RESPOSTA: D
3) O time de futebol do Cruzeiro de Minas Gerai, fez 6 partidas amistosas, obtendo os
seguintes resultados, 4 x 2, 4 x 3, 2 x 5, 6 x 0, 5 x 3, 2 x 0. Qual a média de gols marcados
nestes amistoso?
X = 4+4+2+6+5+2/ 6 = 3,8
4) 1. Um colégio resolveu inovar a forma de calcular a média final de seu alunos.
1º bimestre teve peso 2.
2º bimestre teve peso 2.
3 bimestre teve peso 3.
4 bimestre teve peso 3.
Vamos calcular a média anual de Ricardo que obteve as seguintes notas em historia. 1 bim =
3, 2 bim = 2,5, 3 bim = 3,5 e 4 bim = 3
65.
66. Classifique as variáveis abaixo em qualitativas ou quantitativas
(discretas ou contínuas):
a)
b)
c)
d)
População: Estação meteorológica de uma cidade.
Variável: precipitação pluviométrica, durante o ano.
Resp.: Quantitativa contínua
P: Alunos de uma cidade.
V: Cor dos olhos.
Resp.: Qualitativa
P: Bolsa de valores de São Paulo.
V: Número de ações negociadas.
Resp.: Quantitativa discreta
P: Funcionários de uma empresa.
V: Salários.
Resp.: Quantitativa discreta
67. Exercícios:
Faça a distribuição dos dados abaixo:
a) Sendo limite inferior 30 e 10 para intervalo de classe:
84
68
33
52
47
73
68
61
73
77
74
71
81
91
65
55
57
35
85
88
59
80
41
50
53
65
76
85
73
60
67
41
78
56
94
35
45
55
64
74
65
94
66
48
39
69
89
98
42
54
68. b) Os resultados obtidos pelo lançamento de um dado 50 vezes foram
os seguintes:
6
5
2
6
4
3
6
2
6
5
1
6
3
3
5
1
3
6
3
4
5
4
3
1
3
5
4
4
2
6
2
2
5
2
5
1
3
6
5
1
5
6
2
4
6
1
5
2
4
3
71. MÉDIA ARITMÉTICA
Dados Agrupados: Sem intervalo de classes
Idade (xi)
fi
fi.xi
0
1
2
3
4
2
6
10
12
4
Σ = 34
0
6
20
36
16
Σ fi.xi = 78
Fórmula:
X = Σ fixi
Σ fi
X = 2,29
72. MÉDIA ARITMÉTICA
Dados Agrupados: Com intervalo de classes
i
Estaturas
(cm)
fi
xi
fi.xi
1
2
3
4
5
6
150 ? 154
154 ? 158
158 ? 162
162 ? 166
166 ? 170
170 ? 174
4
9
11
8
5
3
152
156
160
164
168
172
608
1404
1760
1312
840
516
Σ = 40
Σ fi.xi = 6440
Fórmula:
X = Σ xifi
Σ fi
X = 161
73. 1.
3) População ou universo é:
a)
b)
c)
d)
e)
Um conjunto de pessoas;
Um conjunto de elementos quaisquer
Um conjunto de pessoas com uma característica comum;
Um conjunto de elementos com pelo menos uma característica em comum;
Um conjunto de indivíduo de um mesmo município, estado ou país.
2.
a)
b)
c)
d)
e)
4) Uma parte da população retirada para analisá-la denomina-se:
Universo;
Parte;
Pedaço;
Dados Brutos;
Amostra.
3.
5) A parte da estatística que se preocupa somente com a descrição de determinadas
características de um grupo, sem tirar conclusões sobre um grupo maior denomina-se:
a)
Estatística de População;
b)
Estatística de Amostra;
c) Estatística Inferencial
d)
Estatística Descritiva;
e)
Estatística Grupal.
74. 1.
a)
b)
c)
d)
e)
4) Uma série estatística é denominada Temporal quando?
a) O elemento variável é o tempo;
b) O elemento variável é o local;
c) O elemento variável é a espécie;
d) É o resultado da combinação de séries estatísticas de tipos diferentes;
e) Os dados são agrupados em subintervalos do intervalo observado.
2.
5) Suponha que uma pesquisa de opinião pública deve ser realizada em um estado que
tem duas grandes cidades e uma zona rural. Os elementos na população de interesse são todos
os homens e mulheres do estado com idade acima de 21 anos. Que tipo de amostragem você
sugeriria?. Amostragem Estratificada
3.
6) Um médico está interessado em obter informação sobre o número médio de vezes em
que 15.000 especialistas prescreveram certa droga no ano anterior (N = 15.000). Deseja-se obter
uma amostra n = 1.600. Que tipo de amostragem você sugeriria e por que? Amostragem
Sistemática
7) 1.
De acordo com as normas para representação tabular de dados, quando o valor
de um dado é muito pequeno, para ser expresso com o número de casa decimais utilizadas ou
com a unidade de medida utilizada, deve-se colocar na célula correspondente.
a)
Zero (0);
b)
Três pontos (...);
c) Um traço horizontal (-)
d)
Um ponto de interrogação (?);
Um ponto de exclamação (!).
75. 1.
8) Assinale a afirmativa verdadeira:
a) a) Um gráfico de barras ou colunas é aquele em que os retângulos que o compõem estão dispostos
horizontalmente.
b) b) Um gráfico de barras ou colunas é aquele em que os retângulos que o compõem estão dispostos
verticalmente.
c) c)Um gráfico de barras é aquele em que os retângulos que o compõem estão dispostos verticalmente e
um gráfico de colunas, horizontalmente.
d) d)Um gráfico de barras é aquele em que os retângulos que o compõem estão dispostos
horizontalmente e um gráfico de colunas, verticalmente.
e) e) Todas as alternativa anteriores são falsas.
1.
5
4
3
4
6
9) Um dado foi lançado 50 vezes e foram registrados os seguintes resultados
4 6 1 2 5 3 1 3 3
4 1 5 5 6 1 2 5 1
4 5 1 1 6 6 2 1 1
4 4 3 4 3 2 2 2 3
6 3 2 4 2 6 6 2 1
9a. .A amplitude Total (n)
6 a) 5
7 b) 6
8 c) 7
9 d) 10
10 e) 50
11
12
76. a. A freqüência simples absoluta do primeiro elemento:
a) a) 10%
b) b) 20%
c) c) 1
d) d) 10
e) e) 20
77.
1. Qualquer variável com distribuição
simétrica (normal) pode ser relacionada
com uma distribuição normal padrão
◦ Média: zero; DP: 1
◦ Posso estimar entre quais valores está x% dos
meus dados
78.
2. Área abaixo da curva
◦ A área abaixo de toda a curva normal = 1, ou
seja, a probabilidade de que uma observação
fique em algum lugar abaixo da curva é 100%
3. A probabilidade de se estimar a
localização exata de um indivíduo em
específico é “zero”
◦ Não posso estimar a posição de um valor
específico, mas posso calcular:
Proporção de indivíduos abaixo ou acima de certo valor
Proporção de indivíduos entre certos valores
79.
Exemplo
Qual a probabilidade de uma criança ter
peso ao nascer igual a 4000 gramas?
◦ Não tenho como calcular esta probabilidade
exata, mas posso calcular...
Qual é a proporção de crianças com peso ao
nascer maior de 4000 gramas?
80. Média = 3230
DP = 610
Crianças com peso
ao nascer > 4000
gramas
81.
Distribuição normal padrão
◦ (x - média)/desvio padrão
◦ (4000 - 3230)/610 = 1,26 = z
Olhando as tabelas de distribuição normal...
z = 0,1038, ou seja, 10,4% das crianças tem
peso ao nascer maior do que 4000 gramas
82.
O que seria uma amostra? Não é melhor
avaliar toda a população ?
83.
Quero conhecer um atributo de uma
população (alvo)
◦ Estado nutricional das crianças brasileiras
menores de 5 anos
Escolho um grupo para estudar
◦ Crianças menores de 5 anos da cidade de Pelotas
Deste grupo tiro uma amostra
85.
1. Representar a população
◦ Equiprobabilidade = representatividade
Todos os indivíduos da população alvo têm a mesma
chance de participar do estudo (de serem sorteados)
POPULAÇÃO ALVO
POPULAÇÃO ALVO
86.
2. Precisão
◦ Amostra de tamanho adequado
◦ Garantir o mínimo de precisão
◦ Garantir a chance de demonstrar uma diferença
entre dois grupos
PODER: probabilidade de encontrar uma diferença qdo ela
realmente existe
Quanto maior a amostra, maior o poder
◦ Estudos com baixo poder (amostra pequena) para
testar associações são um desperdício de tempo
e dinheiro
87.
3. Variabilidade amostral
◦ Cada amostra dá um resultado
◦ Repetir o processo de amostragem e estudar a
distribuição dos resultados
Como será que a distribuição das amostras
se compara com a distribuição em toda
população?
◦ Se coletarmos muitas amostras independentes,
do mesmo tamanho, de uma mesma população e
calcularmos a média de cada amostra...
Distribuição das médias amostrais
88.
Tem importância pelo que nos conta sobre
a população que representa
A média e o desvio padrão da amostra são
usados para estimar a média e o desvio
padrão da população
x
s
amostra
população
89.
A média da distribuição das médias
amostrais é a média da população (isso eu
já sei!!!)
E como é a variabilidade da média da
população?
◦ O desvio padrão da distribuição das amostras se
denomina ERRO PADRÃO
90.
Enquanto o desvio padrão mede
variabilidade dos indivíduos da amostra
a
... o erro padrão mede a variabilidade da
média das amostras
◦ E indica com que precisão a média da população
pode ser estimada pela média amostral
92.
Dificilmente nós conhecemos
padrão da população ( )
o
desvio
Então se usa o desvio padrão da amostra (s)
para estimar o erro padrão
ep
s
n
Desvio padrão da
amostra
Tamanho da
amostra
93.
Serve para calcular o Intervalo de Confiança
Intervalo de Confiança: intervalo de valores
que contém o parâmetro de interesse
◦ Valores dentro dos quais existe uma certa
probabilidade de estar incluída a real média da
população
◦ Usado para comparar se existem diferenças entre
dois ou mais grupos
Testes de hipóteses
◦ Isso será visto nas próximas aulas...
94.
Massad E, Menezes R, Silveira P, Ortega N. Métodos
Quantitativos em Medicina. SP: Manole, 2004
Kirkwood B and Sterne J. Essential of medical statistics.
Blackwell Science, 2003