1. www.valorp.com
Consultoria e Cursos
Kaluce Gonçalves de Sousa Almondes
Doutora em Ciência dos Alimentos
Faculdade de Ciências Farmacêuticas - USP
www.valorp.com
contato@valorp.com
Estatística Básica para Saúde
Aula 01
2. www.valorp.com
Conteúdo programático
1. Etapas de um levantamento estatístico.
2. Tipos de estudos e de variáveis.
3. Apresentação tabular e gráfica de dados.
4. Medidas de tendência central
5. Medidas de dispersão
6. Medidas de separação
7. Principais testes utilizados na estatística univariada -
programa R.
4. www.valorp.com
Conceitos de estatística
O que é
Estatística?
Conceitos e
métodos
científicos
- coleta;
- organização;
- descrição;
- análise;
- interpretação de dados
Conclusões
e decisões
5. www.valorp.com
Conceitos de estatística
• Planejar a pesquisa e se preocupa
com o mecanismo da coleta de dados
Planejamento
e amostragem
• Organizar, apresentar e sintetizar
dados observados, sem pretensões de
tirar conclusões de caráter extensivo
Estatística
descritiva
• Inferi, induz ou verifica o
comportamento da amostra.
Estatística
inferencial
6. www.valorp.com
Conceitos de estatística
População
- É qualquer conjunto de elementos, tendo pelo menos uma
variável em comum.
- Ex.: Diabéticos do Brasil
Amostra
- É qualquer subconjunto da população
7. www.valorp.com
INDIVÍDUOS
São os objetos descritos por um conjunto de dados, podendo ser
pessoas, animais ou objetos.
VARIÁVEIS
É qualquer característica de um indivíduo e pode assumir valores
diferentes para indivíduos diferentes.
Brigitte, Baldi, Moore, 2014
Conceitos de estatística
8. www.valorp.com
Etapas de um levantamento
estatístico
• Que indivíduos os dados descrevem?
• Quantos indivíduos aparecem nos dados?Quem?
• Quantas/quais variáveis os dados contêm?
• Em qual unidade de medida cada variável está registrada?O quê?
• Que propósitos têm os dados? Eles respondem a
perguntas específicas? As variáveis são adequadas aos
propósitos pretendidos?
• Desejamos tirar conclusões sobre outros indivíduos além
dos quais realmente temos informações?
Por quê?
Brigitte, Baldi, Moore, 2014
1º - Planejamento
9. www.valorp.com
Etapas de um levantamento
estatístico
2º - FORMULAÇÃO DA HIPÓTESE:
- Resposta antecipada do pesquisador, que a deduziu da revisão
bibliográfica;
- É enunciada sob a forma de uma afirmação, ainda que provisória.
3º - VERIFICAÇÃO DAS HIPÓTESES
- Realizada no decorrer da pesquisa
4º - DELINEAMENTO DA PESQUISA
- Compreende o planejamento detalhado da coleta de dados, da
realização do trabalho e da análise dos dados.
10. www.valorp.com
Há comparação entre grupos?
Há intervenção ativa
do pesquisador?
Experimental Observacional
Não
Descritivo
Sim
Analítico
Sim Não
Por que a doença
ocorre nessas pessoas?
Será que alguma ação
aumenta a incidência
de uma doença?
Tipos de estudos
Fonte: Danilla Silva
12. www.valorp.com
Depleção em
vitamina A
Repleção em dieta
regional - AM
Repleção em dieta
regional + pupunha
Repleção em dieta
regional + vitamina A
Dieta controle
Yuyama e Cozzolino, 1996
Estudo
Experimental
Objetivo: estudar o efeito da
suplementação com pupunha
(como fonte de vitamina A) e
verificar os efeitos na
repleção de animais
deficientes em vitamina A.
13. www.valorp.com
200mg de sulfato
ferroso contendo
40mg de ferro
elementar
Pereira et al., 2007
Estudo Clínico
200mg de sulfato
ferroso contendo
10.000 UI de
palmitato de retinol
(1 UI = 0,3 mcg de
retinol)
Objetivo: avaliar a eficácia
da suplementação do
sulfato ferroso associada
ou não à vitamina A no
controle da anemia
ferropriva
15. www.valorp.com
Todos os pacientes recebem o mesmo tratamento e sua condição é
verificada antes do início e em vários momentos após o tratamento.
Antes Após
Endocardite Bacteriana
PENICILINA
Melhora ou não do estado
do paciente
Ensaio Clínico NÃO Controlado
Fonte: Danilla Silva
16. www.valorp.com
A distribuição do fator de intervenção fica a critério do pesquisador,
ele decide quem receberá o tratamento.
Grupo Controle
Grupo
Experimental
Ensaio Clínico Controlado
Fonte: Danilla Silva
17. www.valorp.com
O pesquisador distribui o fator de intervenção de forma aleatória
através de técnica de randomização.
Grupo Controle
Grupo
Experimental
Ensaio Clínico Controlado
Fonte: Danilla Silva
18. www.valorp.com
O paciente não sabe se recebe o tratamento ou o placebo (substância
de aparência, forma e administração semelhante ao tratamento que
está sendo avaliado, porém sem ter o princípio ativo do mesmo).
Placebo
Tratamento
testado
Os pacientes só sabem ao
fim do estudo
O pesquisador
sabe
Ensaio Clínico Controlado
Fonte: Danilla Silva
19. www.valorp.com
O paciente não sabe se recebe o tratamento ou o placebo (substância
de aparência, forma e administração semelhante ao tratamento que
está sendo avaliado, porém sem ter o princípio ativo do mesmo).
Nem os pacientes ...
... nem o
pesquisador sabe
Tratamento
testado
Placebo
Somente após a avaliação dos
resultados todos ficam sabendo
Ensaio Clínico Controlado
Fonte: Danilla Silva
21. www.valorp.com
Características
Se restringem a descrever a distribuição das variáveis
existentes, sem se preocupar com relações causais ou outras
hipóteses;
Respondem a 5 perguntas básicas:
1. Qual o fenômeno em questão?
2. Quem apresenta o fenômeno em questão?
3. Em que condições o fenômeno apareceu?
4. Qual a frequência do fenômeno?
5. Onde o fenômeno apareceu?
Estudo descritivo
Fonte: Danilla Silva
22. www.valorp.com
Vantagens
• Contribuem para o planejamento;
• Pista para causalidade.
Desvantagens
• Baixa relevância;
• Dados incompletos;
• Relação causa/efeito não estabelecida.
Estudo descritivo
Fonte: Danilla Silva
24. www.valorp.com
População Amostra Expostos e
doentes
Expostos e
não doentes
Não expostos
e doentes
Não expostos
e não doentes
“causa” e “efeito” são detectados simultaneamente. Somente a
análise dos dados permite identificar os grupos de interesse.
Estudo Transversal
25. www.valorp.com
573 crianças Excesso de peso e satisfeitas
com a imagem corporal
Excesso de peso e insatisfeitas
com a imagem corporal
Eutróficas e insatisfeitas com a
imagem corporal
Eutróficas e satisfeitas com a imagem
corporal
Coletados dados sobre insatisfação corporal (escala de imagem
corporal) e antropometria das crianças.
Estudo Transversal
Fonte: Danilla Silva
26. www.valorp.com
Casos
Controles
Identificam-se indivíduos com a doença (casos) e, para efeito
de comparação, indivíduos sem a doença (controles) -
PAREADOS
Quantifica a proporção de expostos nos grupos e investiga no
passado causas de diferenças entre as variáveis preditivas que
possam explicar motivo dos casos adoeceram e os controles não.
Expostos e
doentes
Não Expostos
e doentes
Expostos e
não doentes
Não expostos
e não doentes
Estudo caso-controle
Fonte: Danilla Silva
27. www.valorp.com
Casos
Controles
Casos – CA de mama – 25 a 75 anos diagnosticados entre 1978-1987
Controles – igual idade e admitidos no hospital neste período
A presença de histórico familiar de câncer de mama aumenta
o risco da doença em 8,84 vezes (OR).
Caso com histórico
familiar de CA
Caso sem histórico
familiar de CA
Controle com histórico
familiar de CA
Controle sem histórico
familiar de CA
Estudo caso-controle
28. www.valorp.com
Expostos – Fumo
Não Expostos – não fumam
Câncer?
Os participantes são classificados em expostos ou não expostos a um
fator (ex.: fumo) e acompanhados por um tempo (as medidas podem
ser realizadas mais de uma vez em tempo diferente) para verificar a
incidência da doença (ex.: CA) ou condição relacionada à saúde.
Quem fuma
tem 2x mais
chance de ter
CA que quem
não fuma
Estudo Longitudinal - Coorte
Fonte: Danilla Silva
30. www.valorp.com
• T0 – sem CA
• 5 anos - Acompanhamento
• T1 – com CA
Tempo
- Acompanhamento Começa (Presente) => Termina (Futuro)
- Pcts seguidos para identificar eventos que não estavam presentes no início
ou que surgiram no futuro
Callou, 2014
Exemplo - Prospectivo
31. www.valorp.com
• Duração – 20 anos
• Objetivo - conhecer as relações entre o estado nutricional
de gestantes, o peso do recém-nascido e seu crescimento
no primeiro ano de vida.
• Dados - obtidos nos prontuários de crianças atendidas em
um consultório pediátrico.
Siqueira et al., 1985
Altura e peso de filhos de
mães eutróficas na
gestação
Altura e peso de filhos de
mães desnutridas na
gestação
Altura e peso de filhos de
mães obesas na gestação
Altura e peso de filhos de
mães desnutridas na
gestação
>
>
Eventos investigados são ocorridos no passado
Resgata informações passadas para explicar o
presente
Exemplo - Retrospectivo
33. www.valorp.com
Tipos de variáveis
Variável qualitativa ou categórica
Posiciona um indivíduo em um de diversos grupos ou categorias.
Ex.: Faixa etária
Variável quantitativa
Assume valores numéricos para os quais operações aritméticas,
como adição e cálculo de médias, fazem sentido. Os valores de
uma variável quantitativa são usualmente registrados em uma
unidade de medida, como anos, meses ou dias.
Ex.: Idade
Brigitte, Baldi, Moore, 2014
34. www.valorp.com
Discreta – Ex.: número de filhos
Quantitativa
Contínua – Ex.: IMC
Nominal – Ex1.: Sem excesso de peso, Com excesso
de peso
Qualitativa Ex2.: Baixo peso, Eutrófico, Excesso de
peso, obesidade
Ordinal – Ex.: CA I, CA II, CA III
Tipos de variáveis
35. www.valorp.com
Organização de dados
Exemplo
100 indivíduos perfil sócio-econômico, antropométrico
e lipídico
15 variáveis (idade, sexo, peso, altura, IMC, escolaridade,
renda, álcool, fumo, exercício, CT, TG, LDL, VLDL)
100 respostas de cada variável 1500 dados
36. www.valorp.com
Apresentação
Tabular de Dados
Elementos
Essenciais
Título Indicação da natureza do fato estatístico observado,
fazendo referência ao local e ao tempo em que foi observado
Tabela 1. As 10 principais causas de morte nos Estados
Unidos, 2006.
Fonte: National Center for Health Statistics, 2006.
Variável
qualitativa
nominal
Brigitte, Baldi, Moore, 2014
38. www.valorp.com
Apresentação
Tabular de Dados
Elementos
Essenciais
Tabela 1. As 10 principais causas de morte nos Estados
Unidos, 2006.
Fonte: National Center for Health Statistics, 2006.
Coluna indicadora São as indicações que especificam o
conteúdo das linhas.
Brigitte, Baldi, Moore, 2014
40. www.valorp.com
Tabela 1. As 10 principais causas de morte nos Estados
Unidos, 2006.
Fonte: National Center for Health Statistics, 2006.
Variável
qualitativa
nominal
Brigitte, Baldi, Moore, 2014
Exploração de dados
41. www.valorp.com
Gráficos para variáveis categóricas
Figura 1. As 10 principais causas de morte nos Estados
Unidos, 2006.
Fonte: National Center for Health Statistics, 2006.
Gráfico de
barras
Brigitte, Baldi, Moore, 2014
42. www.valorp.com
Figura 1. As 10 principais causas de morte nos Estados
Unidos, 2006.
Fonte: National Center for Health Statistics, 2006.
Gráficos para variáveis categóricas
Gráfico de
barras
Brigitte, Baldi, Moore, 2014
43. www.valorp.com
Figura 2. As 10 principais causas de morte nos Estados Unidos, 2006.
Fonte: National Center for Health Statistics, 2006.
Gráficos para variáveis categóricas
Gráfico de
setores
Brigitte, Baldi, Moore, 2014
44. www.valorp.com
Exploração de dados
Fonte: Hospital X, 2014.
n % n % n %
Médica 300 15 200 8 500 11
Cirúrgica 800 40 1000 42 1800 41
Pronto Socorro 900 45 1200 50 2100 48
Total 2000 100 2400 100 4400 100
Particular INSS
Tipo de Internação
Clínica
Total
Tabela 2. Distribuição de pacientes internados segundo a clínica e
o tipo de internação. Hospital X, 2014
Percentual calculado
com o total das
colunas como 100%
Qual tipo de clínica recebeu a maior
proporção de internações
particulares?
Qual tipo de clínica recebeu a maior
proporção de internações pelo INSS?
Variável
qualitativa
nominal
45. www.valorp.com
Fonte: Hospital X, 2014.
Figura 3. Distribuição de pacientes internados segundo a clínica e
o tipo de internação. Hospital X, 2014
%
15
8
40 4245
50
0
10
20
30
40
50
60
Particular INSS
Médica Cirúrgica Pronto Socorro
Gráficos para variáveis categóricas
Gráfico de
barras
46. www.valorp.com
Exploração de dados
Fonte: Hospital X, 2014.
Tabela 2. Distribuição de pacientes internados segundo a clínica e
o tipo de internação. Hospital X, 2014
n % n % n %
Médica 300 60 200 40 500 100
Cirúrgica 800 44 1000 56 1800 100
Pronto Socorro 900 43 1200 57 2100 100
Total 2000 45 2400 55 4400 100
Clínica
Tipo de Internação
TotalParticular INSS
Percentual calculado
com o total das linhas
como 100%
A clínica médica recebeu a maior proporção de internações
particulares ou pelo INSS?
A clínica cirúrgica recebeu a maior proporção de
internações particulares ou pelo INSS?
A clínica de pronto socorro recebeu a maior proporção de
internações particulares ou pelo INSS?
Variável
qualitativa
nominal
47. www.valorp.com
Fonte: Hospital X, 2014.
Figura 4. Distribuição de pacientes internados segundo a clínica e
o tipo de internação. Hospital X, 2014
%
60
44 4340
56 57
0
10
20
30
40
50
60
70
Médica Cirúrgica Pronto Socorro
Particular INSS
Gráficos para variáveis categóricas
Gráfico de
barras
48. www.valorp.com
Dados brutos
Comprimento em pés de 44 tubarões brancos do
centro de estudos X, 2014
Exploração de dados
Variável
quantitativa
contínua
Brigitte, Baldi, Moore, 2014
1 pé = 0,3048 m
18,7 pés = 5,7 m
9,4 12,1 12,2 12,3 12,4 12,6 13,2 13,2 13,2 13,2 13,5 13,6
13,6 13,8 14,3 14,6 14,7 14,9 15,2 15,3 15,7 15,7 15,8 15,8
16,1 16,2 16,2 16,4 16,4 16,6 16,7 16,8 16,8 17,6 17,8 17,8
18,2 18,3 18,6 18,7 18,7 19,1 19,7 22,8
18,7 12,3 18,6 16,4 15,7 18,3 14,6 15,8 14,9 17,6 12,1
16,4 16,7 17,8 16,2 12,6 17,8 13,8 12,2 15,2 14,7 12,4
13,2 15,8 14,3 16,6 9,4 18,2 13,2 13,6 15,3 16,1 13,5
19,1 16,2 22,8 16,8 13,6 13,2 15,7 19,7 18,7 13,2 16,8
Dados brutos em ordem crescente
49. www.valorp.com
Gráficos para variáveis quantitativas
Histograma
Fonte: Centro de estudos X, 2014
Figura 4. Distribuição do número de tubarões brancos
segundo o comprimento em pés. Centro de estudos
X, 2014
Brigitte, Baldi, Moore, 2014
50. www.valorp.com
Exame de um histograma
• Simétrico
• AssimétricoForma
• É o que tem a maior frequência
• Até 15 pés (n = 18); Até 17 pés (n = 33)Centro
• A dispersão vai de 9,4 a 22,8 pés
• Só 1 tubarão < 11 pés
• Só 1 tubarão > 21 pés.
Dispersão
• Se situam à parte da distribuição em
• geral acima ou abaixo dela.
Valor
atípico
Brigitte, Baldi, Moore, 2014
51. www.valorp.com
Gráficos para variáveis quantitativas
Dispersão
Fonte: Centro de estudos X
Figura 5. Distribuição do número de tubarões brancos
segundo o comprimento em pés. Centro de estudos
X, 2014
5
10
15
20
25
0 10 20 30 40 50
Comprimentoempés
Indivíduos
52. www.valorp.com
Gráficos para variáveis quantitativas
Dispersão
*
Legenda: * - IMC = 24,9 Kg/m2
Figura 6. Distribuição dos indivíduos de acordo com o
IMC e o sexo, UFPI 2014.
F - 158
M -79
F - 35
M - 65
Fonte: Almondes, 2014.
Mínimo F = 13; M = 16
Máximo F = 37; M = 38
53. www.valorp.com
Média –
Soma de todos os valores de um conjunto de observações
dividido pelo número de observações
= x1 + x2 + x3 + ... + xn
n
Exemplo:
Abaixo estão apresentados os consumos em grama de carboidrato
de 15 funcionários de uma UAN – Vamos calcular a média!!
234,83 269,45 129,30 137,23 303,67 247,52 370,16 520,23
168,78 307,31 196,95 325,50 286,99 299,65 263,10
Medidas de tendência central
54. www.valorp.com
Média –
= 234,83 + 269,45 + ... + 263,10 = 270,71
15
A média do consumo de carboidrato dos 15 funcionários da
UAN é de 270,71 g
Medidas de tendência central
55. www.valorp.com
Mediana – M
Ponto do meio de uma distribuição
A regra para o cálculo depende do nº de observações, se é par
ou ímpar
Exemplo:
Abaixo estão apresentados os consumos em grama de carboidrato
de 15 funcionários de uma UAN – Vamos calcular a mediana!!
234,83 269,45 129,30 137,23 303,67 247,52 370,16 520,23
168,78 307,31 196,95 325,50 286,99 299,65 263,10
Medidas de tendência central
56. www.valorp.com
Mediana – M
Número de observações ímpar
1º - observações em ordem crescente:
129,30 137,23 168,78 196,95 234,83 247,52 263,10 269,45
286,99 299,65 303,67 307,31 325,50 370,16 520,23
Medidas de tendência central
2º - Localização da mediana = (n + 1)/2 = (15 + 1)/2 = 8º posição
Ache a 8º posição na lista ordenada a partir do menor valor
A mediana do consumo de carboidrato dos 15 funcionários da
UAN é de 269,45 g
M = 269,45
57. www.valorp.com
Mediana – M
Número de observações par
1º - observações em ordem crescente:
129,30 137,23 168,78 196,95 234,83 247,52 263,10 269,45
286,99 299,65 303,67 307,31 325,50 370,16 384,20 520,23
Medidas de tendência central
2º - Localização da mediana = (n + 1)/2 (16 + 1)/2 = 8,5
M é a média das duas observações centrais na lista ordenada
M = (269,45 + 286,99)/2 M = 278,22 g
A mediana do consumo de carboidrato dos 16 funcionários da
UAN é de 278,22 g
58. www.valorp.com
Comparação entre a Média e a Mediana
1º exemplo com 15 funcionários
129,30 137,23 168,78 196,95 234,83 247,52
263,10 269,45 286,99 299,65 303,67 307,31
325,50 370,16 520,23
= 270,71 g M = 269,45 g
Medidas de tendência central
129,30 137,23 168,78 196,95 234,83 247,52
263,10 269,45 286,99 299,65 303,67 307,31
325,50 370,16 5200,23
= 582,71 g M = 269,45 g
59. www.valorp.com
Moda
Valor que se repete com mais frequência
Nem sempre existe, nem é única
Não é influenciada por valor atípico
Medidas de resumo
Nº de gestações prévias Nº de parturientes
0 40
1 35
2 20
3 5
4 3
Total 103
Tabela 01. Número de parturientes segundo
o número de gestações prévias.
Nº modal de
gestações
prévias = 0
60. www.valorp.com
Identificação Peso (g) Resíduo Resíduo ao quadrado
1 64 1,25 1,5625
2 71 8,25 68,0625
3 53 -9,75 95,0625
4 67 4,25 18,0625
5 55 -7,75 60,0625
6 58 -4,75 22,5625
7 77 14,25 203,0625
8 57 -5,75 33,0625
9 56 -6,75 45,5625
10 51 -11,75 138,0625
11 76 13,25 175,5625
12 68 5,25 27,5625
62,75 0
Média Resíduo Resíduo ao quadrado
= (soma total)/nº de indivíduos = (valor do peso - média do peso) = resíduo x resíduo
𝑽𝒂𝒓𝒊â𝒏𝒄𝒊𝒂 =
Σ 𝑑𝑜 𝑟𝑒𝑠í𝑑𝑢𝑜 𝑎𝑜 𝑞𝑢𝑎𝑑𝑟𝑎𝑑𝑜
𝑛 − 1
𝑉𝑎𝑟𝑖â𝑛𝑐𝑖𝑎 =
888,25
12 − 1
𝑉𝑎𝑟𝑖â𝑛𝑐𝑖𝑎 = 80,75
𝐷𝑒𝑠𝑣𝑖𝑜 𝑝𝑎𝑑𝑟ã𝑜 = 80,75
𝑫𝒆𝒔𝒗𝒊𝒐 𝒑𝒂𝒅𝒓ã𝒐 = 𝑉𝑎𝑟𝑖â𝑛𝑐𝑖𝑎
𝐷𝑒𝑠𝑣𝑖𝑜 𝑝𝑎𝑑𝑟ã𝑜 = 8,986
Medidas de dispersão
Variância:
medida de
dispersão que
mostra quão
distantes os
valores estão da
média
Desvio padrão: é o
resultado positivo da
raiz quadrada da
variância
61. www.valorp.com
Variância (s2) e desvio padrão (s)
s mede a dispersão em torno da média e deve ser usado
apenas quando a média for escolhida como a medida de
centro.
s é sempre zero ou maior que zero.
s tem a mesma unidade de medida que as observações
originais.
Assim como a média, s não é resistente.
Medidas de dispersão
62. www.valorp.com
Medidas de dispersão
Coeficiente de variação: mede a precisão (reprodutibilidade) do teste.
É obtido a partir da média e desvio padrão (CV= DP/média X 100).
Em geral, não devem ser maior que 5%.
64. www.valorp.com
Medidas de separação
Quartis
1 2 3 4
0% 25% 50% 75% 100%
Q1/4 Q2/4
(Mediana)
Q3/4
Q2 > 50%
das observações
Q1 > 25%
das observações
Mediana das
observações à direita da
mediana geral
Mediana das
observações à esquerda
da mediana geral
Q3 > 75%
das observações
100/4 = 25%
65. www.valorp.com
Medidas de separação
Quartis – com observações ímpares
Exemplo - Grupo 1 - 19 indivíduos
Proteína (gramas/dia):
69,55 70,96 56,77 43,19 94,15 81,64 102,2 126,21 67,18 101,91
71,91 87,33 124,97 77,10 67,51 104,02 41,43 94,73 98,79
1º) Localização da mediana = Q2 = (n + 1)/2 = (19 + 1)/2 = 10º posição
Ache a 10º posição na lista ordenada a partir do menor valor
M = 81,64 = Q2
Proteína (gramas/dia) ordenada:
41,43 43,19 56,77 67,18 67,51 69,55 70,96 71,91 77,10 81,64
87,33 94,15 94,73 98,79 101,91 102,20 104,02 124,97 126,21
66. www.valorp.com
Medidas de separação
Quartis – com observações ímpares
Exemplo - Grupo 1 - 19 indivíduos
Proteína (gramas/dia) ordenada:
41,43 43,19 56,77 67,18 67,51 69,55 70,96 71,91 77,10 81,64
87,33 94,15 94,73 98,79 101,91 102,20 104,02 124,97 126,21
2º) Localização do Q1 ou Q3 = (n + 1)/2 = (9 + 1)/2 = 5º posição
Q1 está na 5º posição à esquerda da mediana geral na lista ordenada
Q2 está na 5º posição à direita da mediana geral na lista ordenada
Q1
Q3
67. www.valorp.com
Proteína (gramas/dia) ordenada:
89,17 83,11 89,86 95,06 98,16 99,42 99,91 100,29 102,22 103,18
103,57 106,71 115,73 120,29 122,74 132,21 135,23 137,64 145,23 148,79
Medidas de separação
Quartis – com observações pares
Exemplo - Grupo 2 - 20 indivíduos
Proteína (gramas/dia):
89,17 135,23 83,11 100,29 145,23 148,79 95,06 120,29 115,73 98,16
137,64 132,21 99,42 122,74 106,71 103,57 99,91 102,22 89,86 103,18
1º) Localização da mediana = Q2 = (n + 1)/2 (20 + 1)/2 = 10,5
M é a média das duas observações centrais na lista ordenada
M = (103,18 + 103,57)/2 M = 103,38 g
M = 103,38 = Q2
68. www.valorp.com
Proteína (gramas/dia) ordenada:
89,17 83,11 89,86 95,06 98,16 99,42 99,91 100,29 102,22 103,18
103,57 106,71 115,73 120,29 122,74 132,21 135,23 137,64 145,23 148,79
Medidas de separação
Quartis – com observações pares
Exemplo - Grupo 2 - 20 indivíduos
Proteína (gramas/dia):
89,17 135,23 83,11 100,29 145,23 148,79 95,06 120,29 115,73 98,16
137,64 132,21 99,42 122,74 106,71 103,57 99,91 102,22 89,86 103,18
M = 103,38 = Q2
2º) Localização do Q1 = (n + 1)/2 (10 + 1)/2 = 5,5
M é a média das duas observações centrais na lista ordenada
M = (98,16 + 99,42)/2 M = 98,79 g
Q1
69. www.valorp.com
Proteína (gramas/dia) ordenada:
89,17 83,11 89,86 95,06 98,16 99,42 99,91 100,29 102,22 103,18
103,57 106,71 115,73 120,29 122,74 132,21 135,23 137,64 145,23 148,79
Medidas de separação
Quartis – com observações pares
Exemplo - Grupo 2 - 20 indivíduos
Proteína (gramas/dia):
89,17 135,23 83,11 100,29 145,23 148,79 95,06 120,29 115,73 98,16
137,64 132,21 99,42 122,74 106,71 103,57 99,91 102,22 89,86 103,18
M = 103,38 = Q2
2º) Localização do Q3 = (n + 1)/2 (10 + 1)/2 = 5,5
M é a média das duas observações centrais na lista ordenada
M = (122,74 + 132,21)/2 M = 127,48 g
Q1
Q3
72. www.valorp.com
Valores atípicos
O que fazer com valores atípicos?
1º - Identificá-los e descobrir a razão da sua existência
- Popeye (1929)
- Espinafre com muito Fe > 10x couve
ou alface (1870)
- Fe do espinafre ~ Fe outros vegetais
verdes (1937)
2º - Decidir se devem ser mantidos ou descartados isso
depende do objetivo do trabalho
3º - Se decidir mantê-los ou descartá-los explicar
73. www.valorp.com
Consultoria e Cursos
Kaluce Gonçalves de Sousa Almondes
Doutora em Ciência dos Alimentos
Faculdade de Ciências Farmacêuticas - USP
Estatística Básica
www.valorp.com
Notes de l'éditeur
Estatística é um conjunto de conceitos e métodos científicos para a coleta, a organização, a descrição, a análise e a interpretação de dados experimentais, que permitem conclusões válidas e tomadas de decisões razoáveis.
Amostragem e Planejamento de Experimentos: É a parte que tem por objetivo planejar a pesquisa e se preocupa com o mecanismo da coleta de dados.
Estatística Descritiva: É a parte que tem por objetivo organizar, apresentar e sintetizar dados observados de determinada população, sem pretensões de tirar conclusões de caráter extensivo.
Estatística Inferencial ou Indutiva: É a parte que, baseando-se em estudos realizados sobre os dados de uma amostra, procura inferir, induzir ou verificar leis de comportamento da população da qual a amostra foi retirada. A estatística inferencial tem sua estrutura fundamentada na teoria matemática das probabilidades.
É, também definida como um conjunto de métodos para a tomada de decisões.
A população pode ser formada por pessoas da família, indivíduos de uma certa espécie, estabelecimentos industriais, ou qualquer outro tipo de elementos, cujas variáveis que se pretende estudar sejam passíveis de serem mensuradas.
Descritivos descrevem uma situação. Por exemplo, a distribuição da doença na população em relação ao sexo, idade ou outras características.
Analíticos tentam explicar uma situação ou seus processos determinativos (Por que a doença ocorre nessas pessoas? Pode a queda da incidência de uma doença ser atribuída à introdução de alguma medida preventiva?
São estudos em que há uma intervenção do investigador. Portanto, compara indivíduos/animais expostos com outros não expostos a um referido fator, sendo que o pesquisador decide quem serão os expostos ou não a determinado fator. É um estudo controlado.
Objetivo do estudo: estudar o efeito da suplementação com pupunha em uma dieta regional de Manaus, AM, como fonte suplementar de vitamina A, e verificado os efeitos em relação ao zinco, na repleção de animais deficientes em zinco e vitamina A.
O objetivo do estudo foi avaliar a eficácia da suplementação do sulfato ferroso associada ou não à vitamina A no controle da anemia ferropriva.
O ensaio clínico é a tradução do estudo experimental (em laboratório com animais de experimentação) para a prática clínica (em pessoas ou pacientes). A seleção dos pacientes deve ser feita de forma que minimize variações que possam afetar as comparações entre os grupos em investigação. Isto é feito, geralmente, utilizando o processo de randomização.
Endocardite Bacteriana – infecção bacteriana no coração
Exemplo: x% de indivíduos do sexo feminino tem DC; x% dos indivíduos do sexo feminino têm CT aumentado.
Pode ser um estudo de prevalência e fornece uma informação limitada no tempo - pontual - de uma situação. As medidas ou coletas dos dados são realizadas uma única vez.
Outro exemplo: Deficiência de Se sanguíneo em indivíduos residentes em áreas pobres em Se na China têm doença de Kashin-Back.
Será que o fato de ter a doença está associada com o fato de ter deficiência de Se sanguíneo?
Investiga a associação entre a ocorrência de uma doença e a exposição a algum fator suspeito daquela doença. Nesse estudo identifica-se, inicialmente, um grupo de indivíduos com (casos) e sem doença (controle). Depois se investiga no passado causas de diferenças entre as variáveis preditivas que possam explicar por quê os casos adoeceram e os controles não.
Estudo longitudinal fornece dados acerca de eventos ou mudanças que ocorrem em determinado espaço de tempo. As medidas ou coletas dos dados são realizadas mais de uma vez e em período de tempo diferente. O estudo longitudinal em que grupo de indivíduos é acompanhado por algum tempo é chamado de estudo coorte.
Eventos investigados são ocorridos no passado - retrospectivo.
Pacientes foram seguidos na expectativa de identificar eventos que não estavam presentes no início - prospectivo.
Verificou-se que filhos de desnutridas tiveram peso e altura inferiores quando comparados aos filhos de normais e obesas. Pôde-se constatar, ainda, que ao final do primeiro ano de vida essas diferenças praticamente desapareciam.
Eventos investigados são ocorridos no passado - retrospectivo.
Lembrar do exemplo do estudo caso-controle. A histórico familiar de CA está associada com o CA de mama
Elementos complementares
a. Fonte É a entidade responsável pelos dados contidos na tabela.
b. Nota São informações que esclarecem critérios usados na confecção da tabela.
c. Chamada É a informação de natureza específica, que serve para complementar determinado dado usado na confecção da tabela.
A medida mais comum de centro é a média aritmética usual, ou média.
A medida mais comum de centro é a média aritmética usual, ou média.
A mediana é o número em relação ao qual metade das observações é menor, e metade é maior
A medida mais comum de centro é a média aritmética usual, ou média.
A medida mais comum de centro é a média aritmética usual, ou média.
A média sofre influência de valores aberrantes, também conhecidos como valores atípicos ou outliers. Ela pode ser aumentada se algum dos valores for muito alto ou muito baixo.
A mediana não sofre influência desses valores. Ela é influenciada apenas pelo número total de pontos de dados e pelo valor numérico do ponto, ou pontos, localizado no centro da distribuição
s tem a mesma unidade de medida que as observações originais. Por exemplo, se você medir peso em gramas, tanto a média quanto o desvio-padrão s também estarão em gramas, razão pela qual é preferível obtermos s em vez da variância s2, que estaria medida em gramas ao quadrado.
- s = 0 apenas quando não há dispersão. Isso acontece apenas quando todas as observações têm o mesmo valor. Caso contrário, s > 0. À medida que as observações se tornam mais dispersas em torno de sua média, s aumenta.
- s tem a mesma unidade de medida que as observações originais. Por exemplo, se você medir peso em gramas, tanto a média quanto o desvio-padrão s também estarão em gramas, razão pela qual é preferível obtermos s em vez da variância s2, que estaria medida em gramas ao quadrado.
- Assim como a média, s não é resistente. Algumas observações atípicas podem tornar s bastante grande.
Q1 cai em ¼ das observações; Q2 cai em 2/4 das observações; Q3 cai em ¾ das observações
Q1 cai em ¼ das observações; Q2 cai em 2/4 das observações; Q3 cai em ¾ das observações
Q1 cai em ¼ das observações; Q2 cai em 2/4 das observações; Q3 cai em ¾ das observações
Q1 cai em ¼ das observações; Q2 cai em 2/4 das observações; Q3 cai em ¾ das observações
Q1 cai em ¼ das observações; Q2 cai em 2/4 das observações; Q3 cai em ¾ das observações
Q1 cai em ¼ das observações; Q2 cai em 2/4 das observações; Q3 cai em ¾ das observações
Q1 cai em ¼ das observações; Q2 cai em 2/4 das observações; Q3 cai em ¾ das observações
Talvez o mais famoso exemplo de um valor atípico causado por um erro de registro de dados esteja na história de Popeye, o marinheiro. Criado em 1929, Popeye é um personagem simpático de histórias em quadrinhos, que consegue imediatamente força sobre-humana sempre que come espinafre, que contém muito ferro. Na verdade, uma publicação científica de 1870 relatou que o espinafre tinha, de longe, o maior conteúdo de ferro do que qualquer outro vegetal de folhas verdes, cerca de dez vezes mais do que alface ou couve. Essa afirmativa permaneceu inquestionável, até que um estudo de 1937 mostrou que o conteúdo de ferro do espinafre era semelhante ao de outros vegetais verdes. Acontece que o conteúdo de ferro do espinafre na publicação de 1870 teve uma vírgula decimal colocada em local errado! O valor do espinafre tinha sido corretamente identificado como uma observação extravagante, mas ninguém, por mais de meio século, questionou sua natureza.