SlideShare uma empresa Scribd logo
1 de 49
Baixar para ler offline
- 1 -
Uanderson Rebula de Oliveira Estatística
UniversidadeEstáciodeSá
EngenhariadeProdução
PROBABILIDADE E ESTATÍSTICA
ESTATÍSTICA
Prof. Uanderson Rebula de Oliveira
uanderson@csn.com.br
www.uandersonrebula.blogspot.com | www.iluminaconsultoria.com.br
- 2 -
Uanderson Rebula de Oliveira Estatística
 
EMENTA DE ESTATÍSTICA:  
Estatística: conceito e fases de estudo. Variáveis. População, amostra e métodos 
de amostragem. Estatística descritiva e inferencial. Séries estatísticas: conceitos, 
distribuição  de  frequência  e  representação  gráfica.  Medidas  de  Tendência 
Central: Média, moda e mediana. Medidas de Variação: Variância, desvio padrão 
e coeficiente de variação. 
 
OBJETIVO: 
Refletir a partir da Estatística Básica sobre as ferramentas consolidadas pelo uso e 
pela ciência, disponíveis a todos, que auxiliam na tomada de decisão.
Engenharia de Produção
PROBABILIDADE E ESTATÍSTICA
UANDERSON REBULA DE OLIVEIRA
Mestrando em Engenharia (ênfase em Engenharia de Produção)-Universidade Estado de São Paulo-FEG-UNESP
Pós-graduado em Controladoria e Finanças-Universidade Federal de Lavras-UFLA
Pós-graduado em Logística Empresarial-Universidade Estácio de Sá-UNESA
Graduado em Ciências Contábeis-Universidade Barra Mansa-UBM
Técnico em Metalurgia-Escola Técnica Pandiá Calógeras-ETPC
Técnico em Segurança, Saúde e Higiene do Trabalho-ETPC
Operador Siderúrgico e Industrial-ETPC
Professor na Universidade Barra Mansa – UBM. Professor da Universidade Estácio de Sá - UNESA nas disciplinas de
Gestão Financeira de Empresas, Fundamentos da Contabilidade e Matemática Financeira, Probabilidade e Estatística,
Ergonomia, Higiene e Segurança do Trabalho, Gestão de Segurança e Análise de Processos Industriais, Gestão da
Qualidade: programa 5S (curso de férias). Ex-professor Conteudista na UNESA (elaboração de Planos de Ensino e
de Aula, a nível nacional). Professor em escolas técnicas nas disciplinas de Estatística Aplicada, Estatística de
Acidentes do Trabalho, Probabilidades, Contabilidade Básica de Custos, Metodologia de Pesquisa Científica,
Segurança na Engenharia de Construção Civil e Higiene do Trabalho. Ex-professor do SENAI. Desenvolvedor e
instrutor de diversos cursos corporativos na CSN, a níveis Estratégicos, Táticos e Operacionais.
Membro do IBS–Instituto Brasileiro de Siderurgia.
Resende - 2010
ESTATÍSTICA
- 3 -
Uanderson Rebula de Oliveira Estatística
APRESENTAÇÃO
DA DISCIPLINA
Uma das ferramentas mais utilizadas hoje em dia pelos 
cientistas,  analistas  financeiros,  médicos,  engenheiros,  jornalistas 
etc. é a Estatística, que descreve os dados observados e desenvolve 
a metodologia para a tomada de decisão em presença da incerteza. 
O verbete estatística foi introduzido no século XVIII, tendo origem 
na palavra latina status (Estado), e serviu inicialmente a objetivos 
ligados  à  organização  político‐social,  como  o  fornecimento  de 
dados  ao  sistema  de  poder  vigente.  Hoje  em  dia,  os  modelos  de 
aplicação da Teoria Estatística se estendem por todas as áreas do 
conhecimento,  como  testes  educacionais,  pesquisas  eleitorais, 
análise  de  riscos  ambientais,  finanças,  controle  de  qualidade, 
análises  clínicas,  índices  de  desenvolvimento,  modelagem  de 
fenômenos atmosféricos etc. Podemos informalmente dizer que a 
Teoria  Estatística  é  uma  ferramenta  que  ajuda  a  tomar  decisões 
com  base  na  evidência  disponível,  decisões  essas  afetadas  por 
margens de erro, calculadas através de modelos de probabilidade. 
 
No  entanto,  a  probabilidade  se  desenvolveu  muito 
antes  de  ser  usada  em  aplicações  da  Teoria  Estatística.  Um  dos 
marcos  consagrados  na  literatura  probabilística  foi  a 
correspondência  entre  B.  Pascal  (1623‐1662)  e  P.  Fermat  (1601‐
1665), onde o tema era a probabilidade de ganhar em um jogo com 
dois  jogadores,  sob  determinadas  condições.  Isso  mostra  que  o 
desenvolvimento  da  teoria  de  probabilidades  começou  com  uma 
paixão  humana,  que  são os  jogos  de azar,  mas  evoluiu  para  uma 
área  fortemente  teórica,  em  uma  perspectiva  de  modelar  a 
incerteza,  derivando  probabilidades  a  partir  de  modelos 
matemáticos. 
 
A  análise  combinatória  deve  grande  parte  de  seu 
desenvolvimento  à  necessidade  de  resolver  problemas 
probabilísticos ligados à contagem, mas hoje há diversas áreas em 
que seus resultados são fundamentais para o desenvolvimento de 
teorias, como, por exemplo, a área de sistemas de informação. 
 
Nesta  apostila  encontraremos  as  definições  de  
Estatística,  vocabulário  básico,  população  e  amostra,  séries 
estatísticas,  medidas  de  tendência  central,  medidas  de 
variabilidade. Probabilidades serão tratadas em outra apostila.  
- 4 -
Uanderson Rebula de Oliveira Estatística
Falou mais o Senhor a Moisés, no deserto de Sinai, na tenda da
congregação, no primeiro dia do mês segundo, no segundo ano da sua
saída da terra do Egito, dizendo:
Tomai a soma de toda a congregação dos filhos de Israel, segundo as
suas gerações, segundo a casa dos seus pais, conforme o número dos
nomes de todo o varão, cabeça por cabeça;
Da idade de vinte anos e para cima, todos os que saem à guerra em
Israel; a estes contareis segundo os seus exércitos, tu e Aarão.
Estará convosco, de cada tribo, um homem que seja cabeça da casa dos
seus pais.
Todos os contados, pois, foram seiscentos e três mil, quinhentos e
cinquenta.
Números 1: 1-4; 46
- 5 -
Uanderson Rebula de Oliveira Estatística
Sumário
1 – CONCEITOS PRELIMINARES  
1.1 CONCEITO E IMPORTÂNCIA DA ESTATÍSTICA, 7 
1.2 FASES DO ESTUDO ESTATÍSTICO, 13 
1.3 VOCABULÁRIO BÁSICO DE ESTATÍSTICA, 15 
1.4 POPULAÇÃO E AMOSTRA, 17 
MÉTODOS DE AMOSTRAGEM PROBABILÍSTICOS, 18 
Amostragem aleatória simples, 18 
Amostragem aleatória estratificada, 20 
Amostragem aleatória por conglomerado, 21 
Amostragem sistemática, 23 
1.5 ESTATÍSTICA DESCRITIVA E ESTATÍSTICA INFERENCIAL , 24 
 
2 – SÉRIES ESTATÍSTICAS  
2.1 CONCEITOS E TIPOS DE SÉRIES ESTATÍSTICAS,  26 
Tabelas, 26 
Gráficos, 27 
2.2 DISTRIBUIÇÃO DE FREQUÊNCIA, 30 
Freqüência absoluta e histograma, 30 
Freqüência relativa, absoluta acumulada e relativa acumulada, 31 
Agrupamento em classes, 32 
Polígono de freqüência e ogiva, 33 
 
 3 – MEDIDAS                     
3.1 MEDIDAS DE TENDÊNCIA CENTRAL, 35 
MÉDIA, 35 
Média simples, 35 
Média aparada, 36 
Média ponderada, 36 
Média de distribuição de frequência, 37 
Média geométrica, 38 
MEDIANA, 39 
MODA, 40 
RELAÇÃO ENTRE MÉDIA, MEDIANA E MODA, 41 
3.2 MEDIDAS DE VARIAÇÃO, 42 
VARIÂNCIA E DESVIO PADRÃO, 43 
COEFICIENTE DE VARIAÇÃO,  45 
 
REFERÊNCIAS BIBLIOGRÁFICAS, 46 
                                                                                                                                   
ANEXO I – LIVROS RECOMENDADOS, 47  
ANEXO II –  Software BIOESTAT , 48 
ANEXO III – ESTATÍSTICA NO EXCEL, 49                       
- 6 -
Uanderson Rebula de Oliveira Estatística
1
CONCEITOS PRELIMINARES
- 7 -
Uanderson Rebula de Oliveira Estatística
1.1 CONCEITO E IMPORTÂNCIA DA ESTATÍSTICA
 
ESTATÍSTICA NA PRÁTICA
 
Analise as informações abaixo para melhor compreensão do conceito e importância da Estatística. 
 
 ACIDENTES DO TRABALHO no Brasil – 1970 a 2005 
Conceito resumido: Lesão corporal ou doença, relacionada com o exercício do trabalho. 
Legislação: Lei 8.213/91 – art. 19 a 21  
INSS: Órgão público responsável pela coleta, organização e representação dos dados.  
 
Coleta: Por meio de um formulário eletrônico denominado “CAT – Comunicação de Acidente do Trabalho”, enviado 
pelas empresas quando da ocorrência, conforme determina o art. 22 da Lei 8.213/91. 
Organização: Através de um grande banco de dados do INSS. 
Representação: Através de um documento denominado “Anuário Estatístico de Acidentes do Trabalho”, contendo 
tabelas, gráficos e diversas análises. Disponível no site www.previdencia.gov.br, na seção “Estatística”. 
Motivo: Quando o trabalhador se afasta por motivo de acidente o INSS concede benefícios acidentários, como 
auxílio doença acidentário, auxílio acidente, aposentadoria por invalidez, pensão por morte, reabilitação entre 
outros. Mais informações na apostila Profº Uanderson “Ergonomia, Higiene e Segurança do Trabalho”, pág. 50‐
52;136, disponível no portal www.uandersonrebula.blogspot.com. 
 
COMPILAÇÃO E ANÁLISE DE DADOS (INFORMAÇÕES) sobre acidentes do trabalho, de 1970 a 2005: 
 
 
 
 
 
 
 
 
 
 
 
 
 
Observa‐se ao longo dos anos o aumento gradativo da quantidade de trabalhadores no Brasil, de 7.284.022 chegando 
a  33.238.617,  reflexo  do  crescimento  econômico  do  País.  Essas  informações  (dados)  são  importantes  para  fins  de 
comparação com a evolução da quantidade de acidentes do trabalho no mesmo período, como segue abaixo: 
 
 
 
 
 
 
 
 
 
 
 
 
7.284.022
8.148.987
11.537.024
14.945.489
16.638.799
18.686.355
19.476.36219.673.915
22.163.827
23.661.57923.198.656
22.272.843
23.667.24123.830.312
24.491.635
26.228.629
27.189.614
28.683.913
29.544.927
31.407.576
33.238.617
0
5.000.000
10.000.000
15.000.000
20.000.000
25.000.000
30.000.000
35.000.000
1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2001 2002 2003 2004 2005
Evolução da QUANTIDADE de TRABALHADORES
no Brasil - 1970 a 2005.
FONTE: Revista Proteção Anos
1.220.111
1.504.723
1.796.671
1.743.825
1.551.461
1.464.211
1.178.472
961.575
1.207.859
991.581
693.572
532.514
388.304 395.455
414.341
363.868
340.251
393.071 399.077
465.700 491.711
0
250.000
500.000
750.000
1.000.000
1.250.000
1.500.000
1.750.000
2.000.000
1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2001 2002 2003 2004 2005
Involução da QUANTIDADE de ACIDENTES DO
TRABALHO no Brasil - 1970 a 2005.
Anos
FONTE: Revista Proteção
Aprovação das NR’s
- 8 -
Uanderson Rebula de Oliveira Estatística
No  período  de  1970  a  1976  a  quantidade  de  acidentes  foi  alta,  comparando‐se  com  a  pequena 
quantidade de trabalhadores no mesmo período. Somente a partir de 1978 os acidentes começaram a 
reduzir,  em  razão  da  aprovação  das  Normas  Regulamentadoras  –  NR’s  (disponível  no 
www.mte.gov.br), tornando‐se de aplicação obrigatória em todo o País. Esta redução pode ser vista 
como positiva, entretanto, não podemos comemorar esses números, pois a quantidade de acidentes 
ainda é alarmante e está praticamente estagnada, desde 1994. 
 
E as regiões? Como esses acidentes estão distribuídos nas regiões do país? Qual a pior região? Qual a melhor? 
Vejamos abaixo em um Cartograma (mapa com dados), SOMENTE NO ANO DE 2005 (491.711 acidentes): 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Observa‐se que a região em 1° lugar em número de acidentes é a Sudeste, em 2° está a região Sul, em 3° a região 
Nordeste, em 4° a região Centro‐Oeste e por último a Norte. Ao analisarmos este gráfico podemos tomar diversas 
conclusões, porém, tais conclusões somente são possíveis através de um estudo, o que demanda tempo. Todavia, 
observa‐se  que  a  quantidade  de  acidentes  acompanha  a  porcentagem  da  participação  do  PIB  da  região.  Esta 
correlação pode ser resultado do reflexo da economia da região. Ora, a região Sudeste, por exemplo, corresponde a 
56,5% do PIB do País. Logicamente esta região possui um maior número de empresas e, consequentemente, maior 
número  de  mão‐de‐obra  e  atividades  produtivas,  fato  que  pode  justificar  a  enorme  quantidade  de  acidentes 
comparada com as demais regiões. Esses dados também podem estar relacionados com as políticas dos estados e das 
empresas,  a  atuação  das  fiscalizações  do  Ministério  do  Trabalho,  as  culturas  das  regiões,  os  investimentos 
empresariais,  a  capacitação  de  mão  de  obra  (treinamentos)  entre  outros  fatores.  Entende‐se  por  Produto  Interno 
Bruto (PIB) a soma, em valores monetários, de todos os bens e serviços finais produzidos em uma determinada região. 
 
Mais  dados  vocês  encontrarão  na  Apostila  “Ergonomia, higiene  e  segurança do  trabalho”,  do  profº  Uanderson 
Rebula,  disponível  no  portal  www.uandersonrebula.blogspot.com  ou  no  “Anuário  Estatístico  de  Acidentes  do 
Trabalho”, disponível no portal www.previdencia.gov.br, na seção “Estatística”. 
 
Tradicionalmente, no Brasil, as políticas de desenvolvimento têm se restringido aos aspectos econômicos e vêm 
sendo traçadas de maneira paralela ou pouco articuladas com as políticas sociais, cabendo a estas últimas arcarem 
com  os  ônus  dos  possíveis  danos  gerados  sobre  a  saúde  da  população,  dos  trabalhadores  em  particular  e  a 
degradação ambiental. Para que o Estado cumpra seu papel para a garantia desses direitos, é mister a formulação 
e implementação de políticas e ações de governo. 
Distribuição da quantidade e porcentagem de acidentes de trabalho no Brasil por Regiões, 
correlacionados com o Produto Interno Bruto ‐ PIB ‐ ano 2005. 
FONTE: Adaptado da Revista Proteção e do IBGE (www.ibge.gov.br)
NORDESTE  
• Acidentes: 49.010 (10% do total) 
• PIB: 13,1% de participação 
SUDESTE  
• Acidentes: 279.689 (57% do total) 
• PIB: 56,5% de participação  
NORTE  
• Acidentes: 19.117 (4% do total) 
• PIB: 5% de participação  
CENTRO‐OESTE  
• Acidentes: 31.470 (6% do total) 
• PIB: 8,9% de participação  
SUL  
• Acidentes: 112.425 (23% do total) 
• PIB: 16,6% de participação 
Espírito Santo ‐ 11.039 acidentes 
Minas Gerais ‐ 52.335 acidentes 
Rio de Janeiro ‐ 34.610 acidentes 
São Paulo ‐ 181.705 acidentes
São  campeões  de  acidentes  no  Brasil,  participando  com 
181.705, o que corresponde a 37% do total; por conseguinte 
o  seu  PIB  também  é  o  maior  do  País,  com  33,9%  de 
participação.
- 9 -
Uanderson Rebula de Oliveira Estatística
POSSÍVEIS SOLUÇÕES PARA REDUZIR OS ACIDENTES
 
A partir da análise dos dados podemos concluir que a política de segurança do trabalho adotada no País está 
estagnada.  A  simples  aplicação  da  norma  regulamentadora  não  está  sendo  suficiente  para  reduzir  o  índice  de 
acidentes. Os dados nos mostram que não haverá mudanças significativas se não forem feitas alterações nessa 
política. 
 
Para  contornar  a  situação,  os  Ministérios  do  Trabalho,  da  Saúde  e  da  Previdência  Social  publicaram,  para 
consulta pública, em 29.12.2004 a PNSST ‐ POLÍTICA NACIONAL DE SEGURANÇA E SAÚDE DO TRABALHADOR, 
com  a  finalidade  de  promover  a  melhoria  da  qualidade  de  vida  e  da  saúde  do  trabalhador.  Esse  plano  está 
disponível no portal www.mte.gov.br.  
 
Os Ministérios reconheceram a deficiência da segurança do trabalho no país, carecendo de mecanismos que: 
• Incentivem medidas de prevenção; 
• Responsabilizem os empregadores; 
• Propiciem o efetivo reconhecimento dos direitos do trabalhador; 
• Diminuam a existência de conflitos institucionais;  
• Tarifem de maneira mais adequada as empresas e possibilite um melhor gerenciamento dos fatores 
de riscos ocupacionais. 
Face ao exposto, a PNSST propõe, dentre outras, as seguintes ações a serem desenvolvidas de modo articulado e 
cooperativo pelos três Ministérios: 
Área  Ações 
 
 
 
Tributos1
, 
financiamentos 
e licitações. 
Estabelecer política tributária que privilegie empresas  com menores índices de acidentes e que 
invistam na melhoria das condições de trabalho; 
Criar linhas de financiamento para a melhoria das condições de trabalho, incluindo máquinas e 
equipamentos, em especial para as pequenas e médias empresas; 
Incluir requisitos de Segurança do Trabalho ‐ SST para concessão de financiamentos públicos e 
privados; 
Incluir requisitos de SST nos processos de licitação dos órgãos públicos; 
Instituir a obrigatoriedade de publicação de balanço de SST para as empresas, a exemplo do que já 
ocorre com os dados contábeis; 
 
 
 
Educação e 
pesquisa 
Incluir conhecimentos básicos em SST no currículo do ensino fundamental e médio; 
Incluir disciplinas em SST no currículo de ensino superior, em especial nas carreiras de profissionais 
de saúde, engenharia e administração; 
Estimular a produção de estudos e pesquisas na área de interesse desta Política; 
Articular instituições de pesquisa e universidades para a execução de estudos e pesquisas em SST, 
integrando uma rede de colaboradores para o desenvolvimento técnico ‐ cientifico na área; 
Desenvolver um amplo programa de capacitação dos profissionais, para o desenvolvimento das 
ações em segurança e saúde do trabalhador; 
Ambientes 
nocivos 
Eliminar as políticas de monetarização dos riscos (adicionais de riscos). 
Outras ações 
Coleta de 
dados 
Compatibilizar os instrumentos de coleta de dados e fluxos de informações. 
Incluir nos Sistemas e Bancos de Dados as informações contidas nos relatórios de intervenções e 
análises dos ambientes de trabalho, elaborados pelos órgãos de governo envolvidos nesta Política. 
A gestão do PNSST prevê o seu desenvolvimento pelo Grupo Executivo Interministerial de Segurança e Saúde do 
Trabalhador – GEISAT, integrado por representantes do Ministério do Trabalho, da Saúde e da Previdência Social. 
Ressalta‐se que no PNSST não está previsto o prazo para execução das ações propostas. Infelizmente este plano 
permanece no papel até os dias de hoje e sem sinais de sua saída desta condição tão cedo.
 
 
 
_________________ 
1. Tributo: Impostos; taxas e contribuições de melhoria, devida ao poder público. 
- 10 -
Uanderson Rebula de Oliveira Estatística
CONSIDERAÇÕES FINAIS SOBRE O ESTUDO DE ACIDENTES
 
O que acabamos de ver é um estudo estatístico. 
 
Como vimos, os dados sobre acidentes do trabalho no Brasil são controladas pelo Ministério da Previdência Social, 
junto ao INSS (Instituto Nacional de Seguridade Social). A comunicação de acidentes permite ao INSS estimar e 
acompanhar  o  real  impacto  do  trabalho  sobre  a  saúde  e  a  segurança  da  população  brasileira.  O  INSS  coleta, 
organiza, apresenta e publica as estatísticas de acidentes do trabalho no Brasil. 
 
Conforme observado, quando ocorre um acidente, a empresa, por força de lei, é obrigada a enviar a CAT ao INSS, 
alimentando, assim, o seu grande banco de dados.   
 
As estatísticas de acidentes no Brasil podem ser visualizadas no site da Previdência Social através 
do endereço eletrônico www.previdencia.gov.br. O interessante neste site é a existência de um 
documento, disponível para download, denominado “Anuário estatístico da previdência social”. 
Nele  estão  contidos  todos  os  dados  estatísticos  da  Previdência  Social,  inclusive  os  dados 
referentes  a  acidentes  do  trabalho,  distribuídos  por  região,  idade,  tipos,  parte  do  corpo  mais  atingida  dentre 
outros. É um importante documento para os estudiosos no assunto. 
 
É importante ressaltar que os dados de acidentes de trabalho não se constituem, tão 
somente,  num  importante  registro  histórico,  mas  sim  numa  ferramenta  inestimável 
para os profissionais que desempenham atividades nas áreas de saúde e segurança do 
trabalhador,  assim  como  pesquisadores  e  demais  pessoas  interessadas  no  tema.  A 
análise desses dados possibilita a construção de um diagnóstico mais preciso acerca da 
epidemiologia dos acidentes, propiciando, assim, a elaboração de políticas mais eficazes 
para as áreas relacionadas com o tema, como vimos no PNSST. 
 
 
TÓPICO PARA REFLEXÃO
Acidente do
Trabalho: o
problema do
Brasil.
 
Os acidentes de trabalho afetam a produtividade econômica, são responsáveis por um impacto substancial 
sobre o sistema de proteção social e influenciam o nível de satisfação do trabalhador e o bem estar geral da 
população. 
 
Estima‐se que a ausência de segurança nos ambientes de trabalho no Brasil tenha gerado, no ano de 2003, um 
custo  de  cerca  de  R$32,8  bilhões  para  o  país.  Deste  total,  R$  8,2  bilhões  correspondem  a  gastos  com 
benefícios acidentários e aposentadorias especiais, equivalente a 30% da necessidade de financiamento do 
Regime Geral de Previdência Social ‐ RGPS verificado em 2003, que foi de R$ 27 bilhões. O restante da despesa 
corresponde  à  assistência  à  saúde  do  acidentado,  indenizações,  retreinamento,  reinserção  no  mercado  de 
trabalho e horas de trabalho perdidas. 
 
Isso sem levar em consideração o sub‐dimensionamento na apuração das contas da Previdência Social, que 
desembolsa  e  contabiliza  como  despesas  não  acidentárias  os  benefícios  por  incapacidade,  cujas  CAT  não 
foram emitidas. Ou seja, sob a categoria do auxílio doença não ocupacional, encontra‐se encoberto um grande 
contingente de acidentes que não compõem as contas acidentárias. 
 
Parte  deste  “custo  segurança  no  trabalho”  afeta  negativamente  a  competitividade  das  empresas,  pois  ele 
aumenta o preço da mão‐de‐obra, o que se reflete no preço dos produtos. Por outro lado, o incremento das 
despesas  públicas  com  previdência,  reabilitação  profissional  e  saúde  reduz  a  disponibilidade  de  recursos 
orçamentários para outras áreas ou induz o aumento da carga tributária sobre a sociedade. 
 
De outro lado, algumas empresas afastam trabalhadores, e muitas vezes os despedem logo após a concessão 
do beneficio. Com isso, o trabalhador se afasta, já sendo portador de doença crônica contraída no labor, e o 
desemprego poderá se prolongar na medida em que, para obter o novo emprego, será necessária a realização 
do  exame  admissional,  no  qual  serão  eleitos  apenas  aqueles  considerados  como  “aptos”  e,  portanto,  não 
portadores de enfermidades. 
 
Fonte: RESOLUÇÃO CNPS Nº 1.269, DE 15 DE FEVEREIRO DE 2006 
 
 
- 11 -
Uanderson Rebula de Oliveira Estatística
CONCEITO DE ESTATÍSTICA
 
É A CIÊNCIA QUE SE DEDICA EM COLETAR, ORGANIZAR, APRESENTAR, ANALISAR E INTERPRETAR 
DADOS (INFORMAÇÕES) PARA TOMADA DE DECISÃO. 
 
Estatística é a ciência dos dados. A Estatística lida com a coleta, o 
processamento e disposição de dados (informações), atuando como 
ferramenta fundamental nos processos de soluções de problemas. A 
Estatística facilita o estabelecimento de conclusões confiáveis sobre 
algum fenômeno que esteja sendo estudado (WERKEMA, 1995).  
 
É por meio da análise e interpretação dos dados estatísticos que é 
possível o conhecimento de uma realidade, de seus problemas, bem 
como,  a  formulação  de  soluções  apropriadas  por  meio  de  um 
planejamento  objetivo  da  ação,  para  além  dos  “achismos”  e 
“casuismos” comuns. 
 
No uso diário o termo “estatística” refere‐se a fatos numéricos. Tenha em mente, entretanto, que estatística 
é bem diferente de matemática. Estatística é, antes de qualquer coisa, um método científico que determina 
questões de pesquisa; projeta estudos e experimentos; coleta, organiza, resume e analisa dados; interpreta 
resultados  e esboça  conclusões. Ou  seja, utiliza‐se  dados  como  evidências para  responder  a  interessantes 
questões  sobre  o  mundo.  A  matemática  só  é  utilizada  para  calcular  a  estatística  e  realizar  algumas  das 
análises,  mais  isso  é  apenas  uma  pequena  parte  do  que  realmente  é  a  estatística.  Portanto,  a  estatística 
mantém  com  a  matemática  uma  relação  de  dependência,  solicitando‐lhe  auxílio,  sem  o  qual  não  poderia 
desenvolver‐se. 
 
A  Estatística  é  uma  ciência  interdisciplinar,  ou  seja,  é  comum  a  duas  ou  mais  disciplinas  ou  ramos  de 
conhecimento.  Assim,  a  Estatística  é  aplicada  na  Medicina,  Administração,  Engenharias,  Economia, 
Contabilidade, Direito, Segurança do Trabalho, Qualidade, Marketing entre outras áreas. Veja abaixo. 
 
   
 
Medicina. Estudos de epidemiologia, 
inter‐relações  dos  determinantes  da 
freqüência  e  distribuição  de  doenças 
populacionais 
*Engenharia de Produção. Estudos de 
um  conjunto  de  dados  de  todas  as 
fases de um processo produtivo. 
Segurança  do  Trabalho.  Estudos  de 
acidentes  e  doenças,  suas  causas, 
quantidade, parte atingida, setores, % 
de afastamentos etc. 
Contabilidade.  Estudos  das 
informações financeiras das empresas 
públicas e privadas. 
Finanças.  Estudos  de  uma  série  de 
informações estatísticas para orientar 
investimentos. 
Economia.  Estudos  de  taxas  de 
inflação,  índice  de  preços,  taxa  de 
desemprego, futuro da economia. 
 
*Engenharia de Produção – A aplicação da Estatística na produção merece especial atenção. A atual ênfase na 
qualidade torna o controle da qualidade uma importante aplicação da estatística na área da produção. Usa‐se 
uma série de mapas estatísticos de controle de qualidade para monitorar o resultado (output) de um processo 
de  produção.  Suponha,  por  exemplo,  que  uma  máquina  preencha  recipientes  com  2  litros  de  determinado 
refrigerante. Periodicamente, um operador do setor de produção seleciona uma quantidade de recipientes e 
verifica a exatidão, ou seja, se não há desvios. A Estatística também é usada na Engenharia de Produção para 
Estratificação, que consiste no agrupamento da informação (dados) sob vários pontos de vista, de modo a 
focalizar a ação, considerando os fatores equipamento, tempo entre outros. Exemplo: 
 
Tipo de dano:  Operador:  Máquina de lavar: Roupas danificadas  
em uma lavanderia  Tipo de roupa:  Marca do sabão:  Máquina de secar: 
- 12 -
Uanderson Rebula de Oliveira Estatística
UM POUCO DE HISTÓRIA E ATUALIDADE  
 
O termo “Estatística” provém da palavra “Estado” e foi utilizado originalmente 
para  denominar  levantamentos  de  dados  (riquezas,  impostos,    nascimentos, 
mortalidade,  batizados,  casamentos,  habitantes  etc.),  cuja  finalidade  era 
orientar o Estado em suas decisões.  
 
Segundo  Costa  (2005,  p.  5)  em  1085,  Guilherme  “O  Conquistador”, 
ordenou  que  se  fizesse  um  levantamento  na  Inglaterra,  que  deveria 
incluir  informações  sobre  terras,  proprietários,  uso  da  terra, 
empregados,  animais  e  serviria,  também,  de  base  para  cálculo  de 
impostos. Tal levantamento originou um volume intitulado “domesday book”. 
 
No  século  XVIII  o  estudo  dos  dados  foi  adquirindo,  aos  poucos,  feição 
verdadeiramente  científica.  A  palavra  Estatística  apareceu  pela  primeira 
vez no século XVIII e foi sugerida pelo alemão Godofredo Achenwall (1719‐
1772), onde determinou o seu objetivo e suas relações com as ciências. 
 
Desde essa época, a Estatística deixou de ser a simples catalogação de dados numéricos coletivos e se 
tornou o estudo de como chegar a conclusões sobre o todo, partindo da observação e análise de partes 
desse todo. Essa é sua maior riqueza.  
 
 
Atualmente  a  sociedade  está  completamente  tomada  pelos  números.  Eles 
aparecem  em  todos  os  lugares  para  onde  você  olha,  de  outdoors  mostrando  as 
últimas  estatísticas  sobre  aborto,  passando  pelos  programas  de  esporte  que 
discutem as chances de um time de futebol chegar à final do campeonato, até o 
noticiário  da  noite,  com  reportagens  focadas  no  índice  de  criminalidade,  na 
expectativa de vida de uma pessoa que não come alimentos saudáveis e no índice 
de aprovação do presidente.  
 
Em um dia comum, você pode se deparar com cinco, dez ou, até mesmo, vinte diferentes estatísticas (ou até 
muito  mais  em  um  dia  de  eleição).  Se  você  ler  todo  o  jornal  de  domingo,  irá  se  deparar  com  centenas  de 
estatísticas em reportagens, propagandas e artigos sobre todo tipo de assunto: desde sopa (quanto em média uma 
pessoa consome por ano?) até castanhas (quantas castanhas você precisa comer para aumentar seu QI?). 
Nas  empresas  a  Estatística  desempenha  um  papel  cada  vez  mais  importante  para  os  Gerentes.  Esses 
responsáveis pela tomada de decisão utilizam a estatística para: 
 
Apresentar e descrever apropriadamente dados e informações sobre 
a empresa; 
Tirar conclusões sobre grandes populações, utilizando informações 
coletadas a partir de amostras; 
Realizar suposições confiáveis sobre a atividade da empresa; 
Melhorar os processos da empresa. 
 
A estatística é um instrumento eficiente para a compreensão e interpretação da realidade e não 
deve ser subestimada. Realmente existem pesquisas feitas de forma incorreta e que, por isso, não 
são confiáveis. Mas, em geral, quando um estudo estatístico é feito com critério, seus resultados 
permitem obter conclusões e prever tendências sobre fatos e fenômenos. Um estudo bem feito 
não elimina o erro, mas limita‐o a uma margem, procurando torná‐la o menor possível. 
 
 
 
- 13 -
Uanderson Rebula de Oliveira Estatística
1.2 FASES DO ESTUDO ESTATÍSTICO
 
Um estudo estatístico confiável depende do planejamento e da correta execução das seguintes etapas: 
1. Definir o que será estudado e a natureza dos dados, como exemplo:
 
ESTUDO NATUREZA DOS DADOS
Acidentes do Trabalho  
no Brasil 
Quantidade e período 
Por regiões, estados ou municípios 
Por atividade econômica 
Por idade dos acidentados 
Por parte do corpo atingida 
Por causas dos acidentes etc. 
Peças danificadas  
na linha A 
Tipo de peça   |  Tipo de defeito 
Quantidade  
Período 
Turnos 
Máquinas 
Operadores 
Matéria prima etc. 
 
É preciso definir com clareza os objetivos da pesquisa, ou seja, o que se pretende apurar, que tipo de 
problema buscará detectar. 
2. Coletar dados
Após a definição do que será estudado e o estabelecimento do planejamento do trabalho (forma de coleta dos 
dados,  cronograma  das  atividades,  custos  envolvidos,  levantamento  das  informações  disponíveis),  o  passo 
seguinte é o da coleta de dados, que consiste na busca ou compilação dos dados, componentes do fenômeno a ser 
estudado. 
Nessa etapa recolhem‐se os dados tendo o cuidado de controlar a qualidade da informação. O sucesso de uma 
pesquisa depende muito da qualidade dos dados recolhidos. 
 
Podem ser por meio de:  
• Criação de Softwares, a exemplo da CAT; 
• Uso de Softwares da empresa; 
• Dados históricos da empresa (físicos); 
• Pesquisas com questionários etc.
3. Organizar e contar dados
À  procura  de  falhas  e  imperfeições,  os  dados  devem  ser  cuidadosamente 
organizados  e  contados,  a  fim  de  não  incorrermos  em  erros  grosseiros  que 
possam influenciar nos resultados. 
No exemplo da “Estatística na prática”, após a coleta da quantidade de acidentes por 
meio  da  CAT,  organiza‐os  por  período,  regiões  etc.  Da  mesma  maneira,  se  você  usa  um 
questionário para coletar dados na empresa, organiza‐os da forma necessária à pesquisa, além da 
contagem a ser feita. 
- 14 -
Uanderson Rebula de Oliveira Estatística
4. Apresentação de dados
Os dados devem ser apresentados sob a forma de tabelas ou gráficos, a fim de tornar mais fácil e rápido o exame 
daquilo que está sendo estudado. 
5. Análise dos dados e tomada de decisão
Chegamos à fase mais complexa do processo estatístico, que consiste na análise 
dos  dados.  Por  fim,  a  partir  da  análise  realizada,  poderemos  chegar  a  uma 
tomada de decisão. 
 
Observe  o  estudo  “Estatística  na  prática”.  O  que  resultou  a  análise  dos 
acidentes  no  Brasil,  no  período  de  1970  a  2005?  Veja  que  os  Ministérios  do 
Trabalho, Previdência Social e da Saúde se mobilizaram para resolverem essa 
questão de saúde pública, com diversas ações a serem implementadas no país. 
 
 
 
A partir dessa discussão, fica claro que um profissional com conhecimentos de Estatística terá maior facilidade em 
identificar  um  problema  em  sua  área  de  atuação,  determinar  os  tipos  de  dados  que  irão  contribuir  para  sua 
análise, coletar esses dados e a seguir estabelecer conclusões e determinar um plano de ação para a solução do 
problema detectado. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1.220.111
1.504.723
1.796.671
1.743.825
1.551.461
1.464.211
1.178.472
961.575
1.207.859
991.581
693.572
532.514
388.304 395.455
414.341
363.868
340.251
393.071 399.077
465.700 491.711
0
250.000
500.000
750.000
1.000.000
1.250.000
1.500.000
1.750.000
2.000.000
1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2001 2002 2003 2004 2005
Involução da QUANTIDADE de ACIDENTES DO
TRABALHO no Brasil - 1970 a 2005.
Anos
FONTE: Revista Proteção
Aprovação das NR’s
- 15 -
Uanderson Rebula de Oliveira Estatística
1.3 VOCABULÁRIO BÁSICO DE ESTATÍSTICA 
 
O vocabulário utilizado em estudos estatísticos teve sua origem nos primeiros estudos feitos pela humanidade e 
que  eram  relativos  à  demografia  (estudo  estatístico  das  populações).  Por  isso  a  Estatística  emprega  termos 
próprios dessa área de conhecimento, mas com um sentido diferenciado. Assim, para dar prosseguimento, é de 
extrema importância destacar alguns termos utilizados no jargão estatístico. 
 
VARIÁVEL – É o termo usado para aquilo que você está pesquisando, estudando, analisando. 
 
No  estudo  representado  no  gráfico  abaixo  a  variável  é  o  acidente  do  trabalho.  Utilizada  como  um  adjetivo  do 
vocabulário do dia‐a‐dia, variável sugere que alguma coisa se modifica ou varia.  
 
São exemplos de Variáveis
Doenças, Sexo, Estaturas, Peso, Idade, Renda, Natalidade, Mortalidade, PIB, Inflação, Exportações brasileiras,
Produção de café, Alimentação, Peças produzidas por hora, Paradas de produção no mês, Rotatividade de
estoque por ano, Poluição, Clima na região sudeste, Consumo de energia no mês, Vendas mensais de uma
empresa, Produção diária de automóveis etc.
 
EXEMPLO DE APLICAÇÃO:
A associação dos moradores de um bairro queria traçar um perfil dos freqüentadores de um parque ali situado. 
Uma equipe de pesquisa elaborou questões a fim de reunir as informações procuradas. Numa manhã de quarta‐
feira, 6 pessoas foram entrevistadas e cada uma respondeu a questões para identificar idade, número de vezes 
que freqüenta o parque por semana, estado civil, meio de transporte utilizado para chegar ao parque, tempo de 
permanência no parque e renda familiar mensal. Os resultados são mostrados na tabela a seguir: 
 
 
 
 
Cada um dos aspectos investigados — os quais permitirão fazer a análise desejada — é denominado variável. 
1.220.111
1.504.723
1.796.671
1.743.825
1.551.461
1.464.211
1.178.472
961.575
1.207.859
991.581
693.572
532.514
388.304 395.455
414.341
363.868
340.251
393.071 399.077
465.700 491.711
0
250.000
500.000
750.000
1.000.000
1.250.000
1.500.000
1.750.000
2.000.000
1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2001 2002 2003 2004 2005
Involução da QUANTIDADE de ACIDENTES
DO TRABALHO no Brasil - 1970 a 2005.
FONTE: Revista Proteção Anos
VARIÁVEL
Variáveis
- 16 -
Uanderson Rebula de Oliveira Estatística
TIPOS DE VARIÁVEIS
 
Há,  pois,  uma  divisão  principal  para  as  variáveis  estatísticas,  que  consiste  em  considerá‐las  como  Variáveis  Quantitativas 
(contínuas ou discretas) e Variáveis Qualitativas. Esta divisão é de facílima compreensão! Veja o esquema abaixo. 
 
Esquema básico
Tipo de VARIÁVEL Resposta fornecida à pesquisa Exemplos
Quantitativa Em números
Discreta Inteiros 0,1, 2, 3,...,9 Gols de futebol, Idade (anos)
Contínua Não inteiros 0,12 1,64 Altura (cm), Peso (kg), Tempo
Qualitativa Em nomes, atributos Sexo, Cor, Nacionalidade, Raça
Tipos de Variáveis da pesquisa em um parque:
 
Se a dúvida persiste, no quadro abaixo você pode observar os esclarecimentos do Esquema básico. 
Esclarecimentos do Esquema básico
Tipo de VARIÁVEL Resposta fornecida à pesquisa
Quantitativa
(Em números)
Será Quantitativa a variável para a qual se possa atribuir um valor numérico. Se a resposta 
fornecida  à  pesquisa  estiver  expressa  por  um  número,  então  a  variável  é  quantitativa.  Por 
exemplo:  quantos  livros  você  lê  por  ano?  A  resposta  é  um  número?  Então,  variável 
quantitativa.  Quantas  pessoas  moram  em  sua  casa?  A  resposta  é  um  número?  Então, 
novamente, variável quantitativa.  
Exemplo. No caso do estudo “ACIDENTE DO TRABALHO”, é uma variável quantitativa, pois o 
objeto do estudo foi a quantidade de acidentes no período de 1970 a 2005
Discreta
(números inteiros)
(contagem)
Variável  Quantitativa  Discreta  é  a  variável  quantitativa  que  assume  somente  números 
inteiros.  Resulta,  geralmente,  de  contagem.  Esta  variável  não  pode  assumir  qualquer  valor, 
dentro  de  um  intervalo  de  valores  de  resultados  possíveis.  Por  exemplo,  se  eu  pergunto 
quantos irmãos você tem, a resposta jamais poderia ser “tenho 3,75 irmãos”, ou “tenho 4,8 
irmãos”, ou seja, a resposta não poderia assumir todos os valores de um intervalo! Este acima 
é  o  conceito  formal  de  variável  discreta!  O  conceito  para  memorizar  é  o  seguinte:  aquela 
variável  obtida  por  meio  de  uma  contagem.  Em  outras  palavras:  a  variável  discreta  você 
conta!.  Exemplos:  quantas  pessoas  moram  na  sua  casa?  Quantos  livros  você  tem?  Quantos 
carros você tem? Se, para responder à pergunta, você faz uma contagem, então está diante de 
uma variável quantitativa discreta. 
Contínua
(Números não inteiros)
(medição)
Variável  Quantitativa  Contínua  é  aquela  que  pode  assumir  qualquer  valor  dentro  de  um 
intervalo de resultados possíveis. Se eu pergunto quantos quilos você pesa, a resposta pode ser 
65,35kg. Se eu pergunto qual a temperatura na cidade hoje, a resposta pode ser 27,35°C. Para 
facilitar a memorização, basta lembrar que a variável quantitativa contínua pode ser obtida 
por uma medição, ou seja, a variável contínua você mede! Exemplos: peso, altura, duração de 
tempo para resolução de uma prova, pressão, temperatura etc. 
Qualitativa
(nomes, atributos)
Se a pergunta é “qual a sua cor preferida?”, logicamente a resposta não será um número, daí 
estaremos tratando de uma variável qualitativa, ou seja, aquela para a qual não se atribui um 
valor numérico. Exemplos: Sexo: masculino ou feminino 
Qualitativa
Quantitativa 
discreta 
Quantitativa 
contínua 
- 17 -
Uanderson Rebula de Oliveira Estatística
1.4 POPULAÇÃO E AMOSTRA 
 
Quando você quer saber se a sopa ficou boa, o que você faz? Mexe a panela, retira um pouco com 
uma colher e prova. Depois tira uma conclusão sobre todo o conteúdo da panela sem, na verdade, 
ter provado tudo. Portanto, é possível ter uma idéia de como a sopa está sem ter que comer tudo. 
Isso é o que se faz em estatística. 
 
A estatística deixou de ser a simples catalogação de dados numéricos e se tornou o estudo de como 
chegar a conclusões sobre o todo (população), partindo da observação e análise de partes desse 
todo (amostra). Essa é sua maior riqueza. Assim, podemos conceituar população e amostra como: 
 
POPULAÇÃO É UM CONJUNTO DE TODOS OS ELEMENTOS EM ESTUDO. 
AMOSTRA É UMA PARTE DA POPULAÇÃO. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Muitas vezes quando queremos fazer um estudo estatístico, não é possível analisar toda a população 
envolvida com o fato que pretendemos investigar, como exemplo o sangue de uma pessoa ou a poluição 
de um rio. É impossível o teste do todo. Há situações também em que é inviável o estudo da população, 
por  exemplo,  a  pesquisa  com  todos  os  torcedores  em  um  estádio  de  futebol  durante  uma  partida. 
Nesses  casos,  o  estatístico  recorre  a  uma  amostra  que,  basicamente,  constitui  uma  redução  da 
população a dimensões menores, sem perda das características essenciais. 
 
Os resultados fundamentados em uma amostra não serão exatamente os mesmos que você encontraria 
se estudasse toda a população, pois, quando você retira uma amostra, você não obtém informações a 
respeito  de  todos  em  uma  dada  população.  Portanto,  é  importante  entender  que  os  resultados  da 
amostra fornecem somente estimativas dos valores das características populacionais. Com métodos de 
amostragens apropriados, os resultados da amostra produzirão “boas” estimativas da população, ou 
seja, um estudo bem feito não elimina o erro, mas limita‐o a uma margem, procurando torná‐la o menor 
possível. Quando aprendemos estatística inferencial, também aprendemos técnicas para controlar esses 
erros de amostragem. 
 
4 razões para selecionar uma amostra
O número de elementos em uma população é muito grande; 
Demanda menos tempo do que selecionar todos os itens de uma população; 
É menos dispendioso (caro) do que selecionar todos os itens de uma população; 
Uma análise amostral é menos cansativa e mais prática do que uma análise da população inteira.  
Podemos visualizar o conceito 
de  população  e  amostra  na 
figura ao lado. 
 
Quando  pesquisamos  toda  a 
população, damos o nome de 
censo. 
A  precisão  depende  do 
tamanho  da  amostra,  e 
quanto  maior  é  o  tamanho 
amostral,  maior  será  a 
precisão das informações. 
AMOSTRA
(uma parte da população)
POPULAÇÃO(todos os elementos em estudo)
AMOSTRA
(uma parte da população)
POPULAÇÃO(todos os elementos em estudo)
N é designado para População
n é designado para Amostra
“N”
“n”
- 18 -
Uanderson Rebula de Oliveira Estatística
São exemplos de População e Amostra:
MEDICINA.  Pretende‐se  estudar  o  efeito  de  um  novo  medicamento  para  curar  determinada  doença.  É 
selecionado um grupo de 50 doentes, administrando‐se o novo medicamento a 10 desses doentes escolhidos ao 
acaso e o medicamento habitual aos restantes.  
População: Todos os 50 doentes com a doença que o medicamento a estudar pretende tratar. 
Amostra: Os 10 doentes selecionados. 
CONTROLE DE QUALIDADE. O Gerente de Produção de uma fábrica de parafusos pretende assegurar‐se de que 
a  porcentagem  de  peças  defeituosas  não  excede  um  determinado  valor,  a  partir  do  qual  determinada 
encomenda poderia ser rejeitada.  
População: Todos os parafusos fabricados ou a fabricar, utilizando o mesmo processo. 
Amostra: Parafusos escolhidos ao acaso entre os lotes produzidos. 
ESTUDOS DE MERCADO. O gerente de uma fábrica de produtos desportivos pretende lançar uma nova linha de 
esquis, pelo que encarrega uma empresa especialista em estudos de mercado de “estimar“ a porcentagem de 
potenciais compradores desse produto. 
População: conjunto de todos os praticantes de desportos de neve. 
Amostra: conjunto de alguns praticantes inquiridos pela empresa. 
SISTEMAS DE PRODUÇÃO. Um fabricante de pneus desenvolveu um novo tipo de pneu e quer saber o aumento 
da durabilidade em termos de kilometragem em relação à atual linha da empresa. Produz diariamente 1000 
pneus e selecionou 120 para testes. 
População: 1000 pneus. 
Amostra: 120 pneus. 
 
A amostra na prática - Oxford Cereais (Levine et al, 2008, p.218)
A Oxford Cereais abastece milhares de caixas de cereais durante um turno de oito horas. Como 
gerente de operações da unidade de produção, você é responsável por monitorar a quantidade de 
cereal colocada em cada caixa. Para ser coerente com o conteúdo especificado na embalagem, as 
caixas devem conter 368 gramas de cereal. Em razão da velocidade do processo, o peso do cereal 
varia  de  caixa  para  caixa,  fazendo  com  que  algumas  caixas  fiquem  mal  abastecidas  enquanto 
outras ficam hiperabastecidas. Se o processo não estiver funcionando de maneira apropriada, o 
peso das caixas pode se desviar demasiadamente do peso especificado no rótulo, 368 gramas, e 
se tornar inaceitável. Uma vez que a pesagem de cada caixa individual consome uma quantidade 
demasiadamente grande de tempo, é dispendiosa e ineficiente, você deve extrair uma amostra de caixas. Para cada amostra 
selecionada, você planeja pesar caixas individuais. Com base em sua análise, você terá que decidir entre manter, alterar ou 
interromper o processo. 
 
MÉTODOS DE AMOSTRAGEM PROBABILÍSTICOS
 
 
Amostragem Aleatória Simples – É a técnica de amostragem em que cada um dos
elementos da população tem a mesma chance de ser selecionado. 
Uma característica importante de uma boa pesquisa é que a amostra da população alvo seja selecionada 
aleatoriamente.  Aleatoriamente  significa  que  todos  os  membros  da  população  alvo  devem  ter  as 
mesmas  chances  de  serem  incluídos  na  amostra.  Ou  seja,  o  processo  usado  para  a  seleção  de  sua 
amostra não pode ser parcial. “Aleatório” = Dependente de fatores incertos. 
 
Suponha que você tenha um rebanho com 500 novilhos  e precisa retirar 
uma amostra aleatória de 50 deles para fazer um exame para uma doença. 
Retirar os 50 primeiros novilhos que vierem em sua direção não se encaixaria 
na definição de amostra aleatória. Os primeiros novilhos que forem capazes 
de  vir  em  sua  direção,  provavelmente  são  os  que  têm  menos  chances  de 
apresentarem qualquer tipo de doença ou, talvez, sejam os mais velhos e mais amigáveis, que realmente 
são  os  mais  suscetíveis  a  doenças.  De  qualquer  forma,  a  pesquisa  foi  tendenciosa.  Como  coletar  uma 
amostra  aleatória  dos  novilhos?  Os  animais  provavelmente  possuem  etiquetas  com  um  número  de 
identificação, assim você deve conseguir uma lista com todos os números de identificação, selecione uma 
amostra aleatória desses números e localize os animais.  
- 19 -
Uanderson Rebula de Oliveira Estatística
Uma amostra aleatória é boa; ela dá a mesma chance a todos os membros de uma população de ser 
selecionado, além de utilizar mecanismos de casualidade para escolhê‐los, como a tabela de números 
aleatórios. O método é semelhante a um sorteio. 
Tabela de números aleatórios
 
Um dos mecanismos utilizados para seleção é a tabela de números aleatórios, que consiste em uma série 
de números listados em uma sequência aleatoriamente gerada.  Esta tabela tem duas características que 
a tornam particularmente adequada: primeiro, os números estão dispostos de tal maneira que a chance 
de  qualquer  um  deles  aparecer  em  determinada  sequência  é  igual  à  chance  do  aparecimento  em 
qualquer outra posição; segundo, cada uma de todas as combinações de dois algarismos tem a mesma 
chance de ocorrência, como também todas as combinações de três algarismos, e assim por diante.  
 
Sistemas  computacionais  elaboram  números  aleatórios.  O  Excel  dispõe  da 
função “ALEATÓRIO” para gerar números aleatórios (veja figura ao lado).   
 
A  tabela  de  números  aleatórios  abaixo  foi  construída  de  modo  que  os  dez  algarismos  (0  a  9)  são 
distribuídos ao acaso, pelo Excel, identificadas pelas linhas (1, 2, 3, 4...) e colunas (A, B, C, D ...): 
 
 
Tabela de números aleatórios
  A  B  C  D  E  F  G  H  I  J  K  L  M  N O P Q R S T U V W X Y Z a b  c  d  e  f  g  h i  j  k l 
1  9  3  3  1  2  1  6  6  3  3  9  0  7  0 4 0 4 4 1 3 8 1 6  5 8 8 9 8  6  5  0  6  3  3 1 2 4 8
2  0  7  6  8  1  4  5  0  5  8  6  6  1  4 2 6 7 5 6 0 5 7 7  9 6 3 2 6  3  4  5  9  8  6 5 2 1 1
3  6  5  1  5  3  4  4  2  3  7  9  1  4  8 5 8 7 2 4 7 3 7 0  6 2 2 1 3  5  0  8  9  4  7 1 6 4 4
4  9  7  0  2  6  7  3  2  6  7  4  9  1  6 2 7 7 8 6 8 4 7 8  1 5 7 1 2  6  6  6  3  5  6 0 8 2 1
5  5  5  6  5  1  6  4  8  3  3  1  5  3  8 8 2 3 8 8 7 7 4 5  0 4 5 1 8  7  2  3  2  9  6 4 7 7 9
6  8  3  4  8  8  3  8  0  6  4  8  2  3  5 2 5 3 7 1 7 6 8 2  9 5 3 4 3  7  0  3  9  7  0 1 5 7 2
7  3  1  2  7  5  4  7  1  3  5  2  4  1  5 1 3 1 8 0 5 8 8 6  0 6 6 9 5  5  5  3  5  8  5 6 7 1 2
8  3  6  3  1  1  7  6  9  5  3  3  5  3  5 6 3 3 3 4 3 6 8 4  5 5 8 8 1  9  2  5  7  8  7 7 5 8 7
9  4  2  0  4  7  2  7  9  3  3  3  3  3  2 8 7 1 8 0 6 1 5 3  4 0 6 3 2  8  3  3  0  7  2 7 2 4 2
10  6  8  7  0  3  9  9  9  8  6  8  2  1  5 8 7 4 5 5 2 6 3 4  1 1 2 2 1  2  9  4  0  5  8 7 0 6 8
11  7  9  1  6  5  8  1  4  3  7  9  1  2  5 3 4 1 6 3 1 6 3 2  5 1 9 5 7  7  5  6  6  8  4 6 5 7 1
12  8  1  4  6  3  8  8  4  7  1  3  6  3  7 7 5 2 6 2 4 8 6 3  2 1 4 8 3  1  7  0  8  1  9 4 1 2 3
13  8  1  7  9  3  4  3  6  9  5  9  2  1  7 3 8 7 5 2 2 7 6 0  6 1 8 1 2  1  4  8  5  2  7 3 3 8 5
14  2  8  8  4  4  0  4  3  2  2  8  1  1  0 2 8 1 8 1 4 5 1 8  1 8 3 3 4  5  6  6  8  1  4 7 4 3 3
15  3  3  7  2  0  0  2  9  5  5  6  8  2  4 5 7 4 0 6 7 3 2 6  3 7 6 7 2  7  2  2  7  6  4 1 6 1 1
16  0  2  7  8  1  7  7  6  0  4  3  4  5  8 7 8 3 0 3 1 2 7 8  5 2 3 2 5  7  5  7  4  3  5 2 9 4 6
17  1  1  0  5  9  6  6  2  7  2  2  7  1  8 5 5 2 7 5 9 5 0 3  7 0 3 1 5  4  2  9  7  4  4 2 6 0 5
18  1  9  0  4  1  1  4  3  3  1  5  6  7  0 1 2 2 2 4 4 9 2 2  1 9 7 1 5  9  1  1  5  8  9 7 2 2 2
19  6  9  7  4  5  0  1  0  6  6  2  1  5  2 1 8 8 2 5 2 2 2 8  1 2 3 8 1  3  5  7  6  7  8 1 6 7 1
20  2  7  1  2  1  6  3  1  1  7  1  2  3  4 8 8 1 1 7 1 1 1 3  6 2 1 1 7  9  2  2  5  3  2 2 2 7 6
21  9  5  5  5  2  2  0  1  3  6  9  6  5  3 2 2 6 3 1 4 4 4 3  1 6 7 0 5  5  1  0  7  3  1 2 1 5 3
22  4  2  4  9  7  3  1  8  3  4  8  3  7  1 3 1 1 6 4 8 2 3 3  1 4 7 3 8  6  3  1  8  0  2 8 1 0 8
23  5  8  3  1  1  3  8  2  5  3  8  6  2  2 7 8 1 1 1 3 4 4 8  8 6 4 2 3  1  8  6  1  8  4 9 1 5 6
24  8  4  3  2  1  3  5  7  6  7  3  3  6  1 9 4 7 6 5 6 6 7 2  6 5 7 0 8  2  6  4  9  1  4 7 7 3 4
25  1  2  8  1  0  5  4  3  8  5  1  1  8  9 1 3 8 7 4 5 0 4 7  0 8 3 8 9  6  2  3  7  1  4 6 2 9 4
26  7  7  5  7  9  2  4  5  7  8  7  1  4  8 4 1 6 4 9 7 5 9 4  1 4 4 3 2  2  5  8  0  2  3 4 5 4 2
27  7  2  8  8  8  3  8  5  5  4  4  5  9  4 9 2 3 1 1 1 2 7 6  3 5 1 4 0  6  2  7  7  7  7 7 7 0 4
28  8  7  7  1  9  6  7  6  6  5  5  9  1  6 5 6 1 2 2 3 2 5 7  5 6 9 5 0  3  1  7  1  1  5 5 2 6 6
29  1  4  8  2  2  1  9  5  2  6  6  3  4  0 1 3 0 5 5 6 9 1 7  8 8 8 2 7  7  9  7  5  0  3 6 2 4 4
30  7  6  1  9  0  5  1  4  4  4  1  0  1  6 4 3 7 3 7 1 0 7 4  1 6 8 9 9  7  9  6  2  7  6 3 7 0 1
31  1  5  8  1  0  4  3  9  2  4  5  6  6  8 2 2 3 1 2 8 4 5 9  1 7 4 7 6  7  1  6  1  8  0 4 6 2 9
32  3  2  2  2  1  1  4  5  8  0  2  4  5  8 3 3 0 9 3 9 8 9 6  9 8 8 4 5  9  8  1  3  3  5 8 9 0 6
33  6  5  4  6  5  9  5  1  0  0  1  4  2  7 7 7 7 8 0 3 2 7 7  2 8 7 5 8  1  3  8  7  6  4 0 0 2 6
34  5  0  8  7  8  1  3  5  1  4  6  1  5  5 6 6 0 3 5 5 0 3 6  5 4 1 4 1  4  0  6  9  5  2 2 0 5 5
 
- 20 -
Uanderson Rebula de Oliveira Estatística
Como usar a tabela de números aleatórios
1º Numerar todos os elementos da população N; 
 
2º Determinar as combinações dos algarismos para assegurar correspondência entre os dígitos aleatórios 
e os elementos da população (ex.: se o último número da população for 80, por exemplo, devem ser lidos 
números de dois algarismos; caso o último número seja 456, devem ser lidos números de três algarismos, 
e assim por diante; 
 
3º Escolher um ponto de partida arbitrário da tabela. A leitura pode ser feita horizontalmente →← (da 
direita  para  a  esquerda  ou  vice‐versa),  verticalmente  ↓↑  (de  cima  para  baixo  ou  vice‐versa), 
diagonalmente ↗↙↖↘ (no sentido ascendente ou descendente) ou formando o desenho de uma letra 
qualquer. A opção, porém, deve ser feita antes de iniciado o processo; 
 
4º Descartar os números maiores que o tamanho da população e/ou numeral repetido; 
 
5º Usar os números escolhidos para identificar os elementos da população. 
 
EXEMPLO. Uma empresa pecuária possui uma população de novilhos de tamanho N = 80 e precisa retirar amostras 
de  tamanho  n  =  12  (15%  da  população)  para  fazer  exame  de  uma  determinada  doença.  Utilize  o  método  de 
amostragem  aleatória  simples,  considerando  a  tabela,  a  partir  da  4ª  linha,  coluna  D,  sentido  horizontal,  da 
esquerda para direita (→).  Informar, também, os números descartados. 
 
SOLUÇÃO.  Como  a  população  N=80  teve  dois  algarismos,  então  combinamos  dois  algarismos  na  tabela  (00), 
descartando os números repetidos e/ou maiores que o tamanho da população (Ex.: 81, 82, 83...) e escolhendo outra 
combinação de algarismos. Este procedimento é repetido até a amostra de tamanho n=12 ser escolhida. Então: 
 
  A  B  C  D  E  F  G  H  I  J  K  L  M  N  O P Q R S T U V W X Y Z a b c  d  e  f  g  h  i  j  k l 
1  9  3  3  1  2  1  6  6  3 3  9  0  7  0  4 0 4 4 1 3 8 1 6  5 8 8 9 8 6  5  0  6  3  3  1 2 4 8
2  0  7  6  8  1  4  5  0  5 8  6  6  1  4  2 6 7 5 6 0 5 7 7  9 6 3 2 6 3  4  5  9  8  6  5 2 1 1
3  6  5  1  5  3  4  4  2  3 7  9  1  4  8  5 8 7 2 4 7 3 7 0  6 2 2 1 3 5  0  8  9  4  7  1 6 4 4
4  9  7  0  2  6  7  3  2  6 7  4  9  1  6  2 7 7 8 6 8 4 7 8  1 5 7 1 2 6  6  6  3  5  6  0 8 2 1
5  5  5  6  5  1  6  4  8  3 3  1  5  3  8  8 2 3 8 8 7 7 4 5  0 4 5 1 8 7  2  3  2  9  6  4 7 7 9
6  8  3  4  8  8  3  8  0  6 4  8  2  3  5  2 5 3 7 1 7 6 8 2  9 5 3 4 3 7  0  3  9  7  0  1 5 7 2
 
n =   26  73  74  62  77  78  15  71  66  35  60  56 
 
Descartados por repetição: 
26    26    15 
Descartados por serem maiores que a população: 
91    86    84    82     
 
 
Amostragem Aleatória Estratificada – É a técnica de amostragem em que dividimos todos os
elementos da população em grupos (estratos) de idênticas características.
 
Às  vezes,  a  população  é  heterogênea  (ex.:  sexo  masculino  e  feminino;  peça  A,  B  e  C)  e  a  amostra  aleatória 
simples não apresentaria esta heterogeneidade. Seria, então, necessário homogeneizar as amostras em grupos, 
estratos.  Neste  caso  recorremos  à  amostragem  aleatória  estratificada.  “Estratificar”  sugere  “formar‐se  em 
camadas”. 
 
A  estratificação  mais  simples  que  encontramos  na  população  do  rebanho  de  tamanho  N=80  é  a  divisão  entre 
novilhos e novilhas. Supondo que haja 35 novilhos e 45 novilhas, teremos a seguinte formação dos estratos: 
 
 
População (80)
Novilhos (35) Novilhas (45)
Estrato 1 Estrato 2
- 21 -
Uanderson Rebula de Oliveira Estatística
São,  portanto,  dois  estratos  (novilhos  e  novilhas).  Como  queremos  uma  amostra  de  tamanho  n=12  (15%  da 
população), por estrato, temos: 
 
Rebanho População 15% Amostra
Novilho (estrato 1)
  35  35*15% = 5,25  5 
Novilha (estrato 2)
  45  45*15%= 6,75  7 
TOTAL  80  80*15% = 12  12 
 
O próximo passo é extrair as amostras dentro de cada estrato. Então, numeramos o rebanho de 01 a 80, sendo que 
de 01 a 35 correspondem novilhos e de 36 a 80, as novilhas.  Tomando na tabela de números aleatórios, a partir 
da 4ª linha, coluna D, sentido horizontal, da esquerda para direita (→), obtemos os seguintes números: 
 
  A  B  C  D  E  F  G  H  I  J  K  L  M  N  O P Q R S T U V W X Y Z a b c  d  e  f  g  h  i  j  k l 
1  9  3  3  1  2  1  6  6  3 3  9  0  7  0  4 0 4 4 1 3 8 1 6  5 8 8 9 8 6  5  0  6  3  3  1 2 4 8
2  0  7  6  8  1  4  5  0  5 8  6  6  1  4  2 6 7 5 6 0 5 7 7  9 6 3 2 6 3  4  5  9  8  6  5 2 1 1
3  6  5  1  5  3  4  4  2  3 7  9  1  4  8  5 8 7 2 4 7 3 7 0  6 2 2 1 3 5  0  8  9  4  7  1 6 4 4
4  9  7  0  2  6  7  3  2  6 7  4  9  1  6  2 7 7 8 6 8 4 7 8  1 5 7 1 2 6  6  6  3  5  6  0 8 2 1
5  5  5  6  5  1  6  4  8  3 3  1  5  3  8  8 2 3 8 8 7 7 4 5  0 4 5 1 8 7  2  3  2  9  6  4 7 7 9
6  8  3  4  8  8  3  8  0  6 4  8  2  3  5  2 5 3 7 1 7 6 8 2  9 5 3 4 3 7  0  3  9  7  0  1 5 7 2
 
Temos, então: 
1 a 35 →  Novilhos n =  26  15  35  31  23     
36 a 80 →  Novilhas n =  73  74  62  77  78  71  66 
  Descartados 
 
Notas importantes
sobre este tipo de
amostragem
Como é provável que a variável em estudo apresente, de estrato para estrato, um 
comportamento  heterogêneo  e,  dentro  de  cada  estrato,  um  comportamento 
homogêneo,  convém  que  a  amostragem  seja  feita  por  estratos.  Portanto,  a 
amostragem estratificada é, em geral, usada para reduzir a variação nos resultados. 
A amostragem estratificada é mais eficiente do que a amostragem aleatória simples, 
uma vez que fica assegurada a representatividade de elementos ao longo de toda a 
extensão  da  população.  A  homogeneidade  de  itens  dentro  de  cada  estrato 
proporciona maior precisão. Da mesma maneira, em um sistema produtivo, podemos 
estratificar as amostras em, por exemplo, peça A, peça B, peça C e assim por diante. 
 
Amostragem Aleatória por Conglomerado- É a técnica de amostragem em que dividimos
todos os elementos da população em diversos grupos (conglomerados).
 
A conglomeração mais simples que encontramos na população do rebanho de novilhos de tamanho N=80 é a sua 
divisão,  por  exemplo,  em  10  grupos  (conglomerados),  cada  um  com  8  elementos  da  população.  Depois 
numeramos cada conglomerado, como mostrado na figura abaixo: 
 
 
O  próximo  passo  é  extrair  uma  amostra  aleatória  simples  dos  conglomerados.    Supondo  o  tamanho  amostral 
n=24, teremos, portanto, 3 conglomerados a considerar. Partindo da 1ª linha, coluna A, sentido horizontal e da 
esquerda para direita (→) da tabela aleatória, temos, então: 
 
Conglomerados selecionados:  06  07  02 
Agora,  é  só  coletar  todos  os  elementos  desses 
conglomerados selecionados e estudar todos os itens. 
População (80)
Conglomerado 1 Conglomerado 2 Conglomerado 3 Conglomerado 5Conglomerado 4
Conglomerado 6 Conglomerado 7 Conglomerado 8 Conglomerado 10Conglomerado 9
8 novilhos (as) para cada conglomerado
Número de
amostras
estratificadas
- 22 -
Uanderson Rebula de Oliveira Estatística
Uma amostra por conglomerado é uma amostra aleatória simples na qual cada unidade de amostragem é 
um grupo de elementos. Uma das principais aplicações da amostragem por conglomerados é a amostragem 
por áreas geográficas, como cidades, municípios, setores de uma empresa, quarteirões de cidades, domicílios, 
território de vendas etc.  Segundo Levine et al (2008, p. 222) e Anderson et al (2009, p.263) a amostragem por 
conglomerados têm as seguintes características: 
 
Todos os elementos contidos em cada conglomerado amostrado formam a amostra; 
Cada conglomerado é uma versão representativa em pequena escala da população inteira; 
Tende a produzir melhores resultados quando os elementos neles contidos não são similares;  
De  um  modo  geral,  é  mais  eficaz  em  termos  de  custo  do  que  a  amostragem  aleatória  simples, 
particularmente se a população estiver dispersa ao longo de uma extensa área geográfica. Entretanto, a 
amostragem por conglomerado geralmente demanda um maior tamanho de amostra para que sejam 
produzidos resultados tão precisos quanto aqueles que seriam obtidos da amostragem aleatória simples 
ou estratificada. 
 
Segundo Triola (2008, p. 23) outro exemplo de amostra por conglomerado pode ser encontrado nas pesquisas 
eleitorais, onde selecionamos aleatoriamente 30 zonas eleitorais dentre um grande número de zonas e, em 
seguida, entrevistamos todos os eleitores daquelas seções (zonas selecionadas). Isso é muito mais rápido e 
muito menos dispendioso do que selecionar uma pessoa de cada uma das zonas na área populacional.  
 
ATENÇÃO!
É fácil confundir amostragem estratificada com a amostragem por conglomerado, porque ambas 
envolvem  a  formação  de  grupos.  Porém,  a  amostragem  por  conglomerado  usa  todos  os 
elementos  de  um  grupo  selecionado,  enquanto  a  amostragem  estratificada  usa  amostras  de 
elementos de todos os estratos. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Figura.  Amostragem 
por  Conglomerados 
em quarteirões de um 
bairro. 
- 23 -
Uanderson Rebula de Oliveira Estatística
 
Amostragem Sistemática - É a técnica de amostragem em que retiramos os elementos da
população periodicamente, definida pelo pesquisador.
 
Utilizamos  este  tipo  de  amostragem  quando  os  elementos  de  uma  população  se  encontram  ordenados,  por 
exemplo, a coleta de amostras de um determinado produto em uma linha de produção. 
 
 
 
Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo 
pesquisador.  Assim, no caso de uma linha de produção, podemos, a cada dez itens produzidos, retirar um para 
pertencer a uma amostra da produção diária. Neste caso, estaríamos fixando o tamanho amostral de 10% da 
população. 
 
Uma amostragem é sistemática quando a retirada dos elementos da população é feita periodicamente, sendo o 
intervalo de seleção calculado, por meio da divisão do tamanho da população pelo tamanho da amostra a ser 
selecionada. 
 
EXEMPLO. Deseja‐se retirar uma amostra de n = 10 unidades de peças de uma população de tamanho N = 800. O 
intervalo de seleção é, então, 800/10 = 80. Desse modo, 80 seria o primeiro elemento a ser considerado para a 
amostra;  os  demais  elementos  seriam  periodicamente  considerados  de  80  em  80.  Nesse  caso  escolhem‐se 
aquelas que estiverem nas seguintes posições: 80, 160, 240, 320, 400, 480, 560, 640, 720, 800. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Outras amostragens (não probabilísticas)
Amostragem  por  julgamento  –  A  pessoa  que  conhece  mais  profundamente  o  tema  do  estudo  escolhe  os 
elementos  que  julga  serem  mais  representativos  da  população.  Por  exemplo,  um  repórter  pode  tomar  como 
amostra dois ou três senadores, julgando que eles refletem a opinião geral de todos os senadores. A qualidade dos 
resultados depende do julgamento da pessoa que a seleciona.  
 
Amostragem  por  conveniência  –  a  amostra  é  identificada  primeiramente  por  conveniência  (cômodo,  útil, 
favorável).  Como  exemplo  estudantes  de  uma  universidade  voluntários  para  compor  uma  amostra  de  uma 
determinada pesquisa escolar. 
AmostrasColeta de Amostras
0 80 160 240 320 400 480 560 640 720 800
1 2 3 4 5 6 7 8 9 10Amostra
Nº da peça
População = 800
Amostra = 10
800/10 = 80
80                    80                     80                  80                    80                     80              80                      80                       80
0 80 160 240 320 400 480 560 640 720 800
1 2 3 4 5 6 7 8 9 10Amostra
Nº da peça
População = 800
Amostra = 10
800/10 = 80
80                    80                     80                  80                    80                     80              80                      80                       80
- 24 -
Uanderson Rebula de Oliveira Estatística
AMOSTRA
(uma parte da população)
POPULAÇÃO(todos os elementos em estudo)
AMOSTRA
(uma parte da população)
POPULAÇÃO(todos os elementos em estudo)
1.5 ESTATÍSTICA DESCRITIVA E ESTATÍSTICA INFERENCIAL 
 
Estatística descritiva – É o ramo da estatística 
que  envolve  a  organização,  o  resumo  e  a 
representação  dos  dados  para  tomada  de 
decisão. 
 
Estatística inferencial – É o ramo da estatística 
que envolve o uso da amostra para chegar a 
grandes  conclusões  sobre  a  população.  Uma 
ferramenta  básica  no  estudo  da  estatística 
inferencial é a probabilidade. 
Algumas ferramentas aplicadas à
Estatística Inferencial: 
 
Probabilidades
Uma Probabilidade é uma medida numérica que representa a chance de um evento ocorrer. Ex.: 
Ao lançar um dado, qual a probabilidade de obter o valor 4? R = 1
/6 = 16% 
 
Estimação, margem de erro e intervalo de confiança
Suponha que o tempo médio que você leva para chegar ao trabalho de carro é de 35’, com uma margem de erro 
de 5’ para mais ou para menos. A estimativa é de que o tempo médio gasto até 
chegar ao trabalho fica em algum ponto entre 30’ e 40’. Esta estimativa é um 
intervalo de confiança, pois leva em consideração o fato de que os resultados da 
amostra irão variar e dá uma indicação de uma variação esperada. 
A  margem  de  erro  é  uma  medida 
de  quão  próximo  você  espera  que 
seus resultados representem toda a 
população  que  está  sendo 
estudada.  Vários  fatores 
influenciam  a  amplitude  de  um 
intervalo de confiança, tais como o 
tamanho amostral, a variabilidade da população e o quanto você espera obter de precisão. A maioria dos pesquisadores contenta‐se com 95% 
de  confiança  em  seus  resultados.  Estar  95%  confiante  indica  que  se  você  coletar  muitas,  mas  muitas  amostras  e  calcular  o  intervalo  de 
confiança para todas, 95% dessas amostras terão intervalos de confiança que abrangerão o alvo. 
 
Teste de hipótese
Teste de hipótese é um procedimento estatístico em que os dados são coletados e medidos para comprovar uma 
alegação feita sobre uma população. Por exemplo, se uma pizzaria alega entregar as pizzas dentro de 30’ a partir 
do  pedido,  você  pode  testar  se  essa  alegação  é  verdadeira,  coletando  uma  amostra  aleatória  do  tempo  de 
entrega durante um  determinado período de tempo e observar o tempo médio de entrega para essa amostra. 
 
 
 
 
 
 
 
 
- 25 -
Uanderson Rebula de Oliveira Estatística
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
2
SÉRIES ESTATÍSTICAS
- 26 -
Uanderson Rebula de Oliveira Estatística
2.1 CONCEITOS E TIPOS DE SÉRIES 
 
As  tabelas  e  gráficos  constituem  um  importante  instrumento  de  análise  e  interpretação  de  um  conjunto  de  dados. 
Diariamente é possível encontrar tabelas e gráficos nos mais variados veículos  de comunicação (jornais,  revistas, televisão, 
Internet),  associadas  a  assuntos  diversos  do  nosso  dia‐a‐dia,  como  resultados  de  pesquisas  de  opinião,  saúde  e 
desenvolvimento humano, economia, esportes, cidadania, etc. A importância das tabelas e dos gráficos está ligada sobretudo à 
facilidade e rapidez na absorção e interpretação das informações por parte do leitor e também às inúmeras possibilidades de 
ilustração e resumo dos dados apresentados. 
 
TABELAS
 
São quadros que resumem um conjunto de dados. 
 
 
 
Tipos de Tabelas
 
SÉRIE HISTÓRICA 
Descreve  os  valores  da  variável, 
discriminados  por  TEMPO  (anos, 
meses, dias, horas, etc. 
 
 
 
SÉRIE GEOGRÁFICA 
Descreve  os  valores  da  variável, 
discriminados por REGIÕES (países, 
cidades, bairros, ruas, layout, etc) 
 
 
SÉRIE ESPECÍFICA 
Descreve  os  valores  da  variável, 
discriminados  por  temas 
ESPECIFICOS. 
 
 
 
 
SÉRIE CONJUGADA 
É utilizado quando temos a necessidade de apresentar em uma única 
tabela  a  variação  de  valores  DE  MAIS  DE  UMA  VARIÁVEL,  isto  é, 
fazer de forma conjugada de duas ou mais séries. 
   
Esta série, por exemplo, é GEOGRÁFICA – HISTÓRICA 
 
 
 
 
Título – conjunto de informações sobre o estudo. 
Cabeçalho –especifica o conteúdo das colunas 
Coluna indicadora –especifica o conteúdo das linhas 
Coluna numérica ‐–especifica  a quantidade das linhas 
Linhas – retas imaginárias de dados 
Célula – espaço destinado a um só número 
Rodapé – simplesmente a fonte dos dados
- 27 -
Uanderson Rebula de Oliveira Estatística
GRÁFICOS 
 
A  importância  dos  gráficos  está  ligada  à  facilidade  e  rapidez  na  absorção  e  interpretação  das  informações  e 
também às inúmeras possibilidades de ilustração e resumo dos dados apresentados. Eis os mais usados: 
 
Gráfico em Linha (para séries históricas)
É a representação dos valores por meio de linhas. Usamos quando precisamos de uma informação rápida de um 
valor ao longo do tempo. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Gráfico em Colunas
É  a  representação  dos  valores  por  meio  de  retângulos,  dispostos  verticalmente.  Utiliza‐se  muito  quando 
necessitamos saber a quantidade de valor. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
ACIDENTES DO TRABALHO EM 
SÃO PAULO: 1989 ‐ 1991
0
500
1000
1500
2000
2500
1989 1990 1991
anos
Quantidade
São Paulo
Guarulhos
Campinas
Osasco
Santos
FONTE: Dados fictícios
 QUANTIDADE DE ACIDENTES DO TRABALHO
SÃO PAULO: 1989 ‐ 1994
6254
7265
6325
5458
8658
9578
0
2000
4000
6000
8000
10000
12000
1989 1990 1991 1992 1993 1994
Anos
Quantidade
FONTE: Dados fictícios
 ACIDENTES DO TRABALHO
SÃO PAULO: 1989 ‐ 1994
6254
7265
6325
5458
8658 9578
0
2000
4000
6000
8000
10000
1989 1990 1991 1992 1993 1994
Anos
Quantidade
FONTE: Dados fictícios
- 28 -
Uanderson Rebula de Oliveira Estatística
Gráfico em Barras
É o mesmo conceito que o de Colunas, porém utiliza‐se sempre que os dizeres a serem inscritos são extensos. 
 
 
 
 
 
 
 
 
 
 
    
 
 
 
 
 
Gráfico em Setores
Este gráfico é construído com base em um círculo, e é empregado sempre que desejamos ressaltar a participação 
de um dado no total, geralmente na forma de porcentagem. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Gráfico Polar
É  o  gráfico  ideal  para  representar  séries  temporais  cíclicas,  isto  é,  séries  temporais  que  apresentam  em  seu 
desenvolvimento determinada periodicidade, por exemplo, o mês de janeiro a dezembro. 
 
 
   
 QUANTIDADE DE ACIDENTES DO TRABALHO
EM SÃO PAULO ‐ POR TIPO ‐  1989
55
1396
698
3578
598
0 1000 2000 3000 4000
Impacto
Perfuração
Atrito
Queda
Corte
Tipo
Quantidade
FONTE: Dados fictícios
ACIDENTES DO TRABALHO
SÃO PAULO ‐ 1989 
FONTE: Dados fictícios
ACIDENTES DO TRABALHO
SÃO PAULO ‐ 1989 
FONTE: Dados fictícios
- 29 -
Uanderson Rebula de Oliveira Estatística
Número de cada 
Delegacia 
Gráfico de Pareto
É  um  gráfico  de  colunas  na  qual  a  altura  de  cada  barra  representa  os  dados,  porém  na  ordem  de  altura 
decrescente,  com  a  coluna  mais  alta  posicionada  à  esquerda.  Tal  posicionamento  ajuda  a  enfatizar  dados 
importantes e é frequentemente usado nos negócios. 
 
Os cinco veículos mais vendidos 
no Brasil em janeiro de 1995 
 
Veículo 
Quantidade 
(milhões) 
Ômega  34 
Monza  30 
Gol  25 
Corsa  22 
Fusca  15 
FONTE: dados fictícios 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Gráfico de Dispersão
É usado para representar a relação entre duas variáveis quantitativas, por meio de pontos e linhas. 
 
Investimentos versus vendas  
no setor da empresa X 
 
Anos  Investimentos  Vendas  
1999  500  3000 
2000  3000  2000 
2001  1300  4000 
2002  2000  2500 
FONTE: dados fictícios 
 
 
 
 
Gráfico Cartograma
Este gráfico é empregado quando o objetivo é o de figurar os dados estatísticos diretamente relacionados com 
áreas geográficas ou políticas (mapas), corpo humano entre outras figuras 
 
 
Os cinco veículos mais vendidos 
no Brasil em janeiro de 1995
15
2225
30
34
0
10
20
30
40
Ômega Monza Gol Corsa Fusca
Veículos
Quantidade (milhões)
FONTE: Dados fictícios
FONTE: SSP/SP 
- 30 -
Uanderson Rebula de Oliveira Estatística
2.2 DISTRIBUIÇÃO DE FREQUÊNCIA 
 
FREQUÊNCIA ABSOLUTA E HISTOGRAMA
 
 
Ao se trabalhar com grandes conjuntos de dados, em geral é útil organizá-los e resumi-los
em uma tabela, chamada Distribuição de frequência.
 
Na distribuição de frequência listamos todos os valores coletados, um em cada linha, marcam‐se as vezes em que eles 
aparecem, incluindo as repetições, e conta‐se a quantidade de ocorrências de cada valor. Por este motivo, tabelas 
que apresentam valores e suas ocorrências denominam‐se distribuição de freqüências. 
O termo “freqüência” indica o número de vezes que um dado aparece numa observação estatística. 
 
EXEMPLO 1
 
Um professor organizou os resultados obtidos em uma prova com 25 alunos da seguinte forma: 
 
                                     Notas dos 25 alunos                                                                                                 Comentário 
4,0  5,0  7,0  9,0  9,0 
4,0  5,0  7,0  9,0  9,0 
4,0  5,0  7,0  9,0  9,0 
4,0  6,0  8,0  9,0  9,0 
4,0  6,0  8,0  9,0  9,0 
  Agora  ele  pode  fazer  uma  representação  gráfica  para  analisar  o 
desempenho da turma. Em primeiro lugar, o professor pode fazer uma 
tabulação dos dados, ou seja, organizá‐los de modo que a consulta a eles 
seja  simplificada.  Então,  faremos  a  distribuição  de  freqüência  destas 
notas, por meio da contagem de dados. 
 
                               Distribuição de freqüência                                                                                           Comentário 
Nota 
 Freqüência absoluta, f 
(nº de alunos) 
4,0  5 
5,0  3 
6,0  2 
7,0  3 
8,0  2 
9,0  10 
  ∑f=25 
  Esta  forma  de  organizar  dados  é  conhecida  como  distribuição  de 
frequência, e o  número de vezes que um dado aparece é chamado de 
frequência absoluta, representado por f. Exemplos:  
 
A frequência absoluta da nota 4,0 é 5. 
A freqüência absoluta da nota 9,0 é 10. 
 
O  símbolo  grego  ∑  “sigma”  significa  “somatório”,  muito  usado  em 
Estatística. Portanto, ∑f=25 significa a soma de 5+3+2+3+2+10. 
 
Representamos a freqüência por um gráfico, chamado Histograma. 
 
                                                                                                                                              
                                       HISTOGRAMA                                                                                                         Comentário 
 
 
ESTA FREQUÊNCIA QUE ACABAMOS DE ESTUDAR É DENOMINADA FREQUENCIA 
ABSOLUTA (f), QUE É SIMPLESMENTE A CONTAGEM DOS DADOS. 
 
Em Estatística não trabalhamos somente com frequência absoluta (f), mas também com outros tipos de freqüências, 
que são: freqüência relativa (fr), frequência absoluta acumulada (Fa) e frequência relativa acumulada (FRa). 
 
Estudaremos agora cada uma delas. 
Quando  os  dados  numéricos  são  organizados,  eles  geralmente  são 
ordenados  do  menor  para  o  maior,  divididos  em  grupos  de  tamanho 
razoável  e,  depois,  são  colocados  em  gráficos  para  que  se  examine  sua 
forma, ou distribuição (no exemplo: 4,0 – 5,0 – 6,0 – 7,0 – 8,0 – 9,0). Este 
gráfico é chamado de Histograma.  
 
Um histograma é um gráfico de colunas juntas. Em um histograma não 
existem espaços entre as colunas adjacentes, como ocorre em um gráfico 
de colunas. No exemplo, a escala horizontal (→) representa as notas e a 
escala vertical (↑) as freqüências. 
 
O histograma ao lado indica que cinco alunos tiraram a nota 4,0; três alunos tiraram 
a nota 5,0; dois alunos tiraram a nota 6,0; três alunos tiraram a nota 7,0; dois alunos 
tiraram 8,0 e dez alunos tiraram 9,0. 
5
3
2
3
2
10
0
2
4
6
8
10
12
Número de alunos
4,0 5,0 6,0 7,0 8,0 9,0
Nota
Desempenho dos alunos na prova
- 31 -
Uanderson Rebula de Oliveira Estatística
FREQUENCIA RELATIVA (fr) %
 
Conceito. Representado por fr, significa a relação existente entre a frequência absoluta (f) e a soma das 
freqüências (∑f). É a porcentagem (%) do número de vezes que cada dado aparece em relação ao total. 
 
EXEMPLO 1a
                                                                f/∑f*100→5/25*100= 20% 
       freqüência relativa (fr)%                                                                                            Comentários aos cálculos 
Nota  f  fr(%) 
4,0  5  20% 
5,0  3  12% 
6,0  2  8% 
7,0  3  12% 
8,0  2  8% 
9,0  10  40% 
  ∑f=25  100 
  A frequência relativa (fr) é obtida por f/∑f *100, conforme abaixo: 
 
A fr(%) da nota 4,0 é fr = 5/25 = 0,2 = 20%. 
A fr(%) da nota 5,0 é fr = 3/25 = 0,12 = 12% 
A fr(%) da nota 6,0 é fr = 2/25 = 0,08 = 8% 
A fr(%) da nota 7,0 é fr = 3/25 = 0,12 =12% 
A fr(%) da nota 8,0 é fr = 2/25 = 0,08 = 8% 
A fr(%) da nota 9,0 é fr = 9/25 = 0,4 = 40%. 
 
 
FREQUENCIA ABSOLUTA ACUMULADA (Fa)
 
Conceito. Representado por Fa, significa a soma das freqüências absolutas até o elemento analisado. 
 
EXEMPLO 1b
                                                                                Fa2=5+3 = 8 
     frequência absoluta acumulada (Fa)                                                                                            Comentários aos cálculos 
Nota  f  fr(%)  Fa 
4,0  5  20%  5 
5,0  3  12%  8 
6,0  2  8%  10 
7,0  3  12%  13 
8,0  2  8%  15 
9,0  10  40%  25 
  ∑f=25  100  ‐ 
  A frequência absoluta acumulada (Fa) é obtida conforme abaixo: 
 
A “Fa” da nota 4,0 é 5 (sempre repete a primeira). 
A “Fa” das notas 4,0 e 5,0 é 5+3=8. 
A “Fa” das notas 4,0, 5,0 e 6,0 é 5+3+2=10. 
A “Fa” das notas 4,0, 5,0, 6,0 e 7,0 é 5+3+2+3=13. 
A “Fa” das notas 4,0, 5,0, 6,0, 7,0 e 8,0 é 5+3+2+3+2=15. 
A “Fa” das notas 4,0, 5,0, 6,0, 7,0, 8,0 e 9,0 é 5+3+2+3+2+10=25 
 
 
FREQUENCIA RELATIVA ACUMULADA (FRa) %
 
Conceito. Representado por FRa, significa soma das freqüências relativas (fr) até o elemento analisado. 
 
EXEMPLO 1c
                                                                                             20%+12% = 32% 
             frequência relativa acumulada (FRa)                                                                                 Comentários aos cálculos 
Nota  f  fr(%)  Fa  FRa(%) 
4,0  5  20%  5  20% 
5,0  3  12%  8  32% 
6,0  2  8%  10  40% 
7,0  3  12%  13  52% 
8,0  2  8%  15  60% 
9,0  10  40%  25  100% 
  ∑f=25  100  ‐  ‐ 
  A frequência relativa acumulada (FRa) é obtida conforme abaixo: 
 
A “FRa” de 4,0 é 20% (sempre repete a primeira). 
A “FRa” de 4,0 e 5,0 é 20+12 = 32% 
A “FRa” de 4,0, 5,0 e 6,0 é 20+12+8 = 40% 
A “FRa” de 4,0, 5,0, 6,0 e 7,0 é 20+12+8+12 = 52% 
A “FRa” de 4,0, 5,0, 6,0, 7,0 e 8,0 é 20+12+8+12+8 = 60% 
A “FRa” de 4,0, 5,0, 6,0, 7,0, 8,0 e 9,0 é 20+12+8+12+8+40=100% 
 
NOTA IMPORTANTE SOBRE DISTRIBUIÇÃO DE FREQUÊNCIA: 
Nota  f  fr(%)  Fa  FRa(%) 
      25  100 
  ∑f=25  100  ‐  ‐ 
  Para saber se o desenvolvimento da distribuição de freqüência por completo está 
correto, os valores ao lado, em vermelho, deverão coincidir. 
 
- 32 -
Uanderson Rebula de Oliveira Estatística
AGRUPAMENTO EM CLASSES
 
 
Em uma distribuição de frequência, ao se trabalhar com grandes conjuntos de dados e
com valores dispersos, podemos agrupá-los em classes.
 
Se um conjunto de dados for muito disperso, uma representação melhor seria através do agrupamento dos dados 
com a construção de classes de frequência. Caso isso não ocorresse, a tabela ficaria muito extensa. Veja abaixo: 
 
EXEMPLO 2
 
Um radar instalado na Dutra registrou a velocidade (em Km/h) de 40 veículos, indicadas abaixo: 
                                                                                           
   Velocidade de 40 veículos (Km/h) 
 
Distribuição de frequência 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
É  fácil  ver  que  a  distribuição  de  frequências 
diretamente  obtida  a  partir  desses  dados  é 
dada uma tabela razoavelmente extensa. 
 
 
70  90  100    110   123 
71  93  102   115    123 
73  95  103   115  123 
76  97  105   115  123 
80  97  105   117  124 
81  97  109   117  124 
83  99  109   121  128 
86  99  109   121  128 
Nota  f 
70  1 
71  1 
73  1 
76  1 
80  1 
81  1 
83  1 
86  1 
90  1 
93  1 
95  1 
97  3 
99  2 
100  1 
102  1 
103  1 
105  2 
109  3 
110  1 
115  3 
117  2 
121  2 
123  4 
124  2 
128  2 
  ∑f=40 
       Distribuição de freqüência com classes 
i  Velocidade (Km/h)  f 
1  70 |⎯  80  4 
2  80 |⎯  90  4 
3    90 |⎯  100  8 
4         100 |⎯  110  8 
5         110 |⎯  120  6 
6         120 |⎯  130  10 
    ∑f=40 
 
A  criação  de  grupos  de  frequências,  chamado  de  ”classes”,  é  como  se  fosse 
uma  compressão  dos  dados.  Imagine  se  fizéssemos  uma  distribuição  de 
freqüência  de  todas  velocidades,  desde  70  até  128.  A  distribuição  ficaria 
imensa! Por este motivo existe a distribuição de frequência com classes. 
 
Como criar uma Distribuição de Freqüência com classes 
 
1. Calcule a quantidade de classes (i), obtida por meio da raiz da 
quantidade de dados. Neste exemplo:  40  = 6,3  ≅ i = 6 classes. 
 
2. Calcule a amplitude de classe (h) que nada mais é o tamanho da 
classe, representado por “h”, sendo: 
 
Maior valor  – Menor valor   =   128 – 70    =   9,6   ≅  h=10 
           quantidade de classes (i)                  6 
                                          
Nota: o Maior valor e o Menor valor são obtidos da relação das velocidades dos 
40 veículos, ou seja,o maior valor é 128 e o menor valor é 70. 
 
3. Montar  as  classes  a  partir  do  Menor  valor  (70  no  exemplo), 
somando com a amplitude de classe (10 no exemplo) até que se 
chegue na 6ª classe, assim: 
 
 
 
 
 
 
CONCEITOS IMPORTANTES: 
TIPOS DE INTERVALO DE CLASSE: 
 
 
 
 
 
 
No  Brasil  costuma‐se  utilizar  o  intervalo  |⎯  (Resolução  866/66  do  IBGE).  Já  na 
literatura estrangeira, a exemplo de Triola (2008), Anderson et al (2009) e Levine et 
al (2008), utiliza‐se somente com intervalo fechado. 
 
LIMITES DE CLASSE ‐  São os extremos de cada classe, no exemplo 70 |⎯ 80, 
temos que o limite inferior é 70 e o limite superior  80. 
Classes
i  Velocidade (Km/h) 
  1  70  +10   80 
2...  80  +10   90  
...6  120  +10  130 
Tipo  Representação  Dados do intervalo 
Aberto   70 ⎯  80  70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80 
Fechado à esquerda   70 |⎯ 80  70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80 
Fechado    70 |⎯| 80  70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80 
Fechado à direita    70  ⎯| 80  70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80 
- 33 -
Uanderson Rebula de Oliveira Estatística
0
2
4
6
8
10
12
Quantidade de veículos
Resultados dos registros 
de um radar
             70  75   80   85   90    95  100  105  110  115 120  125  130   
 
Velocidade (Km/h) 
AMPLITUDE TOTAL DA DISTRIBUIÇÃO (AT) – É a diferença entre o limite superior da última classe e o limite inferior da primeira classe, no 
exemplo 130 – 70 = 60. 
AMPLITUDE AMOSTRAL  (AA) – É a diferença entre o valor máximo e o valor mínimo da amostra, no exemplo 128 – 70 = 58. 
 
Abaixo vemos as distribuições de frequências absoluta, relativa, absoluta acumulada e relativa acumulada, bem 
como o Histograma desta distribuição. 
   
                   Distribuição de freqüência com classes f, fr, Fa e FRa 
 
 
 
 
 
 
 
 
 
 
 
 
OUTRAS REPRESENTAÇÕES GRÁFICAS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA 
 
POLÍGONO DE FREQUÊNCIA – É um gráfico em linha que representa os pontos centrais dos intervalos de classe. 
 
Calcule o ponto central de classe (x), que é o ponto que divide o intervalo de classe em duas partes iguais. Por 
exemplo, a velocidade dos veículos da 1ª classe pode ser representada por  70 + 80  = 75Km/h 
                                                                                                                                                              2 
 
 
 
 
 
 
 
 
 
 
 
 
A  construção  de  um  polígono  de  frequências  é  muito  simples.  Primeiro, 
construímos  um  histograma;  depois  marcamos  no  “telhado”  de  cada  coluna  o 
ponto central e unimos sequencialmente esses pontos. 
 
 OGIVA –  (pronuncia‐se o’jiva). Conhecida também por polígono de frequência acumulada. É um gráfico em linha 
que representa freqüências acumuladas (FRa), levantada nos pontos correspondentes aos limites superiores dos 
intervalos de classe. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
i  Velocidade (Km/h)  f  Fr(%)  Fa  FRa(%) 
1  70 |⎯  80  4  10%  4  10% 
2  80 |⎯  90  4  10%  8  20% 
3   90 |⎯  100  8  20%  16  40% 
4      100 |⎯  110  8  20%  24  60% 
5      110 |⎯  120  6  15%  30  75% 
6      120 |⎯  130  10  25%  40  100% 
                                         ∑f=40  100% 
i  Velocidade (Km/h)  f  x 
1  70 |⎯  80  4  75 
2  80 |⎯  90  4  85 
3    90 |⎯  100  8  95 
4       100 |⎯  110  8  105 
5       110 |⎯  120  6  115 
6       120 |⎯  130  10  125 
                                         ∑f=40   
i  Velocidade (Km/h)  f  FRa 
1  70 |⎯  80  4  4 
2  80 |⎯  90  4  8 
3   90 |⎯  100  8  16 
4      100 |⎯  110  8  24 
5      110 |⎯  120  6  30 
6      120 |⎯  130  10  40 
                                         ∑f=40   
4 4
8 8
6
10
0
2
4
6
8
10
12
Quantidade de veículos
Resultados dos registros 
de um radar
70         80        90         100       110        120       130 
 
Velocidade (Km/h) 
70 |⎯  80
Ponto central
 75Km/h
Velocidade (Km/h) 
4 4
8 8
6
10
0
5
10
15
20
25
30
35
40
Quantidade de veículos
Resultados dos registros 
de um radar
70          80           90          100         110         120         130 
4 
8 
16 
24 
30 
40 
- 34 -
Uanderson Rebula de Oliveira Estatística
                                                                                                        
 
 
 
 
3
MEDIDAS
 
 
 
 
Para  resumir a  quantidade de  informação  contida  em  um  conjunto  de  dados,  os 
estatísticos  definem  medidas  que  descrevem,  através  de  um  só  elemento, 
características dos dados. Algumas medidas descrevem a tendência central, isto é, a 
tendência que os dados têm de se agrupar em torno de certos valores. 
 
 
 
 
 
 
1   apostila de estatística   eng.2010
1   apostila de estatística   eng.2010
1   apostila de estatística   eng.2010
1   apostila de estatística   eng.2010
1   apostila de estatística   eng.2010
1   apostila de estatística   eng.2010
1   apostila de estatística   eng.2010
1   apostila de estatística   eng.2010
1   apostila de estatística   eng.2010
1   apostila de estatística   eng.2010
1   apostila de estatística   eng.2010
1   apostila de estatística   eng.2010
1   apostila de estatística   eng.2010
1   apostila de estatística   eng.2010
1   apostila de estatística   eng.2010

Mais conteúdo relacionado

Semelhante a 1 apostila de estatística eng.2010

Objeto De Aprendizagem Sobre Estatistica
Objeto De Aprendizagem Sobre EstatisticaObjeto De Aprendizagem Sobre Estatistica
Objeto De Aprendizagem Sobre Estatistica
Katita Franca
 
Apostila5 ine5102 quimica
Apostila5 ine5102 quimicaApostila5 ine5102 quimica
Apostila5 ine5102 quimica
smpgiacobbo
 

Semelhante a 1 apostila de estatística eng.2010 (20)

Livro pdf - Estatística e Probabilidade - Prof. MSc. Uanderson Rébula
Livro pdf - Estatística e Probabilidade - Prof. MSc. Uanderson RébulaLivro pdf - Estatística e Probabilidade - Prof. MSc. Uanderson Rébula
Livro pdf - Estatística e Probabilidade - Prof. MSc. Uanderson Rébula
 
Aula 01
Aula 01Aula 01
Aula 01
 
Probabilidade estatatìstica e contabilidade
Probabilidade estatatìstica e contabilidadeProbabilidade estatatìstica e contabilidade
Probabilidade estatatìstica e contabilidade
 
Material de apoio estatística 2017 1
Material de apoio estatística 2017 1Material de apoio estatística 2017 1
Material de apoio estatística 2017 1
 
Apostila estatistica1
Apostila estatistica1Apostila estatistica1
Apostila estatistica1
 
Caderno didático estatística
Caderno didático   estatísticaCaderno didático   estatística
Caderno didático estatística
 
Aula1
Aula1Aula1
Aula1
 
Fundamentos da estatística
Fundamentos da estatísticaFundamentos da estatística
Fundamentos da estatística
 
2 em 1mat_41b
2 em 1mat_41b2 em 1mat_41b
2 em 1mat_41b
 
Objeto De Aprendizagem Sobre Estatistica
Objeto De Aprendizagem Sobre EstatisticaObjeto De Aprendizagem Sobre Estatistica
Objeto De Aprendizagem Sobre Estatistica
 
Probabilidade e Estatística - Aula 01
Probabilidade e Estatística - Aula 01Probabilidade e Estatística - Aula 01
Probabilidade e Estatística - Aula 01
 
Indicadores de Saúde
Indicadores de SaúdeIndicadores de Saúde
Indicadores de Saúde
 
Apostila de estatística básica
Apostila de estatística básicaApostila de estatística básica
Apostila de estatística básica
 
Estatistica pdf
Estatistica pdfEstatistica pdf
Estatistica pdf
 
Apostila5 ine5102 quimica
Apostila5 ine5102 quimicaApostila5 ine5102 quimica
Apostila5 ine5102 quimica
 
Estatistica
EstatisticaEstatistica
Estatistica
 
AULA POWER POINT.ppt
AULA POWER POINT.pptAULA POWER POINT.ppt
AULA POWER POINT.ppt
 
Apost estatistica
Apost estatistica Apost estatistica
Apost estatistica
 
Epidemiologia: Estudos de coorte
Epidemiologia: Estudos de coorteEpidemiologia: Estudos de coorte
Epidemiologia: Estudos de coorte
 
Estatística
EstatísticaEstatística
Estatística
 

1 apostila de estatística eng.2010

  • 1. - 1 - Uanderson Rebula de Oliveira Estatística UniversidadeEstáciodeSá EngenhariadeProdução PROBABILIDADE E ESTATÍSTICA ESTATÍSTICA Prof. Uanderson Rebula de Oliveira uanderson@csn.com.br www.uandersonrebula.blogspot.com | www.iluminaconsultoria.com.br
  • 2. - 2 - Uanderson Rebula de Oliveira Estatística   EMENTA DE ESTATÍSTICA:   Estatística: conceito e fases de estudo. Variáveis. População, amostra e métodos  de amostragem. Estatística descritiva e inferencial. Séries estatísticas: conceitos,  distribuição  de  frequência  e  representação  gráfica.  Medidas  de  Tendência  Central: Média, moda e mediana. Medidas de Variação: Variância, desvio padrão  e coeficiente de variação.    OBJETIVO:  Refletir a partir da Estatística Básica sobre as ferramentas consolidadas pelo uso e  pela ciência, disponíveis a todos, que auxiliam na tomada de decisão. Engenharia de Produção PROBABILIDADE E ESTATÍSTICA UANDERSON REBULA DE OLIVEIRA Mestrando em Engenharia (ênfase em Engenharia de Produção)-Universidade Estado de São Paulo-FEG-UNESP Pós-graduado em Controladoria e Finanças-Universidade Federal de Lavras-UFLA Pós-graduado em Logística Empresarial-Universidade Estácio de Sá-UNESA Graduado em Ciências Contábeis-Universidade Barra Mansa-UBM Técnico em Metalurgia-Escola Técnica Pandiá Calógeras-ETPC Técnico em Segurança, Saúde e Higiene do Trabalho-ETPC Operador Siderúrgico e Industrial-ETPC Professor na Universidade Barra Mansa – UBM. Professor da Universidade Estácio de Sá - UNESA nas disciplinas de Gestão Financeira de Empresas, Fundamentos da Contabilidade e Matemática Financeira, Probabilidade e Estatística, Ergonomia, Higiene e Segurança do Trabalho, Gestão de Segurança e Análise de Processos Industriais, Gestão da Qualidade: programa 5S (curso de férias). Ex-professor Conteudista na UNESA (elaboração de Planos de Ensino e de Aula, a nível nacional). Professor em escolas técnicas nas disciplinas de Estatística Aplicada, Estatística de Acidentes do Trabalho, Probabilidades, Contabilidade Básica de Custos, Metodologia de Pesquisa Científica, Segurança na Engenharia de Construção Civil e Higiene do Trabalho. Ex-professor do SENAI. Desenvolvedor e instrutor de diversos cursos corporativos na CSN, a níveis Estratégicos, Táticos e Operacionais. Membro do IBS–Instituto Brasileiro de Siderurgia. Resende - 2010 ESTATÍSTICA
  • 3. - 3 - Uanderson Rebula de Oliveira Estatística APRESENTAÇÃO DA DISCIPLINA Uma das ferramentas mais utilizadas hoje em dia pelos  cientistas,  analistas  financeiros,  médicos,  engenheiros,  jornalistas  etc. é a Estatística, que descreve os dados observados e desenvolve  a metodologia para a tomada de decisão em presença da incerteza.  O verbete estatística foi introduzido no século XVIII, tendo origem  na palavra latina status (Estado), e serviu inicialmente a objetivos  ligados  à  organização  político‐social,  como  o  fornecimento  de  dados  ao  sistema  de  poder  vigente.  Hoje  em  dia,  os  modelos  de  aplicação da Teoria Estatística se estendem por todas as áreas do  conhecimento,  como  testes  educacionais,  pesquisas  eleitorais,  análise  de  riscos  ambientais,  finanças,  controle  de  qualidade,  análises  clínicas,  índices  de  desenvolvimento,  modelagem  de  fenômenos atmosféricos etc. Podemos informalmente dizer que a  Teoria  Estatística  é  uma  ferramenta  que  ajuda  a  tomar  decisões  com  base  na  evidência  disponível,  decisões  essas  afetadas  por  margens de erro, calculadas através de modelos de probabilidade.    No  entanto,  a  probabilidade  se  desenvolveu  muito  antes  de  ser  usada  em  aplicações  da  Teoria  Estatística.  Um  dos  marcos  consagrados  na  literatura  probabilística  foi  a  correspondência  entre  B.  Pascal  (1623‐1662)  e  P.  Fermat  (1601‐ 1665), onde o tema era a probabilidade de ganhar em um jogo com  dois  jogadores,  sob  determinadas  condições.  Isso  mostra  que  o  desenvolvimento  da  teoria  de  probabilidades  começou  com  uma  paixão  humana,  que  são os  jogos  de azar,  mas  evoluiu  para  uma  área  fortemente  teórica,  em  uma  perspectiva  de  modelar  a  incerteza,  derivando  probabilidades  a  partir  de  modelos  matemáticos.    A  análise  combinatória  deve  grande  parte  de  seu  desenvolvimento  à  necessidade  de  resolver  problemas  probabilísticos ligados à contagem, mas hoje há diversas áreas em  que seus resultados são fundamentais para o desenvolvimento de  teorias, como, por exemplo, a área de sistemas de informação.    Nesta  apostila  encontraremos  as  definições  de   Estatística,  vocabulário  básico,  população  e  amostra,  séries  estatísticas,  medidas  de  tendência  central,  medidas  de  variabilidade. Probabilidades serão tratadas em outra apostila.  
  • 4. - 4 - Uanderson Rebula de Oliveira Estatística Falou mais o Senhor a Moisés, no deserto de Sinai, na tenda da congregação, no primeiro dia do mês segundo, no segundo ano da sua saída da terra do Egito, dizendo: Tomai a soma de toda a congregação dos filhos de Israel, segundo as suas gerações, segundo a casa dos seus pais, conforme o número dos nomes de todo o varão, cabeça por cabeça; Da idade de vinte anos e para cima, todos os que saem à guerra em Israel; a estes contareis segundo os seus exércitos, tu e Aarão. Estará convosco, de cada tribo, um homem que seja cabeça da casa dos seus pais. Todos os contados, pois, foram seiscentos e três mil, quinhentos e cinquenta. Números 1: 1-4; 46
  • 5. - 5 - Uanderson Rebula de Oliveira Estatística Sumário 1 – CONCEITOS PRELIMINARES   1.1 CONCEITO E IMPORTÂNCIA DA ESTATÍSTICA, 7  1.2 FASES DO ESTUDO ESTATÍSTICO, 13  1.3 VOCABULÁRIO BÁSICO DE ESTATÍSTICA, 15  1.4 POPULAÇÃO E AMOSTRA, 17  MÉTODOS DE AMOSTRAGEM PROBABILÍSTICOS, 18  Amostragem aleatória simples, 18  Amostragem aleatória estratificada, 20  Amostragem aleatória por conglomerado, 21  Amostragem sistemática, 23  1.5 ESTATÍSTICA DESCRITIVA E ESTATÍSTICA INFERENCIAL , 24    2 – SÉRIES ESTATÍSTICAS   2.1 CONCEITOS E TIPOS DE SÉRIES ESTATÍSTICAS,  26  Tabelas, 26  Gráficos, 27  2.2 DISTRIBUIÇÃO DE FREQUÊNCIA, 30  Freqüência absoluta e histograma, 30  Freqüência relativa, absoluta acumulada e relativa acumulada, 31  Agrupamento em classes, 32  Polígono de freqüência e ogiva, 33     3 – MEDIDAS                      3.1 MEDIDAS DE TENDÊNCIA CENTRAL, 35  MÉDIA, 35  Média simples, 35  Média aparada, 36  Média ponderada, 36  Média de distribuição de frequência, 37  Média geométrica, 38  MEDIANA, 39  MODA, 40  RELAÇÃO ENTRE MÉDIA, MEDIANA E MODA, 41  3.2 MEDIDAS DE VARIAÇÃO, 42  VARIÂNCIA E DESVIO PADRÃO, 43  COEFICIENTE DE VARIAÇÃO,  45    REFERÊNCIAS BIBLIOGRÁFICAS, 46                                                                                                                                      ANEXO I – LIVROS RECOMENDADOS, 47   ANEXO II –  Software BIOESTAT , 48  ANEXO III – ESTATÍSTICA NO EXCEL, 49                       
  • 6. - 6 - Uanderson Rebula de Oliveira Estatística 1 CONCEITOS PRELIMINARES
  • 7. - 7 - Uanderson Rebula de Oliveira Estatística 1.1 CONCEITO E IMPORTÂNCIA DA ESTATÍSTICA   ESTATÍSTICA NA PRÁTICA   Analise as informações abaixo para melhor compreensão do conceito e importância da Estatística.     ACIDENTES DO TRABALHO no Brasil – 1970 a 2005  Conceito resumido: Lesão corporal ou doença, relacionada com o exercício do trabalho.  Legislação: Lei 8.213/91 – art. 19 a 21   INSS: Órgão público responsável pela coleta, organização e representação dos dados.     Coleta: Por meio de um formulário eletrônico denominado “CAT – Comunicação de Acidente do Trabalho”, enviado  pelas empresas quando da ocorrência, conforme determina o art. 22 da Lei 8.213/91.  Organização: Através de um grande banco de dados do INSS.  Representação: Através de um documento denominado “Anuário Estatístico de Acidentes do Trabalho”, contendo  tabelas, gráficos e diversas análises. Disponível no site www.previdencia.gov.br, na seção “Estatística”.  Motivo: Quando o trabalhador se afasta por motivo de acidente o INSS concede benefícios acidentários, como  auxílio doença acidentário, auxílio acidente, aposentadoria por invalidez, pensão por morte, reabilitação entre  outros. Mais informações na apostila Profº Uanderson “Ergonomia, Higiene e Segurança do Trabalho”, pág. 50‐ 52;136, disponível no portal www.uandersonrebula.blogspot.com.    COMPILAÇÃO E ANÁLISE DE DADOS (INFORMAÇÕES) sobre acidentes do trabalho, de 1970 a 2005:                            Observa‐se ao longo dos anos o aumento gradativo da quantidade de trabalhadores no Brasil, de 7.284.022 chegando  a  33.238.617,  reflexo  do  crescimento  econômico  do  País.  Essas  informações  (dados)  são  importantes  para  fins  de  comparação com a evolução da quantidade de acidentes do trabalho no mesmo período, como segue abaixo:                          7.284.022 8.148.987 11.537.024 14.945.489 16.638.799 18.686.355 19.476.36219.673.915 22.163.827 23.661.57923.198.656 22.272.843 23.667.24123.830.312 24.491.635 26.228.629 27.189.614 28.683.913 29.544.927 31.407.576 33.238.617 0 5.000.000 10.000.000 15.000.000 20.000.000 25.000.000 30.000.000 35.000.000 1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2001 2002 2003 2004 2005 Evolução da QUANTIDADE de TRABALHADORES no Brasil - 1970 a 2005. FONTE: Revista Proteção Anos 1.220.111 1.504.723 1.796.671 1.743.825 1.551.461 1.464.211 1.178.472 961.575 1.207.859 991.581 693.572 532.514 388.304 395.455 414.341 363.868 340.251 393.071 399.077 465.700 491.711 0 250.000 500.000 750.000 1.000.000 1.250.000 1.500.000 1.750.000 2.000.000 1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2001 2002 2003 2004 2005 Involução da QUANTIDADE de ACIDENTES DO TRABALHO no Brasil - 1970 a 2005. Anos FONTE: Revista Proteção Aprovação das NR’s
  • 8. - 8 - Uanderson Rebula de Oliveira Estatística No  período  de  1970  a  1976  a  quantidade  de  acidentes  foi  alta,  comparando‐se  com  a  pequena  quantidade de trabalhadores no mesmo período. Somente a partir de 1978 os acidentes começaram a  reduzir,  em  razão  da  aprovação  das  Normas  Regulamentadoras  –  NR’s  (disponível  no  www.mte.gov.br), tornando‐se de aplicação obrigatória em todo o País. Esta redução pode ser vista  como positiva, entretanto, não podemos comemorar esses números, pois a quantidade de acidentes  ainda é alarmante e está praticamente estagnada, desde 1994.    E as regiões? Como esses acidentes estão distribuídos nas regiões do país? Qual a pior região? Qual a melhor?  Vejamos abaixo em um Cartograma (mapa com dados), SOMENTE NO ANO DE 2005 (491.711 acidentes):                                                Observa‐se que a região em 1° lugar em número de acidentes é a Sudeste, em 2° está a região Sul, em 3° a região  Nordeste, em 4° a região Centro‐Oeste e por último a Norte. Ao analisarmos este gráfico podemos tomar diversas  conclusões, porém, tais conclusões somente são possíveis através de um estudo, o que demanda tempo. Todavia,  observa‐se  que  a  quantidade  de  acidentes  acompanha  a  porcentagem  da  participação  do  PIB  da  região.  Esta  correlação pode ser resultado do reflexo da economia da região. Ora, a região Sudeste, por exemplo, corresponde a  56,5% do PIB do País. Logicamente esta região possui um maior número de empresas e, consequentemente, maior  número  de  mão‐de‐obra  e  atividades  produtivas,  fato  que  pode  justificar  a  enorme  quantidade  de  acidentes  comparada com as demais regiões. Esses dados também podem estar relacionados com as políticas dos estados e das  empresas,  a  atuação  das  fiscalizações  do  Ministério  do  Trabalho,  as  culturas  das  regiões,  os  investimentos  empresariais,  a  capacitação  de  mão  de  obra  (treinamentos)  entre  outros  fatores.  Entende‐se  por  Produto  Interno  Bruto (PIB) a soma, em valores monetários, de todos os bens e serviços finais produzidos em uma determinada região.    Mais  dados  vocês  encontrarão  na  Apostila  “Ergonomia, higiene  e  segurança do  trabalho”,  do  profº  Uanderson  Rebula,  disponível  no  portal  www.uandersonrebula.blogspot.com  ou  no  “Anuário  Estatístico  de  Acidentes  do  Trabalho”, disponível no portal www.previdencia.gov.br, na seção “Estatística”.    Tradicionalmente, no Brasil, as políticas de desenvolvimento têm se restringido aos aspectos econômicos e vêm  sendo traçadas de maneira paralela ou pouco articuladas com as políticas sociais, cabendo a estas últimas arcarem  com  os  ônus  dos  possíveis  danos  gerados  sobre  a  saúde  da  população,  dos  trabalhadores  em  particular  e  a  degradação ambiental. Para que o Estado cumpra seu papel para a garantia desses direitos, é mister a formulação  e implementação de políticas e ações de governo.  Distribuição da quantidade e porcentagem de acidentes de trabalho no Brasil por Regiões,  correlacionados com o Produto Interno Bruto ‐ PIB ‐ ano 2005.  FONTE: Adaptado da Revista Proteção e do IBGE (www.ibge.gov.br) NORDESTE   • Acidentes: 49.010 (10% do total)  • PIB: 13,1% de participação  SUDESTE   • Acidentes: 279.689 (57% do total)  • PIB: 56,5% de participação   NORTE   • Acidentes: 19.117 (4% do total)  • PIB: 5% de participação   CENTRO‐OESTE   • Acidentes: 31.470 (6% do total)  • PIB: 8,9% de participação   SUL   • Acidentes: 112.425 (23% do total)  • PIB: 16,6% de participação  Espírito Santo ‐ 11.039 acidentes  Minas Gerais ‐ 52.335 acidentes  Rio de Janeiro ‐ 34.610 acidentes  São Paulo ‐ 181.705 acidentes São  campeões  de  acidentes  no  Brasil,  participando  com  181.705, o que corresponde a 37% do total; por conseguinte  o  seu  PIB  também  é  o  maior  do  País,  com  33,9%  de  participação.
  • 9. - 9 - Uanderson Rebula de Oliveira Estatística POSSÍVEIS SOLUÇÕES PARA REDUZIR OS ACIDENTES   A partir da análise dos dados podemos concluir que a política de segurança do trabalho adotada no País está  estagnada.  A  simples  aplicação  da  norma  regulamentadora  não  está  sendo  suficiente  para  reduzir  o  índice  de  acidentes. Os dados nos mostram que não haverá mudanças significativas se não forem feitas alterações nessa  política.    Para  contornar  a  situação,  os  Ministérios  do  Trabalho,  da  Saúde  e  da  Previdência  Social  publicaram,  para  consulta pública, em 29.12.2004 a PNSST ‐ POLÍTICA NACIONAL DE SEGURANÇA E SAÚDE DO TRABALHADOR,  com  a  finalidade  de  promover  a  melhoria  da  qualidade  de  vida  e  da  saúde  do  trabalhador.  Esse  plano  está  disponível no portal www.mte.gov.br.     Os Ministérios reconheceram a deficiência da segurança do trabalho no país, carecendo de mecanismos que:  • Incentivem medidas de prevenção;  • Responsabilizem os empregadores;  • Propiciem o efetivo reconhecimento dos direitos do trabalhador;  • Diminuam a existência de conflitos institucionais;   • Tarifem de maneira mais adequada as empresas e possibilite um melhor gerenciamento dos fatores  de riscos ocupacionais.  Face ao exposto, a PNSST propõe, dentre outras, as seguintes ações a serem desenvolvidas de modo articulado e  cooperativo pelos três Ministérios:  Área  Ações        Tributos1 ,  financiamentos  e licitações.  Estabelecer política tributária que privilegie empresas  com menores índices de acidentes e que  invistam na melhoria das condições de trabalho;  Criar linhas de financiamento para a melhoria das condições de trabalho, incluindo máquinas e  equipamentos, em especial para as pequenas e médias empresas;  Incluir requisitos de Segurança do Trabalho ‐ SST para concessão de financiamentos públicos e  privados;  Incluir requisitos de SST nos processos de licitação dos órgãos públicos;  Instituir a obrigatoriedade de publicação de balanço de SST para as empresas, a exemplo do que já  ocorre com os dados contábeis;        Educação e  pesquisa  Incluir conhecimentos básicos em SST no currículo do ensino fundamental e médio;  Incluir disciplinas em SST no currículo de ensino superior, em especial nas carreiras de profissionais  de saúde, engenharia e administração;  Estimular a produção de estudos e pesquisas na área de interesse desta Política;  Articular instituições de pesquisa e universidades para a execução de estudos e pesquisas em SST,  integrando uma rede de colaboradores para o desenvolvimento técnico ‐ cientifico na área;  Desenvolver um amplo programa de capacitação dos profissionais, para o desenvolvimento das  ações em segurança e saúde do trabalhador;  Ambientes  nocivos  Eliminar as políticas de monetarização dos riscos (adicionais de riscos).  Outras ações  Coleta de  dados  Compatibilizar os instrumentos de coleta de dados e fluxos de informações.  Incluir nos Sistemas e Bancos de Dados as informações contidas nos relatórios de intervenções e  análises dos ambientes de trabalho, elaborados pelos órgãos de governo envolvidos nesta Política.  A gestão do PNSST prevê o seu desenvolvimento pelo Grupo Executivo Interministerial de Segurança e Saúde do  Trabalhador – GEISAT, integrado por representantes do Ministério do Trabalho, da Saúde e da Previdência Social.  Ressalta‐se que no PNSST não está previsto o prazo para execução das ações propostas. Infelizmente este plano  permanece no papel até os dias de hoje e sem sinais de sua saída desta condição tão cedo.       _________________  1. Tributo: Impostos; taxas e contribuições de melhoria, devida ao poder público. 
  • 10. - 10 - Uanderson Rebula de Oliveira Estatística CONSIDERAÇÕES FINAIS SOBRE O ESTUDO DE ACIDENTES   O que acabamos de ver é um estudo estatístico.    Como vimos, os dados sobre acidentes do trabalho no Brasil são controladas pelo Ministério da Previdência Social,  junto ao INSS (Instituto Nacional de Seguridade Social). A comunicação de acidentes permite ao INSS estimar e  acompanhar  o  real  impacto  do  trabalho  sobre  a  saúde  e  a  segurança  da  população  brasileira.  O  INSS  coleta,  organiza, apresenta e publica as estatísticas de acidentes do trabalho no Brasil.    Conforme observado, quando ocorre um acidente, a empresa, por força de lei, é obrigada a enviar a CAT ao INSS,  alimentando, assim, o seu grande banco de dados.      As estatísticas de acidentes no Brasil podem ser visualizadas no site da Previdência Social através  do endereço eletrônico www.previdencia.gov.br. O interessante neste site é a existência de um  documento, disponível para download, denominado “Anuário estatístico da previdência social”.  Nele  estão  contidos  todos  os  dados  estatísticos  da  Previdência  Social,  inclusive  os  dados  referentes  a  acidentes  do  trabalho,  distribuídos  por  região,  idade,  tipos,  parte  do  corpo  mais  atingida  dentre  outros. É um importante documento para os estudiosos no assunto.    É importante ressaltar que os dados de acidentes de trabalho não se constituem, tão  somente,  num  importante  registro  histórico,  mas  sim  numa  ferramenta  inestimável  para os profissionais que desempenham atividades nas áreas de saúde e segurança do  trabalhador,  assim  como  pesquisadores  e  demais  pessoas  interessadas  no  tema.  A  análise desses dados possibilita a construção de um diagnóstico mais preciso acerca da  epidemiologia dos acidentes, propiciando, assim, a elaboração de políticas mais eficazes  para as áreas relacionadas com o tema, como vimos no PNSST.      TÓPICO PARA REFLEXÃO Acidente do Trabalho: o problema do Brasil.   Os acidentes de trabalho afetam a produtividade econômica, são responsáveis por um impacto substancial  sobre o sistema de proteção social e influenciam o nível de satisfação do trabalhador e o bem estar geral da  população.    Estima‐se que a ausência de segurança nos ambientes de trabalho no Brasil tenha gerado, no ano de 2003, um  custo  de  cerca  de  R$32,8  bilhões  para  o  país.  Deste  total,  R$  8,2  bilhões  correspondem  a  gastos  com  benefícios acidentários e aposentadorias especiais, equivalente a 30% da necessidade de financiamento do  Regime Geral de Previdência Social ‐ RGPS verificado em 2003, que foi de R$ 27 bilhões. O restante da despesa  corresponde  à  assistência  à  saúde  do  acidentado,  indenizações,  retreinamento,  reinserção  no  mercado  de  trabalho e horas de trabalho perdidas.    Isso sem levar em consideração o sub‐dimensionamento na apuração das contas da Previdência Social, que  desembolsa  e  contabiliza  como  despesas  não  acidentárias  os  benefícios  por  incapacidade,  cujas  CAT  não  foram emitidas. Ou seja, sob a categoria do auxílio doença não ocupacional, encontra‐se encoberto um grande  contingente de acidentes que não compõem as contas acidentárias.    Parte  deste  “custo  segurança  no  trabalho”  afeta  negativamente  a  competitividade  das  empresas,  pois  ele  aumenta o preço da mão‐de‐obra, o que se reflete no preço dos produtos. Por outro lado, o incremento das  despesas  públicas  com  previdência,  reabilitação  profissional  e  saúde  reduz  a  disponibilidade  de  recursos  orçamentários para outras áreas ou induz o aumento da carga tributária sobre a sociedade.    De outro lado, algumas empresas afastam trabalhadores, e muitas vezes os despedem logo após a concessão  do beneficio. Com isso, o trabalhador se afasta, já sendo portador de doença crônica contraída no labor, e o  desemprego poderá se prolongar na medida em que, para obter o novo emprego, será necessária a realização  do  exame  admissional,  no  qual  serão  eleitos  apenas  aqueles  considerados  como  “aptos”  e,  portanto,  não  portadores de enfermidades.    Fonte: RESOLUÇÃO CNPS Nº 1.269, DE 15 DE FEVEREIRO DE 2006     
  • 11. - 11 - Uanderson Rebula de Oliveira Estatística CONCEITO DE ESTATÍSTICA   É A CIÊNCIA QUE SE DEDICA EM COLETAR, ORGANIZAR, APRESENTAR, ANALISAR E INTERPRETAR  DADOS (INFORMAÇÕES) PARA TOMADA DE DECISÃO.    Estatística é a ciência dos dados. A Estatística lida com a coleta, o  processamento e disposição de dados (informações), atuando como  ferramenta fundamental nos processos de soluções de problemas. A  Estatística facilita o estabelecimento de conclusões confiáveis sobre  algum fenômeno que esteja sendo estudado (WERKEMA, 1995).     É por meio da análise e interpretação dos dados estatísticos que é  possível o conhecimento de uma realidade, de seus problemas, bem  como,  a  formulação  de  soluções  apropriadas  por  meio  de  um  planejamento  objetivo  da  ação,  para  além  dos  “achismos”  e  “casuismos” comuns.    No uso diário o termo “estatística” refere‐se a fatos numéricos. Tenha em mente, entretanto, que estatística  é bem diferente de matemática. Estatística é, antes de qualquer coisa, um método científico que determina  questões de pesquisa; projeta estudos e experimentos; coleta, organiza, resume e analisa dados; interpreta  resultados  e esboça  conclusões. Ou  seja, utiliza‐se  dados  como  evidências para  responder  a  interessantes  questões  sobre  o  mundo.  A  matemática  só  é  utilizada  para  calcular  a  estatística  e  realizar  algumas  das  análises,  mais  isso  é  apenas  uma  pequena  parte  do  que  realmente  é  a  estatística.  Portanto,  a  estatística  mantém  com  a  matemática  uma  relação  de  dependência,  solicitando‐lhe  auxílio,  sem  o  qual  não  poderia  desenvolver‐se.    A  Estatística  é  uma  ciência  interdisciplinar,  ou  seja,  é  comum  a  duas  ou  mais  disciplinas  ou  ramos  de  conhecimento.  Assim,  a  Estatística  é  aplicada  na  Medicina,  Administração,  Engenharias,  Economia,  Contabilidade, Direito, Segurança do Trabalho, Qualidade, Marketing entre outras áreas. Veja abaixo.          Medicina. Estudos de epidemiologia,  inter‐relações  dos  determinantes  da  freqüência  e  distribuição  de  doenças  populacionais  *Engenharia de Produção. Estudos de  um  conjunto  de  dados  de  todas  as  fases de um processo produtivo.  Segurança  do  Trabalho.  Estudos  de  acidentes  e  doenças,  suas  causas,  quantidade, parte atingida, setores, %  de afastamentos etc.  Contabilidade.  Estudos  das  informações financeiras das empresas  públicas e privadas.  Finanças.  Estudos  de  uma  série  de  informações estatísticas para orientar  investimentos.  Economia.  Estudos  de  taxas  de  inflação,  índice  de  preços,  taxa  de  desemprego, futuro da economia.    *Engenharia de Produção – A aplicação da Estatística na produção merece especial atenção. A atual ênfase na  qualidade torna o controle da qualidade uma importante aplicação da estatística na área da produção. Usa‐se  uma série de mapas estatísticos de controle de qualidade para monitorar o resultado (output) de um processo  de  produção.  Suponha,  por  exemplo,  que  uma  máquina  preencha  recipientes  com  2  litros  de  determinado  refrigerante. Periodicamente, um operador do setor de produção seleciona uma quantidade de recipientes e  verifica a exatidão, ou seja, se não há desvios. A Estatística também é usada na Engenharia de Produção para  Estratificação, que consiste no agrupamento da informação (dados) sob vários pontos de vista, de modo a  focalizar a ação, considerando os fatores equipamento, tempo entre outros. Exemplo:    Tipo de dano:  Operador:  Máquina de lavar: Roupas danificadas   em uma lavanderia  Tipo de roupa:  Marca do sabão:  Máquina de secar: 
  • 12. - 12 - Uanderson Rebula de Oliveira Estatística UM POUCO DE HISTÓRIA E ATUALIDADE     O termo “Estatística” provém da palavra “Estado” e foi utilizado originalmente  para  denominar  levantamentos  de  dados  (riquezas,  impostos,    nascimentos,  mortalidade,  batizados,  casamentos,  habitantes  etc.),  cuja  finalidade  era  orientar o Estado em suas decisões.     Segundo  Costa  (2005,  p.  5)  em  1085,  Guilherme  “O  Conquistador”,  ordenou  que  se  fizesse  um  levantamento  na  Inglaterra,  que  deveria  incluir  informações  sobre  terras,  proprietários,  uso  da  terra,  empregados,  animais  e  serviria,  também,  de  base  para  cálculo  de  impostos. Tal levantamento originou um volume intitulado “domesday book”.    No  século  XVIII  o  estudo  dos  dados  foi  adquirindo,  aos  poucos,  feição  verdadeiramente  científica.  A  palavra  Estatística  apareceu  pela  primeira  vez no século XVIII e foi sugerida pelo alemão Godofredo Achenwall (1719‐ 1772), onde determinou o seu objetivo e suas relações com as ciências.    Desde essa época, a Estatística deixou de ser a simples catalogação de dados numéricos coletivos e se  tornou o estudo de como chegar a conclusões sobre o todo, partindo da observação e análise de partes  desse todo. Essa é sua maior riqueza.       Atualmente  a  sociedade  está  completamente  tomada  pelos  números.  Eles  aparecem  em  todos  os  lugares  para  onde  você  olha,  de  outdoors  mostrando  as  últimas  estatísticas  sobre  aborto,  passando  pelos  programas  de  esporte  que  discutem as chances de um time de futebol chegar à final do campeonato, até o  noticiário  da  noite,  com  reportagens  focadas  no  índice  de  criminalidade,  na  expectativa de vida de uma pessoa que não come alimentos saudáveis e no índice  de aprovação do presidente.     Em um dia comum, você pode se deparar com cinco, dez ou, até mesmo, vinte diferentes estatísticas (ou até  muito  mais  em  um  dia  de  eleição).  Se  você  ler  todo  o  jornal  de  domingo,  irá  se  deparar  com  centenas  de  estatísticas em reportagens, propagandas e artigos sobre todo tipo de assunto: desde sopa (quanto em média uma  pessoa consome por ano?) até castanhas (quantas castanhas você precisa comer para aumentar seu QI?).  Nas  empresas  a  Estatística  desempenha  um  papel  cada  vez  mais  importante  para  os  Gerentes.  Esses  responsáveis pela tomada de decisão utilizam a estatística para:    Apresentar e descrever apropriadamente dados e informações sobre  a empresa;  Tirar conclusões sobre grandes populações, utilizando informações  coletadas a partir de amostras;  Realizar suposições confiáveis sobre a atividade da empresa;  Melhorar os processos da empresa.    A estatística é um instrumento eficiente para a compreensão e interpretação da realidade e não  deve ser subestimada. Realmente existem pesquisas feitas de forma incorreta e que, por isso, não  são confiáveis. Mas, em geral, quando um estudo estatístico é feito com critério, seus resultados  permitem obter conclusões e prever tendências sobre fatos e fenômenos. Um estudo bem feito  não elimina o erro, mas limita‐o a uma margem, procurando torná‐la o menor possível.       
  • 13. - 13 - Uanderson Rebula de Oliveira Estatística 1.2 FASES DO ESTUDO ESTATÍSTICO   Um estudo estatístico confiável depende do planejamento e da correta execução das seguintes etapas:  1. Definir o que será estudado e a natureza dos dados, como exemplo:   ESTUDO NATUREZA DOS DADOS Acidentes do Trabalho   no Brasil  Quantidade e período  Por regiões, estados ou municípios  Por atividade econômica  Por idade dos acidentados  Por parte do corpo atingida  Por causas dos acidentes etc.  Peças danificadas   na linha A  Tipo de peça   |  Tipo de defeito  Quantidade   Período  Turnos  Máquinas  Operadores  Matéria prima etc.    É preciso definir com clareza os objetivos da pesquisa, ou seja, o que se pretende apurar, que tipo de  problema buscará detectar.  2. Coletar dados Após a definição do que será estudado e o estabelecimento do planejamento do trabalho (forma de coleta dos  dados,  cronograma  das  atividades,  custos  envolvidos,  levantamento  das  informações  disponíveis),  o  passo  seguinte é o da coleta de dados, que consiste na busca ou compilação dos dados, componentes do fenômeno a ser  estudado.  Nessa etapa recolhem‐se os dados tendo o cuidado de controlar a qualidade da informação. O sucesso de uma  pesquisa depende muito da qualidade dos dados recolhidos.    Podem ser por meio de:   • Criação de Softwares, a exemplo da CAT;  • Uso de Softwares da empresa;  • Dados históricos da empresa (físicos);  • Pesquisas com questionários etc. 3. Organizar e contar dados À  procura  de  falhas  e  imperfeições,  os  dados  devem  ser  cuidadosamente  organizados  e  contados,  a  fim  de  não  incorrermos  em  erros  grosseiros  que  possam influenciar nos resultados.  No exemplo da “Estatística na prática”, após a coleta da quantidade de acidentes por  meio  da  CAT,  organiza‐os  por  período,  regiões  etc.  Da  mesma  maneira,  se  você  usa  um  questionário para coletar dados na empresa, organiza‐os da forma necessária à pesquisa, além da  contagem a ser feita. 
  • 14. - 14 - Uanderson Rebula de Oliveira Estatística 4. Apresentação de dados Os dados devem ser apresentados sob a forma de tabelas ou gráficos, a fim de tornar mais fácil e rápido o exame  daquilo que está sendo estudado.  5. Análise dos dados e tomada de decisão Chegamos à fase mais complexa do processo estatístico, que consiste na análise  dos  dados.  Por  fim,  a  partir  da  análise  realizada,  poderemos  chegar  a  uma  tomada de decisão.    Observe  o  estudo  “Estatística  na  prática”.  O  que  resultou  a  análise  dos  acidentes  no  Brasil,  no  período  de  1970  a  2005?  Veja  que  os  Ministérios  do  Trabalho, Previdência Social e da Saúde se mobilizaram para resolverem essa  questão de saúde pública, com diversas ações a serem implementadas no país.        A partir dessa discussão, fica claro que um profissional com conhecimentos de Estatística terá maior facilidade em  identificar  um  problema  em  sua  área  de  atuação,  determinar  os  tipos  de  dados  que  irão  contribuir  para  sua  análise, coletar esses dados e a seguir estabelecer conclusões e determinar um plano de ação para a solução do  problema detectado.                              1.220.111 1.504.723 1.796.671 1.743.825 1.551.461 1.464.211 1.178.472 961.575 1.207.859 991.581 693.572 532.514 388.304 395.455 414.341 363.868 340.251 393.071 399.077 465.700 491.711 0 250.000 500.000 750.000 1.000.000 1.250.000 1.500.000 1.750.000 2.000.000 1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2001 2002 2003 2004 2005 Involução da QUANTIDADE de ACIDENTES DO TRABALHO no Brasil - 1970 a 2005. Anos FONTE: Revista Proteção Aprovação das NR’s
  • 15. - 15 - Uanderson Rebula de Oliveira Estatística 1.3 VOCABULÁRIO BÁSICO DE ESTATÍSTICA    O vocabulário utilizado em estudos estatísticos teve sua origem nos primeiros estudos feitos pela humanidade e  que  eram  relativos  à  demografia  (estudo  estatístico  das  populações).  Por  isso  a  Estatística  emprega  termos  próprios dessa área de conhecimento, mas com um sentido diferenciado. Assim, para dar prosseguimento, é de  extrema importância destacar alguns termos utilizados no jargão estatístico.    VARIÁVEL – É o termo usado para aquilo que você está pesquisando, estudando, analisando.    No  estudo  representado  no  gráfico  abaixo  a  variável  é  o  acidente  do  trabalho.  Utilizada  como  um  adjetivo  do  vocabulário do dia‐a‐dia, variável sugere que alguma coisa se modifica ou varia.     São exemplos de Variáveis Doenças, Sexo, Estaturas, Peso, Idade, Renda, Natalidade, Mortalidade, PIB, Inflação, Exportações brasileiras, Produção de café, Alimentação, Peças produzidas por hora, Paradas de produção no mês, Rotatividade de estoque por ano, Poluição, Clima na região sudeste, Consumo de energia no mês, Vendas mensais de uma empresa, Produção diária de automóveis etc.   EXEMPLO DE APLICAÇÃO: A associação dos moradores de um bairro queria traçar um perfil dos freqüentadores de um parque ali situado.  Uma equipe de pesquisa elaborou questões a fim de reunir as informações procuradas. Numa manhã de quarta‐ feira, 6 pessoas foram entrevistadas e cada uma respondeu a questões para identificar idade, número de vezes  que freqüenta o parque por semana, estado civil, meio de transporte utilizado para chegar ao parque, tempo de  permanência no parque e renda familiar mensal. Os resultados são mostrados na tabela a seguir:          Cada um dos aspectos investigados — os quais permitirão fazer a análise desejada — é denominado variável.  1.220.111 1.504.723 1.796.671 1.743.825 1.551.461 1.464.211 1.178.472 961.575 1.207.859 991.581 693.572 532.514 388.304 395.455 414.341 363.868 340.251 393.071 399.077 465.700 491.711 0 250.000 500.000 750.000 1.000.000 1.250.000 1.500.000 1.750.000 2.000.000 1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2001 2002 2003 2004 2005 Involução da QUANTIDADE de ACIDENTES DO TRABALHO no Brasil - 1970 a 2005. FONTE: Revista Proteção Anos VARIÁVEL Variáveis
  • 16. - 16 - Uanderson Rebula de Oliveira Estatística TIPOS DE VARIÁVEIS   Há,  pois,  uma  divisão  principal  para  as  variáveis  estatísticas,  que  consiste  em  considerá‐las  como  Variáveis  Quantitativas  (contínuas ou discretas) e Variáveis Qualitativas. Esta divisão é de facílima compreensão! Veja o esquema abaixo.    Esquema básico Tipo de VARIÁVEL Resposta fornecida à pesquisa Exemplos Quantitativa Em números Discreta Inteiros 0,1, 2, 3,...,9 Gols de futebol, Idade (anos) Contínua Não inteiros 0,12 1,64 Altura (cm), Peso (kg), Tempo Qualitativa Em nomes, atributos Sexo, Cor, Nacionalidade, Raça Tipos de Variáveis da pesquisa em um parque:   Se a dúvida persiste, no quadro abaixo você pode observar os esclarecimentos do Esquema básico.  Esclarecimentos do Esquema básico Tipo de VARIÁVEL Resposta fornecida à pesquisa Quantitativa (Em números) Será Quantitativa a variável para a qual se possa atribuir um valor numérico. Se a resposta  fornecida  à  pesquisa  estiver  expressa  por  um  número,  então  a  variável  é  quantitativa.  Por  exemplo:  quantos  livros  você  lê  por  ano?  A  resposta  é  um  número?  Então,  variável  quantitativa.  Quantas  pessoas  moram  em  sua  casa?  A  resposta  é  um  número?  Então,  novamente, variável quantitativa.   Exemplo. No caso do estudo “ACIDENTE DO TRABALHO”, é uma variável quantitativa, pois o  objeto do estudo foi a quantidade de acidentes no período de 1970 a 2005 Discreta (números inteiros) (contagem) Variável  Quantitativa  Discreta  é  a  variável  quantitativa  que  assume  somente  números  inteiros.  Resulta,  geralmente,  de  contagem.  Esta  variável  não  pode  assumir  qualquer  valor,  dentro  de  um  intervalo  de  valores  de  resultados  possíveis.  Por  exemplo,  se  eu  pergunto  quantos irmãos você tem, a resposta jamais poderia ser “tenho 3,75 irmãos”, ou “tenho 4,8  irmãos”, ou seja, a resposta não poderia assumir todos os valores de um intervalo! Este acima  é  o  conceito  formal  de  variável  discreta!  O  conceito  para  memorizar  é  o  seguinte:  aquela  variável  obtida  por  meio  de  uma  contagem.  Em  outras  palavras:  a  variável  discreta  você  conta!.  Exemplos:  quantas  pessoas  moram  na  sua  casa?  Quantos  livros  você  tem?  Quantos  carros você tem? Se, para responder à pergunta, você faz uma contagem, então está diante de  uma variável quantitativa discreta.  Contínua (Números não inteiros) (medição) Variável  Quantitativa  Contínua  é  aquela  que  pode  assumir  qualquer  valor  dentro  de  um  intervalo de resultados possíveis. Se eu pergunto quantos quilos você pesa, a resposta pode ser  65,35kg. Se eu pergunto qual a temperatura na cidade hoje, a resposta pode ser 27,35°C. Para  facilitar a memorização, basta lembrar que a variável quantitativa contínua pode ser obtida  por uma medição, ou seja, a variável contínua você mede! Exemplos: peso, altura, duração de  tempo para resolução de uma prova, pressão, temperatura etc.  Qualitativa (nomes, atributos) Se a pergunta é “qual a sua cor preferida?”, logicamente a resposta não será um número, daí  estaremos tratando de uma variável qualitativa, ou seja, aquela para a qual não se atribui um  valor numérico. Exemplos: Sexo: masculino ou feminino  Qualitativa Quantitativa  discreta  Quantitativa  contínua 
  • 17. - 17 - Uanderson Rebula de Oliveira Estatística 1.4 POPULAÇÃO E AMOSTRA    Quando você quer saber se a sopa ficou boa, o que você faz? Mexe a panela, retira um pouco com  uma colher e prova. Depois tira uma conclusão sobre todo o conteúdo da panela sem, na verdade,  ter provado tudo. Portanto, é possível ter uma idéia de como a sopa está sem ter que comer tudo.  Isso é o que se faz em estatística.    A estatística deixou de ser a simples catalogação de dados numéricos e se tornou o estudo de como  chegar a conclusões sobre o todo (população), partindo da observação e análise de partes desse  todo (amostra). Essa é sua maior riqueza. Assim, podemos conceituar população e amostra como:    POPULAÇÃO É UM CONJUNTO DE TODOS OS ELEMENTOS EM ESTUDO.  AMOSTRA É UMA PARTE DA POPULAÇÃO.                                      Muitas vezes quando queremos fazer um estudo estatístico, não é possível analisar toda a população  envolvida com o fato que pretendemos investigar, como exemplo o sangue de uma pessoa ou a poluição  de um rio. É impossível o teste do todo. Há situações também em que é inviável o estudo da população,  por  exemplo,  a  pesquisa  com  todos  os  torcedores  em  um  estádio  de  futebol  durante  uma  partida.  Nesses  casos,  o  estatístico  recorre  a  uma  amostra  que,  basicamente,  constitui  uma  redução  da  população a dimensões menores, sem perda das características essenciais.    Os resultados fundamentados em uma amostra não serão exatamente os mesmos que você encontraria  se estudasse toda a população, pois, quando você retira uma amostra, você não obtém informações a  respeito  de  todos  em  uma  dada  população.  Portanto,  é  importante  entender  que  os  resultados  da  amostra fornecem somente estimativas dos valores das características populacionais. Com métodos de  amostragens apropriados, os resultados da amostra produzirão “boas” estimativas da população, ou  seja, um estudo bem feito não elimina o erro, mas limita‐o a uma margem, procurando torná‐la o menor  possível. Quando aprendemos estatística inferencial, também aprendemos técnicas para controlar esses  erros de amostragem.    4 razões para selecionar uma amostra O número de elementos em uma população é muito grande;  Demanda menos tempo do que selecionar todos os itens de uma população;  É menos dispendioso (caro) do que selecionar todos os itens de uma população;  Uma análise amostral é menos cansativa e mais prática do que uma análise da população inteira.   Podemos visualizar o conceito  de  população  e  amostra  na  figura ao lado.    Quando  pesquisamos  toda  a  população, damos o nome de  censo.  A  precisão  depende  do  tamanho  da  amostra,  e  quanto  maior  é  o  tamanho  amostral,  maior  será  a  precisão das informações.  AMOSTRA (uma parte da população) POPULAÇÃO(todos os elementos em estudo) AMOSTRA (uma parte da população) POPULAÇÃO(todos os elementos em estudo) N é designado para População n é designado para Amostra “N” “n”
  • 18. - 18 - Uanderson Rebula de Oliveira Estatística São exemplos de População e Amostra: MEDICINA.  Pretende‐se  estudar  o  efeito  de  um  novo  medicamento  para  curar  determinada  doença.  É  selecionado um grupo de 50 doentes, administrando‐se o novo medicamento a 10 desses doentes escolhidos ao  acaso e o medicamento habitual aos restantes.   População: Todos os 50 doentes com a doença que o medicamento a estudar pretende tratar.  Amostra: Os 10 doentes selecionados.  CONTROLE DE QUALIDADE. O Gerente de Produção de uma fábrica de parafusos pretende assegurar‐se de que  a  porcentagem  de  peças  defeituosas  não  excede  um  determinado  valor,  a  partir  do  qual  determinada  encomenda poderia ser rejeitada.   População: Todos os parafusos fabricados ou a fabricar, utilizando o mesmo processo.  Amostra: Parafusos escolhidos ao acaso entre os lotes produzidos.  ESTUDOS DE MERCADO. O gerente de uma fábrica de produtos desportivos pretende lançar uma nova linha de  esquis, pelo que encarrega uma empresa especialista em estudos de mercado de “estimar“ a porcentagem de  potenciais compradores desse produto.  População: conjunto de todos os praticantes de desportos de neve.  Amostra: conjunto de alguns praticantes inquiridos pela empresa.  SISTEMAS DE PRODUÇÃO. Um fabricante de pneus desenvolveu um novo tipo de pneu e quer saber o aumento  da durabilidade em termos de kilometragem em relação à atual linha da empresa. Produz diariamente 1000  pneus e selecionou 120 para testes.  População: 1000 pneus.  Amostra: 120 pneus.    A amostra na prática - Oxford Cereais (Levine et al, 2008, p.218) A Oxford Cereais abastece milhares de caixas de cereais durante um turno de oito horas. Como  gerente de operações da unidade de produção, você é responsável por monitorar a quantidade de  cereal colocada em cada caixa. Para ser coerente com o conteúdo especificado na embalagem, as  caixas devem conter 368 gramas de cereal. Em razão da velocidade do processo, o peso do cereal  varia  de  caixa  para  caixa,  fazendo  com  que  algumas  caixas  fiquem  mal  abastecidas  enquanto  outras ficam hiperabastecidas. Se o processo não estiver funcionando de maneira apropriada, o  peso das caixas pode se desviar demasiadamente do peso especificado no rótulo, 368 gramas, e  se tornar inaceitável. Uma vez que a pesagem de cada caixa individual consome uma quantidade  demasiadamente grande de tempo, é dispendiosa e ineficiente, você deve extrair uma amostra de caixas. Para cada amostra  selecionada, você planeja pesar caixas individuais. Com base em sua análise, você terá que decidir entre manter, alterar ou  interromper o processo.    MÉTODOS DE AMOSTRAGEM PROBABILÍSTICOS     Amostragem Aleatória Simples – É a técnica de amostragem em que cada um dos elementos da população tem a mesma chance de ser selecionado.  Uma característica importante de uma boa pesquisa é que a amostra da população alvo seja selecionada  aleatoriamente.  Aleatoriamente  significa  que  todos  os  membros  da  população  alvo  devem  ter  as  mesmas  chances  de  serem  incluídos  na  amostra.  Ou  seja,  o  processo  usado  para  a  seleção  de  sua  amostra não pode ser parcial. “Aleatório” = Dependente de fatores incertos.    Suponha que você tenha um rebanho com 500 novilhos  e precisa retirar  uma amostra aleatória de 50 deles para fazer um exame para uma doença.  Retirar os 50 primeiros novilhos que vierem em sua direção não se encaixaria  na definição de amostra aleatória. Os primeiros novilhos que forem capazes  de  vir  em  sua  direção,  provavelmente  são  os  que  têm  menos  chances  de  apresentarem qualquer tipo de doença ou, talvez, sejam os mais velhos e mais amigáveis, que realmente  são  os  mais  suscetíveis  a  doenças.  De  qualquer  forma,  a  pesquisa  foi  tendenciosa.  Como  coletar  uma  amostra  aleatória  dos  novilhos?  Os  animais  provavelmente  possuem  etiquetas  com  um  número  de  identificação, assim você deve conseguir uma lista com todos os números de identificação, selecione uma  amostra aleatória desses números e localize os animais.  
  • 19. - 19 - Uanderson Rebula de Oliveira Estatística Uma amostra aleatória é boa; ela dá a mesma chance a todos os membros de uma população de ser  selecionado, além de utilizar mecanismos de casualidade para escolhê‐los, como a tabela de números  aleatórios. O método é semelhante a um sorteio.  Tabela de números aleatórios   Um dos mecanismos utilizados para seleção é a tabela de números aleatórios, que consiste em uma série  de números listados em uma sequência aleatoriamente gerada.  Esta tabela tem duas características que  a tornam particularmente adequada: primeiro, os números estão dispostos de tal maneira que a chance  de  qualquer  um  deles  aparecer  em  determinada  sequência  é  igual  à  chance  do  aparecimento  em  qualquer outra posição; segundo, cada uma de todas as combinações de dois algarismos tem a mesma  chance de ocorrência, como também todas as combinações de três algarismos, e assim por diante.     Sistemas  computacionais  elaboram  números  aleatórios.  O  Excel  dispõe  da  função “ALEATÓRIO” para gerar números aleatórios (veja figura ao lado).      A  tabela  de  números  aleatórios  abaixo  foi  construída  de  modo  que  os  dez  algarismos  (0  a  9)  são  distribuídos ao acaso, pelo Excel, identificadas pelas linhas (1, 2, 3, 4...) e colunas (A, B, C, D ...):      Tabela de números aleatórios   A  B  C  D  E  F  G  H  I  J  K  L  M  N O P Q R S T U V W X Y Z a b  c  d  e  f  g  h i  j  k l  1  9  3  3  1  2  1  6  6  3  3  9  0  7  0 4 0 4 4 1 3 8 1 6  5 8 8 9 8  6  5  0  6  3  3 1 2 4 8 2  0  7  6  8  1  4  5  0  5  8  6  6  1  4 2 6 7 5 6 0 5 7 7  9 6 3 2 6  3  4  5  9  8  6 5 2 1 1 3  6  5  1  5  3  4  4  2  3  7  9  1  4  8 5 8 7 2 4 7 3 7 0  6 2 2 1 3  5  0  8  9  4  7 1 6 4 4 4  9  7  0  2  6  7  3  2  6  7  4  9  1  6 2 7 7 8 6 8 4 7 8  1 5 7 1 2  6  6  6  3  5  6 0 8 2 1 5  5  5  6  5  1  6  4  8  3  3  1  5  3  8 8 2 3 8 8 7 7 4 5  0 4 5 1 8  7  2  3  2  9  6 4 7 7 9 6  8  3  4  8  8  3  8  0  6  4  8  2  3  5 2 5 3 7 1 7 6 8 2  9 5 3 4 3  7  0  3  9  7  0 1 5 7 2 7  3  1  2  7  5  4  7  1  3  5  2  4  1  5 1 3 1 8 0 5 8 8 6  0 6 6 9 5  5  5  3  5  8  5 6 7 1 2 8  3  6  3  1  1  7  6  9  5  3  3  5  3  5 6 3 3 3 4 3 6 8 4  5 5 8 8 1  9  2  5  7  8  7 7 5 8 7 9  4  2  0  4  7  2  7  9  3  3  3  3  3  2 8 7 1 8 0 6 1 5 3  4 0 6 3 2  8  3  3  0  7  2 7 2 4 2 10  6  8  7  0  3  9  9  9  8  6  8  2  1  5 8 7 4 5 5 2 6 3 4  1 1 2 2 1  2  9  4  0  5  8 7 0 6 8 11  7  9  1  6  5  8  1  4  3  7  9  1  2  5 3 4 1 6 3 1 6 3 2  5 1 9 5 7  7  5  6  6  8  4 6 5 7 1 12  8  1  4  6  3  8  8  4  7  1  3  6  3  7 7 5 2 6 2 4 8 6 3  2 1 4 8 3  1  7  0  8  1  9 4 1 2 3 13  8  1  7  9  3  4  3  6  9  5  9  2  1  7 3 8 7 5 2 2 7 6 0  6 1 8 1 2  1  4  8  5  2  7 3 3 8 5 14  2  8  8  4  4  0  4  3  2  2  8  1  1  0 2 8 1 8 1 4 5 1 8  1 8 3 3 4  5  6  6  8  1  4 7 4 3 3 15  3  3  7  2  0  0  2  9  5  5  6  8  2  4 5 7 4 0 6 7 3 2 6  3 7 6 7 2  7  2  2  7  6  4 1 6 1 1 16  0  2  7  8  1  7  7  6  0  4  3  4  5  8 7 8 3 0 3 1 2 7 8  5 2 3 2 5  7  5  7  4  3  5 2 9 4 6 17  1  1  0  5  9  6  6  2  7  2  2  7  1  8 5 5 2 7 5 9 5 0 3  7 0 3 1 5  4  2  9  7  4  4 2 6 0 5 18  1  9  0  4  1  1  4  3  3  1  5  6  7  0 1 2 2 2 4 4 9 2 2  1 9 7 1 5  9  1  1  5  8  9 7 2 2 2 19  6  9  7  4  5  0  1  0  6  6  2  1  5  2 1 8 8 2 5 2 2 2 8  1 2 3 8 1  3  5  7  6  7  8 1 6 7 1 20  2  7  1  2  1  6  3  1  1  7  1  2  3  4 8 8 1 1 7 1 1 1 3  6 2 1 1 7  9  2  2  5  3  2 2 2 7 6 21  9  5  5  5  2  2  0  1  3  6  9  6  5  3 2 2 6 3 1 4 4 4 3  1 6 7 0 5  5  1  0  7  3  1 2 1 5 3 22  4  2  4  9  7  3  1  8  3  4  8  3  7  1 3 1 1 6 4 8 2 3 3  1 4 7 3 8  6  3  1  8  0  2 8 1 0 8 23  5  8  3  1  1  3  8  2  5  3  8  6  2  2 7 8 1 1 1 3 4 4 8  8 6 4 2 3  1  8  6  1  8  4 9 1 5 6 24  8  4  3  2  1  3  5  7  6  7  3  3  6  1 9 4 7 6 5 6 6 7 2  6 5 7 0 8  2  6  4  9  1  4 7 7 3 4 25  1  2  8  1  0  5  4  3  8  5  1  1  8  9 1 3 8 7 4 5 0 4 7  0 8 3 8 9  6  2  3  7  1  4 6 2 9 4 26  7  7  5  7  9  2  4  5  7  8  7  1  4  8 4 1 6 4 9 7 5 9 4  1 4 4 3 2  2  5  8  0  2  3 4 5 4 2 27  7  2  8  8  8  3  8  5  5  4  4  5  9  4 9 2 3 1 1 1 2 7 6  3 5 1 4 0  6  2  7  7  7  7 7 7 0 4 28  8  7  7  1  9  6  7  6  6  5  5  9  1  6 5 6 1 2 2 3 2 5 7  5 6 9 5 0  3  1  7  1  1  5 5 2 6 6 29  1  4  8  2  2  1  9  5  2  6  6  3  4  0 1 3 0 5 5 6 9 1 7  8 8 8 2 7  7  9  7  5  0  3 6 2 4 4 30  7  6  1  9  0  5  1  4  4  4  1  0  1  6 4 3 7 3 7 1 0 7 4  1 6 8 9 9  7  9  6  2  7  6 3 7 0 1 31  1  5  8  1  0  4  3  9  2  4  5  6  6  8 2 2 3 1 2 8 4 5 9  1 7 4 7 6  7  1  6  1  8  0 4 6 2 9 32  3  2  2  2  1  1  4  5  8  0  2  4  5  8 3 3 0 9 3 9 8 9 6  9 8 8 4 5  9  8  1  3  3  5 8 9 0 6 33  6  5  4  6  5  9  5  1  0  0  1  4  2  7 7 7 7 8 0 3 2 7 7  2 8 7 5 8  1  3  8  7  6  4 0 0 2 6 34  5  0  8  7  8  1  3  5  1  4  6  1  5  5 6 6 0 3 5 5 0 3 6  5 4 1 4 1  4  0  6  9  5  2 2 0 5 5  
  • 20. - 20 - Uanderson Rebula de Oliveira Estatística Como usar a tabela de números aleatórios 1º Numerar todos os elementos da população N;    2º Determinar as combinações dos algarismos para assegurar correspondência entre os dígitos aleatórios  e os elementos da população (ex.: se o último número da população for 80, por exemplo, devem ser lidos  números de dois algarismos; caso o último número seja 456, devem ser lidos números de três algarismos,  e assim por diante;    3º Escolher um ponto de partida arbitrário da tabela. A leitura pode ser feita horizontalmente →← (da  direita  para  a  esquerda  ou  vice‐versa),  verticalmente  ↓↑  (de  cima  para  baixo  ou  vice‐versa),  diagonalmente ↗↙↖↘ (no sentido ascendente ou descendente) ou formando o desenho de uma letra  qualquer. A opção, porém, deve ser feita antes de iniciado o processo;    4º Descartar os números maiores que o tamanho da população e/ou numeral repetido;    5º Usar os números escolhidos para identificar os elementos da população.    EXEMPLO. Uma empresa pecuária possui uma população de novilhos de tamanho N = 80 e precisa retirar amostras  de  tamanho  n  =  12  (15%  da  população)  para  fazer  exame  de  uma  determinada  doença.  Utilize  o  método  de  amostragem  aleatória  simples,  considerando  a  tabela,  a  partir  da  4ª  linha,  coluna  D,  sentido  horizontal,  da  esquerda para direita (→).  Informar, também, os números descartados.    SOLUÇÃO.  Como  a  população  N=80  teve  dois  algarismos,  então  combinamos  dois  algarismos  na  tabela  (00),  descartando os números repetidos e/ou maiores que o tamanho da população (Ex.: 81, 82, 83...) e escolhendo outra  combinação de algarismos. Este procedimento é repetido até a amostra de tamanho n=12 ser escolhida. Então:      A  B  C  D  E  F  G  H  I  J  K  L  M  N  O P Q R S T U V W X Y Z a b c  d  e  f  g  h  i  j  k l  1  9  3  3  1  2  1  6  6  3 3  9  0  7  0  4 0 4 4 1 3 8 1 6  5 8 8 9 8 6  5  0  6  3  3  1 2 4 8 2  0  7  6  8  1  4  5  0  5 8  6  6  1  4  2 6 7 5 6 0 5 7 7  9 6 3 2 6 3  4  5  9  8  6  5 2 1 1 3  6  5  1  5  3  4  4  2  3 7  9  1  4  8  5 8 7 2 4 7 3 7 0  6 2 2 1 3 5  0  8  9  4  7  1 6 4 4 4  9  7  0  2  6  7  3  2  6 7  4  9  1  6  2 7 7 8 6 8 4 7 8  1 5 7 1 2 6  6  6  3  5  6  0 8 2 1 5  5  5  6  5  1  6  4  8  3 3  1  5  3  8  8 2 3 8 8 7 7 4 5  0 4 5 1 8 7  2  3  2  9  6  4 7 7 9 6  8  3  4  8  8  3  8  0  6 4  8  2  3  5  2 5 3 7 1 7 6 8 2  9 5 3 4 3 7  0  3  9  7  0  1 5 7 2   n =   26  73  74  62  77  78  15  71  66  35  60  56    Descartados por repetição:  26    26    15  Descartados por serem maiores que a população:  91    86    84    82          Amostragem Aleatória Estratificada – É a técnica de amostragem em que dividimos todos os elementos da população em grupos (estratos) de idênticas características.   Às  vezes,  a  população  é  heterogênea  (ex.:  sexo  masculino  e  feminino;  peça  A,  B  e  C)  e  a  amostra  aleatória  simples não apresentaria esta heterogeneidade. Seria, então, necessário homogeneizar as amostras em grupos,  estratos.  Neste  caso  recorremos  à  amostragem  aleatória  estratificada.  “Estratificar”  sugere  “formar‐se  em  camadas”.    A  estratificação  mais  simples  que  encontramos  na  população  do  rebanho  de  tamanho  N=80  é  a  divisão  entre  novilhos e novilhas. Supondo que haja 35 novilhos e 45 novilhas, teremos a seguinte formação dos estratos:      População (80) Novilhos (35) Novilhas (45) Estrato 1 Estrato 2
  • 21. - 21 - Uanderson Rebula de Oliveira Estatística São,  portanto,  dois  estratos  (novilhos  e  novilhas).  Como  queremos  uma  amostra  de  tamanho  n=12  (15%  da  população), por estrato, temos:    Rebanho População 15% Amostra Novilho (estrato 1)   35  35*15% = 5,25  5  Novilha (estrato 2)   45  45*15%= 6,75  7  TOTAL  80  80*15% = 12  12    O próximo passo é extrair as amostras dentro de cada estrato. Então, numeramos o rebanho de 01 a 80, sendo que  de 01 a 35 correspondem novilhos e de 36 a 80, as novilhas.  Tomando na tabela de números aleatórios, a partir  da 4ª linha, coluna D, sentido horizontal, da esquerda para direita (→), obtemos os seguintes números:      A  B  C  D  E  F  G  H  I  J  K  L  M  N  O P Q R S T U V W X Y Z a b c  d  e  f  g  h  i  j  k l  1  9  3  3  1  2  1  6  6  3 3  9  0  7  0  4 0 4 4 1 3 8 1 6  5 8 8 9 8 6  5  0  6  3  3  1 2 4 8 2  0  7  6  8  1  4  5  0  5 8  6  6  1  4  2 6 7 5 6 0 5 7 7  9 6 3 2 6 3  4  5  9  8  6  5 2 1 1 3  6  5  1  5  3  4  4  2  3 7  9  1  4  8  5 8 7 2 4 7 3 7 0  6 2 2 1 3 5  0  8  9  4  7  1 6 4 4 4  9  7  0  2  6  7  3  2  6 7  4  9  1  6  2 7 7 8 6 8 4 7 8  1 5 7 1 2 6  6  6  3  5  6  0 8 2 1 5  5  5  6  5  1  6  4  8  3 3  1  5  3  8  8 2 3 8 8 7 7 4 5  0 4 5 1 8 7  2  3  2  9  6  4 7 7 9 6  8  3  4  8  8  3  8  0  6 4  8  2  3  5  2 5 3 7 1 7 6 8 2  9 5 3 4 3 7  0  3  9  7  0  1 5 7 2   Temos, então:  1 a 35 →  Novilhos n =  26  15  35  31  23      36 a 80 →  Novilhas n =  73  74  62  77  78  71  66    Descartados    Notas importantes sobre este tipo de amostragem Como é provável que a variável em estudo apresente, de estrato para estrato, um  comportamento  heterogêneo  e,  dentro  de  cada  estrato,  um  comportamento  homogêneo,  convém  que  a  amostragem  seja  feita  por  estratos.  Portanto,  a  amostragem estratificada é, em geral, usada para reduzir a variação nos resultados.  A amostragem estratificada é mais eficiente do que a amostragem aleatória simples,  uma vez que fica assegurada a representatividade de elementos ao longo de toda a  extensão  da  população.  A  homogeneidade  de  itens  dentro  de  cada  estrato  proporciona maior precisão. Da mesma maneira, em um sistema produtivo, podemos  estratificar as amostras em, por exemplo, peça A, peça B, peça C e assim por diante.    Amostragem Aleatória por Conglomerado- É a técnica de amostragem em que dividimos todos os elementos da população em diversos grupos (conglomerados).   A conglomeração mais simples que encontramos na população do rebanho de novilhos de tamanho N=80 é a sua  divisão,  por  exemplo,  em  10  grupos  (conglomerados),  cada  um  com  8  elementos  da  população.  Depois  numeramos cada conglomerado, como mostrado na figura abaixo:      O  próximo  passo  é  extrair  uma  amostra  aleatória  simples  dos  conglomerados.    Supondo  o  tamanho  amostral  n=24, teremos, portanto, 3 conglomerados a considerar. Partindo da 1ª linha, coluna A, sentido horizontal e da  esquerda para direita (→) da tabela aleatória, temos, então:    Conglomerados selecionados:  06  07  02  Agora,  é  só  coletar  todos  os  elementos  desses  conglomerados selecionados e estudar todos os itens.  População (80) Conglomerado 1 Conglomerado 2 Conglomerado 3 Conglomerado 5Conglomerado 4 Conglomerado 6 Conglomerado 7 Conglomerado 8 Conglomerado 10Conglomerado 9 8 novilhos (as) para cada conglomerado Número de amostras estratificadas
  • 22. - 22 - Uanderson Rebula de Oliveira Estatística Uma amostra por conglomerado é uma amostra aleatória simples na qual cada unidade de amostragem é  um grupo de elementos. Uma das principais aplicações da amostragem por conglomerados é a amostragem  por áreas geográficas, como cidades, municípios, setores de uma empresa, quarteirões de cidades, domicílios,  território de vendas etc.  Segundo Levine et al (2008, p. 222) e Anderson et al (2009, p.263) a amostragem por  conglomerados têm as seguintes características:    Todos os elementos contidos em cada conglomerado amostrado formam a amostra;  Cada conglomerado é uma versão representativa em pequena escala da população inteira;  Tende a produzir melhores resultados quando os elementos neles contidos não são similares;   De  um  modo  geral,  é  mais  eficaz  em  termos  de  custo  do  que  a  amostragem  aleatória  simples,  particularmente se a população estiver dispersa ao longo de uma extensa área geográfica. Entretanto, a  amostragem por conglomerado geralmente demanda um maior tamanho de amostra para que sejam  produzidos resultados tão precisos quanto aqueles que seriam obtidos da amostragem aleatória simples  ou estratificada.    Segundo Triola (2008, p. 23) outro exemplo de amostra por conglomerado pode ser encontrado nas pesquisas  eleitorais, onde selecionamos aleatoriamente 30 zonas eleitorais dentre um grande número de zonas e, em  seguida, entrevistamos todos os eleitores daquelas seções (zonas selecionadas). Isso é muito mais rápido e  muito menos dispendioso do que selecionar uma pessoa de cada uma das zonas na área populacional.     ATENÇÃO! É fácil confundir amostragem estratificada com a amostragem por conglomerado, porque ambas  envolvem  a  formação  de  grupos.  Porém,  a  amostragem  por  conglomerado  usa  todos  os  elementos  de  um  grupo  selecionado,  enquanto  a  amostragem  estratificada  usa  amostras  de  elementos de todos os estratos.                                                                Figura.  Amostragem  por  Conglomerados  em quarteirões de um  bairro. 
  • 23. - 23 - Uanderson Rebula de Oliveira Estatística   Amostragem Sistemática - É a técnica de amostragem em que retiramos os elementos da população periodicamente, definida pelo pesquisador.   Utilizamos  este  tipo  de  amostragem  quando  os  elementos  de  uma  população  se  encontram  ordenados,  por  exemplo, a coleta de amostras de um determinado produto em uma linha de produção.        Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo  pesquisador.  Assim, no caso de uma linha de produção, podemos, a cada dez itens produzidos, retirar um para  pertencer a uma amostra da produção diária. Neste caso, estaríamos fixando o tamanho amostral de 10% da  população.    Uma amostragem é sistemática quando a retirada dos elementos da população é feita periodicamente, sendo o  intervalo de seleção calculado, por meio da divisão do tamanho da população pelo tamanho da amostra a ser  selecionada.    EXEMPLO. Deseja‐se retirar uma amostra de n = 10 unidades de peças de uma população de tamanho N = 800. O  intervalo de seleção é, então, 800/10 = 80. Desse modo, 80 seria o primeiro elemento a ser considerado para a  amostra;  os  demais  elementos  seriam  periodicamente  considerados  de  80  em  80.  Nesse  caso  escolhem‐se  aquelas que estiverem nas seguintes posições: 80, 160, 240, 320, 400, 480, 560, 640, 720, 800.                              Outras amostragens (não probabilísticas) Amostragem  por  julgamento  –  A  pessoa  que  conhece  mais  profundamente  o  tema  do  estudo  escolhe  os  elementos  que  julga  serem  mais  representativos  da  população.  Por  exemplo,  um  repórter  pode  tomar  como  amostra dois ou três senadores, julgando que eles refletem a opinião geral de todos os senadores. A qualidade dos  resultados depende do julgamento da pessoa que a seleciona.     Amostragem  por  conveniência  –  a  amostra  é  identificada  primeiramente  por  conveniência  (cômodo,  útil,  favorável).  Como  exemplo  estudantes  de  uma  universidade  voluntários  para  compor  uma  amostra  de  uma  determinada pesquisa escolar.  AmostrasColeta de Amostras 0 80 160 240 320 400 480 560 640 720 800 1 2 3 4 5 6 7 8 9 10Amostra Nº da peça População = 800 Amostra = 10 800/10 = 80 80                    80                     80                  80                    80                     80              80                      80                       80 0 80 160 240 320 400 480 560 640 720 800 1 2 3 4 5 6 7 8 9 10Amostra Nº da peça População = 800 Amostra = 10 800/10 = 80 80                    80                     80                  80                    80                     80              80                      80                       80
  • 24. - 24 - Uanderson Rebula de Oliveira Estatística AMOSTRA (uma parte da população) POPULAÇÃO(todos os elementos em estudo) AMOSTRA (uma parte da população) POPULAÇÃO(todos os elementos em estudo) 1.5 ESTATÍSTICA DESCRITIVA E ESTATÍSTICA INFERENCIAL    Estatística descritiva – É o ramo da estatística  que  envolve  a  organização,  o  resumo  e  a  representação  dos  dados  para  tomada  de  decisão.    Estatística inferencial – É o ramo da estatística  que envolve o uso da amostra para chegar a  grandes  conclusões  sobre  a  população.  Uma  ferramenta  básica  no  estudo  da  estatística  inferencial é a probabilidade.  Algumas ferramentas aplicadas à Estatística Inferencial:    Probabilidades Uma Probabilidade é uma medida numérica que representa a chance de um evento ocorrer. Ex.:  Ao lançar um dado, qual a probabilidade de obter o valor 4? R = 1 /6 = 16%    Estimação, margem de erro e intervalo de confiança Suponha que o tempo médio que você leva para chegar ao trabalho de carro é de 35’, com uma margem de erro  de 5’ para mais ou para menos. A estimativa é de que o tempo médio gasto até  chegar ao trabalho fica em algum ponto entre 30’ e 40’. Esta estimativa é um  intervalo de confiança, pois leva em consideração o fato de que os resultados da  amostra irão variar e dá uma indicação de uma variação esperada.  A  margem  de  erro  é  uma  medida  de  quão  próximo  você  espera  que  seus resultados representem toda a  população  que  está  sendo  estudada.  Vários  fatores  influenciam  a  amplitude  de  um  intervalo de confiança, tais como o  tamanho amostral, a variabilidade da população e o quanto você espera obter de precisão. A maioria dos pesquisadores contenta‐se com 95%  de  confiança  em  seus  resultados.  Estar  95%  confiante  indica  que  se  você  coletar  muitas,  mas  muitas  amostras  e  calcular  o  intervalo  de  confiança para todas, 95% dessas amostras terão intervalos de confiança que abrangerão o alvo.    Teste de hipótese Teste de hipótese é um procedimento estatístico em que os dados são coletados e medidos para comprovar uma  alegação feita sobre uma população. Por exemplo, se uma pizzaria alega entregar as pizzas dentro de 30’ a partir  do  pedido,  você  pode  testar  se  essa  alegação  é  verdadeira,  coletando  uma  amostra  aleatória  do  tempo  de  entrega durante um  determinado período de tempo e observar o tempo médio de entrega para essa amostra.                 
  • 25. - 25 - Uanderson Rebula de Oliveira Estatística                                                                                             2 SÉRIES ESTATÍSTICAS
  • 26. - 26 - Uanderson Rebula de Oliveira Estatística 2.1 CONCEITOS E TIPOS DE SÉRIES    As  tabelas  e  gráficos  constituem  um  importante  instrumento  de  análise  e  interpretação  de  um  conjunto  de  dados.  Diariamente é possível encontrar tabelas e gráficos nos mais variados veículos  de comunicação (jornais,  revistas, televisão,  Internet),  associadas  a  assuntos  diversos  do  nosso  dia‐a‐dia,  como  resultados  de  pesquisas  de  opinião,  saúde  e  desenvolvimento humano, economia, esportes, cidadania, etc. A importância das tabelas e dos gráficos está ligada sobretudo à  facilidade e rapidez na absorção e interpretação das informações por parte do leitor e também às inúmeras possibilidades de  ilustração e resumo dos dados apresentados.    TABELAS   São quadros que resumem um conjunto de dados.        Tipos de Tabelas   SÉRIE HISTÓRICA  Descreve  os  valores  da  variável,  discriminados  por  TEMPO  (anos,  meses, dias, horas, etc.        SÉRIE GEOGRÁFICA  Descreve  os  valores  da  variável,  discriminados por REGIÕES (países,  cidades, bairros, ruas, layout, etc)      SÉRIE ESPECÍFICA  Descreve  os  valores  da  variável,  discriminados  por  temas  ESPECIFICOS.          SÉRIE CONJUGADA  É utilizado quando temos a necessidade de apresentar em uma única  tabela  a  variação  de  valores  DE  MAIS  DE  UMA  VARIÁVEL,  isto  é,  fazer de forma conjugada de duas ou mais séries.      Esta série, por exemplo, é GEOGRÁFICA – HISTÓRICA          Título – conjunto de informações sobre o estudo.  Cabeçalho –especifica o conteúdo das colunas  Coluna indicadora –especifica o conteúdo das linhas  Coluna numérica ‐–especifica  a quantidade das linhas  Linhas – retas imaginárias de dados  Célula – espaço destinado a um só número  Rodapé – simplesmente a fonte dos dados
  • 27. - 27 - Uanderson Rebula de Oliveira Estatística GRÁFICOS    A  importância  dos  gráficos  está  ligada  à  facilidade  e  rapidez  na  absorção  e  interpretação  das  informações  e  também às inúmeras possibilidades de ilustração e resumo dos dados apresentados. Eis os mais usados:    Gráfico em Linha (para séries históricas) É a representação dos valores por meio de linhas. Usamos quando precisamos de uma informação rápida de um  valor ao longo do tempo.                                                                    Gráfico em Colunas É  a  representação  dos  valores  por  meio  de  retângulos,  dispostos  verticalmente.  Utiliza‐se  muito  quando  necessitamos saber a quantidade de valor.                                ACIDENTES DO TRABALHO EM  SÃO PAULO: 1989 ‐ 1991 0 500 1000 1500 2000 2500 1989 1990 1991 anos Quantidade São Paulo Guarulhos Campinas Osasco Santos FONTE: Dados fictícios  QUANTIDADE DE ACIDENTES DO TRABALHO SÃO PAULO: 1989 ‐ 1994 6254 7265 6325 5458 8658 9578 0 2000 4000 6000 8000 10000 12000 1989 1990 1991 1992 1993 1994 Anos Quantidade FONTE: Dados fictícios  ACIDENTES DO TRABALHO SÃO PAULO: 1989 ‐ 1994 6254 7265 6325 5458 8658 9578 0 2000 4000 6000 8000 10000 1989 1990 1991 1992 1993 1994 Anos Quantidade FONTE: Dados fictícios
  • 28. - 28 - Uanderson Rebula de Oliveira Estatística Gráfico em Barras É o mesmo conceito que o de Colunas, porém utiliza‐se sempre que os dizeres a serem inscritos são extensos.                                     Gráfico em Setores Este gráfico é construído com base em um círculo, e é empregado sempre que desejamos ressaltar a participação  de um dado no total, geralmente na forma de porcentagem.                              Gráfico Polar É  o  gráfico  ideal  para  representar  séries  temporais  cíclicas,  isto  é,  séries  temporais  que  apresentam  em  seu  desenvolvimento determinada periodicidade, por exemplo, o mês de janeiro a dezembro.           QUANTIDADE DE ACIDENTES DO TRABALHO EM SÃO PAULO ‐ POR TIPO ‐  1989 55 1396 698 3578 598 0 1000 2000 3000 4000 Impacto Perfuração Atrito Queda Corte Tipo Quantidade FONTE: Dados fictícios ACIDENTES DO TRABALHO SÃO PAULO ‐ 1989  FONTE: Dados fictícios ACIDENTES DO TRABALHO SÃO PAULO ‐ 1989  FONTE: Dados fictícios
  • 29. - 29 - Uanderson Rebula de Oliveira Estatística Número de cada  Delegacia  Gráfico de Pareto É  um  gráfico  de  colunas  na  qual  a  altura  de  cada  barra  representa  os  dados,  porém  na  ordem  de  altura  decrescente,  com  a  coluna  mais  alta  posicionada  à  esquerda.  Tal  posicionamento  ajuda  a  enfatizar  dados  importantes e é frequentemente usado nos negócios.    Os cinco veículos mais vendidos  no Brasil em janeiro de 1995    Veículo  Quantidade  (milhões)  Ômega  34  Monza  30  Gol  25  Corsa  22  Fusca  15  FONTE: dados fictícios                              Gráfico de Dispersão É usado para representar a relação entre duas variáveis quantitativas, por meio de pontos e linhas.    Investimentos versus vendas   no setor da empresa X    Anos  Investimentos  Vendas   1999  500  3000  2000  3000  2000  2001  1300  4000  2002  2000  2500  FONTE: dados fictícios          Gráfico Cartograma Este gráfico é empregado quando o objetivo é o de figurar os dados estatísticos diretamente relacionados com  áreas geográficas ou políticas (mapas), corpo humano entre outras figuras      Os cinco veículos mais vendidos  no Brasil em janeiro de 1995 15 2225 30 34 0 10 20 30 40 Ômega Monza Gol Corsa Fusca Veículos Quantidade (milhões) FONTE: Dados fictícios FONTE: SSP/SP 
  • 30. - 30 - Uanderson Rebula de Oliveira Estatística 2.2 DISTRIBUIÇÃO DE FREQUÊNCIA    FREQUÊNCIA ABSOLUTA E HISTOGRAMA     Ao se trabalhar com grandes conjuntos de dados, em geral é útil organizá-los e resumi-los em uma tabela, chamada Distribuição de frequência.   Na distribuição de frequência listamos todos os valores coletados, um em cada linha, marcam‐se as vezes em que eles  aparecem, incluindo as repetições, e conta‐se a quantidade de ocorrências de cada valor. Por este motivo, tabelas  que apresentam valores e suas ocorrências denominam‐se distribuição de freqüências.  O termo “freqüência” indica o número de vezes que um dado aparece numa observação estatística.    EXEMPLO 1   Um professor organizou os resultados obtidos em uma prova com 25 alunos da seguinte forma:                                         Notas dos 25 alunos                                                                                                 Comentário  4,0  5,0  7,0  9,0  9,0  4,0  5,0  7,0  9,0  9,0  4,0  5,0  7,0  9,0  9,0  4,0  6,0  8,0  9,0  9,0  4,0  6,0  8,0  9,0  9,0    Agora  ele  pode  fazer  uma  representação  gráfica  para  analisar  o  desempenho da turma. Em primeiro lugar, o professor pode fazer uma  tabulação dos dados, ou seja, organizá‐los de modo que a consulta a eles  seja  simplificada.  Então,  faremos  a  distribuição  de  freqüência  destas  notas, por meio da contagem de dados.                                   Distribuição de freqüência                                                                                           Comentário  Nota   Freqüência absoluta, f  (nº de alunos)  4,0  5  5,0  3  6,0  2  7,0  3  8,0  2  9,0  10    ∑f=25    Esta  forma  de  organizar  dados  é  conhecida  como  distribuição  de  frequência, e o  número de vezes que um dado aparece é chamado de  frequência absoluta, representado por f. Exemplos:     A frequência absoluta da nota 4,0 é 5.  A freqüência absoluta da nota 9,0 é 10.    O  símbolo  grego  ∑  “sigma”  significa  “somatório”,  muito  usado  em  Estatística. Portanto, ∑f=25 significa a soma de 5+3+2+3+2+10.    Representamos a freqüência por um gráfico, chamado Histograma.                                                                                                                                                                                          HISTOGRAMA                                                                                                         Comentário      ESTA FREQUÊNCIA QUE ACABAMOS DE ESTUDAR É DENOMINADA FREQUENCIA  ABSOLUTA (f), QUE É SIMPLESMENTE A CONTAGEM DOS DADOS.    Em Estatística não trabalhamos somente com frequência absoluta (f), mas também com outros tipos de freqüências,  que são: freqüência relativa (fr), frequência absoluta acumulada (Fa) e frequência relativa acumulada (FRa).    Estudaremos agora cada uma delas.  Quando  os  dados  numéricos  são  organizados,  eles  geralmente  são  ordenados  do  menor  para  o  maior,  divididos  em  grupos  de  tamanho  razoável  e,  depois,  são  colocados  em  gráficos  para  que  se  examine  sua  forma, ou distribuição (no exemplo: 4,0 – 5,0 – 6,0 – 7,0 – 8,0 – 9,0). Este  gráfico é chamado de Histograma.     Um histograma é um gráfico de colunas juntas. Em um histograma não  existem espaços entre as colunas adjacentes, como ocorre em um gráfico  de colunas. No exemplo, a escala horizontal (→) representa as notas e a  escala vertical (↑) as freqüências.    O histograma ao lado indica que cinco alunos tiraram a nota 4,0; três alunos tiraram  a nota 5,0; dois alunos tiraram a nota 6,0; três alunos tiraram a nota 7,0; dois alunos  tiraram 8,0 e dez alunos tiraram 9,0.  5 3 2 3 2 10 0 2 4 6 8 10 12 Número de alunos 4,0 5,0 6,0 7,0 8,0 9,0 Nota Desempenho dos alunos na prova
  • 31. - 31 - Uanderson Rebula de Oliveira Estatística FREQUENCIA RELATIVA (fr) %   Conceito. Representado por fr, significa a relação existente entre a frequência absoluta (f) e a soma das  freqüências (∑f). É a porcentagem (%) do número de vezes que cada dado aparece em relação ao total.    EXEMPLO 1a                                                                 f/∑f*100→5/25*100= 20%         freqüência relativa (fr)%                                                                                            Comentários aos cálculos  Nota  f  fr(%)  4,0  5  20%  5,0  3  12%  6,0  2  8%  7,0  3  12%  8,0  2  8%  9,0  10  40%    ∑f=25  100    A frequência relativa (fr) é obtida por f/∑f *100, conforme abaixo:    A fr(%) da nota 4,0 é fr = 5/25 = 0,2 = 20%.  A fr(%) da nota 5,0 é fr = 3/25 = 0,12 = 12%  A fr(%) da nota 6,0 é fr = 2/25 = 0,08 = 8%  A fr(%) da nota 7,0 é fr = 3/25 = 0,12 =12%  A fr(%) da nota 8,0 é fr = 2/25 = 0,08 = 8%  A fr(%) da nota 9,0 é fr = 9/25 = 0,4 = 40%.      FREQUENCIA ABSOLUTA ACUMULADA (Fa)   Conceito. Representado por Fa, significa a soma das freqüências absolutas até o elemento analisado.    EXEMPLO 1b                                                                                 Fa2=5+3 = 8       frequência absoluta acumulada (Fa)                                                                                            Comentários aos cálculos  Nota  f  fr(%)  Fa  4,0  5  20%  5  5,0  3  12%  8  6,0  2  8%  10  7,0  3  12%  13  8,0  2  8%  15  9,0  10  40%  25    ∑f=25  100  ‐    A frequência absoluta acumulada (Fa) é obtida conforme abaixo:    A “Fa” da nota 4,0 é 5 (sempre repete a primeira).  A “Fa” das notas 4,0 e 5,0 é 5+3=8.  A “Fa” das notas 4,0, 5,0 e 6,0 é 5+3+2=10.  A “Fa” das notas 4,0, 5,0, 6,0 e 7,0 é 5+3+2+3=13.  A “Fa” das notas 4,0, 5,0, 6,0, 7,0 e 8,0 é 5+3+2+3+2=15.  A “Fa” das notas 4,0, 5,0, 6,0, 7,0, 8,0 e 9,0 é 5+3+2+3+2+10=25      FREQUENCIA RELATIVA ACUMULADA (FRa) %   Conceito. Representado por FRa, significa soma das freqüências relativas (fr) até o elemento analisado.    EXEMPLO 1c                                                                                              20%+12% = 32%               frequência relativa acumulada (FRa)                                                                                 Comentários aos cálculos  Nota  f  fr(%)  Fa  FRa(%)  4,0  5  20%  5  20%  5,0  3  12%  8  32%  6,0  2  8%  10  40%  7,0  3  12%  13  52%  8,0  2  8%  15  60%  9,0  10  40%  25  100%    ∑f=25  100  ‐  ‐    A frequência relativa acumulada (FRa) é obtida conforme abaixo:    A “FRa” de 4,0 é 20% (sempre repete a primeira).  A “FRa” de 4,0 e 5,0 é 20+12 = 32%  A “FRa” de 4,0, 5,0 e 6,0 é 20+12+8 = 40%  A “FRa” de 4,0, 5,0, 6,0 e 7,0 é 20+12+8+12 = 52%  A “FRa” de 4,0, 5,0, 6,0, 7,0 e 8,0 é 20+12+8+12+8 = 60%  A “FRa” de 4,0, 5,0, 6,0, 7,0, 8,0 e 9,0 é 20+12+8+12+8+40=100%    NOTA IMPORTANTE SOBRE DISTRIBUIÇÃO DE FREQUÊNCIA:  Nota  f  fr(%)  Fa  FRa(%)        25  100    ∑f=25  100  ‐  ‐    Para saber se o desenvolvimento da distribuição de freqüência por completo está  correto, os valores ao lado, em vermelho, deverão coincidir.   
  • 32. - 32 - Uanderson Rebula de Oliveira Estatística AGRUPAMENTO EM CLASSES     Em uma distribuição de frequência, ao se trabalhar com grandes conjuntos de dados e com valores dispersos, podemos agrupá-los em classes.   Se um conjunto de dados for muito disperso, uma representação melhor seria através do agrupamento dos dados  com a construção de classes de frequência. Caso isso não ocorresse, a tabela ficaria muito extensa. Veja abaixo:    EXEMPLO 2   Um radar instalado na Dutra registrou a velocidade (em Km/h) de 40 veículos, indicadas abaixo:                                                                                                 Velocidade de 40 veículos (Km/h)    Distribuição de frequência                                                                            É  fácil  ver  que  a  distribuição  de  frequências  diretamente  obtida  a  partir  desses  dados  é  dada uma tabela razoavelmente extensa.      70  90  100    110   123  71  93  102   115    123  73  95  103   115  123  76  97  105   115  123  80  97  105   117  124  81  97  109   117  124  83  99  109   121  128  86  99  109   121  128  Nota  f  70  1  71  1  73  1  76  1  80  1  81  1  83  1  86  1  90  1  93  1  95  1  97  3  99  2  100  1  102  1  103  1  105  2  109  3  110  1  115  3  117  2  121  2  123  4  124  2  128  2    ∑f=40         Distribuição de freqüência com classes  i  Velocidade (Km/h)  f  1  70 |⎯  80  4  2  80 |⎯  90  4  3    90 |⎯  100  8  4         100 |⎯  110  8  5         110 |⎯  120  6  6         120 |⎯  130  10      ∑f=40    A  criação  de  grupos  de  frequências,  chamado  de  ”classes”,  é  como  se  fosse  uma  compressão  dos  dados.  Imagine  se  fizéssemos  uma  distribuição  de  freqüência  de  todas  velocidades,  desde  70  até  128.  A  distribuição  ficaria  imensa! Por este motivo existe a distribuição de frequência com classes.    Como criar uma Distribuição de Freqüência com classes    1. Calcule a quantidade de classes (i), obtida por meio da raiz da  quantidade de dados. Neste exemplo:  40  = 6,3  ≅ i = 6 classes.    2. Calcule a amplitude de classe (h) que nada mais é o tamanho da  classe, representado por “h”, sendo:    Maior valor  – Menor valor   =   128 – 70    =   9,6   ≅  h=10             quantidade de classes (i)                  6                                             Nota: o Maior valor e o Menor valor são obtidos da relação das velocidades dos  40 veículos, ou seja,o maior valor é 128 e o menor valor é 70.    3. Montar  as  classes  a  partir  do  Menor  valor  (70  no  exemplo),  somando com a amplitude de classe (10 no exemplo) até que se  chegue na 6ª classe, assim:              CONCEITOS IMPORTANTES:  TIPOS DE INTERVALO DE CLASSE:              No  Brasil  costuma‐se  utilizar  o  intervalo  |⎯  (Resolução  866/66  do  IBGE).  Já  na  literatura estrangeira, a exemplo de Triola (2008), Anderson et al (2009) e Levine et  al (2008), utiliza‐se somente com intervalo fechado.    LIMITES DE CLASSE ‐  São os extremos de cada classe, no exemplo 70 |⎯ 80,  temos que o limite inferior é 70 e o limite superior  80.  Classes i  Velocidade (Km/h)    1  70  +10   80  2...  80  +10   90   ...6  120  +10  130  Tipo  Representação  Dados do intervalo  Aberto   70 ⎯  80  70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80  Fechado à esquerda   70 |⎯ 80  70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80  Fechado    70 |⎯| 80  70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80  Fechado à direita    70  ⎯| 80  70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80 
  • 33. - 33 - Uanderson Rebula de Oliveira Estatística 0 2 4 6 8 10 12 Quantidade de veículos Resultados dos registros  de um radar              70  75   80   85   90    95  100  105  110  115 120  125  130      Velocidade (Km/h)  AMPLITUDE TOTAL DA DISTRIBUIÇÃO (AT) – É a diferença entre o limite superior da última classe e o limite inferior da primeira classe, no  exemplo 130 – 70 = 60.  AMPLITUDE AMOSTRAL  (AA) – É a diferença entre o valor máximo e o valor mínimo da amostra, no exemplo 128 – 70 = 58.    Abaixo vemos as distribuições de frequências absoluta, relativa, absoluta acumulada e relativa acumulada, bem  como o Histograma desta distribuição.                         Distribuição de freqüência com classes f, fr, Fa e FRa                          OUTRAS REPRESENTAÇÕES GRÁFICAS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA    POLÍGONO DE FREQUÊNCIA – É um gráfico em linha que representa os pontos centrais dos intervalos de classe.    Calcule o ponto central de classe (x), que é o ponto que divide o intervalo de classe em duas partes iguais. Por  exemplo, a velocidade dos veículos da 1ª classe pode ser representada por  70 + 80  = 75Km/h                                                                                                                                                                2                          A  construção  de  um  polígono  de  frequências  é  muito  simples.  Primeiro,  construímos  um  histograma;  depois  marcamos  no  “telhado”  de  cada  coluna  o  ponto central e unimos sequencialmente esses pontos.     OGIVA –  (pronuncia‐se o’jiva). Conhecida também por polígono de frequência acumulada. É um gráfico em linha  que representa freqüências acumuladas (FRa), levantada nos pontos correspondentes aos limites superiores dos  intervalos de classe.                                  i  Velocidade (Km/h)  f  Fr(%)  Fa  FRa(%)  1  70 |⎯  80  4  10%  4  10%  2  80 |⎯  90  4  10%  8  20%  3   90 |⎯  100  8  20%  16  40%  4      100 |⎯  110  8  20%  24  60%  5      110 |⎯  120  6  15%  30  75%  6      120 |⎯  130  10  25%  40  100%                                           ∑f=40  100%  i  Velocidade (Km/h)  f  x  1  70 |⎯  80  4  75  2  80 |⎯  90  4  85  3    90 |⎯  100  8  95  4       100 |⎯  110  8  105  5       110 |⎯  120  6  115  6       120 |⎯  130  10  125                                           ∑f=40    i  Velocidade (Km/h)  f  FRa  1  70 |⎯  80  4  4  2  80 |⎯  90  4  8  3   90 |⎯  100  8  16  4      100 |⎯  110  8  24  5      110 |⎯  120  6  30  6      120 |⎯  130  10  40                                           ∑f=40    4 4 8 8 6 10 0 2 4 6 8 10 12 Quantidade de veículos Resultados dos registros  de um radar 70         80        90         100       110        120       130    Velocidade (Km/h)  70 |⎯  80 Ponto central  75Km/h Velocidade (Km/h)  4 4 8 8 6 10 0 5 10 15 20 25 30 35 40 Quantidade de veículos Resultados dos registros  de um radar 70          80           90          100         110         120         130  4  8  16  24  30  40 
  • 34. - 34 - Uanderson Rebula de Oliveira Estatística                                                                                                                  3 MEDIDAS         Para  resumir a  quantidade de  informação  contida  em  um  conjunto  de  dados,  os  estatísticos  definem  medidas  que  descrevem,  através  de  um  só  elemento,  características dos dados. Algumas medidas descrevem a tendência central, isto é, a  tendência que os dados têm de se agrupar em torno de certos valores.