1. O documento apresenta dados estatísticos sobre acidentes de trabalho no Brasil de 1970 a 2005, coletados e organizados pelo INSS.
2. Ao longo dos anos, houve um aumento gradativo da quantidade de trabalhadores no Brasil, de 7,2 milhões em 1970 para 33,2 milhões em 2005.
3. Também houve um crescimento no número de acidentes de trabalho no período, indicando a importância da estatística para analisar tendências e subsidiar a prevenção de acidentes.
1. - 1 -
Uanderson Rebula de Oliveira Estatística
UniversidadeEstáciodeSá
EngenhariadeProdução
PROBABILIDADE E ESTATÍSTICA
ESTATÍSTICA
Prof. Uanderson Rebula de Oliveira
uanderson@csn.com.br
www.uandersonrebula.blogspot.com | www.iluminaconsultoria.com.br
2. - 2 -
Uanderson Rebula de Oliveira Estatística
EMENTA DE ESTATÍSTICA:
Estatística: conceito e fases de estudo. Variáveis. População, amostra e métodos
de amostragem. Estatística descritiva e inferencial. Séries estatísticas: conceitos,
distribuição de frequência e representação gráfica. Medidas de Tendência
Central: Média, moda e mediana. Medidas de Variação: Variância, desvio padrão
e coeficiente de variação.
OBJETIVO:
Refletir a partir da Estatística Básica sobre as ferramentas consolidadas pelo uso e
pela ciência, disponíveis a todos, que auxiliam na tomada de decisão.
Engenharia de Produção
PROBABILIDADE E ESTATÍSTICA
UANDERSON REBULA DE OLIVEIRA
Mestrando em Engenharia (ênfase em Engenharia de Produção)-Universidade Estado de São Paulo-FEG-UNESP
Pós-graduado em Controladoria e Finanças-Universidade Federal de Lavras-UFLA
Pós-graduado em Logística Empresarial-Universidade Estácio de Sá-UNESA
Graduado em Ciências Contábeis-Universidade Barra Mansa-UBM
Técnico em Metalurgia-Escola Técnica Pandiá Calógeras-ETPC
Técnico em Segurança, Saúde e Higiene do Trabalho-ETPC
Operador Siderúrgico e Industrial-ETPC
Professor na Universidade Barra Mansa – UBM. Professor da Universidade Estácio de Sá - UNESA nas disciplinas de
Gestão Financeira de Empresas, Fundamentos da Contabilidade e Matemática Financeira, Probabilidade e Estatística,
Ergonomia, Higiene e Segurança do Trabalho, Gestão de Segurança e Análise de Processos Industriais, Gestão da
Qualidade: programa 5S (curso de férias). Ex-professor Conteudista na UNESA (elaboração de Planos de Ensino e
de Aula, a nível nacional). Professor em escolas técnicas nas disciplinas de Estatística Aplicada, Estatística de
Acidentes do Trabalho, Probabilidades, Contabilidade Básica de Custos, Metodologia de Pesquisa Científica,
Segurança na Engenharia de Construção Civil e Higiene do Trabalho. Ex-professor do SENAI. Desenvolvedor e
instrutor de diversos cursos corporativos na CSN, a níveis Estratégicos, Táticos e Operacionais.
Membro do IBS–Instituto Brasileiro de Siderurgia.
Resende - 2010
ESTATÍSTICA
3. - 3 -
Uanderson Rebula de Oliveira Estatística
APRESENTAÇÃO
DA DISCIPLINA
Uma das ferramentas mais utilizadas hoje em dia pelos
cientistas, analistas financeiros, médicos, engenheiros, jornalistas
etc. é a Estatística, que descreve os dados observados e desenvolve
a metodologia para a tomada de decisão em presença da incerteza.
O verbete estatística foi introduzido no século XVIII, tendo origem
na palavra latina status (Estado), e serviu inicialmente a objetivos
ligados à organização político‐social, como o fornecimento de
dados ao sistema de poder vigente. Hoje em dia, os modelos de
aplicação da Teoria Estatística se estendem por todas as áreas do
conhecimento, como testes educacionais, pesquisas eleitorais,
análise de riscos ambientais, finanças, controle de qualidade,
análises clínicas, índices de desenvolvimento, modelagem de
fenômenos atmosféricos etc. Podemos informalmente dizer que a
Teoria Estatística é uma ferramenta que ajuda a tomar decisões
com base na evidência disponível, decisões essas afetadas por
margens de erro, calculadas através de modelos de probabilidade.
No entanto, a probabilidade se desenvolveu muito
antes de ser usada em aplicações da Teoria Estatística. Um dos
marcos consagrados na literatura probabilística foi a
correspondência entre B. Pascal (1623‐1662) e P. Fermat (1601‐
1665), onde o tema era a probabilidade de ganhar em um jogo com
dois jogadores, sob determinadas condições. Isso mostra que o
desenvolvimento da teoria de probabilidades começou com uma
paixão humana, que são os jogos de azar, mas evoluiu para uma
área fortemente teórica, em uma perspectiva de modelar a
incerteza, derivando probabilidades a partir de modelos
matemáticos.
A análise combinatória deve grande parte de seu
desenvolvimento à necessidade de resolver problemas
probabilísticos ligados à contagem, mas hoje há diversas áreas em
que seus resultados são fundamentais para o desenvolvimento de
teorias, como, por exemplo, a área de sistemas de informação.
Nesta apostila encontraremos as definições de
Estatística, vocabulário básico, população e amostra, séries
estatísticas, medidas de tendência central, medidas de
variabilidade. Probabilidades serão tratadas em outra apostila.
4. - 4 -
Uanderson Rebula de Oliveira Estatística
Falou mais o Senhor a Moisés, no deserto de Sinai, na tenda da
congregação, no primeiro dia do mês segundo, no segundo ano da sua
saída da terra do Egito, dizendo:
Tomai a soma de toda a congregação dos filhos de Israel, segundo as
suas gerações, segundo a casa dos seus pais, conforme o número dos
nomes de todo o varão, cabeça por cabeça;
Da idade de vinte anos e para cima, todos os que saem à guerra em
Israel; a estes contareis segundo os seus exércitos, tu e Aarão.
Estará convosco, de cada tribo, um homem que seja cabeça da casa dos
seus pais.
Todos os contados, pois, foram seiscentos e três mil, quinhentos e
cinquenta.
Números 1: 1-4; 46
5. - 5 -
Uanderson Rebula de Oliveira Estatística
Sumário
1 – CONCEITOS PRELIMINARES
1.1 CONCEITO E IMPORTÂNCIA DA ESTATÍSTICA, 7
1.2 FASES DO ESTUDO ESTATÍSTICO, 13
1.3 VOCABULÁRIO BÁSICO DE ESTATÍSTICA, 15
1.4 POPULAÇÃO E AMOSTRA, 17
MÉTODOS DE AMOSTRAGEM PROBABILÍSTICOS, 18
Amostragem aleatória simples, 18
Amostragem aleatória estratificada, 20
Amostragem aleatória por conglomerado, 21
Amostragem sistemática, 23
1.5 ESTATÍSTICA DESCRITIVA E ESTATÍSTICA INFERENCIAL , 24
2 – SÉRIES ESTATÍSTICAS
2.1 CONCEITOS E TIPOS DE SÉRIES ESTATÍSTICAS, 26
Tabelas, 26
Gráficos, 27
2.2 DISTRIBUIÇÃO DE FREQUÊNCIA, 30
Freqüência absoluta e histograma, 30
Freqüência relativa, absoluta acumulada e relativa acumulada, 31
Agrupamento em classes, 32
Polígono de freqüência e ogiva, 33
3 – MEDIDAS
3.1 MEDIDAS DE TENDÊNCIA CENTRAL, 35
MÉDIA, 35
Média simples, 35
Média aparada, 36
Média ponderada, 36
Média de distribuição de frequência, 37
Média geométrica, 38
MEDIANA, 39
MODA, 40
RELAÇÃO ENTRE MÉDIA, MEDIANA E MODA, 41
3.2 MEDIDAS DE VARIAÇÃO, 42
VARIÂNCIA E DESVIO PADRÃO, 43
COEFICIENTE DE VARIAÇÃO, 45
REFERÊNCIAS BIBLIOGRÁFICAS, 46
ANEXO I – LIVROS RECOMENDADOS, 47
ANEXO II – Software BIOESTAT , 48
ANEXO III – ESTATÍSTICA NO EXCEL, 49
7. - 7 -
Uanderson Rebula de Oliveira Estatística
1.1 CONCEITO E IMPORTÂNCIA DA ESTATÍSTICA
ESTATÍSTICA NA PRÁTICA
Analise as informações abaixo para melhor compreensão do conceito e importância da Estatística.
ACIDENTES DO TRABALHO no Brasil – 1970 a 2005
Conceito resumido: Lesão corporal ou doença, relacionada com o exercício do trabalho.
Legislação: Lei 8.213/91 – art. 19 a 21
INSS: Órgão público responsável pela coleta, organização e representação dos dados.
Coleta: Por meio de um formulário eletrônico denominado “CAT – Comunicação de Acidente do Trabalho”, enviado
pelas empresas quando da ocorrência, conforme determina o art. 22 da Lei 8.213/91.
Organização: Através de um grande banco de dados do INSS.
Representação: Através de um documento denominado “Anuário Estatístico de Acidentes do Trabalho”, contendo
tabelas, gráficos e diversas análises. Disponível no site www.previdencia.gov.br, na seção “Estatística”.
Motivo: Quando o trabalhador se afasta por motivo de acidente o INSS concede benefícios acidentários, como
auxílio doença acidentário, auxílio acidente, aposentadoria por invalidez, pensão por morte, reabilitação entre
outros. Mais informações na apostila Profº Uanderson “Ergonomia, Higiene e Segurança do Trabalho”, pág. 50‐
52;136, disponível no portal www.uandersonrebula.blogspot.com.
COMPILAÇÃO E ANÁLISE DE DADOS (INFORMAÇÕES) sobre acidentes do trabalho, de 1970 a 2005:
Observa‐se ao longo dos anos o aumento gradativo da quantidade de trabalhadores no Brasil, de 7.284.022 chegando
a 33.238.617, reflexo do crescimento econômico do País. Essas informações (dados) são importantes para fins de
comparação com a evolução da quantidade de acidentes do trabalho no mesmo período, como segue abaixo:
7.284.022
8.148.987
11.537.024
14.945.489
16.638.799
18.686.355
19.476.36219.673.915
22.163.827
23.661.57923.198.656
22.272.843
23.667.24123.830.312
24.491.635
26.228.629
27.189.614
28.683.913
29.544.927
31.407.576
33.238.617
0
5.000.000
10.000.000
15.000.000
20.000.000
25.000.000
30.000.000
35.000.000
1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2001 2002 2003 2004 2005
Evolução da QUANTIDADE de TRABALHADORES
no Brasil - 1970 a 2005.
FONTE: Revista Proteção Anos
1.220.111
1.504.723
1.796.671
1.743.825
1.551.461
1.464.211
1.178.472
961.575
1.207.859
991.581
693.572
532.514
388.304 395.455
414.341
363.868
340.251
393.071 399.077
465.700 491.711
0
250.000
500.000
750.000
1.000.000
1.250.000
1.500.000
1.750.000
2.000.000
1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2001 2002 2003 2004 2005
Involução da QUANTIDADE de ACIDENTES DO
TRABALHO no Brasil - 1970 a 2005.
Anos
FONTE: Revista Proteção
Aprovação das NR’s
8. - 8 -
Uanderson Rebula de Oliveira Estatística
No período de 1970 a 1976 a quantidade de acidentes foi alta, comparando‐se com a pequena
quantidade de trabalhadores no mesmo período. Somente a partir de 1978 os acidentes começaram a
reduzir, em razão da aprovação das Normas Regulamentadoras – NR’s (disponível no
www.mte.gov.br), tornando‐se de aplicação obrigatória em todo o País. Esta redução pode ser vista
como positiva, entretanto, não podemos comemorar esses números, pois a quantidade de acidentes
ainda é alarmante e está praticamente estagnada, desde 1994.
E as regiões? Como esses acidentes estão distribuídos nas regiões do país? Qual a pior região? Qual a melhor?
Vejamos abaixo em um Cartograma (mapa com dados), SOMENTE NO ANO DE 2005 (491.711 acidentes):
Observa‐se que a região em 1° lugar em número de acidentes é a Sudeste, em 2° está a região Sul, em 3° a região
Nordeste, em 4° a região Centro‐Oeste e por último a Norte. Ao analisarmos este gráfico podemos tomar diversas
conclusões, porém, tais conclusões somente são possíveis através de um estudo, o que demanda tempo. Todavia,
observa‐se que a quantidade de acidentes acompanha a porcentagem da participação do PIB da região. Esta
correlação pode ser resultado do reflexo da economia da região. Ora, a região Sudeste, por exemplo, corresponde a
56,5% do PIB do País. Logicamente esta região possui um maior número de empresas e, consequentemente, maior
número de mão‐de‐obra e atividades produtivas, fato que pode justificar a enorme quantidade de acidentes
comparada com as demais regiões. Esses dados também podem estar relacionados com as políticas dos estados e das
empresas, a atuação das fiscalizações do Ministério do Trabalho, as culturas das regiões, os investimentos
empresariais, a capacitação de mão de obra (treinamentos) entre outros fatores. Entende‐se por Produto Interno
Bruto (PIB) a soma, em valores monetários, de todos os bens e serviços finais produzidos em uma determinada região.
Mais dados vocês encontrarão na Apostila “Ergonomia, higiene e segurança do trabalho”, do profº Uanderson
Rebula, disponível no portal www.uandersonrebula.blogspot.com ou no “Anuário Estatístico de Acidentes do
Trabalho”, disponível no portal www.previdencia.gov.br, na seção “Estatística”.
Tradicionalmente, no Brasil, as políticas de desenvolvimento têm se restringido aos aspectos econômicos e vêm
sendo traçadas de maneira paralela ou pouco articuladas com as políticas sociais, cabendo a estas últimas arcarem
com os ônus dos possíveis danos gerados sobre a saúde da população, dos trabalhadores em particular e a
degradação ambiental. Para que o Estado cumpra seu papel para a garantia desses direitos, é mister a formulação
e implementação de políticas e ações de governo.
Distribuição da quantidade e porcentagem de acidentes de trabalho no Brasil por Regiões,
correlacionados com o Produto Interno Bruto ‐ PIB ‐ ano 2005.
FONTE: Adaptado da Revista Proteção e do IBGE (www.ibge.gov.br)
NORDESTE
• Acidentes: 49.010 (10% do total)
• PIB: 13,1% de participação
SUDESTE
• Acidentes: 279.689 (57% do total)
• PIB: 56,5% de participação
NORTE
• Acidentes: 19.117 (4% do total)
• PIB: 5% de participação
CENTRO‐OESTE
• Acidentes: 31.470 (6% do total)
• PIB: 8,9% de participação
SUL
• Acidentes: 112.425 (23% do total)
• PIB: 16,6% de participação
Espírito Santo ‐ 11.039 acidentes
Minas Gerais ‐ 52.335 acidentes
Rio de Janeiro ‐ 34.610 acidentes
São Paulo ‐ 181.705 acidentes
São campeões de acidentes no Brasil, participando com
181.705, o que corresponde a 37% do total; por conseguinte
o seu PIB também é o maior do País, com 33,9% de
participação.
9. - 9 -
Uanderson Rebula de Oliveira Estatística
POSSÍVEIS SOLUÇÕES PARA REDUZIR OS ACIDENTES
A partir da análise dos dados podemos concluir que a política de segurança do trabalho adotada no País está
estagnada. A simples aplicação da norma regulamentadora não está sendo suficiente para reduzir o índice de
acidentes. Os dados nos mostram que não haverá mudanças significativas se não forem feitas alterações nessa
política.
Para contornar a situação, os Ministérios do Trabalho, da Saúde e da Previdência Social publicaram, para
consulta pública, em 29.12.2004 a PNSST ‐ POLÍTICA NACIONAL DE SEGURANÇA E SAÚDE DO TRABALHADOR,
com a finalidade de promover a melhoria da qualidade de vida e da saúde do trabalhador. Esse plano está
disponível no portal www.mte.gov.br.
Os Ministérios reconheceram a deficiência da segurança do trabalho no país, carecendo de mecanismos que:
• Incentivem medidas de prevenção;
• Responsabilizem os empregadores;
• Propiciem o efetivo reconhecimento dos direitos do trabalhador;
• Diminuam a existência de conflitos institucionais;
• Tarifem de maneira mais adequada as empresas e possibilite um melhor gerenciamento dos fatores
de riscos ocupacionais.
Face ao exposto, a PNSST propõe, dentre outras, as seguintes ações a serem desenvolvidas de modo articulado e
cooperativo pelos três Ministérios:
Área Ações
Tributos1
,
financiamentos
e licitações.
Estabelecer política tributária que privilegie empresas com menores índices de acidentes e que
invistam na melhoria das condições de trabalho;
Criar linhas de financiamento para a melhoria das condições de trabalho, incluindo máquinas e
equipamentos, em especial para as pequenas e médias empresas;
Incluir requisitos de Segurança do Trabalho ‐ SST para concessão de financiamentos públicos e
privados;
Incluir requisitos de SST nos processos de licitação dos órgãos públicos;
Instituir a obrigatoriedade de publicação de balanço de SST para as empresas, a exemplo do que já
ocorre com os dados contábeis;
Educação e
pesquisa
Incluir conhecimentos básicos em SST no currículo do ensino fundamental e médio;
Incluir disciplinas em SST no currículo de ensino superior, em especial nas carreiras de profissionais
de saúde, engenharia e administração;
Estimular a produção de estudos e pesquisas na área de interesse desta Política;
Articular instituições de pesquisa e universidades para a execução de estudos e pesquisas em SST,
integrando uma rede de colaboradores para o desenvolvimento técnico ‐ cientifico na área;
Desenvolver um amplo programa de capacitação dos profissionais, para o desenvolvimento das
ações em segurança e saúde do trabalhador;
Ambientes
nocivos
Eliminar as políticas de monetarização dos riscos (adicionais de riscos).
Outras ações
Coleta de
dados
Compatibilizar os instrumentos de coleta de dados e fluxos de informações.
Incluir nos Sistemas e Bancos de Dados as informações contidas nos relatórios de intervenções e
análises dos ambientes de trabalho, elaborados pelos órgãos de governo envolvidos nesta Política.
A gestão do PNSST prevê o seu desenvolvimento pelo Grupo Executivo Interministerial de Segurança e Saúde do
Trabalhador – GEISAT, integrado por representantes do Ministério do Trabalho, da Saúde e da Previdência Social.
Ressalta‐se que no PNSST não está previsto o prazo para execução das ações propostas. Infelizmente este plano
permanece no papel até os dias de hoje e sem sinais de sua saída desta condição tão cedo.
_________________
1. Tributo: Impostos; taxas e contribuições de melhoria, devida ao poder público.
10. - 10 -
Uanderson Rebula de Oliveira Estatística
CONSIDERAÇÕES FINAIS SOBRE O ESTUDO DE ACIDENTES
O que acabamos de ver é um estudo estatístico.
Como vimos, os dados sobre acidentes do trabalho no Brasil são controladas pelo Ministério da Previdência Social,
junto ao INSS (Instituto Nacional de Seguridade Social). A comunicação de acidentes permite ao INSS estimar e
acompanhar o real impacto do trabalho sobre a saúde e a segurança da população brasileira. O INSS coleta,
organiza, apresenta e publica as estatísticas de acidentes do trabalho no Brasil.
Conforme observado, quando ocorre um acidente, a empresa, por força de lei, é obrigada a enviar a CAT ao INSS,
alimentando, assim, o seu grande banco de dados.
As estatísticas de acidentes no Brasil podem ser visualizadas no site da Previdência Social através
do endereço eletrônico www.previdencia.gov.br. O interessante neste site é a existência de um
documento, disponível para download, denominado “Anuário estatístico da previdência social”.
Nele estão contidos todos os dados estatísticos da Previdência Social, inclusive os dados
referentes a acidentes do trabalho, distribuídos por região, idade, tipos, parte do corpo mais atingida dentre
outros. É um importante documento para os estudiosos no assunto.
É importante ressaltar que os dados de acidentes de trabalho não se constituem, tão
somente, num importante registro histórico, mas sim numa ferramenta inestimável
para os profissionais que desempenham atividades nas áreas de saúde e segurança do
trabalhador, assim como pesquisadores e demais pessoas interessadas no tema. A
análise desses dados possibilita a construção de um diagnóstico mais preciso acerca da
epidemiologia dos acidentes, propiciando, assim, a elaboração de políticas mais eficazes
para as áreas relacionadas com o tema, como vimos no PNSST.
TÓPICO PARA REFLEXÃO
Acidente do
Trabalho: o
problema do
Brasil.
Os acidentes de trabalho afetam a produtividade econômica, são responsáveis por um impacto substancial
sobre o sistema de proteção social e influenciam o nível de satisfação do trabalhador e o bem estar geral da
população.
Estima‐se que a ausência de segurança nos ambientes de trabalho no Brasil tenha gerado, no ano de 2003, um
custo de cerca de R$32,8 bilhões para o país. Deste total, R$ 8,2 bilhões correspondem a gastos com
benefícios acidentários e aposentadorias especiais, equivalente a 30% da necessidade de financiamento do
Regime Geral de Previdência Social ‐ RGPS verificado em 2003, que foi de R$ 27 bilhões. O restante da despesa
corresponde à assistência à saúde do acidentado, indenizações, retreinamento, reinserção no mercado de
trabalho e horas de trabalho perdidas.
Isso sem levar em consideração o sub‐dimensionamento na apuração das contas da Previdência Social, que
desembolsa e contabiliza como despesas não acidentárias os benefícios por incapacidade, cujas CAT não
foram emitidas. Ou seja, sob a categoria do auxílio doença não ocupacional, encontra‐se encoberto um grande
contingente de acidentes que não compõem as contas acidentárias.
Parte deste “custo segurança no trabalho” afeta negativamente a competitividade das empresas, pois ele
aumenta o preço da mão‐de‐obra, o que se reflete no preço dos produtos. Por outro lado, o incremento das
despesas públicas com previdência, reabilitação profissional e saúde reduz a disponibilidade de recursos
orçamentários para outras áreas ou induz o aumento da carga tributária sobre a sociedade.
De outro lado, algumas empresas afastam trabalhadores, e muitas vezes os despedem logo após a concessão
do beneficio. Com isso, o trabalhador se afasta, já sendo portador de doença crônica contraída no labor, e o
desemprego poderá se prolongar na medida em que, para obter o novo emprego, será necessária a realização
do exame admissional, no qual serão eleitos apenas aqueles considerados como “aptos” e, portanto, não
portadores de enfermidades.
Fonte: RESOLUÇÃO CNPS Nº 1.269, DE 15 DE FEVEREIRO DE 2006
11. - 11 -
Uanderson Rebula de Oliveira Estatística
CONCEITO DE ESTATÍSTICA
É A CIÊNCIA QUE SE DEDICA EM COLETAR, ORGANIZAR, APRESENTAR, ANALISAR E INTERPRETAR
DADOS (INFORMAÇÕES) PARA TOMADA DE DECISÃO.
Estatística é a ciência dos dados. A Estatística lida com a coleta, o
processamento e disposição de dados (informações), atuando como
ferramenta fundamental nos processos de soluções de problemas. A
Estatística facilita o estabelecimento de conclusões confiáveis sobre
algum fenômeno que esteja sendo estudado (WERKEMA, 1995).
É por meio da análise e interpretação dos dados estatísticos que é
possível o conhecimento de uma realidade, de seus problemas, bem
como, a formulação de soluções apropriadas por meio de um
planejamento objetivo da ação, para além dos “achismos” e
“casuismos” comuns.
No uso diário o termo “estatística” refere‐se a fatos numéricos. Tenha em mente, entretanto, que estatística
é bem diferente de matemática. Estatística é, antes de qualquer coisa, um método científico que determina
questões de pesquisa; projeta estudos e experimentos; coleta, organiza, resume e analisa dados; interpreta
resultados e esboça conclusões. Ou seja, utiliza‐se dados como evidências para responder a interessantes
questões sobre o mundo. A matemática só é utilizada para calcular a estatística e realizar algumas das
análises, mais isso é apenas uma pequena parte do que realmente é a estatística. Portanto, a estatística
mantém com a matemática uma relação de dependência, solicitando‐lhe auxílio, sem o qual não poderia
desenvolver‐se.
A Estatística é uma ciência interdisciplinar, ou seja, é comum a duas ou mais disciplinas ou ramos de
conhecimento. Assim, a Estatística é aplicada na Medicina, Administração, Engenharias, Economia,
Contabilidade, Direito, Segurança do Trabalho, Qualidade, Marketing entre outras áreas. Veja abaixo.
Medicina. Estudos de epidemiologia,
inter‐relações dos determinantes da
freqüência e distribuição de doenças
populacionais
*Engenharia de Produção. Estudos de
um conjunto de dados de todas as
fases de um processo produtivo.
Segurança do Trabalho. Estudos de
acidentes e doenças, suas causas,
quantidade, parte atingida, setores, %
de afastamentos etc.
Contabilidade. Estudos das
informações financeiras das empresas
públicas e privadas.
Finanças. Estudos de uma série de
informações estatísticas para orientar
investimentos.
Economia. Estudos de taxas de
inflação, índice de preços, taxa de
desemprego, futuro da economia.
*Engenharia de Produção – A aplicação da Estatística na produção merece especial atenção. A atual ênfase na
qualidade torna o controle da qualidade uma importante aplicação da estatística na área da produção. Usa‐se
uma série de mapas estatísticos de controle de qualidade para monitorar o resultado (output) de um processo
de produção. Suponha, por exemplo, que uma máquina preencha recipientes com 2 litros de determinado
refrigerante. Periodicamente, um operador do setor de produção seleciona uma quantidade de recipientes e
verifica a exatidão, ou seja, se não há desvios. A Estatística também é usada na Engenharia de Produção para
Estratificação, que consiste no agrupamento da informação (dados) sob vários pontos de vista, de modo a
focalizar a ação, considerando os fatores equipamento, tempo entre outros. Exemplo:
Tipo de dano: Operador: Máquina de lavar: Roupas danificadas
em uma lavanderia Tipo de roupa: Marca do sabão: Máquina de secar:
12. - 12 -
Uanderson Rebula de Oliveira Estatística
UM POUCO DE HISTÓRIA E ATUALIDADE
O termo “Estatística” provém da palavra “Estado” e foi utilizado originalmente
para denominar levantamentos de dados (riquezas, impostos, nascimentos,
mortalidade, batizados, casamentos, habitantes etc.), cuja finalidade era
orientar o Estado em suas decisões.
Segundo Costa (2005, p. 5) em 1085, Guilherme “O Conquistador”,
ordenou que se fizesse um levantamento na Inglaterra, que deveria
incluir informações sobre terras, proprietários, uso da terra,
empregados, animais e serviria, também, de base para cálculo de
impostos. Tal levantamento originou um volume intitulado “domesday book”.
No século XVIII o estudo dos dados foi adquirindo, aos poucos, feição
verdadeiramente científica. A palavra Estatística apareceu pela primeira
vez no século XVIII e foi sugerida pelo alemão Godofredo Achenwall (1719‐
1772), onde determinou o seu objetivo e suas relações com as ciências.
Desde essa época, a Estatística deixou de ser a simples catalogação de dados numéricos coletivos e se
tornou o estudo de como chegar a conclusões sobre o todo, partindo da observação e análise de partes
desse todo. Essa é sua maior riqueza.
Atualmente a sociedade está completamente tomada pelos números. Eles
aparecem em todos os lugares para onde você olha, de outdoors mostrando as
últimas estatísticas sobre aborto, passando pelos programas de esporte que
discutem as chances de um time de futebol chegar à final do campeonato, até o
noticiário da noite, com reportagens focadas no índice de criminalidade, na
expectativa de vida de uma pessoa que não come alimentos saudáveis e no índice
de aprovação do presidente.
Em um dia comum, você pode se deparar com cinco, dez ou, até mesmo, vinte diferentes estatísticas (ou até
muito mais em um dia de eleição). Se você ler todo o jornal de domingo, irá se deparar com centenas de
estatísticas em reportagens, propagandas e artigos sobre todo tipo de assunto: desde sopa (quanto em média uma
pessoa consome por ano?) até castanhas (quantas castanhas você precisa comer para aumentar seu QI?).
Nas empresas a Estatística desempenha um papel cada vez mais importante para os Gerentes. Esses
responsáveis pela tomada de decisão utilizam a estatística para:
Apresentar e descrever apropriadamente dados e informações sobre
a empresa;
Tirar conclusões sobre grandes populações, utilizando informações
coletadas a partir de amostras;
Realizar suposições confiáveis sobre a atividade da empresa;
Melhorar os processos da empresa.
A estatística é um instrumento eficiente para a compreensão e interpretação da realidade e não
deve ser subestimada. Realmente existem pesquisas feitas de forma incorreta e que, por isso, não
são confiáveis. Mas, em geral, quando um estudo estatístico é feito com critério, seus resultados
permitem obter conclusões e prever tendências sobre fatos e fenômenos. Um estudo bem feito
não elimina o erro, mas limita‐o a uma margem, procurando torná‐la o menor possível.
13. - 13 -
Uanderson Rebula de Oliveira Estatística
1.2 FASES DO ESTUDO ESTATÍSTICO
Um estudo estatístico confiável depende do planejamento e da correta execução das seguintes etapas:
1. Definir o que será estudado e a natureza dos dados, como exemplo:
ESTUDO NATUREZA DOS DADOS
Acidentes do Trabalho
no Brasil
Quantidade e período
Por regiões, estados ou municípios
Por atividade econômica
Por idade dos acidentados
Por parte do corpo atingida
Por causas dos acidentes etc.
Peças danificadas
na linha A
Tipo de peça | Tipo de defeito
Quantidade
Período
Turnos
Máquinas
Operadores
Matéria prima etc.
É preciso definir com clareza os objetivos da pesquisa, ou seja, o que se pretende apurar, que tipo de
problema buscará detectar.
2. Coletar dados
Após a definição do que será estudado e o estabelecimento do planejamento do trabalho (forma de coleta dos
dados, cronograma das atividades, custos envolvidos, levantamento das informações disponíveis), o passo
seguinte é o da coleta de dados, que consiste na busca ou compilação dos dados, componentes do fenômeno a ser
estudado.
Nessa etapa recolhem‐se os dados tendo o cuidado de controlar a qualidade da informação. O sucesso de uma
pesquisa depende muito da qualidade dos dados recolhidos.
Podem ser por meio de:
• Criação de Softwares, a exemplo da CAT;
• Uso de Softwares da empresa;
• Dados históricos da empresa (físicos);
• Pesquisas com questionários etc.
3. Organizar e contar dados
À procura de falhas e imperfeições, os dados devem ser cuidadosamente
organizados e contados, a fim de não incorrermos em erros grosseiros que
possam influenciar nos resultados.
No exemplo da “Estatística na prática”, após a coleta da quantidade de acidentes por
meio da CAT, organiza‐os por período, regiões etc. Da mesma maneira, se você usa um
questionário para coletar dados na empresa, organiza‐os da forma necessária à pesquisa, além da
contagem a ser feita.
14. - 14 -
Uanderson Rebula de Oliveira Estatística
4. Apresentação de dados
Os dados devem ser apresentados sob a forma de tabelas ou gráficos, a fim de tornar mais fácil e rápido o exame
daquilo que está sendo estudado.
5. Análise dos dados e tomada de decisão
Chegamos à fase mais complexa do processo estatístico, que consiste na análise
dos dados. Por fim, a partir da análise realizada, poderemos chegar a uma
tomada de decisão.
Observe o estudo “Estatística na prática”. O que resultou a análise dos
acidentes no Brasil, no período de 1970 a 2005? Veja que os Ministérios do
Trabalho, Previdência Social e da Saúde se mobilizaram para resolverem essa
questão de saúde pública, com diversas ações a serem implementadas no país.
A partir dessa discussão, fica claro que um profissional com conhecimentos de Estatística terá maior facilidade em
identificar um problema em sua área de atuação, determinar os tipos de dados que irão contribuir para sua
análise, coletar esses dados e a seguir estabelecer conclusões e determinar um plano de ação para a solução do
problema detectado.
1.220.111
1.504.723
1.796.671
1.743.825
1.551.461
1.464.211
1.178.472
961.575
1.207.859
991.581
693.572
532.514
388.304 395.455
414.341
363.868
340.251
393.071 399.077
465.700 491.711
0
250.000
500.000
750.000
1.000.000
1.250.000
1.500.000
1.750.000
2.000.000
1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2001 2002 2003 2004 2005
Involução da QUANTIDADE de ACIDENTES DO
TRABALHO no Brasil - 1970 a 2005.
Anos
FONTE: Revista Proteção
Aprovação das NR’s
15. - 15 -
Uanderson Rebula de Oliveira Estatística
1.3 VOCABULÁRIO BÁSICO DE ESTATÍSTICA
O vocabulário utilizado em estudos estatísticos teve sua origem nos primeiros estudos feitos pela humanidade e
que eram relativos à demografia (estudo estatístico das populações). Por isso a Estatística emprega termos
próprios dessa área de conhecimento, mas com um sentido diferenciado. Assim, para dar prosseguimento, é de
extrema importância destacar alguns termos utilizados no jargão estatístico.
VARIÁVEL – É o termo usado para aquilo que você está pesquisando, estudando, analisando.
No estudo representado no gráfico abaixo a variável é o acidente do trabalho. Utilizada como um adjetivo do
vocabulário do dia‐a‐dia, variável sugere que alguma coisa se modifica ou varia.
São exemplos de Variáveis
Doenças, Sexo, Estaturas, Peso, Idade, Renda, Natalidade, Mortalidade, PIB, Inflação, Exportações brasileiras,
Produção de café, Alimentação, Peças produzidas por hora, Paradas de produção no mês, Rotatividade de
estoque por ano, Poluição, Clima na região sudeste, Consumo de energia no mês, Vendas mensais de uma
empresa, Produção diária de automóveis etc.
EXEMPLO DE APLICAÇÃO:
A associação dos moradores de um bairro queria traçar um perfil dos freqüentadores de um parque ali situado.
Uma equipe de pesquisa elaborou questões a fim de reunir as informações procuradas. Numa manhã de quarta‐
feira, 6 pessoas foram entrevistadas e cada uma respondeu a questões para identificar idade, número de vezes
que freqüenta o parque por semana, estado civil, meio de transporte utilizado para chegar ao parque, tempo de
permanência no parque e renda familiar mensal. Os resultados são mostrados na tabela a seguir:
Cada um dos aspectos investigados — os quais permitirão fazer a análise desejada — é denominado variável.
1.220.111
1.504.723
1.796.671
1.743.825
1.551.461
1.464.211
1.178.472
961.575
1.207.859
991.581
693.572
532.514
388.304 395.455
414.341
363.868
340.251
393.071 399.077
465.700 491.711
0
250.000
500.000
750.000
1.000.000
1.250.000
1.500.000
1.750.000
2.000.000
1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2001 2002 2003 2004 2005
Involução da QUANTIDADE de ACIDENTES
DO TRABALHO no Brasil - 1970 a 2005.
FONTE: Revista Proteção Anos
VARIÁVEL
Variáveis
16. - 16 -
Uanderson Rebula de Oliveira Estatística
TIPOS DE VARIÁVEIS
Há, pois, uma divisão principal para as variáveis estatísticas, que consiste em considerá‐las como Variáveis Quantitativas
(contínuas ou discretas) e Variáveis Qualitativas. Esta divisão é de facílima compreensão! Veja o esquema abaixo.
Esquema básico
Tipo de VARIÁVEL Resposta fornecida à pesquisa Exemplos
Quantitativa Em números
Discreta Inteiros 0,1, 2, 3,...,9 Gols de futebol, Idade (anos)
Contínua Não inteiros 0,12 1,64 Altura (cm), Peso (kg), Tempo
Qualitativa Em nomes, atributos Sexo, Cor, Nacionalidade, Raça
Tipos de Variáveis da pesquisa em um parque:
Se a dúvida persiste, no quadro abaixo você pode observar os esclarecimentos do Esquema básico.
Esclarecimentos do Esquema básico
Tipo de VARIÁVEL Resposta fornecida à pesquisa
Quantitativa
(Em números)
Será Quantitativa a variável para a qual se possa atribuir um valor numérico. Se a resposta
fornecida à pesquisa estiver expressa por um número, então a variável é quantitativa. Por
exemplo: quantos livros você lê por ano? A resposta é um número? Então, variável
quantitativa. Quantas pessoas moram em sua casa? A resposta é um número? Então,
novamente, variável quantitativa.
Exemplo. No caso do estudo “ACIDENTE DO TRABALHO”, é uma variável quantitativa, pois o
objeto do estudo foi a quantidade de acidentes no período de 1970 a 2005
Discreta
(números inteiros)
(contagem)
Variável Quantitativa Discreta é a variável quantitativa que assume somente números
inteiros. Resulta, geralmente, de contagem. Esta variável não pode assumir qualquer valor,
dentro de um intervalo de valores de resultados possíveis. Por exemplo, se eu pergunto
quantos irmãos você tem, a resposta jamais poderia ser “tenho 3,75 irmãos”, ou “tenho 4,8
irmãos”, ou seja, a resposta não poderia assumir todos os valores de um intervalo! Este acima
é o conceito formal de variável discreta! O conceito para memorizar é o seguinte: aquela
variável obtida por meio de uma contagem. Em outras palavras: a variável discreta você
conta!. Exemplos: quantas pessoas moram na sua casa? Quantos livros você tem? Quantos
carros você tem? Se, para responder à pergunta, você faz uma contagem, então está diante de
uma variável quantitativa discreta.
Contínua
(Números não inteiros)
(medição)
Variável Quantitativa Contínua é aquela que pode assumir qualquer valor dentro de um
intervalo de resultados possíveis. Se eu pergunto quantos quilos você pesa, a resposta pode ser
65,35kg. Se eu pergunto qual a temperatura na cidade hoje, a resposta pode ser 27,35°C. Para
facilitar a memorização, basta lembrar que a variável quantitativa contínua pode ser obtida
por uma medição, ou seja, a variável contínua você mede! Exemplos: peso, altura, duração de
tempo para resolução de uma prova, pressão, temperatura etc.
Qualitativa
(nomes, atributos)
Se a pergunta é “qual a sua cor preferida?”, logicamente a resposta não será um número, daí
estaremos tratando de uma variável qualitativa, ou seja, aquela para a qual não se atribui um
valor numérico. Exemplos: Sexo: masculino ou feminino
Qualitativa
Quantitativa
discreta
Quantitativa
contínua
17. - 17 -
Uanderson Rebula de Oliveira Estatística
1.4 POPULAÇÃO E AMOSTRA
Quando você quer saber se a sopa ficou boa, o que você faz? Mexe a panela, retira um pouco com
uma colher e prova. Depois tira uma conclusão sobre todo o conteúdo da panela sem, na verdade,
ter provado tudo. Portanto, é possível ter uma idéia de como a sopa está sem ter que comer tudo.
Isso é o que se faz em estatística.
A estatística deixou de ser a simples catalogação de dados numéricos e se tornou o estudo de como
chegar a conclusões sobre o todo (população), partindo da observação e análise de partes desse
todo (amostra). Essa é sua maior riqueza. Assim, podemos conceituar população e amostra como:
POPULAÇÃO É UM CONJUNTO DE TODOS OS ELEMENTOS EM ESTUDO.
AMOSTRA É UMA PARTE DA POPULAÇÃO.
Muitas vezes quando queremos fazer um estudo estatístico, não é possível analisar toda a população
envolvida com o fato que pretendemos investigar, como exemplo o sangue de uma pessoa ou a poluição
de um rio. É impossível o teste do todo. Há situações também em que é inviável o estudo da população,
por exemplo, a pesquisa com todos os torcedores em um estádio de futebol durante uma partida.
Nesses casos, o estatístico recorre a uma amostra que, basicamente, constitui uma redução da
população a dimensões menores, sem perda das características essenciais.
Os resultados fundamentados em uma amostra não serão exatamente os mesmos que você encontraria
se estudasse toda a população, pois, quando você retira uma amostra, você não obtém informações a
respeito de todos em uma dada população. Portanto, é importante entender que os resultados da
amostra fornecem somente estimativas dos valores das características populacionais. Com métodos de
amostragens apropriados, os resultados da amostra produzirão “boas” estimativas da população, ou
seja, um estudo bem feito não elimina o erro, mas limita‐o a uma margem, procurando torná‐la o menor
possível. Quando aprendemos estatística inferencial, também aprendemos técnicas para controlar esses
erros de amostragem.
4 razões para selecionar uma amostra
O número de elementos em uma população é muito grande;
Demanda menos tempo do que selecionar todos os itens de uma população;
É menos dispendioso (caro) do que selecionar todos os itens de uma população;
Uma análise amostral é menos cansativa e mais prática do que uma análise da população inteira.
Podemos visualizar o conceito
de população e amostra na
figura ao lado.
Quando pesquisamos toda a
população, damos o nome de
censo.
A precisão depende do
tamanho da amostra, e
quanto maior é o tamanho
amostral, maior será a
precisão das informações.
AMOSTRA
(uma parte da população)
POPULAÇÃO(todos os elementos em estudo)
AMOSTRA
(uma parte da população)
POPULAÇÃO(todos os elementos em estudo)
N é designado para População
n é designado para Amostra
“N”
“n”
18. - 18 -
Uanderson Rebula de Oliveira Estatística
São exemplos de População e Amostra:
MEDICINA. Pretende‐se estudar o efeito de um novo medicamento para curar determinada doença. É
selecionado um grupo de 50 doentes, administrando‐se o novo medicamento a 10 desses doentes escolhidos ao
acaso e o medicamento habitual aos restantes.
População: Todos os 50 doentes com a doença que o medicamento a estudar pretende tratar.
Amostra: Os 10 doentes selecionados.
CONTROLE DE QUALIDADE. O Gerente de Produção de uma fábrica de parafusos pretende assegurar‐se de que
a porcentagem de peças defeituosas não excede um determinado valor, a partir do qual determinada
encomenda poderia ser rejeitada.
População: Todos os parafusos fabricados ou a fabricar, utilizando o mesmo processo.
Amostra: Parafusos escolhidos ao acaso entre os lotes produzidos.
ESTUDOS DE MERCADO. O gerente de uma fábrica de produtos desportivos pretende lançar uma nova linha de
esquis, pelo que encarrega uma empresa especialista em estudos de mercado de “estimar“ a porcentagem de
potenciais compradores desse produto.
População: conjunto de todos os praticantes de desportos de neve.
Amostra: conjunto de alguns praticantes inquiridos pela empresa.
SISTEMAS DE PRODUÇÃO. Um fabricante de pneus desenvolveu um novo tipo de pneu e quer saber o aumento
da durabilidade em termos de kilometragem em relação à atual linha da empresa. Produz diariamente 1000
pneus e selecionou 120 para testes.
População: 1000 pneus.
Amostra: 120 pneus.
A amostra na prática - Oxford Cereais (Levine et al, 2008, p.218)
A Oxford Cereais abastece milhares de caixas de cereais durante um turno de oito horas. Como
gerente de operações da unidade de produção, você é responsável por monitorar a quantidade de
cereal colocada em cada caixa. Para ser coerente com o conteúdo especificado na embalagem, as
caixas devem conter 368 gramas de cereal. Em razão da velocidade do processo, o peso do cereal
varia de caixa para caixa, fazendo com que algumas caixas fiquem mal abastecidas enquanto
outras ficam hiperabastecidas. Se o processo não estiver funcionando de maneira apropriada, o
peso das caixas pode se desviar demasiadamente do peso especificado no rótulo, 368 gramas, e
se tornar inaceitável. Uma vez que a pesagem de cada caixa individual consome uma quantidade
demasiadamente grande de tempo, é dispendiosa e ineficiente, você deve extrair uma amostra de caixas. Para cada amostra
selecionada, você planeja pesar caixas individuais. Com base em sua análise, você terá que decidir entre manter, alterar ou
interromper o processo.
MÉTODOS DE AMOSTRAGEM PROBABILÍSTICOS
Amostragem Aleatória Simples – É a técnica de amostragem em que cada um dos
elementos da população tem a mesma chance de ser selecionado.
Uma característica importante de uma boa pesquisa é que a amostra da população alvo seja selecionada
aleatoriamente. Aleatoriamente significa que todos os membros da população alvo devem ter as
mesmas chances de serem incluídos na amostra. Ou seja, o processo usado para a seleção de sua
amostra não pode ser parcial. “Aleatório” = Dependente de fatores incertos.
Suponha que você tenha um rebanho com 500 novilhos e precisa retirar
uma amostra aleatória de 50 deles para fazer um exame para uma doença.
Retirar os 50 primeiros novilhos que vierem em sua direção não se encaixaria
na definição de amostra aleatória. Os primeiros novilhos que forem capazes
de vir em sua direção, provavelmente são os que têm menos chances de
apresentarem qualquer tipo de doença ou, talvez, sejam os mais velhos e mais amigáveis, que realmente
são os mais suscetíveis a doenças. De qualquer forma, a pesquisa foi tendenciosa. Como coletar uma
amostra aleatória dos novilhos? Os animais provavelmente possuem etiquetas com um número de
identificação, assim você deve conseguir uma lista com todos os números de identificação, selecione uma
amostra aleatória desses números e localize os animais.
20. - 20 -
Uanderson Rebula de Oliveira Estatística
Como usar a tabela de números aleatórios
1º Numerar todos os elementos da população N;
2º Determinar as combinações dos algarismos para assegurar correspondência entre os dígitos aleatórios
e os elementos da população (ex.: se o último número da população for 80, por exemplo, devem ser lidos
números de dois algarismos; caso o último número seja 456, devem ser lidos números de três algarismos,
e assim por diante;
3º Escolher um ponto de partida arbitrário da tabela. A leitura pode ser feita horizontalmente →← (da
direita para a esquerda ou vice‐versa), verticalmente ↓↑ (de cima para baixo ou vice‐versa),
diagonalmente ↗↙↖↘ (no sentido ascendente ou descendente) ou formando o desenho de uma letra
qualquer. A opção, porém, deve ser feita antes de iniciado o processo;
4º Descartar os números maiores que o tamanho da população e/ou numeral repetido;
5º Usar os números escolhidos para identificar os elementos da população.
EXEMPLO. Uma empresa pecuária possui uma população de novilhos de tamanho N = 80 e precisa retirar amostras
de tamanho n = 12 (15% da população) para fazer exame de uma determinada doença. Utilize o método de
amostragem aleatória simples, considerando a tabela, a partir da 4ª linha, coluna D, sentido horizontal, da
esquerda para direita (→). Informar, também, os números descartados.
SOLUÇÃO. Como a população N=80 teve dois algarismos, então combinamos dois algarismos na tabela (00),
descartando os números repetidos e/ou maiores que o tamanho da população (Ex.: 81, 82, 83...) e escolhendo outra
combinação de algarismos. Este procedimento é repetido até a amostra de tamanho n=12 ser escolhida. Então:
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c d e f g h i j k l
1 9 3 3 1 2 1 6 6 3 3 9 0 7 0 4 0 4 4 1 3 8 1 6 5 8 8 9 8 6 5 0 6 3 3 1 2 4 8
2 0 7 6 8 1 4 5 0 5 8 6 6 1 4 2 6 7 5 6 0 5 7 7 9 6 3 2 6 3 4 5 9 8 6 5 2 1 1
3 6 5 1 5 3 4 4 2 3 7 9 1 4 8 5 8 7 2 4 7 3 7 0 6 2 2 1 3 5 0 8 9 4 7 1 6 4 4
4 9 7 0 2 6 7 3 2 6 7 4 9 1 6 2 7 7 8 6 8 4 7 8 1 5 7 1 2 6 6 6 3 5 6 0 8 2 1
5 5 5 6 5 1 6 4 8 3 3 1 5 3 8 8 2 3 8 8 7 7 4 5 0 4 5 1 8 7 2 3 2 9 6 4 7 7 9
6 8 3 4 8 8 3 8 0 6 4 8 2 3 5 2 5 3 7 1 7 6 8 2 9 5 3 4 3 7 0 3 9 7 0 1 5 7 2
n = 26 73 74 62 77 78 15 71 66 35 60 56
Descartados por repetição:
26 26 15
Descartados por serem maiores que a população:
91 86 84 82
Amostragem Aleatória Estratificada – É a técnica de amostragem em que dividimos todos os
elementos da população em grupos (estratos) de idênticas características.
Às vezes, a população é heterogênea (ex.: sexo masculino e feminino; peça A, B e C) e a amostra aleatória
simples não apresentaria esta heterogeneidade. Seria, então, necessário homogeneizar as amostras em grupos,
estratos. Neste caso recorremos à amostragem aleatória estratificada. “Estratificar” sugere “formar‐se em
camadas”.
A estratificação mais simples que encontramos na população do rebanho de tamanho N=80 é a divisão entre
novilhos e novilhas. Supondo que haja 35 novilhos e 45 novilhas, teremos a seguinte formação dos estratos:
População (80)
Novilhos (35) Novilhas (45)
Estrato 1 Estrato 2
21. - 21 -
Uanderson Rebula de Oliveira Estatística
São, portanto, dois estratos (novilhos e novilhas). Como queremos uma amostra de tamanho n=12 (15% da
população), por estrato, temos:
Rebanho População 15% Amostra
Novilho (estrato 1)
35 35*15% = 5,25 5
Novilha (estrato 2)
45 45*15%= 6,75 7
TOTAL 80 80*15% = 12 12
O próximo passo é extrair as amostras dentro de cada estrato. Então, numeramos o rebanho de 01 a 80, sendo que
de 01 a 35 correspondem novilhos e de 36 a 80, as novilhas. Tomando na tabela de números aleatórios, a partir
da 4ª linha, coluna D, sentido horizontal, da esquerda para direita (→), obtemos os seguintes números:
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c d e f g h i j k l
1 9 3 3 1 2 1 6 6 3 3 9 0 7 0 4 0 4 4 1 3 8 1 6 5 8 8 9 8 6 5 0 6 3 3 1 2 4 8
2 0 7 6 8 1 4 5 0 5 8 6 6 1 4 2 6 7 5 6 0 5 7 7 9 6 3 2 6 3 4 5 9 8 6 5 2 1 1
3 6 5 1 5 3 4 4 2 3 7 9 1 4 8 5 8 7 2 4 7 3 7 0 6 2 2 1 3 5 0 8 9 4 7 1 6 4 4
4 9 7 0 2 6 7 3 2 6 7 4 9 1 6 2 7 7 8 6 8 4 7 8 1 5 7 1 2 6 6 6 3 5 6 0 8 2 1
5 5 5 6 5 1 6 4 8 3 3 1 5 3 8 8 2 3 8 8 7 7 4 5 0 4 5 1 8 7 2 3 2 9 6 4 7 7 9
6 8 3 4 8 8 3 8 0 6 4 8 2 3 5 2 5 3 7 1 7 6 8 2 9 5 3 4 3 7 0 3 9 7 0 1 5 7 2
Temos, então:
1 a 35 → Novilhos n = 26 15 35 31 23
36 a 80 → Novilhas n = 73 74 62 77 78 71 66
Descartados
Notas importantes
sobre este tipo de
amostragem
Como é provável que a variável em estudo apresente, de estrato para estrato, um
comportamento heterogêneo e, dentro de cada estrato, um comportamento
homogêneo, convém que a amostragem seja feita por estratos. Portanto, a
amostragem estratificada é, em geral, usada para reduzir a variação nos resultados.
A amostragem estratificada é mais eficiente do que a amostragem aleatória simples,
uma vez que fica assegurada a representatividade de elementos ao longo de toda a
extensão da população. A homogeneidade de itens dentro de cada estrato
proporciona maior precisão. Da mesma maneira, em um sistema produtivo, podemos
estratificar as amostras em, por exemplo, peça A, peça B, peça C e assim por diante.
Amostragem Aleatória por Conglomerado- É a técnica de amostragem em que dividimos
todos os elementos da população em diversos grupos (conglomerados).
A conglomeração mais simples que encontramos na população do rebanho de novilhos de tamanho N=80 é a sua
divisão, por exemplo, em 10 grupos (conglomerados), cada um com 8 elementos da população. Depois
numeramos cada conglomerado, como mostrado na figura abaixo:
O próximo passo é extrair uma amostra aleatória simples dos conglomerados. Supondo o tamanho amostral
n=24, teremos, portanto, 3 conglomerados a considerar. Partindo da 1ª linha, coluna A, sentido horizontal e da
esquerda para direita (→) da tabela aleatória, temos, então:
Conglomerados selecionados: 06 07 02
Agora, é só coletar todos os elementos desses
conglomerados selecionados e estudar todos os itens.
População (80)
Conglomerado 1 Conglomerado 2 Conglomerado 3 Conglomerado 5Conglomerado 4
Conglomerado 6 Conglomerado 7 Conglomerado 8 Conglomerado 10Conglomerado 9
8 novilhos (as) para cada conglomerado
Número de
amostras
estratificadas
22. - 22 -
Uanderson Rebula de Oliveira Estatística
Uma amostra por conglomerado é uma amostra aleatória simples na qual cada unidade de amostragem é
um grupo de elementos. Uma das principais aplicações da amostragem por conglomerados é a amostragem
por áreas geográficas, como cidades, municípios, setores de uma empresa, quarteirões de cidades, domicílios,
território de vendas etc. Segundo Levine et al (2008, p. 222) e Anderson et al (2009, p.263) a amostragem por
conglomerados têm as seguintes características:
Todos os elementos contidos em cada conglomerado amostrado formam a amostra;
Cada conglomerado é uma versão representativa em pequena escala da população inteira;
Tende a produzir melhores resultados quando os elementos neles contidos não são similares;
De um modo geral, é mais eficaz em termos de custo do que a amostragem aleatória simples,
particularmente se a população estiver dispersa ao longo de uma extensa área geográfica. Entretanto, a
amostragem por conglomerado geralmente demanda um maior tamanho de amostra para que sejam
produzidos resultados tão precisos quanto aqueles que seriam obtidos da amostragem aleatória simples
ou estratificada.
Segundo Triola (2008, p. 23) outro exemplo de amostra por conglomerado pode ser encontrado nas pesquisas
eleitorais, onde selecionamos aleatoriamente 30 zonas eleitorais dentre um grande número de zonas e, em
seguida, entrevistamos todos os eleitores daquelas seções (zonas selecionadas). Isso é muito mais rápido e
muito menos dispendioso do que selecionar uma pessoa de cada uma das zonas na área populacional.
ATENÇÃO!
É fácil confundir amostragem estratificada com a amostragem por conglomerado, porque ambas
envolvem a formação de grupos. Porém, a amostragem por conglomerado usa todos os
elementos de um grupo selecionado, enquanto a amostragem estratificada usa amostras de
elementos de todos os estratos.
Figura. Amostragem
por Conglomerados
em quarteirões de um
bairro.
23. - 23 -
Uanderson Rebula de Oliveira Estatística
Amostragem Sistemática - É a técnica de amostragem em que retiramos os elementos da
população periodicamente, definida pelo pesquisador.
Utilizamos este tipo de amostragem quando os elementos de uma população se encontram ordenados, por
exemplo, a coleta de amostras de um determinado produto em uma linha de produção.
Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo
pesquisador. Assim, no caso de uma linha de produção, podemos, a cada dez itens produzidos, retirar um para
pertencer a uma amostra da produção diária. Neste caso, estaríamos fixando o tamanho amostral de 10% da
população.
Uma amostragem é sistemática quando a retirada dos elementos da população é feita periodicamente, sendo o
intervalo de seleção calculado, por meio da divisão do tamanho da população pelo tamanho da amostra a ser
selecionada.
EXEMPLO. Deseja‐se retirar uma amostra de n = 10 unidades de peças de uma população de tamanho N = 800. O
intervalo de seleção é, então, 800/10 = 80. Desse modo, 80 seria o primeiro elemento a ser considerado para a
amostra; os demais elementos seriam periodicamente considerados de 80 em 80. Nesse caso escolhem‐se
aquelas que estiverem nas seguintes posições: 80, 160, 240, 320, 400, 480, 560, 640, 720, 800.
Outras amostragens (não probabilísticas)
Amostragem por julgamento – A pessoa que conhece mais profundamente o tema do estudo escolhe os
elementos que julga serem mais representativos da população. Por exemplo, um repórter pode tomar como
amostra dois ou três senadores, julgando que eles refletem a opinião geral de todos os senadores. A qualidade dos
resultados depende do julgamento da pessoa que a seleciona.
Amostragem por conveniência – a amostra é identificada primeiramente por conveniência (cômodo, útil,
favorável). Como exemplo estudantes de uma universidade voluntários para compor uma amostra de uma
determinada pesquisa escolar.
AmostrasColeta de Amostras
0 80 160 240 320 400 480 560 640 720 800
1 2 3 4 5 6 7 8 9 10Amostra
Nº da peça
População = 800
Amostra = 10
800/10 = 80
80 80 80 80 80 80 80 80 80
0 80 160 240 320 400 480 560 640 720 800
1 2 3 4 5 6 7 8 9 10Amostra
Nº da peça
População = 800
Amostra = 10
800/10 = 80
80 80 80 80 80 80 80 80 80
24. - 24 -
Uanderson Rebula de Oliveira Estatística
AMOSTRA
(uma parte da população)
POPULAÇÃO(todos os elementos em estudo)
AMOSTRA
(uma parte da população)
POPULAÇÃO(todos os elementos em estudo)
1.5 ESTATÍSTICA DESCRITIVA E ESTATÍSTICA INFERENCIAL
Estatística descritiva – É o ramo da estatística
que envolve a organização, o resumo e a
representação dos dados para tomada de
decisão.
Estatística inferencial – É o ramo da estatística
que envolve o uso da amostra para chegar a
grandes conclusões sobre a população. Uma
ferramenta básica no estudo da estatística
inferencial é a probabilidade.
Algumas ferramentas aplicadas à
Estatística Inferencial:
Probabilidades
Uma Probabilidade é uma medida numérica que representa a chance de um evento ocorrer. Ex.:
Ao lançar um dado, qual a probabilidade de obter o valor 4? R = 1
/6 = 16%
Estimação, margem de erro e intervalo de confiança
Suponha que o tempo médio que você leva para chegar ao trabalho de carro é de 35’, com uma margem de erro
de 5’ para mais ou para menos. A estimativa é de que o tempo médio gasto até
chegar ao trabalho fica em algum ponto entre 30’ e 40’. Esta estimativa é um
intervalo de confiança, pois leva em consideração o fato de que os resultados da
amostra irão variar e dá uma indicação de uma variação esperada.
A margem de erro é uma medida
de quão próximo você espera que
seus resultados representem toda a
população que está sendo
estudada. Vários fatores
influenciam a amplitude de um
intervalo de confiança, tais como o
tamanho amostral, a variabilidade da população e o quanto você espera obter de precisão. A maioria dos pesquisadores contenta‐se com 95%
de confiança em seus resultados. Estar 95% confiante indica que se você coletar muitas, mas muitas amostras e calcular o intervalo de
confiança para todas, 95% dessas amostras terão intervalos de confiança que abrangerão o alvo.
Teste de hipótese
Teste de hipótese é um procedimento estatístico em que os dados são coletados e medidos para comprovar uma
alegação feita sobre uma população. Por exemplo, se uma pizzaria alega entregar as pizzas dentro de 30’ a partir
do pedido, você pode testar se essa alegação é verdadeira, coletando uma amostra aleatória do tempo de
entrega durante um determinado período de tempo e observar o tempo médio de entrega para essa amostra.
26. - 26 -
Uanderson Rebula de Oliveira Estatística
2.1 CONCEITOS E TIPOS DE SÉRIES
As tabelas e gráficos constituem um importante instrumento de análise e interpretação de um conjunto de dados.
Diariamente é possível encontrar tabelas e gráficos nos mais variados veículos de comunicação (jornais, revistas, televisão,
Internet), associadas a assuntos diversos do nosso dia‐a‐dia, como resultados de pesquisas de opinião, saúde e
desenvolvimento humano, economia, esportes, cidadania, etc. A importância das tabelas e dos gráficos está ligada sobretudo à
facilidade e rapidez na absorção e interpretação das informações por parte do leitor e também às inúmeras possibilidades de
ilustração e resumo dos dados apresentados.
TABELAS
São quadros que resumem um conjunto de dados.
Tipos de Tabelas
SÉRIE HISTÓRICA
Descreve os valores da variável,
discriminados por TEMPO (anos,
meses, dias, horas, etc.
SÉRIE GEOGRÁFICA
Descreve os valores da variável,
discriminados por REGIÕES (países,
cidades, bairros, ruas, layout, etc)
SÉRIE ESPECÍFICA
Descreve os valores da variável,
discriminados por temas
ESPECIFICOS.
SÉRIE CONJUGADA
É utilizado quando temos a necessidade de apresentar em uma única
tabela a variação de valores DE MAIS DE UMA VARIÁVEL, isto é,
fazer de forma conjugada de duas ou mais séries.
Esta série, por exemplo, é GEOGRÁFICA – HISTÓRICA
Título – conjunto de informações sobre o estudo.
Cabeçalho –especifica o conteúdo das colunas
Coluna indicadora –especifica o conteúdo das linhas
Coluna numérica ‐–especifica a quantidade das linhas
Linhas – retas imaginárias de dados
Célula – espaço destinado a um só número
Rodapé – simplesmente a fonte dos dados
27. - 27 -
Uanderson Rebula de Oliveira Estatística
GRÁFICOS
A importância dos gráficos está ligada à facilidade e rapidez na absorção e interpretação das informações e
também às inúmeras possibilidades de ilustração e resumo dos dados apresentados. Eis os mais usados:
Gráfico em Linha (para séries históricas)
É a representação dos valores por meio de linhas. Usamos quando precisamos de uma informação rápida de um
valor ao longo do tempo.
Gráfico em Colunas
É a representação dos valores por meio de retângulos, dispostos verticalmente. Utiliza‐se muito quando
necessitamos saber a quantidade de valor.
ACIDENTES DO TRABALHO EM
SÃO PAULO: 1989 ‐ 1991
0
500
1000
1500
2000
2500
1989 1990 1991
anos
Quantidade
São Paulo
Guarulhos
Campinas
Osasco
Santos
FONTE: Dados fictícios
QUANTIDADE DE ACIDENTES DO TRABALHO
SÃO PAULO: 1989 ‐ 1994
6254
7265
6325
5458
8658
9578
0
2000
4000
6000
8000
10000
12000
1989 1990 1991 1992 1993 1994
Anos
Quantidade
FONTE: Dados fictícios
ACIDENTES DO TRABALHO
SÃO PAULO: 1989 ‐ 1994
6254
7265
6325
5458
8658 9578
0
2000
4000
6000
8000
10000
1989 1990 1991 1992 1993 1994
Anos
Quantidade
FONTE: Dados fictícios
28. - 28 -
Uanderson Rebula de Oliveira Estatística
Gráfico em Barras
É o mesmo conceito que o de Colunas, porém utiliza‐se sempre que os dizeres a serem inscritos são extensos.
Gráfico em Setores
Este gráfico é construído com base em um círculo, e é empregado sempre que desejamos ressaltar a participação
de um dado no total, geralmente na forma de porcentagem.
Gráfico Polar
É o gráfico ideal para representar séries temporais cíclicas, isto é, séries temporais que apresentam em seu
desenvolvimento determinada periodicidade, por exemplo, o mês de janeiro a dezembro.
QUANTIDADE DE ACIDENTES DO TRABALHO
EM SÃO PAULO ‐ POR TIPO ‐ 1989
55
1396
698
3578
598
0 1000 2000 3000 4000
Impacto
Perfuração
Atrito
Queda
Corte
Tipo
Quantidade
FONTE: Dados fictícios
ACIDENTES DO TRABALHO
SÃO PAULO ‐ 1989
FONTE: Dados fictícios
ACIDENTES DO TRABALHO
SÃO PAULO ‐ 1989
FONTE: Dados fictícios
29. - 29 -
Uanderson Rebula de Oliveira Estatística
Número de cada
Delegacia
Gráfico de Pareto
É um gráfico de colunas na qual a altura de cada barra representa os dados, porém na ordem de altura
decrescente, com a coluna mais alta posicionada à esquerda. Tal posicionamento ajuda a enfatizar dados
importantes e é frequentemente usado nos negócios.
Os cinco veículos mais vendidos
no Brasil em janeiro de 1995
Veículo
Quantidade
(milhões)
Ômega 34
Monza 30
Gol 25
Corsa 22
Fusca 15
FONTE: dados fictícios
Gráfico de Dispersão
É usado para representar a relação entre duas variáveis quantitativas, por meio de pontos e linhas.
Investimentos versus vendas
no setor da empresa X
Anos Investimentos Vendas
1999 500 3000
2000 3000 2000
2001 1300 4000
2002 2000 2500
FONTE: dados fictícios
Gráfico Cartograma
Este gráfico é empregado quando o objetivo é o de figurar os dados estatísticos diretamente relacionados com
áreas geográficas ou políticas (mapas), corpo humano entre outras figuras
Os cinco veículos mais vendidos
no Brasil em janeiro de 1995
15
2225
30
34
0
10
20
30
40
Ômega Monza Gol Corsa Fusca
Veículos
Quantidade (milhões)
FONTE: Dados fictícios
FONTE: SSP/SP
30. - 30 -
Uanderson Rebula de Oliveira Estatística
2.2 DISTRIBUIÇÃO DE FREQUÊNCIA
FREQUÊNCIA ABSOLUTA E HISTOGRAMA
Ao se trabalhar com grandes conjuntos de dados, em geral é útil organizá-los e resumi-los
em uma tabela, chamada Distribuição de frequência.
Na distribuição de frequência listamos todos os valores coletados, um em cada linha, marcam‐se as vezes em que eles
aparecem, incluindo as repetições, e conta‐se a quantidade de ocorrências de cada valor. Por este motivo, tabelas
que apresentam valores e suas ocorrências denominam‐se distribuição de freqüências.
O termo “freqüência” indica o número de vezes que um dado aparece numa observação estatística.
EXEMPLO 1
Um professor organizou os resultados obtidos em uma prova com 25 alunos da seguinte forma:
Notas dos 25 alunos Comentário
4,0 5,0 7,0 9,0 9,0
4,0 5,0 7,0 9,0 9,0
4,0 5,0 7,0 9,0 9,0
4,0 6,0 8,0 9,0 9,0
4,0 6,0 8,0 9,0 9,0
Agora ele pode fazer uma representação gráfica para analisar o
desempenho da turma. Em primeiro lugar, o professor pode fazer uma
tabulação dos dados, ou seja, organizá‐los de modo que a consulta a eles
seja simplificada. Então, faremos a distribuição de freqüência destas
notas, por meio da contagem de dados.
Distribuição de freqüência Comentário
Nota
Freqüência absoluta, f
(nº de alunos)
4,0 5
5,0 3
6,0 2
7,0 3
8,0 2
9,0 10
∑f=25
Esta forma de organizar dados é conhecida como distribuição de
frequência, e o número de vezes que um dado aparece é chamado de
frequência absoluta, representado por f. Exemplos:
A frequência absoluta da nota 4,0 é 5.
A freqüência absoluta da nota 9,0 é 10.
O símbolo grego ∑ “sigma” significa “somatório”, muito usado em
Estatística. Portanto, ∑f=25 significa a soma de 5+3+2+3+2+10.
Representamos a freqüência por um gráfico, chamado Histograma.
HISTOGRAMA Comentário
ESTA FREQUÊNCIA QUE ACABAMOS DE ESTUDAR É DENOMINADA FREQUENCIA
ABSOLUTA (f), QUE É SIMPLESMENTE A CONTAGEM DOS DADOS.
Em Estatística não trabalhamos somente com frequência absoluta (f), mas também com outros tipos de freqüências,
que são: freqüência relativa (fr), frequência absoluta acumulada (Fa) e frequência relativa acumulada (FRa).
Estudaremos agora cada uma delas.
Quando os dados numéricos são organizados, eles geralmente são
ordenados do menor para o maior, divididos em grupos de tamanho
razoável e, depois, são colocados em gráficos para que se examine sua
forma, ou distribuição (no exemplo: 4,0 – 5,0 – 6,0 – 7,0 – 8,0 – 9,0). Este
gráfico é chamado de Histograma.
Um histograma é um gráfico de colunas juntas. Em um histograma não
existem espaços entre as colunas adjacentes, como ocorre em um gráfico
de colunas. No exemplo, a escala horizontal (→) representa as notas e a
escala vertical (↑) as freqüências.
O histograma ao lado indica que cinco alunos tiraram a nota 4,0; três alunos tiraram
a nota 5,0; dois alunos tiraram a nota 6,0; três alunos tiraram a nota 7,0; dois alunos
tiraram 8,0 e dez alunos tiraram 9,0.
5
3
2
3
2
10
0
2
4
6
8
10
12
Número de alunos
4,0 5,0 6,0 7,0 8,0 9,0
Nota
Desempenho dos alunos na prova
31. - 31 -
Uanderson Rebula de Oliveira Estatística
FREQUENCIA RELATIVA (fr) %
Conceito. Representado por fr, significa a relação existente entre a frequência absoluta (f) e a soma das
freqüências (∑f). É a porcentagem (%) do número de vezes que cada dado aparece em relação ao total.
EXEMPLO 1a
f/∑f*100→5/25*100= 20%
freqüência relativa (fr)% Comentários aos cálculos
Nota f fr(%)
4,0 5 20%
5,0 3 12%
6,0 2 8%
7,0 3 12%
8,0 2 8%
9,0 10 40%
∑f=25 100
A frequência relativa (fr) é obtida por f/∑f *100, conforme abaixo:
A fr(%) da nota 4,0 é fr = 5/25 = 0,2 = 20%.
A fr(%) da nota 5,0 é fr = 3/25 = 0,12 = 12%
A fr(%) da nota 6,0 é fr = 2/25 = 0,08 = 8%
A fr(%) da nota 7,0 é fr = 3/25 = 0,12 =12%
A fr(%) da nota 8,0 é fr = 2/25 = 0,08 = 8%
A fr(%) da nota 9,0 é fr = 9/25 = 0,4 = 40%.
FREQUENCIA ABSOLUTA ACUMULADA (Fa)
Conceito. Representado por Fa, significa a soma das freqüências absolutas até o elemento analisado.
EXEMPLO 1b
Fa2=5+3 = 8
frequência absoluta acumulada (Fa) Comentários aos cálculos
Nota f fr(%) Fa
4,0 5 20% 5
5,0 3 12% 8
6,0 2 8% 10
7,0 3 12% 13
8,0 2 8% 15
9,0 10 40% 25
∑f=25 100 ‐
A frequência absoluta acumulada (Fa) é obtida conforme abaixo:
A “Fa” da nota 4,0 é 5 (sempre repete a primeira).
A “Fa” das notas 4,0 e 5,0 é 5+3=8.
A “Fa” das notas 4,0, 5,0 e 6,0 é 5+3+2=10.
A “Fa” das notas 4,0, 5,0, 6,0 e 7,0 é 5+3+2+3=13.
A “Fa” das notas 4,0, 5,0, 6,0, 7,0 e 8,0 é 5+3+2+3+2=15.
A “Fa” das notas 4,0, 5,0, 6,0, 7,0, 8,0 e 9,0 é 5+3+2+3+2+10=25
FREQUENCIA RELATIVA ACUMULADA (FRa) %
Conceito. Representado por FRa, significa soma das freqüências relativas (fr) até o elemento analisado.
EXEMPLO 1c
20%+12% = 32%
frequência relativa acumulada (FRa) Comentários aos cálculos
Nota f fr(%) Fa FRa(%)
4,0 5 20% 5 20%
5,0 3 12% 8 32%
6,0 2 8% 10 40%
7,0 3 12% 13 52%
8,0 2 8% 15 60%
9,0 10 40% 25 100%
∑f=25 100 ‐ ‐
A frequência relativa acumulada (FRa) é obtida conforme abaixo:
A “FRa” de 4,0 é 20% (sempre repete a primeira).
A “FRa” de 4,0 e 5,0 é 20+12 = 32%
A “FRa” de 4,0, 5,0 e 6,0 é 20+12+8 = 40%
A “FRa” de 4,0, 5,0, 6,0 e 7,0 é 20+12+8+12 = 52%
A “FRa” de 4,0, 5,0, 6,0, 7,0 e 8,0 é 20+12+8+12+8 = 60%
A “FRa” de 4,0, 5,0, 6,0, 7,0, 8,0 e 9,0 é 20+12+8+12+8+40=100%
NOTA IMPORTANTE SOBRE DISTRIBUIÇÃO DE FREQUÊNCIA:
Nota f fr(%) Fa FRa(%)
25 100
∑f=25 100 ‐ ‐
Para saber se o desenvolvimento da distribuição de freqüência por completo está
correto, os valores ao lado, em vermelho, deverão coincidir.
32. - 32 -
Uanderson Rebula de Oliveira Estatística
AGRUPAMENTO EM CLASSES
Em uma distribuição de frequência, ao se trabalhar com grandes conjuntos de dados e
com valores dispersos, podemos agrupá-los em classes.
Se um conjunto de dados for muito disperso, uma representação melhor seria através do agrupamento dos dados
com a construção de classes de frequência. Caso isso não ocorresse, a tabela ficaria muito extensa. Veja abaixo:
EXEMPLO 2
Um radar instalado na Dutra registrou a velocidade (em Km/h) de 40 veículos, indicadas abaixo:
Velocidade de 40 veículos (Km/h)
Distribuição de frequência
É fácil ver que a distribuição de frequências
diretamente obtida a partir desses dados é
dada uma tabela razoavelmente extensa.
70 90 100 110 123
71 93 102 115 123
73 95 103 115 123
76 97 105 115 123
80 97 105 117 124
81 97 109 117 124
83 99 109 121 128
86 99 109 121 128
Nota f
70 1
71 1
73 1
76 1
80 1
81 1
83 1
86 1
90 1
93 1
95 1
97 3
99 2
100 1
102 1
103 1
105 2
109 3
110 1
115 3
117 2
121 2
123 4
124 2
128 2
∑f=40
Distribuição de freqüência com classes
i Velocidade (Km/h) f
1 70 |⎯ 80 4
2 80 |⎯ 90 4
3 90 |⎯ 100 8
4 100 |⎯ 110 8
5 110 |⎯ 120 6
6 120 |⎯ 130 10
∑f=40
A criação de grupos de frequências, chamado de ”classes”, é como se fosse
uma compressão dos dados. Imagine se fizéssemos uma distribuição de
freqüência de todas velocidades, desde 70 até 128. A distribuição ficaria
imensa! Por este motivo existe a distribuição de frequência com classes.
Como criar uma Distribuição de Freqüência com classes
1. Calcule a quantidade de classes (i), obtida por meio da raiz da
quantidade de dados. Neste exemplo: 40 = 6,3 ≅ i = 6 classes.
2. Calcule a amplitude de classe (h) que nada mais é o tamanho da
classe, representado por “h”, sendo:
Maior valor – Menor valor = 128 – 70 = 9,6 ≅ h=10
quantidade de classes (i) 6
Nota: o Maior valor e o Menor valor são obtidos da relação das velocidades dos
40 veículos, ou seja,o maior valor é 128 e o menor valor é 70.
3. Montar as classes a partir do Menor valor (70 no exemplo),
somando com a amplitude de classe (10 no exemplo) até que se
chegue na 6ª classe, assim:
CONCEITOS IMPORTANTES:
TIPOS DE INTERVALO DE CLASSE:
No Brasil costuma‐se utilizar o intervalo |⎯ (Resolução 866/66 do IBGE). Já na
literatura estrangeira, a exemplo de Triola (2008), Anderson et al (2009) e Levine et
al (2008), utiliza‐se somente com intervalo fechado.
LIMITES DE CLASSE ‐ São os extremos de cada classe, no exemplo 70 |⎯ 80,
temos que o limite inferior é 70 e o limite superior 80.
Classes
i Velocidade (Km/h)
1 70 +10 80
2... 80 +10 90
...6 120 +10 130
Tipo Representação Dados do intervalo
Aberto 70 ⎯ 80 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80
Fechado à esquerda 70 |⎯ 80 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80
Fechado 70 |⎯| 80 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80
Fechado à direita 70 ⎯| 80 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80
33. - 33 -
Uanderson Rebula de Oliveira Estatística
0
2
4
6
8
10
12
Quantidade de veículos
Resultados dos registros
de um radar
70 75 80 85 90 95 100 105 110 115 120 125 130
Velocidade (Km/h)
AMPLITUDE TOTAL DA DISTRIBUIÇÃO (AT) – É a diferença entre o limite superior da última classe e o limite inferior da primeira classe, no
exemplo 130 – 70 = 60.
AMPLITUDE AMOSTRAL (AA) – É a diferença entre o valor máximo e o valor mínimo da amostra, no exemplo 128 – 70 = 58.
Abaixo vemos as distribuições de frequências absoluta, relativa, absoluta acumulada e relativa acumulada, bem
como o Histograma desta distribuição.
Distribuição de freqüência com classes f, fr, Fa e FRa
OUTRAS REPRESENTAÇÕES GRÁFICAS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA
POLÍGONO DE FREQUÊNCIA – É um gráfico em linha que representa os pontos centrais dos intervalos de classe.
Calcule o ponto central de classe (x), que é o ponto que divide o intervalo de classe em duas partes iguais. Por
exemplo, a velocidade dos veículos da 1ª classe pode ser representada por 70 + 80 = 75Km/h
2
A construção de um polígono de frequências é muito simples. Primeiro,
construímos um histograma; depois marcamos no “telhado” de cada coluna o
ponto central e unimos sequencialmente esses pontos.
OGIVA – (pronuncia‐se o’jiva). Conhecida também por polígono de frequência acumulada. É um gráfico em linha
que representa freqüências acumuladas (FRa), levantada nos pontos correspondentes aos limites superiores dos
intervalos de classe.
i Velocidade (Km/h) f Fr(%) Fa FRa(%)
1 70 |⎯ 80 4 10% 4 10%
2 80 |⎯ 90 4 10% 8 20%
3 90 |⎯ 100 8 20% 16 40%
4 100 |⎯ 110 8 20% 24 60%
5 110 |⎯ 120 6 15% 30 75%
6 120 |⎯ 130 10 25% 40 100%
∑f=40 100%
i Velocidade (Km/h) f x
1 70 |⎯ 80 4 75
2 80 |⎯ 90 4 85
3 90 |⎯ 100 8 95
4 100 |⎯ 110 8 105
5 110 |⎯ 120 6 115
6 120 |⎯ 130 10 125
∑f=40
i Velocidade (Km/h) f FRa
1 70 |⎯ 80 4 4
2 80 |⎯ 90 4 8
3 90 |⎯ 100 8 16
4 100 |⎯ 110 8 24
5 110 |⎯ 120 6 30
6 120 |⎯ 130 10 40
∑f=40
4 4
8 8
6
10
0
2
4
6
8
10
12
Quantidade de veículos
Resultados dos registros
de um radar
70 80 90 100 110 120 130
Velocidade (Km/h)
70 |⎯ 80
Ponto central
75Km/h
Velocidade (Km/h)
4 4
8 8
6
10
0
5
10
15
20
25
30
35
40
Quantidade de veículos
Resultados dos registros
de um radar
70 80 90 100 110 120 130
4
8
16
24
30
40
34. - 34 -
Uanderson Rebula de Oliveira Estatística
3
MEDIDAS
Para resumir a quantidade de informação contida em um conjunto de dados, os
estatísticos definem medidas que descrevem, através de um só elemento,
características dos dados. Algumas medidas descrevem a tendência central, isto é, a
tendência que os dados têm de se agrupar em torno de certos valores.