Estatística Descritiva: Séries, Tabelas, Gráficos e Distribuição de Frequência

Probabilidade e
Estatística
ESTATÍSTICA DESCRITIVA
SÉRIES, TABELAS, GRÁFICOS E DISTRIBUIÇÃO DE FREQUÊNCIA
1

Estatística Descritiva
 Parte da estatística que desenvolve e disponibiliza métodos
para resumo e apresentação dos dados coletados;
 Objetivo: Facilitar a compreensão e a utilização da
informação contida;
 Em resumo: tem por finalidade a utilização de tabelas,
gráficos, diagramas, distribuições de frequência e medidas
descritivas para:
 Examinar o formato geral da distribuição dos dados;
 Verificar a ocorrência de valores atípicos;
 Identificar valores típicos que informem sobre o centro da
distribuição;
 Verificar o grau de variação presente nos dados.
2

IMPORTANTE
A validade do resumo dos dados está intimamente ligada
à quantidade de informação disponível e à qualidade de
obtenção dos dados.
Pode-se pensar que todo método descritivo possui uma
entrada, os dados, e uma saída, que pode ser uma
medida descritiva ou um gráfico.
Se a entrada é deficiente a saída também será de má
qualidade.
3

Apresentação de dados:
Séries Estatísticas
 A reunião, ou agrupamento, de dados estatísticos,
quando apresentados em tabelas ou em gráficos, para
apreciação ou investigação.
 Resumem um conjunto ordenado de observações através
de três fatores fundamentais:
 Tempo: Referência à data, ou a época, em que o fenômeno
foi investigado;
 Espaço: Referência ao local, ou região, onde o fato ocorreu;
 Espécie: Referência ao fato, ou fenômeno, que está sendo
investigado e cujos valores numéricos estão sendo
apresentados.
 As séries estatísticas são classificadas de acordo com o
fato que estiver variando, podendo ser simples, mistas e
por distribuição de frequências.
4

Séries Estatísticas - Simples
 São aquelas em que apenas um fator varia.
 Podem ser de três tipos:
 Histórica;
 Geográfica;
 Especificativa.
5

 Séries Históricas (temporal, cronológica, evolutiva)
 Onde varia o tempo, permanecendo fixos o espaço e a
espécie do fenômeno estudado.
6

 Séries Geográficas (territorial ou regional)
 Onde varia o espaço, permanecendo fixos o tempo e a
espécie do fenômeno estudado.
7

 Séries Especificativas (qualitativa ou categórica)
 Onde varia o espécie do fenômeno estudado,
permanecendo fixos o tempo e o espaço.
8

Séries Estatísticas - Mistas
 São aquelas em que mais de um fator varia, ou um
mesmo fator varia mais de uma vez.
 Exemplo 1: Série histórica geográfica (ou geográfica
histórica).
9

 Exemplo 2: Especificativa geográfica (ou geográfica
especificativa)
10

 Exemplo 4: Especificativa histórica geográfica
11

Séries Estatísticas –
Distribuição de Frequências
 Ocorre quando nenhum dos fatores varia;
 Os dados são agrupados em classes (intervalos com limites
predeterminados)segundo suas respectivas frequências;
 Podem ser de dois tipos:
 Por dados de enumeração;
 Por dados de mensuração.
12
 Este tipo de série será melhor estudado nos próximos
capítulos.

Tabela
 É a forma, não discursiva, de apresentar informações, das
quais o dado numérico se destaca como informação central.
 Tem como finalidade apresentar os dados de modo
ordenado, simples e de fácil interpretação, fornecendo o
máximo de informação num mínimo de espaço.
 A construção de uma tabela deve, no entanto, obedecer uma
série de normas técnicas.
 Estas normas podem ser encontradas na publicação do IBGE
intitulada “Normas de Apresentação Tabular”.
 O objetivo dessas normas é orientar a apresentação racional e
uniforme de dados estatísticos na forma tabular.
15

Tabela – Normas IBGE
 Composta por elementos essenciais e complementares.
 Elementos essenciais:
 Corpo: Conjunto de linhas e colunas que contém informações sobre a variável em
estudo;
 Cabeçalho: Parte superior da tabela que especifica o conteúdo das colunas;
 Coluna Indicadora: Parte da tabela que especifica o conteúdo das linhas;
 Casa, ou célula: Espaço destinado a um só número;
 Título: Conjunto de informações, as mais completas possíveis, que respondem as
perguntas: O quê?, Quando?, Onde?, localizado no topo da tabela.
 Elementos Complementares: Deverão situar-se no rodapé da tabela, na
mesma ordem em que foram escritos abaixo.
 Fonte: Indicação da entidade responsável pelo fornecimento dos dados, ou elabora
a tabela;
 Notas: Informações de natureza geral, destinadas a esclarecer o conteúdo das
tabelas;
 Chamadas: Informações específicas a esclarecer ou conceituar dados numa parte
da tabela. Deverão estar indicados no corpo da tabela, em números arábicos entre
parênteses, à esquerda das casa e à direita da coluna indicadora.
16

 Número da tabela
 Uma tabela deve ter um número para identifica-la sempre que o
documento apresentar uma ou mais tabelas, permitindo, assim, sua
localização.
 A identificação deve ser feita em números arábicos, de modo crescente,
precedidos pela palavra Tabela, podendo ou não ser subordinada a
capítulos ou seções de um documento.
 Exemplo: Tabela 5, Tabela 10.4.
 Apresentação de dados numéricos
 Toda tabela deve ter dado numérico para informar a quantificação de um
fato específico observado, oqual deve ser apresentado em números
arábicos;
 A parte inteira dos dados numéricos deve ser separada por pontos ou
espaços de três em três algarismos, da direita para a esquerda.
 Exemplo: 12.243.527 ou 12 243 527.
 A separação da parte inteira da decimal deve ser feita por vírgula.
 Exemplo: 25,67.
18

 Sinais convencionais
 Sempre que um dado numérico não puder ser apresentado, o
mesmo deve ser substituído por um sinal convencional.
 Conforme o caso, a substituição de um dados numérico deve ser
feita por dos sinais abaixo:
 - (traço): Indica dado numérico igual a zero não resultante de
arredondamento;
 .. (dois pontos): Indica que o dado numérico não se aplica;
 ... (três pontos): Indica dado numérico não disponível;
 X (xis): Indica dado numérico omitido a fim de evitar individualização da
informação;
 0, 0,0, 0,00: Indica dado numérico igual a zero resultante de
arredondamento;
 ? (interrogação): Quando houver dúvida sobre a veracidade da
informação.
 Quando uma tabela contiver sinais convencionais, estes deverão ser
apresentados em nota geral com seus respectivos significados.
19

 Arredondamento
 Quando o primeiro algarismo a ser abandonado for 0, 1, 2, 3 ou 4, fica
inalterado o último algarismo a permanecer.
 Exemplo: 48,32 48,3
 Quando o primeiro algarismo a ser abandonado for 5, 6, 7, 8, ou 9,
aumenta-se de uma unidade o último algarismo a permanecer.
 Exemplo: 94,27 94,3
 Unidade de medida
 Uma tabela deve ter unidade de medida, inscrita no cabeçalho ou nas
colunas indicadoras, sempre que houver necessidade de se indicar,
complementarmente ao título, a expressão quantitativa ou metrológica
dos dados numéricos.
 Esta indicação deve ser feita com símbolos ou palavras, entre parênteses.
 Exemplos: (m) ou (metros), (t) ou (toneladas), (R$) ou (reais).
 Quando os dados numéricos forem divididos por uma constante, esta
deve ser indicada por algarismos arábicos, símbolos, ou palavras, entre
parênteses, precedendo a unidade de medida, quando for o caso.
 Exemplos: (1.000 t) – indica dados em toneladas dividas por mil; (1.000 R$) –
indica dados em reais divididos por mil; (%) ou (percentual) – indica dados
proporcionais a cem.
20

 Classe de frequência
 É cada um dos intervalos não superpostos em que se divide uma
distribuição de frequências.
 Toda classe deve ser apresentada, sem ambiguidade, por extenso ou com
notação
 Toda classe que inclui o extremo inferior do intervalo (EI) e exclui o
extremo superior (ES), deve ser apresentada em uma destas formas:
EI I– ES ou [EI; ES)
 Apresentação de tempo
 Toda série histórica consecutiva deve ser apresentada por seus pontos
inicial e final, ligados por hífen (-).
 Exemplos: 1812-912: Quando varia o século; 1950-58: Quando variam os anos
dentro de um mesmo século; out 2013 – set 2014: Quando variam os meses
dentro de anos.
 Toda série histórica não consecutiva deve ser ligadapor seus pontos inicial
e final por barra (/).
 Exemplos: 1990/1997 – Indica dados não apresentados para, pelo menos, um
ano do intervalo; abr 2000 / abr 2001 – Indica dados não apresentados para,
pelo menos, um mês do intervalo.
21

 Apresentação da tabela
 O corpo da tabela deve ser delimitado com, pelo menos, três
traços horizontais;
 Recomenda-se não delimitar as tabelas à direita e à esquerda
por traços verticais;
 É facultativo o uso de traços verticais para a separação de colunas
no corpo da tabela.
 Quando, por excessiva altura, a tabela tiver que ocupar mais de
uma página, não deve ser limitada inferiormente, repetindo-se
o cabeçalho na página seguinte;
 Deve-se usar no alto do cabeçalho a palavra “continuação” ou
“conclusão”, conforme o caso.
 Se possuir muitas linhas e poucas colunas, poderá ser
apresentada em duas ou mais partes dispostas lado a lado e
separadas por traço duplo;
 A disposição da tabela deve estar na posição normal de leitura.
Caso não seja possível, a apresentação será feita de forma que
a rotação da página seja no sentido horário.
22

Gráficos
 É um outro modo de apresentar os dados estatísticos
encontrados sob uma forma ilustrada.
 Mais eficiente.
 Essencialmente, é uma figura construída a partir de uma
tabela;
 Porém, gráficos e tabelas se prestam a objetivos distintos,
de modo que a utilização e uma não exclui a outra
 Enquanto a tabela fornece uma idéia mais precisa e
organizada, possibilitando uma inspeção mais rigorosa dos
dados;
 Os gráficos são mais indicados para situações que visem
proporcionar uma visualização mais rápida e maior facilidade
de compreensão do comportamento do fenômeno em estudo.
24

Gráficos
Normas para Representação
 Geralmente, são construídos num plano cartesiano ortogonal.
 A variável independente é localizada no eixo horizontal (x);
 A variável dependente é localizada no eixo vertical (y);
 Iguais intervalos para medida deverão corresponder a iguais
intervalos para as escalas.
 Exemplo: Se, ao intervalo entre 10 e 15 Kg corresponde a 2 cm na escala,
ao intervalo entre 40 e 45 Kg também deverá ser de 2 cm, enquanto o
intervalo entre 40 e 50 Kg corresponderá 4 cm.
 Deverá possuir toda informação necessária à sua compreensão, para
que não precise de auxílio de texto extra.
 Título, fontes, notas e legenda.
 Deverá possuir formato aproximadamente quadrado.
 Evitar que problemas de escala interfiram na correta interpretação.
25

Tipos de gráficos
 Estereogramas
 Gráficos onde as grandezas são representadas por volumes.
 Geralmente são construídos num sistemas de eixos bidimensional, mas podem ser feitos
num sistema tridimensional para ilustrar a relação entre três variáveis.
26

Tipos de gráficos
 Cartogramas
 Representações em cartas geográficas (mapas)
27

Tipos de gráficos
 Pictogramas (Gráficos pictóricos)
 Gráficos puramente ilustrativos, construídos de modo a ter apelo visual;
 Dirigido a um público grande e heterogêneo;
 Não deve ser utilizado em situações que exijam maior precisão.
28

Tipos de gráficos
 Diagramas
 Gráficos geométricos de duas dimensões, de fácil
elaboração e grande utilização;
 Subdivisões
 Gráfico de colunas;
 Gráfico de barras;
 Gráfico de linhas, ou curvas;
 Gráfico de setores.
29

Gráfico de Colunas
 Grandezas comparadas através de retângulos, de mesma largura, dispostos
verticalmente e com alturas proporcionais às grandezas.
30

Gráfico de Barras
 Segue as mesmas
instruções do gráfico de
colunas, tendo a
diferença de que os
retângulos são
dispostos
horizontalmente.
 Usado quando as
inscrições dos
retângulos forem
maiores que a base dos
mesmos.
31

Gráfico de Linhas, ou Curvas
 Os pontos são postos no plano de acordo com as suas coordenadas,
e a seguir são ligados por segmentos de reta.
 Muito utilizado em situações em situações onde o tempo é a variável
independente.
32

Gráfico em Setores
 Também chamado de gráfico de “Pizza”.
 Recomendado para situações em que se deseja evidenciar o quanto
cada informação representa do total.
 Consiste num círculo, que representa o 100%, subdividido em quantas
partes for necessário à representação.
33

Distribuição de
frequências
Forma eficiente de resumir e apresentar
uma grande quantidade de dados.
34
Uma das formas mais comuns de resumir e
apresentar os dados é através de tabelas de
distribuição de frequências, que são de dois
tipos:
 Classificação simples;
 Classificação cruzada.

Tabelas de classificação
simples
 Tabelas de frequência relativa a uma variável.
 As características da tabela variam de acordo com a
variável de estudo.
 Variável discreta (ou categórica):
 São obtidas as frequências de ocorrência de cada nível
dessa variável;
 Variável contínua
 Primeiro: obtém-se os intervalos de mesma amplitude;
 Segundo: contagem dos valores que ocorrem em cada
intervalo.
35

Construção da tabela –
Variáveis discretas
Envolve apenas dois passos
 1º Passo – Ordenar os níveis do fator.
 Colocá-los em ordem crescente de grandeza (rol).
 O número de cada classe da distribuição será representado
por j, tal que j = 1, 2, ..., k.
 2º Passo – Contar o número de vezes que o dados
daquela classe se repete
36

Variáveis categóricas
Exemplo 1: Seja a variável em estudo o tamanho do macacão de
trabalho, observado em 60 trabalhadores de uma determinada
empresa. As observações foram:
P, M, G, M, P, M, P, M, P, G, M, M, G, M, M, M, GG, M, G, GG, G,
GG, M, G, M, P, M, GG, M, M, G, P, GG, P, M, M, M, GG, M, G, P, P,
G, M, M, P, G, M, M, G, G, G, P, M, G, M, M, P, M, G.
 Podemos observar que trata-se de uma variável qualitativa
ordinal (categórica).
 Quatro níveis (P, M, G e GG). Logo, o número de classes (k) é
igual a 4 (quatro).
37

 1º passo: ordenação dos níveis da variável.
 2º passo: Contagem do tamanho dos macacões em cada nível, que chama-se
frequências absolutas (𝐹𝑗).
 A partir de 𝐹𝑗 podemos obter outras frequências de interesse nessa
distribuição:
 Frequência absoluta acumulada (𝐹𝑗
′
): Números de elementos acumulados até a
classe j;
 Frequência relativa (𝑓𝑗): Expressa a proporção de elementos na classe;
 Frequência relativa acumulada (𝑓𝑗
′
): Proporção de elementos acumulados até a
classe j.
38
Número da classe (j) Classe
1 P
2 M
3 G
4 GG

Tabela 1: Frequência do tamanho do macacão de
trabalho utilizado pelos trabalhadores de uma
determinada empresa.
39
j Classe 𝐹𝑗 𝐹𝑗
′
𝑓𝑗 𝑓𝑗
′
1 P 12 12 0,2 0,2
2 M 27 39 0,45 0,65
3 G 15 54 0,25 0,9
4 GG 6 60 0,1 1
Total (Σ) 60 - 1 -

Exemplo 2: Seja a variável em estudo o número de animais
portadores de brucelose em 350 propriedades rurais. As
observações foram:
2, 5, 6, 0, 4, 4, 3, 5, 1, 2, 1, 3, 4, 4, 2, 2, 3, 2, 1, 5, 6, 4, 2, 1, 3...
 Podemos observar que trata-se de uma variável quantitativa
discreta.
 De acordo com os dados observados, levando-se em conta o
total, foram detectados sete valores diferentes para esta variável.
 Sete níveis (0, 1, 2, 3, 4, 5, 6). Logo, serão geradas 7 classes.
40

 1º passo: Ordenação dos níveis da variável
41Construção da tabela –
1 0
2 1
3 2
4 3
5 4
6 5
7 6

 2º passo: Determinação das frequências de cada classe
Tabela 2: Frequência do número de animais portadores de brucelose
em 350 propriedades rurais. UFPel, 2001.
j Classe 𝐹𝑗 𝐹𝑗
′
𝑓𝑗 𝑓𝑗
′
1 0 55 55 0,1571 0,1571
2 1 60 115 0,1714 0,3286
3 2 112 227 0,32 0,6486
4 3 82 309 0,2343 0,8829
5 4 31 340 0,0886 0,9714
6 5 8 348 0,0229 0,9943
7 6 2 350 0,0057 1,0000
Total (Σ) 350 - 1,0000 -

Tão importante quanto saber construir uma tabela é saber
interpretar os seus valores.
 𝐹4 = 82 → significa que, das 350 propriedades rurais consultadas,
82 possuem três animais portadores de brucelose;
 𝐹3
′
= 227 → significa que, das 350 propriedades rurais consultadas,
227 possuem menos de três animais portadores de brucelose;
 𝑓2 = 0,1714 → significa que a proporção de propriedades rurais
que possuem apenas um animal portador de brucelose é de 0,1714
(em percentual: 17,14%);
 𝑓5
′
= 0,9714 → significa que a proporção de propriedades rurais
com menos de quatro animais portadores de brucelose é de
0,9714 (em percentual: 97,14%).

Construção da tabela-
Variáveis contínuas
 Ao contrário das variáveis discretas, essas assumem, em
geral, muitos valores e, em sua grande maioria, diferentes
uns dos outros.
 Para sanar problemas dessa natureza, as tabelas de
distribuição de frequências para variáveis contínuas são
construídas de modo que cada classe possua um intervalo
de valores da variável.
Obs.: Devemos observar que, no entanto, em algumas
situações pode acontecer de uma variável discreta também
assumir vários valores diferentes.
Nesses casos, também adotamos a formação de intervalos dos
dados discretos para uma melhor visualização da tabela.
44

 A construção da tabela de variáveis contínuas:
 1º passo: ordenar o conjunto de dados, ou seja, colocar os dados
brutos em sequência de grandeza (rol);
 2º passo: determinar o número de classes da tabela.
 Modo geral: 5 ≤ 𝑘 ≤ 15; 𝑜𝑛𝑑𝑒 𝑘 é 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑠𝑒𝑠.
 Regras de determinação:
 Regra empírica: 𝑛 ≤ 𝑘 ≤ 1,5 𝑛
 Fórmula de Sturges:
𝑘 = 1 + 3,32 𝑥 log 𝑛 ; 𝑜𝑛𝑑𝑒:
𝑛 = 𝑜 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎çõ𝑒𝑠;
log 𝑛 = 𝑙𝑜𝑔𝑎𝑟í𝑡𝑖𝑚𝑜, 𝑛𝑎 𝑏𝑎𝑠𝑒 10, 𝑑𝑒 𝑛.
45

 3º passo: determinar a amplitude do intervalo.
 Utilizaremos a seguinte expressão:
𝑖 =
𝑎 𝑡
𝑘
 i = amplitude do intervalo;
 𝑎 𝑡 = ES – EI : amplitude total do conjunto de valores;
 k = número de classes.
Convencionamos, também, que o arredondamento do
número de classes (k), ou na amplitude do intervalo (i) é
sempre feito pra cima.
46

 4º passo: Construir os intervalos de classe.
 O limite inferior sempre será o menor valor do conjunto de
dados ( 𝑥(1));
 O limite superior será o limite inferior acrescido do valor da
amplitude do intervalo de classe (i);
 Na sequência, o limite inferior da próxima classe será o limite
superior da classe anterior e o limite superior será esse limite
inferior acrescido da amplitude do intervalo.
47
1 𝑥(1) 𝑥(1) + 𝑖
2 𝑥(1) + 𝑖 𝑥(1) + 2𝑖
... ...
K 𝑥(1) + (𝑘 − 1)𝑖 𝑥(1) + 𝑘𝑖

 Em distribuições de frequência de variáveis contínuas,
geralmente existe o interesse em uma outra quantidade
conhecida como o ponto médio ou o centro da classe ( 𝑐𝑗).
 A obtenção desse valor dá-se pela expressão:
𝑐𝑗 =
𝐸𝐼𝑗 + 𝐸𝑆𝑗
2
 Onde:
𝐸𝐼𝑗 = extremo inferior da classe j
ESj = extremo superior da classe j
48

Exemplo
Tomemos a seguinte variável:
X = peso ao nascer (em Kg) de 60 bovinos machos,
para qual os valores observados (e já ordenados)
foram:
16, 17, 17, 18, 18, 18, 19, 20, 20, 20, 20, 20, 21,
21, 22, 22, 23, 23, 23, 23, 23, 23, 23, 23, 23, 25,
25, 25, 25, 25, 25, 26, 26, 27, 27, 27, 27, 28, 28,
28, 29, 29, 29, 30, 30, 30, 30, 30, 30, 30, 31, 32,
33, 33, 33, 34, 34, 35, 36, 39.
49

 Sendo o peso uma variável contínua, não podemos
considerar cada valor sendo uma classe.
 Este valor deverá ser determinado e, neste exemplo,
usaremos a fórmula de Sturges.
𝑘 = 1 + 3,32 𝑥 log 𝑛
𝑘 = 1 + 3,32 𝑥 log 60
𝑘 = 1 + 3,32 𝑥 1,778 = 6,9
 Como o número de classe tem que ser um número inteiro,
teremos que arredondar o valor encontrado de forma a
obtermos 𝑘 = 7.
 Arredondamento para cima, conforme convencionado
anteriormente.
50Resolução do Exemplo

 Obtendo a amplitude dos intervalos:
𝑎 𝑡 = 𝐸𝑆 − 𝐸𝐼
𝑎 𝑡 = 39 − 16 = 23
 Com isso, podemos calcular o (i):
𝑖 =
𝑎 𝑡
𝑘
=
23
7
= 3,2857 = 3,3

 Construção dos intervalos de classe:
 Sabendo-se que o menor valor do conjunto de
dados é 𝑥(1) = 16 , o número de classes é 𝑘 = 7 e
a amplitude do intervalo é 𝑖 = 3,3, temos assim a
tabela:
Número da classe (j) Classes
1 16,0 19,3
2 19,3 22,6
3 22,6 25,9
4 25,9 29,2
5 29,2 32,5
6 32,5 35,8
7 35,8 39,1

 Tabela 3: Frequência do peso ao nascer (em Kg) de 60
bovinos machos.
j Classes 𝐹𝑗 𝐹𝑗
′
𝑓𝑗 𝑓𝑗
′
𝑐𝑗
1 16,0 19,3 7 7 0,1167 0,1167 17,65
2 19,3 22,6 9 16 0,15 0,2667 20,95
3 22,6 25,9 15 31 0,25 0,5167 24,25
4 25,9 29,2 12 43 0,2 0,7167 27,55
5 29,2 32,5 9 52 0,15 0,8667 30,85
6 32,5 35,8 6 58 0,1 0,9667 34,15
7 35,8 39,1 2 60 0,0333 1,0000 37,45
Total (Σ) 60 - 1,0000 - -

Algumas interpretações dessa tabela:
 𝐹3 = 15 → significa que 15 dos 60 bovinos nasceram com
peso entre 22,6 e 25,9 Kg (exclusive);
 𝐹5
′
= 52 → significa que 52 dos 60 bovinos nasceram com
peso entre 16,0 e 32,5 Kg (exclusive);
 𝑓2 = 0,15 → significa que a proporção de bovinos que
nasceram com peso entre 19,3 e 22,6 Kg (exclusive) é de 0,15 (em
percentual: 15%);
 𝑓6
′
= 0,9667 → significa que a proporção de bovinos com
peso entre 16,0 e 35,8 Kg (exclusive) é de 0,9667 (em
percentual: 96,67%).

EXERCÍCIOS PROPOSTOS
1- Os dados a seguir se referem ao números de pães não
vendidos em uma certa padaria até a hora do encerramento
do expediente:
0 0 4 2 0 1 0 2 0 4
1 0 0 3 2 0 1 0 0 0
2 0 0 1 0 0 3 2 1 7
0 1 0 0 2 0 0 3 2 1
Construa a distribuição de frequência para esses dados,
obedecendo todos os passos para a sua criação.
55

EXERCÍCIOS PROPOSTOS
2- Os dados abaixo, em rol, referem-se aos valores gastos (em reais)
pelas primeiras 50 pessoas que entraram em um determinado
supermercado, no dia 01/01/2000:
3,11 8,88 9,26 10,81 12,69 13,78 15,23 15,62 17,00 17,39
18,36 18,43 19,27 19,50 19,54 20,16 20,59 22,22 23,04 24,47
24,58 25,13 26,24 26,26 27,65 28,06 28,08 28,38 32,03 36,37
38,64 38,98 39,16 41,02 42,97 44,08 44,67 45,40 46,69 48,65
50,39 52,75 54,80 59,07 61,22 70,32 82,70 85,76 86,37 93,34
1º - O que é rol?
2º - Faça a distribuição de frequência desses dados.
56

Distribuição de frequências
Representação gráfica
 Duas formas distintas e exclusivas:
 Histograma;
 Polígono de frequências.
 Histograma
 Conjunto de retângulos contíguos cuja base é igual a amplitude do
intervalo e a altura proporcional à frequência das respectivas classes.
 Quando as variáveis são numéricas discretas os retângulos dão lugar a
retas.
 Polígono de frequências
 Segmentos de reta que unem os pontos cujas coordenadas são os
ponto médio e a frequência de cada classe;
 É fechado porque usa uma classe anterior a primeira e uma posterior
a última (ambas possuem frequência igual a zero).
57

Histograma
58

Histograma
59

Polígono de frequência
60

Polígono de frequência
61

EXERCÍCIO PROPOSTO
Faça a representação gráfica
(histograma e polígono de
frequências, quando for o
caso) das distribuições de
frequências construídas nos
exercícios anteriores (1 e 2).
62

Tabelas de classificação
cruzada
 Tabelas de frequência relativa a duas, ou mais,
variáveis, seja ela numérica ou categórica.
 Distribuição conjunta de frequências.
 Existe um número razoável de tipos de tabelas e
gráficos para esses casos.
63

Frequência cruzada de
variáveis categóricas
 Conhecida, também, como tabela de dupla entrada, tabela de
associação ou tabela de contingência.
 Mesmas regras das que foram utilizadas para a construção da tabela
simples.
 Única diferença: a tabela agora apresenta duas, ou mais, margens, que são
os fatores (variáveis).
64

variáveis categóricas
 A representação gráfica pode ser feita através de dois gráficos:
 Gráficos bi-dimensionais (diagramas);
 Gráficos tri-dimensionais (Estereogramas).
65

Gráfico bidimensional
(Diagrama)
66

Gráfico tridimensional
(Estereograma)
67

variáveis numéricas
 As tabelas, nesse caso, são chamadas de tabelas de
correlação.
 A idéia básica de montagem é semelhante à vista
anteriormente, para a tabela simples.
 Primeiramente, classificamos as observações de uma
variável e, em seguida, dentro de cada classe da
primeira, classificamos a outra variável.
68

 Exemplo 1: Observamos a classificação dos 400 alunos do
Colégio C, segundo duas variáveis distintas: Nota em
Estatística e Nota em Matemática.
69
0 4 4 7 7 10
0 4 32 25 5 62
4 7 20 183 82 285
7 10 7 27 19 53
Totais 59 235 106 400
Estatística
Matemática
Totais
Tabela 4: Distribuição dos alunos do Colégio C, segundo suas notas em Estatística
e Matemática.

 Gráfico que melhor representa a situação anterior:
Histograma em três dimensões (Estereogramas).
 Retângulos tornam-se paralelogramos;
 É pouco utilizado em trabalhos científicos pela
dificuldade de execução e interpretação.
70

 Exemplo 2: Estudar a relação do peso dos pais e o peso dos
alunos. Foi realizada a medição de dez pais e dez alunos do
Colégio C
71
Tabela 5: Peso de 10 pais e o peso de seus respectivos filhos.
Observação (i) 1 2 3 4 5 6 7 8 9 10
Peso dos pais (xi) 78 65 86 68 83 68 75 80 82 66
Peso dos filhos (yi) 60 52 68 53 65 57 58 62 65 53

 Gráfico que melhor
representa a situação
anterior: Diagrama de
dispersão de pontos.
 Fornece uma indicação do
tipo de relacionamento
entre as duas classes.
 Nesta situação, a tendência
é que seja criada uma linha
reta.
 Regressão linear.
72
50
52
54
56
58
60
62
64
66
68
70
60 65 70 75 80 85 90
PEsodosfilhos
Peso dos pais
Gráfico 1: Relação do peso dos pais e seus respectivos
filhos - Colégio C

Estatística Descritiva: Séries, Tabelas, Gráficos e Distribuição de Frequência

Recommandé

Recommandé

Contenu connexe

Tendances

Tendances (20)

En vedette

En vedette (20)

Similaire à Estatística Descritiva: Séries, Tabelas, Gráficos e Distribuição de Frequência

Similaire à Estatística Descritiva: Séries, Tabelas, Gráficos e Distribuição de Frequência (20)

Plus de Augusto Junior

Plus de Augusto Junior (19)

Dernier

Dernier (20)

Estatística Descritiva: Séries, Tabelas, Gráficos e Distribuição de Frequência