O documento discute estatística descritiva, com foco em séries estatísticas, tabelas e gráficos. Ele explica como séries podem ser simples, mistas ou por distribuição de frequência, e como tabelas e gráficos podem ser usados para resumir e apresentar dados de forma concisa e visual.
2. Estatística Descritiva
Parte da estatística que desenvolve e disponibiliza métodos
para resumo e apresentação dos dados coletados;
Objetivo: Facilitar a compreensão e a utilização da
informação contida;
Em resumo: tem por finalidade a utilização de tabelas,
gráficos, diagramas, distribuições de frequência e medidas
descritivas para:
Examinar o formato geral da distribuição dos dados;
Verificar a ocorrência de valores atípicos;
Identificar valores típicos que informem sobre o centro da
distribuição;
Verificar o grau de variação presente nos dados.
2
3. IMPORTANTE
A validade do resumo dos dados está intimamente ligada
à quantidade de informação disponível e à qualidade de
obtenção dos dados.
Pode-se pensar que todo método descritivo possui uma
entrada, os dados, e uma saída, que pode ser uma
medida descritiva ou um gráfico.
Se a entrada é deficiente a saída também será de má
qualidade.
3
4. Apresentação de dados:
Séries Estatísticas
A reunião, ou agrupamento, de dados estatísticos,
quando apresentados em tabelas ou em gráficos, para
apreciação ou investigação.
Resumem um conjunto ordenado de observações através
de três fatores fundamentais:
Tempo: Referência à data, ou a época, em que o fenômeno
foi investigado;
Espaço: Referência ao local, ou região, onde o fato ocorreu;
Espécie: Referência ao fato, ou fenômeno, que está sendo
investigado e cujos valores numéricos estão sendo
apresentados.
As séries estatísticas são classificadas de acordo com o
fato que estiver variando, podendo ser simples, mistas e
por distribuição de frequências.
4
5. Séries Estatísticas - Simples
São aquelas em que apenas um fator varia.
Podem ser de três tipos:
Histórica;
Geográfica;
Especificativa.
5
6. Séries Estatísticas - Simples
Séries Históricas (temporal, cronológica, evolutiva)
Onde varia o tempo, permanecendo fixos o espaço e a
espécie do fenômeno estudado.
6
7. Séries Estatísticas - Simples
Séries Geográficas (territorial ou regional)
Onde varia o espaço, permanecendo fixos o tempo e a
espécie do fenômeno estudado.
7
8. Séries Estatísticas - Simples
Séries Especificativas (qualitativa ou categórica)
Onde varia o espécie do fenômeno estudado,
permanecendo fixos o tempo e o espaço.
8
9. Séries Estatísticas - Mistas
São aquelas em que mais de um fator varia, ou um
mesmo fator varia mais de uma vez.
Exemplo 1: Série histórica geográfica (ou geográfica
histórica).
9
12. Séries Estatísticas –
Distribuição de Frequências
Ocorre quando nenhum dos fatores varia;
Os dados são agrupados em classes (intervalos com limites
predeterminados)segundo suas respectivas frequências;
Podem ser de dois tipos:
Por dados de enumeração;
Por dados de mensuração.
12
Este tipo de série será melhor estudado nos próximos
capítulos.
15. Tabela
É a forma, não discursiva, de apresentar informações, das
quais o dado numérico se destaca como informação central.
Tem como finalidade apresentar os dados de modo
ordenado, simples e de fácil interpretação, fornecendo o
máximo de informação num mínimo de espaço.
A construção de uma tabela deve, no entanto, obedecer uma
série de normas técnicas.
Estas normas podem ser encontradas na publicação do IBGE
intitulada “Normas de Apresentação Tabular”.
O objetivo dessas normas é orientar a apresentação racional e
uniforme de dados estatísticos na forma tabular.
15
16. Tabela – Normas IBGE
Composta por elementos essenciais e complementares.
Elementos essenciais:
Corpo: Conjunto de linhas e colunas que contém informações sobre a variável em
estudo;
Cabeçalho: Parte superior da tabela que especifica o conteúdo das colunas;
Coluna Indicadora: Parte da tabela que especifica o conteúdo das linhas;
Casa, ou célula: Espaço destinado a um só número;
Título: Conjunto de informações, as mais completas possíveis, que respondem as
perguntas: O quê?, Quando?, Onde?, localizado no topo da tabela.
Elementos Complementares: Deverão situar-se no rodapé da tabela, na
mesma ordem em que foram escritos abaixo.
Fonte: Indicação da entidade responsável pelo fornecimento dos dados, ou elabora
a tabela;
Notas: Informações de natureza geral, destinadas a esclarecer o conteúdo das
tabelas;
Chamadas: Informações específicas a esclarecer ou conceituar dados numa parte
da tabela. Deverão estar indicados no corpo da tabela, em números arábicos entre
parênteses, à esquerda das casa e à direita da coluna indicadora.
16
18. Número da tabela
Uma tabela deve ter um número para identifica-la sempre que o
documento apresentar uma ou mais tabelas, permitindo, assim, sua
localização.
A identificação deve ser feita em números arábicos, de modo crescente,
precedidos pela palavra Tabela, podendo ou não ser subordinada a
capítulos ou seções de um documento.
Exemplo: Tabela 5, Tabela 10.4.
Apresentação de dados numéricos
Toda tabela deve ter dado numérico para informar a quantificação de um
fato específico observado, oqual deve ser apresentado em números
arábicos;
A parte inteira dos dados numéricos deve ser separada por pontos ou
espaços de três em três algarismos, da direita para a esquerda.
Exemplo: 12.243.527 ou 12 243 527.
A separação da parte inteira da decimal deve ser feita por vírgula.
Exemplo: 25,67.
18
Tabela – Normas IBGE
19. Sinais convencionais
Sempre que um dado numérico não puder ser apresentado, o
mesmo deve ser substituído por um sinal convencional.
Conforme o caso, a substituição de um dados numérico deve ser
feita por dos sinais abaixo:
- (traço): Indica dado numérico igual a zero não resultante de
arredondamento;
.. (dois pontos): Indica que o dado numérico não se aplica;
... (três pontos): Indica dado numérico não disponível;
X (xis): Indica dado numérico omitido a fim de evitar individualização da
informação;
0, 0,0, 0,00: Indica dado numérico igual a zero resultante de
arredondamento;
? (interrogação): Quando houver dúvida sobre a veracidade da
informação.
Quando uma tabela contiver sinais convencionais, estes deverão ser
apresentados em nota geral com seus respectivos significados.
19
Tabela – Normas IBGE
20. Arredondamento
Quando o primeiro algarismo a ser abandonado for 0, 1, 2, 3 ou 4, fica
inalterado o último algarismo a permanecer.
Exemplo: 48,32 48,3
Quando o primeiro algarismo a ser abandonado for 5, 6, 7, 8, ou 9,
aumenta-se de uma unidade o último algarismo a permanecer.
Exemplo: 94,27 94,3
Unidade de medida
Uma tabela deve ter unidade de medida, inscrita no cabeçalho ou nas
colunas indicadoras, sempre que houver necessidade de se indicar,
complementarmente ao título, a expressão quantitativa ou metrológica
dos dados numéricos.
Esta indicação deve ser feita com símbolos ou palavras, entre parênteses.
Exemplos: (m) ou (metros), (t) ou (toneladas), (R$) ou (reais).
Quando os dados numéricos forem divididos por uma constante, esta
deve ser indicada por algarismos arábicos, símbolos, ou palavras, entre
parênteses, precedendo a unidade de medida, quando for o caso.
Exemplos: (1.000 t) – indica dados em toneladas dividas por mil; (1.000 R$) –
indica dados em reais divididos por mil; (%) ou (percentual) – indica dados
proporcionais a cem.
20
Tabela – Normas IBGE
21. Classe de frequência
É cada um dos intervalos não superpostos em que se divide uma
distribuição de frequências.
Toda classe deve ser apresentada, sem ambiguidade, por extenso ou com
notação
Toda classe que inclui o extremo inferior do intervalo (EI) e exclui o
extremo superior (ES), deve ser apresentada em uma destas formas:
EI I– ES ou [EI; ES)
Apresentação de tempo
Toda série histórica consecutiva deve ser apresentada por seus pontos
inicial e final, ligados por hífen (-).
Exemplos: 1812-912: Quando varia o século; 1950-58: Quando variam os anos
dentro de um mesmo século; out 2013 – set 2014: Quando variam os meses
dentro de anos.
Toda série histórica não consecutiva deve ser ligadapor seus pontos inicial
e final por barra (/).
Exemplos: 1990/1997 – Indica dados não apresentados para, pelo menos, um
ano do intervalo; abr 2000 / abr 2001 – Indica dados não apresentados para,
pelo menos, um mês do intervalo.
21
Tabela – Normas IBGE
22. Apresentação da tabela
O corpo da tabela deve ser delimitado com, pelo menos, três
traços horizontais;
Recomenda-se não delimitar as tabelas à direita e à esquerda
por traços verticais;
É facultativo o uso de traços verticais para a separação de colunas
no corpo da tabela.
Quando, por excessiva altura, a tabela tiver que ocupar mais de
uma página, não deve ser limitada inferiormente, repetindo-se
o cabeçalho na página seguinte;
Deve-se usar no alto do cabeçalho a palavra “continuação” ou
“conclusão”, conforme o caso.
Se possuir muitas linhas e poucas colunas, poderá ser
apresentada em duas ou mais partes dispostas lado a lado e
separadas por traço duplo;
A disposição da tabela deve estar na posição normal de leitura.
Caso não seja possível, a apresentação será feita de forma que
a rotação da página seja no sentido horário.
22
Tabela – Normas IBGE
24. Gráficos
É um outro modo de apresentar os dados estatísticos
encontrados sob uma forma ilustrada.
Mais eficiente.
Essencialmente, é uma figura construída a partir de uma
tabela;
Porém, gráficos e tabelas se prestam a objetivos distintos,
de modo que a utilização e uma não exclui a outra
Enquanto a tabela fornece uma idéia mais precisa e
organizada, possibilitando uma inspeção mais rigorosa dos
dados;
Os gráficos são mais indicados para situações que visem
proporcionar uma visualização mais rápida e maior facilidade
de compreensão do comportamento do fenômeno em estudo.
24
25. Gráficos
Normas para Representação
Geralmente, são construídos num plano cartesiano ortogonal.
A variável independente é localizada no eixo horizontal (x);
A variável dependente é localizada no eixo vertical (y);
Iguais intervalos para medida deverão corresponder a iguais
intervalos para as escalas.
Exemplo: Se, ao intervalo entre 10 e 15 Kg corresponde a 2 cm na escala,
ao intervalo entre 40 e 45 Kg também deverá ser de 2 cm, enquanto o
intervalo entre 40 e 50 Kg corresponderá 4 cm.
Deverá possuir toda informação necessária à sua compreensão, para
que não precise de auxílio de texto extra.
Título, fontes, notas e legenda.
Deverá possuir formato aproximadamente quadrado.
Evitar que problemas de escala interfiram na correta interpretação.
25
26. Tipos de gráficos
Estereogramas
Gráficos onde as grandezas são representadas por volumes.
Geralmente são construídos num sistemas de eixos bidimensional, mas podem ser feitos
num sistema tridimensional para ilustrar a relação entre três variáveis.
26
27. Tipos de gráficos
Cartogramas
Representações em cartas geográficas (mapas)
27
28. Tipos de gráficos
Pictogramas (Gráficos pictóricos)
Gráficos puramente ilustrativos, construídos de modo a ter apelo visual;
Dirigido a um público grande e heterogêneo;
Não deve ser utilizado em situações que exijam maior precisão.
28
29. Tipos de gráficos
Diagramas
Gráficos geométricos de duas dimensões, de fácil
elaboração e grande utilização;
Subdivisões
Gráfico de colunas;
Gráfico de barras;
Gráfico de linhas, ou curvas;
Gráfico de setores.
29
30. Gráfico de Colunas
Grandezas comparadas através de retângulos, de mesma largura, dispostos
verticalmente e com alturas proporcionais às grandezas.
30
31. Gráfico de Barras
Segue as mesmas
instruções do gráfico de
colunas, tendo a
diferença de que os
retângulos são
dispostos
horizontalmente.
Usado quando as
inscrições dos
retângulos forem
maiores que a base dos
mesmos.
31
32. Gráfico de Linhas, ou Curvas
Os pontos são postos no plano de acordo com as suas coordenadas,
e a seguir são ligados por segmentos de reta.
Muito utilizado em situações em situações onde o tempo é a variável
independente.
32
33. Gráfico em Setores
Também chamado de gráfico de “Pizza”.
Recomendado para situações em que se deseja evidenciar o quanto
cada informação representa do total.
Consiste num círculo, que representa o 100%, subdividido em quantas
partes for necessário à representação.
33
34. Distribuição de
frequências
Forma eficiente de resumir e apresentar
uma grande quantidade de dados.
34
Uma das formas mais comuns de resumir e
apresentar os dados é através de tabelas de
distribuição de frequências, que são de dois
tipos:
Classificação simples;
Classificação cruzada.
35. Tabelas de classificação
simples
Tabelas de frequência relativa a uma variável.
As características da tabela variam de acordo com a
variável de estudo.
Variável discreta (ou categórica):
São obtidas as frequências de ocorrência de cada nível
dessa variável;
Variável contínua
Primeiro: obtém-se os intervalos de mesma amplitude;
Segundo: contagem dos valores que ocorrem em cada
intervalo.
35
36. Construção da tabela –
Variáveis discretas
Envolve apenas dois passos
1º Passo – Ordenar os níveis do fator.
Colocá-los em ordem crescente de grandeza (rol).
O número de cada classe da distribuição será representado
por j, tal que j = 1, 2, ..., k.
2º Passo – Contar o número de vezes que o dados
daquela classe se repete
36
37. Construção da tabela –
Variáveis categóricas
Exemplo 1: Seja a variável em estudo o tamanho do macacão de
trabalho, observado em 60 trabalhadores de uma determinada
empresa. As observações foram:
P, M, G, M, P, M, P, M, P, G, M, M, G, M, M, M, GG, M, G, GG, G,
GG, M, G, M, P, M, GG, M, M, G, P, GG, P, M, M, M, GG, M, G, P, P,
G, M, M, P, G, M, M, G, G, G, P, M, G, M, M, P, M, G.
Podemos observar que trata-se de uma variável qualitativa
ordinal (categórica).
Quatro níveis (P, M, G e GG). Logo, o número de classes (k) é
igual a 4 (quatro).
37
38. Construção da tabela –
Variáveis categóricas
1º passo: ordenação dos níveis da variável.
2º passo: Contagem do tamanho dos macacões em cada nível, que chama-se
frequências absolutas (𝐹𝑗).
A partir de 𝐹𝑗 podemos obter outras frequências de interesse nessa
distribuição:
Frequência absoluta acumulada (𝐹𝑗
′
): Números de elementos acumulados até a
classe j;
Frequência relativa (𝑓𝑗): Expressa a proporção de elementos na classe;
Frequência relativa acumulada (𝑓𝑗
′
): Proporção de elementos acumulados até a
classe j.
38
Número da classe (j) Classe
1 P
2 M
3 G
4 GG
39. Construção da tabela –
Variáveis categóricas
Tabela 1: Frequência do tamanho do macacão de
trabalho utilizado pelos trabalhadores de uma
determinada empresa.
39
j Classe 𝐹𝑗 𝐹𝑗
′
𝑓𝑗 𝑓𝑗
′
1 P 12 12 0,2 0,2
2 M 27 39 0,45 0,65
3 G 15 54 0,25 0,9
4 GG 6 60 0,1 1
Total (Σ) 60 - 1 -
40. Construção da tabela –
Variáveis discretas
Exemplo 2: Seja a variável em estudo o número de animais
portadores de brucelose em 350 propriedades rurais. As
observações foram:
2, 5, 6, 0, 4, 4, 3, 5, 1, 2, 1, 3, 4, 4, 2, 2, 3, 2, 1, 5, 6, 4, 2, 1, 3...
Podemos observar que trata-se de uma variável quantitativa
discreta.
De acordo com os dados observados, levando-se em conta o
total, foram detectados sete valores diferentes para esta variável.
Sete níveis (0, 1, 2, 3, 4, 5, 6). Logo, serão geradas 7 classes.
40
41. 1º passo: Ordenação dos níveis da variável
41Construção da tabela –
Variáveis discretas
Número da classe (j) Classe
1 0
2 1
3 2
4 3
5 4
6 5
7 6
42. 2º passo: Determinação das frequências de cada classe
Tabela 2: Frequência do número de animais portadores de brucelose
em 350 propriedades rurais. UFPel, 2001.
42Construção da tabela –
Variáveis discretas
j Classe 𝐹𝑗 𝐹𝑗
′
𝑓𝑗 𝑓𝑗
′
1 0 55 55 0,1571 0,1571
2 1 60 115 0,1714 0,3286
3 2 112 227 0,32 0,6486
4 3 82 309 0,2343 0,8829
5 4 31 340 0,0886 0,9714
6 5 8 348 0,0229 0,9943
7 6 2 350 0,0057 1,0000
Total (Σ) 350 - 1,0000 -
43. Tão importante quanto saber construir uma tabela é saber
interpretar os seus valores.
𝐹4 = 82 → significa que, das 350 propriedades rurais consultadas,
82 possuem três animais portadores de brucelose;
𝐹3
′
= 227 → significa que, das 350 propriedades rurais consultadas,
227 possuem menos de três animais portadores de brucelose;
𝑓2 = 0,1714 → significa que a proporção de propriedades rurais
que possuem apenas um animal portador de brucelose é de 0,1714
(em percentual: 17,14%);
𝑓5
′
= 0,9714 → significa que a proporção de propriedades rurais
com menos de quatro animais portadores de brucelose é de
0,9714 (em percentual: 97,14%).
43Construção da tabela –
Variáveis discretas
44. Construção da tabela-
Variáveis contínuas
Ao contrário das variáveis discretas, essas assumem, em
geral, muitos valores e, em sua grande maioria, diferentes
uns dos outros.
Para sanar problemas dessa natureza, as tabelas de
distribuição de frequências para variáveis contínuas são
construídas de modo que cada classe possua um intervalo
de valores da variável.
Obs.: Devemos observar que, no entanto, em algumas
situações pode acontecer de uma variável discreta também
assumir vários valores diferentes.
Nesses casos, também adotamos a formação de intervalos dos
dados discretos para uma melhor visualização da tabela.
44
45. A construção da tabela de variáveis contínuas:
1º passo: ordenar o conjunto de dados, ou seja, colocar os dados
brutos em sequência de grandeza (rol);
2º passo: determinar o número de classes da tabela.
Modo geral: 5 ≤ 𝑘 ≤ 15; 𝑜𝑛𝑑𝑒 𝑘 é 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑠𝑒𝑠.
Regras de determinação:
Regra empírica: 𝑛 ≤ 𝑘 ≤ 1,5 𝑛
Fórmula de Sturges:
𝑘 = 1 + 3,32 𝑥 log 𝑛 ; 𝑜𝑛𝑑𝑒:
𝑛 = 𝑜 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎çõ𝑒𝑠;
log 𝑛 = 𝑙𝑜𝑔𝑎𝑟í𝑡𝑖𝑚𝑜, 𝑛𝑎 𝑏𝑎𝑠𝑒 10, 𝑑𝑒 𝑛.
45
Construção da tabela-
Variáveis contínuas
46. 3º passo: determinar a amplitude do intervalo.
Utilizaremos a seguinte expressão:
𝑖 =
𝑎 𝑡
𝑘
i = amplitude do intervalo;
𝑎 𝑡 = ES – EI : amplitude total do conjunto de valores;
k = número de classes.
Convencionamos, também, que o arredondamento do
número de classes (k), ou na amplitude do intervalo (i) é
sempre feito pra cima.
46
Construção da tabela-
Variáveis contínuas
47. 4º passo: Construir os intervalos de classe.
O limite inferior sempre será o menor valor do conjunto de
dados ( 𝑥(1));
O limite superior será o limite inferior acrescido do valor da
amplitude do intervalo de classe (i);
Na sequência, o limite inferior da próxima classe será o limite
superior da classe anterior e o limite superior será esse limite
inferior acrescido da amplitude do intervalo.
47
Construção da tabela-
Variáveis contínuas
Número da classe (j) Classe
1 𝑥(1) 𝑥(1) + 𝑖
2 𝑥(1) + 𝑖 𝑥(1) + 2𝑖
... ...
K 𝑥(1) + (𝑘 − 1)𝑖 𝑥(1) + 𝑘𝑖
48. Em distribuições de frequência de variáveis contínuas,
geralmente existe o interesse em uma outra quantidade
conhecida como o ponto médio ou o centro da classe ( 𝑐𝑗).
A obtenção desse valor dá-se pela expressão:
𝑐𝑗 =
𝐸𝐼𝑗 + 𝐸𝑆𝑗
2
Onde:
𝐸𝐼𝑗 = extremo inferior da classe j
ESj = extremo superior da classe j
48
Construção da tabela-
Variáveis contínuas
49. Exemplo
Tomemos a seguinte variável:
X = peso ao nascer (em Kg) de 60 bovinos machos,
para qual os valores observados (e já ordenados)
foram:
16, 17, 17, 18, 18, 18, 19, 20, 20, 20, 20, 20, 21,
21, 22, 22, 23, 23, 23, 23, 23, 23, 23, 23, 23, 25,
25, 25, 25, 25, 25, 26, 26, 27, 27, 27, 27, 28, 28,
28, 29, 29, 29, 30, 30, 30, 30, 30, 30, 30, 31, 32,
33, 33, 33, 34, 34, 35, 36, 39.
49
Construção da tabela-
Variáveis contínuas
50. Sendo o peso uma variável contínua, não podemos
considerar cada valor sendo uma classe.
Este valor deverá ser determinado e, neste exemplo,
usaremos a fórmula de Sturges.
𝑘 = 1 + 3,32 𝑥 log 𝑛
𝑘 = 1 + 3,32 𝑥 log 60
𝑘 = 1 + 3,32 𝑥 1,778 = 6,9
Como o número de classe tem que ser um número inteiro,
teremos que arredondar o valor encontrado de forma a
obtermos 𝑘 = 7.
Arredondamento para cima, conforme convencionado
anteriormente.
50Resolução do Exemplo
51. Obtendo a amplitude dos intervalos:
𝑎 𝑡 = 𝐸𝑆 − 𝐸𝐼
𝑎 𝑡 = 39 − 16 = 23
Com isso, podemos calcular o (i):
𝑖 =
𝑎 𝑡
𝑘
=
23
7
= 3,2857 = 3,3
51Resolução do Exemplo
52. Construção dos intervalos de classe:
Sabendo-se que o menor valor do conjunto de
dados é 𝑥(1) = 16 , o número de classes é 𝑘 = 7 e
a amplitude do intervalo é 𝑖 = 3,3, temos assim a
tabela:
52Resolução do Exemplo
Número da classe (j) Classes
1 16,0 19,3
2 19,3 22,6
3 22,6 25,9
4 25,9 29,2
5 29,2 32,5
6 32,5 35,8
7 35,8 39,1
54. Algumas interpretações dessa tabela:
𝐹3 = 15 → significa que 15 dos 60 bovinos nasceram com
peso entre 22,6 e 25,9 Kg (exclusive);
𝐹5
′
= 52 → significa que 52 dos 60 bovinos nasceram com
peso entre 16,0 e 32,5 Kg (exclusive);
𝑓2 = 0,15 → significa que a proporção de bovinos que
nasceram com peso entre 19,3 e 22,6 Kg (exclusive) é de 0,15 (em
percentual: 15%);
𝑓6
′
= 0,9667 → significa que a proporção de bovinos com
peso entre 16,0 e 35,8 Kg (exclusive) é de 0,9667 (em
percentual: 96,67%).
54Resolução do Exemplo
55. EXERCÍCIOS PROPOSTOS
1- Os dados a seguir se referem ao números de pães não
vendidos em uma certa padaria até a hora do encerramento
do expediente:
0 0 4 2 0 1 0 2 0 4
1 0 0 3 2 0 1 0 0 0
2 0 0 1 0 0 3 2 1 7
0 1 0 0 2 0 0 3 2 1
Construa a distribuição de frequência para esses dados,
obedecendo todos os passos para a sua criação.
55
56. EXERCÍCIOS PROPOSTOS
2- Os dados abaixo, em rol, referem-se aos valores gastos (em reais)
pelas primeiras 50 pessoas que entraram em um determinado
supermercado, no dia 01/01/2000:
3,11 8,88 9,26 10,81 12,69 13,78 15,23 15,62 17,00 17,39
18,36 18,43 19,27 19,50 19,54 20,16 20,59 22,22 23,04 24,47
24,58 25,13 26,24 26,26 27,65 28,06 28,08 28,38 32,03 36,37
38,64 38,98 39,16 41,02 42,97 44,08 44,67 45,40 46,69 48,65
50,39 52,75 54,80 59,07 61,22 70,32 82,70 85,76 86,37 93,34
1º - O que é rol?
2º - Faça a distribuição de frequência desses dados.
56
57. Distribuição de frequências
Representação gráfica
Duas formas distintas e exclusivas:
Histograma;
Polígono de frequências.
Histograma
Conjunto de retângulos contíguos cuja base é igual a amplitude do
intervalo e a altura proporcional à frequência das respectivas classes.
Quando as variáveis são numéricas discretas os retângulos dão lugar a
retas.
Polígono de frequências
Segmentos de reta que unem os pontos cujas coordenadas são os
ponto médio e a frequência de cada classe;
É fechado porque usa uma classe anterior a primeira e uma posterior
a última (ambas possuem frequência igual a zero).
57
62. EXERCÍCIO PROPOSTO
Faça a representação gráfica
(histograma e polígono de
frequências, quando for o
caso) das distribuições de
frequências construídas nos
exercícios anteriores (1 e 2).
62
63. Tabelas de classificação
cruzada
Tabelas de frequência relativa a duas, ou mais,
variáveis, seja ela numérica ou categórica.
Distribuição conjunta de frequências.
Existe um número razoável de tipos de tabelas e
gráficos para esses casos.
63
64. Frequência cruzada de
variáveis categóricas
Conhecida, também, como tabela de dupla entrada, tabela de
associação ou tabela de contingência.
Mesmas regras das que foram utilizadas para a construção da tabela
simples.
Única diferença: a tabela agora apresenta duas, ou mais, margens, que são
os fatores (variáveis).
64
65. Frequência cruzada de
variáveis categóricas
A representação gráfica pode ser feita através de dois gráficos:
Gráficos bi-dimensionais (diagramas);
Gráficos tri-dimensionais (Estereogramas).
65
68. Frequência cruzada de
variáveis numéricas
As tabelas, nesse caso, são chamadas de tabelas de
correlação.
A idéia básica de montagem é semelhante à vista
anteriormente, para a tabela simples.
Primeiramente, classificamos as observações de uma
variável e, em seguida, dentro de cada classe da
primeira, classificamos a outra variável.
68
69. Frequência cruzada de
variáveis numéricas
Exemplo 1: Observamos a classificação dos 400 alunos do
Colégio C, segundo duas variáveis distintas: Nota em
Estatística e Nota em Matemática.
69
0 4 4 7 7 10
0 4 32 25 5 62
4 7 20 183 82 285
7 10 7 27 19 53
Totais 59 235 106 400
Estatística
Matemática
Totais
Tabela 4: Distribuição dos alunos do Colégio C, segundo suas notas em Estatística
e Matemática.
70. Frequência cruzada de
variáveis numéricas
Gráfico que melhor representa a situação anterior:
Histograma em três dimensões (Estereogramas).
Retângulos tornam-se paralelogramos;
É pouco utilizado em trabalhos científicos pela
dificuldade de execução e interpretação.
70
71. Frequência cruzada de
variáveis numéricas
Exemplo 2: Estudar a relação do peso dos pais e o peso dos
alunos. Foi realizada a medição de dez pais e dez alunos do
Colégio C
71
Tabela 5: Peso de 10 pais e o peso de seus respectivos filhos.
Observação (i) 1 2 3 4 5 6 7 8 9 10
Peso dos pais (xi) 78 65 86 68 83 68 75 80 82 66
Peso dos filhos (yi) 60 52 68 53 65 57 58 62 65 53
72. Frequência cruzada de
variáveis numéricas
Gráfico que melhor
representa a situação
anterior: Diagrama de
dispersão de pontos.
Fornece uma indicação do
tipo de relacionamento
entre as duas classes.
Nesta situação, a tendência
é que seja criada uma linha
reta.
Regressão linear.
72
50
52
54
56
58
60
62
64
66
68
70
60 65 70 75 80 85 90
PEsodosfilhos
Peso dos pais
Gráfico 1: Relação do peso dos pais e seus respectivos
filhos - Colégio C