Estatística descritiva: média, mediana, desvio-padrão e histogramas
1. Estatística
4º Período ADS
Prof. Aristóteles Meneses Lima
2. Frequência e Histogramas
• Imagine que você estava lendo uma revista
para descobrir o melhor lugar para se comer
algo;
• Imagine que você goste de Lámen, com isso,
você faz uma tabela de preços.
• Como será essa tabela?
4. Como podemos tornar essa tabela
mais significativa?
• Transformá-la em um gráfico;
• Para fazer um gráfico primeiro temos que dividir os
preços em grupos.
• Vamos supor que....
• Há um shopping center gigante composto de 50
restaurantes de Lámen...e somente restaurantes de
Lámen!
• Cada restaurante serve apenas um tipo de Lámen, e
os restaurante são distribuídos em diferentes pisos
de acordo com o preço do Lámen.
• Essa divisão de grupos é chamada de classe em
Estatística.
6. GUIA DE PISOS
PISO NOME DO RESTAURANTE MÉDIA DA CLASSE
>= <
5P XXX 950
900-1000
4P XXX 850
800-900 XXXXXXXXX
3P XXXXXXXXX 750
700-800 XXXXXXXXX
2P XXXX 650
600-700 XXXXXXXXX
1P XXXX 550
500-600
• EM CADA PISO, UMA PLACA INDICA O PREÇO CENTRAL DE CADA
CLASSE.
• O SEGUNDO PISO É A CLASSE DO INTERVALO ENTRE 600 E 700,
ONDE SE TEM UMA LOJA COM UMA PLACA DE 650.
• ISSO RECEBE O NOME PONTO MÉDIO DA CLASSE.
7. • Uma vez que este shopping center distribui
cada loja em um piso diferente de acordo com
o preço, o número de lojas em cada piso varia.
• O número de restaurantes em cada piso
recebe o nome de frequência.
• Agora, tente calcular a frequência relativa de
restaurantes no terceiro piso.
• Frequência Relativa é parecido com
porcentagem, é a proporção em relação ao
total, quando o total é considerado como 1.
8.
9. TABELA DE FREQUÊNCIA DOS 50 MELHORES RESTAURANTES DE LÁMEN
CLASSE MÉDIA DA CLASSE FREQUÊNCIA FREQUÊNCIA
RELATIVA
500-600 550 4 0,08
600-700 650 13 0,26
700-800 750 18 0,36
800-900 850 12 0,24
900-1000 950 3 0,06
SOMA 50 1,00
10. • Agora se descrevermos tudo isso usando um
gráfico de barras chamado HISTOGRAMA...
HISTOGRAMA (O EIXO VERTICAL É A
FREQUÊNCIA)
20
15
10 HISTOGRAMA (O
EIXO VERTICAL É A
FREQUÊNCIA)
5
0
550 650 750 850 950
11. HISTOGRAMA (O EIXO VERTICAL É A FREQUÊNCIA
RELATIVA)
0.4
0.35
0.3
0.25
0.2 HISTOGRAMA (O EIXO
VERTICAL É A
0.15
FREQUÊNCIA RELATIVA)
0.1
0.05
0
550 650 750 850 950
12.
13.
14.
15.
16.
17. Média (Valor Médio)
• Observe a tabela:
RESULTADO DO TORNEIO DE BOLICHE
EQUIPE A EQUIPE B EQUIPE C
Jogadora Pontuação Jogadora Pontuação Jogadora Pontuação
LUY-LUY 86 KIMIKO 84 SHINOBU 229
JUN 73 MEGUME 71 YUKA 77
YUMI 124 YOSHIMI 103 SAKURA 59
SHIZUKA 111 MEI 85 KANAKO 95
TOUKO 90 KAORI 90 KUMIKO 70
KAEDE 38 YUKIKO 89 HIRONO 88
• Você sabe o que é Valor Médio?
18.
19. • O Valor Médio é chamado de Média em
Estatística. E a média em questão agora é o
que chamamos de MÉDIA ARITMÉTICA, para
ser exato.
• Há outros tipos de Média, como MÉDIA
GEOMÉTRICA e MÉDIA HARMÔNICA, você não
precisa aprender as fórmulas agora, mas
sugiro que se lembre desses nomes.
20. Mediana
RESULTADO DO TORNEIO DE BOLICHE
EQUIPE A EQUIPE B EQUIPE C
Jogadora Pontuação Jogadora Pontuação Jogadora Pontuação
LUY-LUY 86 KIMIKO 84 SHINOBU 229
JUN 73 MEGUME 71 YUKA 77
YUMI 124 YOSHIMI 103 SAKURA 59
SHIZUKA 111 MEI 85 KANAKO 95
TOUKO 90 KAORI 90 KUMIKO 70
KAEDE 38 YUKIKO 89 HIRONO 88
• VAMOS DEIXAR DE LADO AS EQUIPES A E B E PRESTAR ATENÇÃO À EQUIPE C.
21. • A Mediana é o valos central quando se coloca
os valores em ordem do menor ao maior.
• Primeiro organizamos as pontuações de cada
equipe.
Equipe A
38 73 86 90 111 124
Equipe B
71 84 85 89 90 103
Equipe C
59 70 77 88 95 229
22. Dedução
• Número de Valores = Ímpar
-1041,6 -39,0 -5,7 60,4 77,3
MEDIANA
• Número de Valores=Par
-0,4 35,2 37,8 42,2 46,1 910,3
A MEDIANA É O VALOR MÉDIO
DESSES DOIS VALORES
24. Imagine
• Então, você já deve se perguntar porque a
“Poupança Média” anunciada nos jornais e na
tv é tão alta.
• A média é alta por causa de alguns
milionários.
• Nesses casos, a Mediana está bem mais
próxima das pessoas comuns.
25. Desvio-Padrão
• Equipes A e B
• Desenhe uma reta numérica e escreva os nomes
dos jogadores de acordo com suas pontuações.
EQUIPE A MÉDIA
LUY-LUY
KAEDE JUN TOUKO SHIZUK
YUMI
A
0 50 100
26. EQUIPE B
MÉDIA
KAORI
YUKIKO
MEI
KIMIKO
MEGUMI YOSHIMI
0 50 100
27. • Apesar de a pontuação média de cada equipe
ser de 87....
• As tendências descritas pelas linhas numéricas
são bem diferentes.
• O Desvio-Padrão é usado para descrever essa
dispersão dos dados.
• Em resumo, Desvio-Padrão é um indicador que
mostra a diferença da média de cada valor
nesse conjunto.
28. • O desvio-padrão mínimo é o zero, e na medida
que a “dispersão dos dados” aumenta, o
mesmo ocorre com o desvio-padrão.
0 (mínimo)
Sem dispersão
(todos os valores dispersos
são iguais)
32. De uma maneira geral...
• A primeira fórmula é aplicada quando se
calcula o Desvio-padrão de uma população
inteira.
• A segunda fórmula é usada quando se calcula
o Desvio-padrão de uma amostra.
33. Recapitulando....
• Se você acha que algo não ficou claro em
“Tabelas de distribuição de frequência e
histogramas”. Vamos rever uma tabela
apresentada.
TABELA DE FREQUÊNCIA DOS 50 MELHORES RESTAURANTES DE LÁMEN
CLASSE MÉDIA DA CLASSE FREQUÊNCIA FREQUÊNCIA
RELATIVA
500-600 550 4 0,08
600-700 650 13 0,26
700-800 750 18 0,36
800-900 850 12 0,24
900-1000 950 3 0,06
SOMA 50 1,00
34. • Como você pode ver, o intervalo de classe
nessa tabela é 100.
• O intervalo não foi determinado de acordo
com nenhum tipo padrão matemático – foi
definido de forma subjetiva. Determinar o
intervalo de classe cabe a quem está
analisando os dados.
• Há um jeito de definir o intervalo de classe
matematicamente.
• Usa-se a Regra de Sturges.
35.
36. Exercício
• A tabela seguinte é o registro de corrida de 100m de
várias meninas.
• Atleta Corrida de 100m
• A 16,3
• B 22,4
• C 18,5
• D 18,7
• E 20,1
1. Qual o valor médio?
2. Qual a mediana?
3. Qual é o desvio-padrão?
37. Resumo
• Para visualizar o panorama geral dos dados
intuitivamente, crie uma tabela de frequência ou
desenhe um histograma;
• Ao fazer uma tabela de frequência, o intervalo de
classe pode ser determinado pela regra de Sturges;
• Para visualizar os dados matematicamente, calcule
a média, mediana e o desvio-padrão;
• Quando há um valor muito grande ou pequeno no
conjunto de dados, é mais adequado utilizar a
mediana que a média aritmética.
• Desvio-padrão é um índice para descrever “o grau
de dispersão” dos dados.