Este documento fornece uma introdução aos conceitos básicos de estatística descritiva. Discute a distinção entre estatística descritiva e analítica, variáveis qualitativas e quantitativas, distribuição de frequências, medidas estatísticas e representação gráfica de dados. O documento serve como um guia para estudantes aprenderem os fundamentos da estatística descritiva.
3. Estatística: É um ramo da Matemática que nos
ajuda a recolher, a organizar e a interpretar dados
que através da utilização de métodos e técnicas
permitem-nos classificar os dados recolhidos e
reunir informações de modo a destacar o que é mais
importante.
www.joaoleal.net Professor: João José Leal 3
4. A Estatística, enquanto conjunto de métodos e técnicas
próprios para recolher, classificar (tratar), apresentar e interpretar
os dados, organiza-se em dois sub-conjuntos: a Estatística
Descritiva e a Estatística Analítica.
A Estatística Descritiva é o sub-conjunto da estatística que
se ocupa indistintamente de um universo ou de uma amostra, com
o intuito de os descrever, ou seja, dedica-se apenas à classificação
(tratamento), representação e redução de dados, podendo
compreender a análise dos mesmos, sempre que as conclusões não
respeitem a um conjunto maior do que o observado.
www.joaoleal.net Professor: João José Leal 4
5. Portanto, quando se torna necessário manusear e organizar
dados para os transformar em informação, é na Estatística
Descritiva que buscamos os métodos e as técnicas para realizar
essas actividades.
www.joaoleal.net Professor: João José Leal 5
6. Rotina de Abordagem da Fase Descritiva
1. Determinar a natureza da informação desejada para os fins que
se têm em vista;
2. Indagar se os dados já publicados - pelos serviços oficiais de
estatística ou outras entidades – contêm elementos de interesse:
Conhecer as principais fontes de dados estatísticos;
3. Citar as fontes a que se recorreu. Procurar as fontes originais,
tentando saber como foram apurados os dados e que fim
presidiu à sua recolha;
www.joaoleal.net Professor: João José Leal 6
7. 4. Se os dados pretendidos não estiverem disponíveis, há que
proceder à sua recolha, que terá um objectivo e um âmbito. Há
ainda a considerar a definição do:
– PLANO DE RECOLHA DOS DADOS: dados necessários e
suficientes e meios para os obter
– PROCESSO DE RECOLHA DOS DADOS
• Inquéritos exaustivos ou censos
• Inquéritos ou indagações parciais
• Sondagens ou inquéritos por amostragem
– MODO DE RECOLHA DOS DADOS
• Contínuo
• Periódico
• Ocasional
www.joaoleal.net Professor: João José Leal 7
8. 5. Obtidas as respostas, há que fazer a análise crítica dos dados,
verificando a verosimilhança das respostas e as suas falhas
(censura das respostas), eliminando as contraditórias ou
inexactas
6. Finalmente, há que tratar os dados (classificação) com vista à
sua representação: Quadros, Gráficos, Redução de Dados
www.joaoleal.net Professor: João José Leal 8
9. População/ Universo: Conjunto de todos os elementos
que vão ser objecto de estudo ou análise, que têm pelo
menos uma característica em comum.
Exemplo: Os alunos da Escola X.
www.joaoleal.net Professor: João José Leal 9
10. Amostra: É um subconjunto finito da população que se
supõe representativo desta. Ou seja, na impossibilidade
de se estudar todos os elementos da população efectua-
se um subconjunto finito da população.
Exemplo: Os alunos de uma determinada turma da
Escola X.
Unidade Estatística: É cada elemento da população ou
da amostra.
www.joaoleal.net Professor: João José Leal 10
11. Exercícios:
1. Para estimar a audiência de cada um dos quatro canais de
televisão, realizou-se um estudo a partir de 1000 famílias
portuguesas. Relativamente ao estudo indique:
a) a população;
b) a amostra;
c) a unidade estatística.
www.joaoleal.net Professor: João José Leal 11
12. 2. De entre os 3000 alunos de uma escola seleccionaram-se 60 e
inquiriram-se sobre o programa de televisão preferido.
Os resultados obtidos de dados, indique:
a) a população;
b) a amostra;
c) a unidade estatística.
www.joaoleal.net Professor: João José Leal 12
13. Censos ou Recenseamento: Num censo ou recenseamento são
observados todos os indivíduos da população relativamente aos
diferentes atributos que estão a ser objecto do estudo estatístico.
Sondagens: Numa sondagem, o estudo estatístico baseia-se numa
parte da população, isto é, numa amostra que deve ser representativa
dessa população.
Caracter (ou atributos ou variável): É um modo pelo qual eu vou
estudar a minha população, isto é, segundo uma determinada
característica.
Exemplo: Relativamente aos elementos de uma família, podemos observar: a altura; a
cor dos olhos; o sexo; a idade (em anos); etc.
www.joaoleal.net Professor: João José Leal 13
14. Atributos ou características de uma população
É o que se pretende conhecer quando se estuda uma
população.
população. Podem ser:
ser:
•Qualitativos:
Qualitativos: São aquelas que estão relacionadas com uma qualidade e se
apresentam com várias modalidades. Ou seja, não é possível a sua mensuração,
não é possível traduzi-los em números. Exemplo: O sexo (masculino, feminino); Cor
dos olhos (castanhos, verdes, azuis).
•Quantitativos:
Quantitativos: São aquelas a que é possível atribuir uma medida e
apresentam-se com diferentes intensidades ou valores. Isto é, são mensuráveis e
podem ser traduzidos por números. Exemplo: A altura; a idade (em anos).
www.joaoleal.net Professor: João José Leal 14
15. Dados
Os dados quantitativos de um atributo ou característica
podem ser discretos ou contínuos.
• Discretos se tomam um número finito ou infinito
numerável de valores.
• Contínuos se tomam um número infinito não-
não-
numerável de valores.
www.joaoleal.net Professor: João José Leal 15
16. Variável
É um símbolo que representa determinado atributo ou
característica de uma população.
Pode ser:
- discreta
- contínua
www.joaoleal.net Professor: João José Leal 16
17. Proporção
Permite avaliar o peso relativo de uma parte em relação a
um todo, e obtém-se através do quociente da parte pelo
todo.
Ex:
Relação entre desempregados e população activa; proporção de
activa;
observações com um determinado valor da característica
analisada e o total de observações realizadas.
realizadas
www.joaoleal.net Professor: João José Leal 17
18. Percentagem
Proporção, multiplicada por 100.
Ex:
A percentagem de desempregados é de 6,4%, ou seja, em 100
pessoas activas há 6,4 no desemprego.
www.joaoleal.net Professor: João José Leal 18
19. Taxa
Percentagem
Ex:
Ex:
Taxa de desemprego é de 6,4%. Traduz o peso da população
desempregada sobre o total da população activa; taxa de
activa;
abstenção foi de 21,3 %.
21,
Taxa de variação
Compara dois valores da mesma variável. Traduz o acréscimo
variável.
ou o decréscimo verificado relativamente a uma variável.
variável.
Ex:
A Taxa de variação mensal compara o nível de variação da variável
entre dois meses consecutivos.
www.joaoleal.net Professor: João José Leal 19
20. Em resultado da observação (em sentido amplo,
seja por visualização, medição, inquirição, etc.) das
etc.
unidades estatísticas que constituem os conjuntos alvos
da nossa atenção/interesse, os correspondentes dados
que se obtêm vêm “a granel”: rol de dados.
” dados.
www.joaoleal.net Professor: João José Leal 20
21. Exemplo 1: Relativamente a 50 motoristas que trabalham numa
empresa de transportes, observou-se a quantidade de acidentes
sofridos em serviço, donde se obtiveram os seguintes dados:
Estes dados apenas foram inscritos e listados pela ordem em
que foram sendo recolhidos, não tendo havido ainda qualquer
preocupação de representação, visando a facilitação da apreensão
das características do conjunto a que os dados se referem.
www.joaoleal.net Professor: João José Leal 21
22. Todavia, se tomarmos os dados anteriores e os tratarmos, poderemos
apresentá-los de uma forma muito mais “apelativa” e susceptível de permitir
a quem os aprecie uma percepção mais fácil das características do conjunto
a que respeitam
Atributo alvo
da observação
realizada sobre
o conjunto dos
motoristas
Frequências
Relativas
Acumuladas
Modalidades numéricas
(valores) assumidas pelo
atributo Qtd. de repetições Proporção de
Variável DISCRETA de cada repetições de cada
modalidade do Frequências
modalidade do Absolutas
atributo: atributo:
atributo: frequências
frequências Acumuladas
relativas simples
absolutas simples
www.joaoleal.net Professor: João José Leal 22
23. A um conjunto de elementos como os que se identificaram no quadro
anterior, chama-se Distribuição de Frequências.
chama- Frequências.
Ou seja, uma Distribuição de Frequências é uma associação de 1
atributo (ou mais), e o respectivo campo de variação, com as suas
frequências e os respectivos campos de frequências.
Se estamos a trabalhar apenas com 1 atributo, a distribuição diz-se
unidimensional. Se forem 2 atributos, será bidimensional; se forem
N, será N-dimensional.
www.joaoleal.net Professor: João José Leal 23
24. Distribuição de Frequências de acidentes sofridos por 50 motoristas
Neste caso estamos a trabalhar apenas com 1 atributo, a
distribuição diz-se unidimensional.
www.joaoleal.net Professor: João José Leal 24
25. O quadro estatístico é uma forma possível de representação
da distribuição de frequências, mas não é a única!
Freq. 20 Freq.
Absoluta Absoluta 50
15 46
11 35
4 20
0 1 2 3 Quant. Acid. 0 1 2 3 Quant. Acid.
Sofridos Sofridos
Temos assim os gráficos de frequências absolutas simples e
absolutas acumuladas.
www.joaoleal.net Professor: João José Leal 25
26. As frequências relativas são representadas com os
mesmos tipos de gráficos mas utilizando uma escala de
valores relativos no eixo das ordenadas
Na representação de dados que acabámos de
apreciar, o quadro e os gráficos estatísticos são típicos do
tratamento de uma variável discreta.
www.joaoleal.net Professor: João José Leal 26
27. Exemplo 2: Uma fábrica de parafusos pretende analisar a qualidade
da produção de uma determinada máquina e seleccionou uma
amostra de 100 parafusos produzidos por essa máquina, tendo
procedido à medição dos respectivos comprimentos, em milímetros,
donde obteve o seguinte rol de dados:
www.joaoleal.net Professor: João José Leal 27
28. Atributo Analisado:
Comprimento (em mm)
Tipo de Variável:
Variável Contínua
Modo de Representação:
Em Classes de Valores
www.joaoleal.net Professor: João José Leal 28
30. As medidas de estatística descritiva permitem:
representar um conjunto de dados de forma
resumida (Redução de Dados);
a comparação de diferentes distribuições.
As medidas descritivas designam-se por:
parâmetros (população)
estatísticas (amostra)
www.joaoleal.net Professor: João José Leal 30
31. As medidas descritivas dividem-se em:
Medidas de localização
Medidas de dispersão
Medidas de assimetria
Medidas de achatamento
Medidas de concentração
www.joaoleal.net Professor: João José Leal 31
32. Medidas de tendência central
Médias:aritmética
geométrica
harmónica
Mediana
Moda
Medidas de tendência não central
Quantis:Quartis
Quintis
…
Decis
…
Centis
…
Milis
www.joaoleal.net Professor: João José Leal 32
33. A média aritmética ( x ) é a soma de todos os valores observados, dividida
pela quantidade de observações.
Sendo, xk : Dados observados (k = 1, 2, 3, …, N)
N : Quantidade de observações
m : Quantidade de diferentes valores observados
ni : Frequência absoluta de cada valor observado xi
fi : Frequência relativa de cada valor observado xi
N
Fórmulas de cálculo:
x + x + ... + x x k
Dados Não Classificados : x = 1 2 N = k =1
N N m
n 1 x1 + n 2 x2 + … + n m xm nx i i
Dados Classificados : x = = i =1 =
N N
m
= fx
i =1
i i
www.joaoleal.net Professor: João José Leal 33
34. Exemplo 3: Relativamente a 50 motoristas que trabalham numa empresa de
transportes, observou-se a quantidade de acidentes sofridos em serviço…
www.joaoleal.net Professor: João José Leal 34
35. O valor da média aritmética não tem,
necessariamente, que ser algum dos valores
observados, mas tem de estar compreendido no
intervalo dos valores observados!
A média aritmética, corresponde ao valor que,
para o mesmo total do valor de todas as observações,
cada uma teria, se todas tivessem igual valor.
www.joaoleal.net Professor: João José Leal 35
36. Exemplo 4: Uma fábrica de parafusos seleccionou uma amostra de 100 parafusos
produzidos por uma máquina, tendo procedido à medição dos respectivos
comprimentos, em milímetros …
www.joaoleal.net Professor: João José Leal 36
37. Se já não tivermos acesso ao rol de dados, e estes estiverem
agrupados em classes, não podemos saber com rigor quais os
valores observados em cada classe. Nestas circunstâncias, a média
aritmética calcula-se por aproximação, estabelecendo a hipótese de
o valor de cada observação dentro da mesma classe ter valor igual
ao ponto central dessa classe (hipótese de tabulagem). À diferença
entre o verdadeiro valor da média aritmética (apurado a partir dos
dados das observações) e o valor da média aritmética que é apurado
desta forma, chama-se erro de tabulagem.
www.joaoleal.net Professor: João José Leal 37
38. A média geométrica (Mg) de N números positivos é a raiz de índice N do
produto desses números.
Sendo, xk : Dados observados (k = 1, 2, 3, …, N)
N : Quantidade de observações
m : Quantidade de diferentes valores observados
ni : Frequência absoluta de cada valor observado xi
fi : Frequência relativa de cada valor observado xi
Fórmulas de cálculo
N
Dados Não Classificados : Mg = N x1 . x2 … xN = N
x k
k=1
m nk
Dados Classificados : Mg = N x1 n1 2 …2 xmnm
.x n = N
xk
k=1
www.joaoleal.net Professor: João José Leal 38
39. Exemplo 5: Num determinado momento um indivíduo investiu
10.000 € numa aplicação financeira e manteve esse investimento
durante 3 anos, ao longo dos quais obteve diferentes taxas de
rentabilidade anuais, conforme exposto no quadro seguinte:
www.joaoleal.net Professor: João José Leal 39
40. Pretende calcular-se qual foi a taxa média anual de rentabilidade
que o indivíduo obteve, durante os 3 anos, com este investimento.
www.joaoleal.net Professor: João José Leal 40
41. A média harmónica ( Mh ) é o inverso da média aritmética dos
inversos dos valores observados.
Sendo, xk : Dados observados (k = 1, 2, 3, …, N)
N : Quantidade de observações
m : Quantidade de diferentes valores observados
ni : Frequência absoluta de cada valor observado xi
fi : Frequência relativa de cada valor observado xi
Fórmulas de cálculo
1
Dados Não Classificados : Mh =
1 N 1
N xk
.
k=1
1 1
Dados Classificados : Mh = 1 m
= m
ni
.
fi
N xi xi
i =1 i =1
www.joaoleal.net Professor: João José Leal 41
42. Exemplo 6: Em cada um de 3 anos, um indivíduo gastou 1000 € na
compra de um certo produto, nas condições descritas no quadro
seguinte:
Pretende calcular-se as médias por ano de cada uma das grandezas
envolvidas nesta questão: Gasto, Quantidade comprada e Preço.
www.joaoleal.net Professor: João José Leal 42
44. A mediana (Me) é o valor da variável que ocupa a posição central
na sucessão de observações ou na distribuição de frequências
depois de se colocar os dados por ordem.
Para observações de variável discreta, temos de verificar
previamente se a quantidade de observações é par ou ímpar:
* Se N for ímpar, então: Me será o elemento central de ordem [(N+1) / 2]
* Se N for par, então: Me será a média aritmética entre os elementos
centrais (de ordem N/2 e de [(N+2)/2] )
www.joaoleal.net Professor: João José Leal 44
45. Porém, dado que já aprendemos a representar distribuições
de frequências de variável discreta, também podemos apurar o valor
da mediana com recurso às respectivas funções cumulativas de
frequências acumuladas.
No caso de variável discreta, o valor da mediana será o valor
da variável que satisfaça simultaneamente as seguintes
desigualdades:
F(Me – ε ) ≤ 0,5 F(Me) ≥ 0,5
www.joaoleal.net Professor: João José Leal 45
46. Exemplo 7: Cálculo da Mediana (variável discreta)
Freq. Relativa
Distribuição de Frequências de acidentes Acum.
sofridos por 50 motoristas 1
0,92
0,70
0,40
0 1 2 3 Quant. Acid.
Sofridos
Temos uma quantidade par de observações: 50
Para x = 1, vem:
Ordenando as 50 observações, verifica-se
que a 25ª. e a 26ª. observações têm o F(1 – ε ) = 0,4 e F(1) = 0,7
valor 1, pelo que Me = 1
Pelo que Me = 1
www.joaoleal.net Professor: João José Leal 46
47. Para valores de variável contínua, agrupados em classes, o
cálculo da mediana faz-se do seguinte modo:
1.º - Calcula-se a ordem N/2.
2.º- Pelas frequências acumuladas identifica-se a classe que
contém a mediana e que será a classe mediana.
3.º - Calcula-se o valor exacto através de uma das seguintes
fórmulas:
www.joaoleal.net Professor: João José Leal 47
48. Frequências absolutas
Frequências relativas
Com
www.joaoleal.net Professor: João José Leal 48
49. Porém, dado que já aprendemos a representar distribuições
de frequências de variável contínua, também podemos apurar o
valor da mediana com recurso às respectivas funções cumulativas
de frequências acumuladas.
No caso de variável contínua, o valor da mediana será o valor
da variável que satisfaça a seguinte igualdade da função cumulativa
de frequências relativas:
F(Me) = 0,5
www.joaoleal.net Professor: João José Leal 49
50. Exemplo 8:
Distribuição de Frequências dos comprimentos (em mm)
de 100 parafusos produzidos por uma determinada máquina Frequências Relativas Acumuladas
1,20
1,00
0,80
Frequências
0,60
C
0,40 B D
A E
0,20
0,00
00
00
20
40
60
80
0
0
0
0
0
0
0
0
0
,0
,2
,4
,6
,8
,0
,2
,4
,0
0,
9,
9,
9,
9,
9,
10
10
10
10
10
11
11
11
-1
Comprimentos (em mm)
www.joaoleal.net Professor: João José Leal 50
51. Exemplo 9: Cálculo da Mediana (variável contínua)
C
0,50
B D
A E
1.º N/2 = 25
2.º A classe mediana é a de [55 – 65[
3.º Fórmula 1:
Fórmula 2:
www.joaoleal.net Professor: João José Leal 51
52. A moda (Mo) é a modalidade ou o valor do atributo mais frequente
na distribuição, isto é, o que mais observações apresenta.
Para distribuições de frequências de atributo qualitativo, ou
de atributo quantitativo de variável discreta, a moda encontra-se
por observação directa !
Para variáveis contínuas, é necessário identificar a classe
modal e depois aplicar alguma fórmula, como por exemplo, a
fórmula de King:
www.joaoleal.net Professor: João José Leal 52
53. Frequências absolutas
Frequências relativas
Com
www.joaoleal.net Professor: João José Leal 53
54. Outra fórmula empírica de localizar a moda (Mo) a partir da
identificação da classe modal, baseia-se na relação de
proporcionalidade de dois triângulos, conforme exemplificado na
imagem seguinte: nMo D F AB DE
=
BC FG
A B C
nMo-1 E com
AB = Mo - liMo
nMo+1 G BC = LiMo - Mo
DE = nMo – nMo-1
FG = nMo – nMo+1
Mo
liMo LiMo
Classe
Modal
www.joaoleal.net Professor: João José Leal 54
55. O apuramento do valor da moda pela fórmula de
King ou pela proporcionalidade dos triângulos
desenhados no interior da classe modal não tem que
dar exactamente o mesmo resultado, mas dá resultados
aproximados!
www.joaoleal.net Professor: João José Leal 55
56. Exemplo 10: Classes ni Ni fi Fi
35 - 45 5 5 0,10 0,10
45 - 55 10 15 0,20 0,30
55 - 65 16 31 0,32 0,62
65 - 75 12 43 0,24 0,86
75 - 85 4 47 0,08 0,94
85 - 95 3 50 0,06 1,00
Cálculo da Moda 50 1
Fórmula de King: Proporcionalidade dos triângulos:
0,6 Mo - 55
1.º Classe modal é a de [55 – 65[ =
0,4 65 - Mo
2.ºFórmula 1:
Fórmula 2: Mo = 61
www.joaoleal.net Professor: João José Leal 56