Estatística Descritiva

Ricardo Bruno - Universidade Federal do Pará
Ricardo Bruno - Universidade Federal do ParáProfessor Adjunto à Ricardo Bruno - Universidade Federal do Pará
CURSO DE ESTATÍSTICA I
Ricardo Bruno N. dos Santos
FACECON-PPGE (UFPA)
O Que é a Estatística?
• A Estatística originou-se com a coleta e construção de tabelas de
dados para o governo.
• A situação evoluiu e esta coleta de dados representa somente um
dos aspectos da Estatística.
• No século XIX, o desenvolvimento do cálculo de probabilidade e
outras metodologias matemáticas, tais como a técnica de Mínimos
Quadrados, foram fundamentais para o desenvolvimento da
Estatística
O Que é a Estatística?
• Somente no século XX a Estatística desenvolve-se como uma área
específica do conhecimento a partir do desenvolvimento da
Inferência Estatística; uma metodologia baseada em probabilidade
que tem ampla aplicação nas ciências experimentais.
• A Estatística hoje consiste num metodologia científica para
obtenção, organização e análise de dados, oriundos das mais variadas
áreas das ciência experimentais, cujo objetivo principal é auxiliar a
tomada de decisões em situações de incerteza.
O Que é a Estatística?
Etapa inicial da análise utilizada para descrever, organizar e
resumir os dados coletados.
A disponibilidade de uma grande quantidade de dados e de
métodos computacionais muito eficientes revigorou esta área da
Estatística.
O Que é a Estatística?
O que fazer com as observações
que coletamos?
6
QUALITATIVA
QUANTITATIVA
NOMINAL
ORDINAL
CONTÍNUA
DISCRETA
peso, altura, salário, idade
número de filhos, número de
carros
sexo, cor dos olhos
classe social, grau de instrução
Variável:
Qualquer característica associada a uma população.
Classificação das variáveis:
O Que é a Estatística?
7
Amplitude, Intervalo-Interquartil, Variância, Desvio
Padrão, Coeficiente de Variação.
MEDIDAS DE DISPERSÃO:
Mínimo, Máximo, Moda, Média, Mediana, Percentis
MEDIDAS DE POSIÇÃO:
O Que é a Estatística?
Medidas de posição: Medidas de Tendência
Central
Resumos numéricos são ferramentas importantes para descrever a
distribuição de uma variável quantitativa. Agora você vai trabalhar com
medidas de posição que, como o próprio nome indica, são medidas que
indicam a localização dos dados. O objetivo não é o cálculo das medidas,
mas, sim, explorar propriedades e relações entre três das principais
medidas de posição.
Média Aritmética Simples: é calculada somando-se os valores de todas
as observações e dividindo-se essa soma pelo número de observações.
Equivale a dividir o total das n observações em n partes iguais.
Mediana: é o valor que divide o conjunto de dados em duas partes tais
que abaixo e acima da mediana encontram-se 50% das observações. O
cálculo da mediana requer que os dados estejam ordenados. Se o número
de observações for ímpar, a mediana é o valor central; se o número de
observações for par, a mediana é a média dos dois valores centrais.
Medidas de posição: Medidas de Tendência
Central
Moda: é o valor mais frequente.
Média Amostral: A média amostral, aritmética, ou simplesmente
média, é calculada somando-se os valores das observações da
amostra e dividindo-se o resultado pelo número de valores. Assim, a
média amostral é dada por:
𝒙 =
𝒙𝒊
𝒏
Média Populacional: A média populacional é calculada somando-
se todos os valores da população e dividindo o resultado pelo total
de elementos da população. Numa população de elementos, a
média populacional é dada por
𝝁 =
𝒙𝒊
𝑵
Medidas de posição: Medidas de Tendência
Central
Mediana: Para calcular a mediana devemos, em primeiro lugar,
ordenar os dados do menor para o maior valor. Se o número de
observações for ímpar, a mediana será a observação central. Se o
número de observações for par, a mediana será a média aritmética
das duas observações centrais. Notação: 𝑥
Exemplo: Salários mensais iniciais para uma amostra de 12
graduados em Administração
Medidas de posição: Medidas de Tendência
Central
Percentis: Em estatística descritiva, o p-ésimo percentil Pk é o valor x (xk)
que corresponde à frequência cumulativa de 𝑛
𝑝
100
, onde n é o tamanho
amostral.
𝒊 =
𝒑
𝟏𝟎𝟎
𝒏
Calculando o p-ésimo percentil
1 – Arranje os dados na ordem ascendente (do menor para o maior)
2 – Calcule o índice 𝒊 =
𝒑
𝟏𝟎𝟎
𝒏
3 - (a) Se não for um inteiro, arredonde para cima. O próximo inteiro
maior que i expressará a posição do p-ésimo percentil.
- (b) Se i é impar, o p-ésimo percentil é a média dos valores dados nas
posições i e i+1
Medidas de posição: Medidas de Tendência
Central
Exemplo: para os dados de salários o 85º percentil será:
𝑖 =
85
100
12 = 10,2
Arredondando para mais teríamos então a 11ª posição.
Medidas de posição: Medidas de Tendência
Central
Quartis: Na estatística descritiva, um quartil é qualquer um dos
três valores que divide o conjunto ordenado de dados em quatro
partes iguais, e assim cada parte representa 1/4 da amostra ou
população.
Assim, no caso duma amostra ordenada,
primeiro quartil (designado por Q1/4) = quartil inferior = é o valor
aos 25% da amostra ordenada = 25º percentil
segundo quartil (designado por Q2/4) = mediana = é o valor até ao
qual se encontra 50% da amostra ordenada = 50º percentil, ou
5º decil.
terceiro quartil (designado por Q3/4) = quartil superior = valor a
partir do qual se encontram 25% dos valores mais elevados = valor
aos 75% da amostra ordenada = 75º percentil à diferença entre os
quartis superior e inferior chama-se amplitude inter-quartil.
Medidas de posição: Medidas de Tendência
Central
Exemplo 1:
Amostra: 6, 47, 49, 15, 42, 41, 7, 39, 43, 40, 36
Amostra ordenada: 6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49
Q1/4 = 15
Q2/4 = 40
Q3/4 = 43
Exemplo 2:
Amostra ordenada: 7, 15, 36, 39, 40, 41
Q1/4 = 15
Q2/4 = (39+36)/2 = 37.5
Q3/4 = 40
Medidas de posição: Medidas de Tendência
Central
Medidas de posição: Medidas de
Tendência CentralBox Plot (Diagrama de Caixa)
Em estatística descritiva, diagrama de caixa, ou boxplot, box plot, é um gráfico
no qual o:
- eixo vertical representa a variável a ser analisada;
- eixo horizontal um fator de interesse.
O diagrama de caixa é uma ferramenta para localizar e analisar a variação de
uma variável dentre diferentes grupos de dados.
O diagrama de caixa procura obter as seguintes informações:
- Calcular a mediana e os quartis ( o quartil inferior contém 25% ( 1/4) das
menores medidas e o quartil superior contém 75 ( 3/4) de todas as medidas);
- Plotar um símbolo onde se localiza a mediana e uma caixa, daí o nome de
diagrama de caixas, onde a base representa o quartil inferior ( 25% ou 1/4) dos
menores valores), e o topo da caixa o quartil superior (75% ou 3/4) dos valores
observados. A caixa portanto representa 50% de todos os os valores observados
,concentrados na tendência central dos valores, eliminando os 25% menores
valores e 25% maiores valores ( 75% - 25% = 50%);
- Um segmento de reta vertical conecta o topo da caixa ao maior valor
observado e outro segmento conecta a base da caixa ao menor valor observado,
este segmento denomina-se Whisker, ou fio de bigode.
Estatística Descritiva
Medidas de posição: Medidas de Tendência
Central
Média Geométrica: Este tipo de média é calculada multiplicando-
se todos os valores e extraindo-se a raiz de índice n deste produto.
Digamos que tenhamos os números 4, 6 e 9, para obtermos o
valor médio aritmético deste conjunto, multiplicamos os elementos
e obtemos o produto 216. Pegamos então este produto e extraímos
a sua raiz cúbica, chegando ao valor médio 6.
Extraímos a raiz cúbica, pois o conjunto é composto de 3
elementos. Se fossem n elementos, extrairíamos a raiz de índice n.
Neste exemplo teríamos a seguinte solução
𝑮 =
𝒊=𝟏
𝒏
𝒙𝒊
𝟏
𝒏
= 𝒙 𝟏 𝒙 𝟐
.
. . 𝒙 𝒏
𝟏
𝒏 = 𝒏
𝒙 𝟏 𝒙 𝟐 … 𝒙 𝒏
Medidas de posição: Medidas de Tendência
Central
Média Harmônica: é o número de membros dividido pela soma
do inverso dos membros
𝐻 =
1
𝑛
𝑖=1
𝑛
𝑥𝑖
−1
−1
Pode-se então estabelecer que:
𝐻 ≤ 𝐺 ≤ 𝑥
A origem das médias
Arquitas de Tarento, um matemático pitagórico que viveu por volta
de 400 a.C., definiu que existiam três tipos de média. Um número é
a média aritmética de dois outros quando o excesso do primeiro
para o segundo é igual ao excesso do segundo para o terceiro,
a média geométrica quando a proporção do segundo para o terceiro
é igual à proporção do primeiro para o segundo, e a média
harmônica quando a quantidade que o primeiro excede o segundo
em relação ao primeiro é igual à quantidade que o segundo excede o
terceiro em relação ao terceiro; em notação moderna, sendo o
primeiro x, o segundo m e o terceiro y (x > m > y > 0):
A origem das médias
Logo
MEDIDAS DE DISPERSÃO
Medidas de dispersão
As medidas de posição apresentadas fornecem a informação dos
dados apenas a nível pontual, sem ilustrar outros aspectos
referentes à forma como os dados estão distribuídos na amostra.
As medidas de dispersão são utilizadas para avaliar o grau de
variabilidade, ou dispersão, dos valores em torno da média.
Medidas de dispersão
Qual a importância das medidas de dispersão na prática?
Vejamos o exemplo das notas de três turmas (A, B e C)
Essa tabela será o nosso mote para no final avaliar qual foi a
melhor turma.
Turma A Turma B Turma C
4 5 2
5 6 3
6 6 8
7 6 8
8 7 9
Medidas de dispersão
Amplitude total: é a diferença entre o menor e o maior valor
observado.
𝑨𝑻 = 𝑿𝒊 𝒎𝒂𝒙 − 𝑿𝒊 𝒎𝒊𝒏
Verifica-se que a amplitude como medida de dispersão é limitada.
Essa medida só depende dos valores extremos, ou seja, não é
afetada pela dispersão dos valores internos.
Quais os resultados para as notas das turmas?
Amplitude interquartil: é a diferença entre o terceiro quartil e o
primeiro.
Medidas de dispersão
Variância: A variância de um conjunto de dados (amostra ou
população) é uma medida de “VARIABILIDADE ABSOLUTA”. Ela mede
a variabilidade do conjunto em termos de desvios quadrados em
relação à média aritmética. É uma quantidade sempre NÃO
NEGATIVA e expressa em unidades quadradas do conjunto de dados,
sendo de difícil interpretação.
𝜎2 =
𝑖=1
𝑛
𝑥𝑖 − 𝜇 2
𝑁
𝑠2 =
𝑖=1
𝑛
𝑥𝑖 − 𝑥 2
𝑛 − 1
Populacional
Amostral
Medidas de dispersão
Desvio Padrão: É uma outra medida de dispersão mais
comumente empregada do que a variância, por ser expressa na
mesma unidade de medida do conjunto de dados. Mede a
"DISPERSÃO ABSOLUTA" de um conjunto de valores e é obtida a
partir da variância. Trata-se da raiz quadrada da variância
𝜎 = 𝑖=1
𝑛
𝑥𝑖 − 𝜇 2
𝑁
𝑠 = 𝑖=1
𝑛
𝑥𝑖 − 𝑥 2
𝑛 − 1
Medidas de dispersão
Coeficiente de variação: É uma medida de “VARIABILIDADE
RELATIVA”, útil para comparar a variabilidade de observações com
diferentes unidades de medida.
𝑐𝑣 =
𝜎
𝑥
(100)
Medidas de dispersão
Medidas de dispersão
Vamos avaliar qual a melhor Turma. Na sua opinião qual turma é
melhor.
Medidas de dispersão
Vamos usar:
Excel
R
Estatística Descritiva
Distribuição de Frequências
Organização dos dados: Os métodos utilizados para organizar
dados compreendem o arranjo desses dados em subconjuntos que
apresentem características similares.
mesma idade (ou “faixa etária”), mesma finalidade, mesma escola,
mesmo bairro, etc
Os DADOS AGRUPADOS podem ser resumidos em tabelas ou
gráficos e, a partir desses, podemos obter as estatísticas descritivas
já definidas: média, mediana, desvio, etc.
Dados organizados em grupos ou categorias/classes são
usualmente designados “DISTRIBUIÇÃO DE FREQUÊNCIA”.
Distribuição de Frequências
Uma distribuição de frequência é um método de se agrupar dados
em classes de modo a fornecer a quantidade (e/ou a percentagem)
de dados em cada classe.
Com isso, podemos RESUMIR e VISUALIZAR um conjunto de
dados sem precisar levar em conta os valores individuais.
Construindo assim uma SÍNTESE dos DADOS QUANTITATIVOS.
Uma distribuição de frequência (absoluta ou relativa ) pode ser
apresentada em TABELAS ou GRÁFICOS.
Distribuição de Frequências
Uma distribuição de frequência agrupa os dados por classes de
ocorrência, resumindo a análise de conjunto de dados grandes.
Tipos de Frequência
Simples
Absolutas
Relativas
Acumuladas
Crescente
Absolutas
Relativas
Decrescente
Absolutas
Relativas
Distribuição de Frequências
Eventos Altura
Aluno1 1,60
Aluno2 1,69
Aluno3 1,72
Aluno4 1,73
Aluno5 1,73
Aluno6 1,74
Aluno7 1,75
Aluno8 1,75
Aluno9 1,75
Aluno10 1,75
Aluno11 1,75
Aluno12 1,76
Aluno13 1,78
Aluno14 1,80
Aluno15 1,82
Aluno16 1,82
Aluno17 1,84
Aluno18 1,88
Distribuição de Frequências
Como construir uma distribuição de frequência a partir dessas
informações?
Primeiro reduzir o número de linhas da tabela, para isso temos
que calcular o NÚMERO DE CLASSES.
O Número de classes pode ser representado pela letra (k). Para o
cálculo do número de classes pode-se utilizar algumas regras como:
1) Regra de Sturges (Regra do Logaritmo)
𝑘 = 1 + 3,3log(𝑛)
2) Regra da Raiz Quadrada
𝑘 = 𝑛
3) Bom Senso!
Podemos decidir qual o melhor número de classes, muitos afirmam
que devemos ter classes entre os tamanhos 5 a 20.
Distribuição de Frequências
Distribuição de Frequências
Existem várias maneiras de apresentarmos o intervalo de classes: iguais
ou diferentes entre si. Porém, sempre que possível, deveremos optar por
intervalos iguais, o que facilitará os cálculos posteriores. Mas mesmo com
intervalos iguais, as distribuições poderão apresentar-se da seguinte
forma:
0 -- 10: compreende todos os valores entre 0 e 10, exclusive os
extremos.
0 |--|10: compreende todos os valores entre 0 e 10, inclusive os
extremos.
0 --|10: compreende todos os valores entre 0 e 10, inclusive o 10 e
exclusive o 0.
010: compreende todos os valores entre 0 e 10, inclusive o 0 e
exclusive o 10.
Como optaremos por este último tipo (010), pode-se definir como
intervalo de classe a diferença entre o limite superior e o limite inferior da
classe. Portanto, no exemplo, 10 – 0 = 10 é o intervalo ou amplitude da
classe que será representado pela letra h.
Distribuição de Frequências
Largura das classes (amplitude das classes (h)): É a segunda etapa
da construção de uma distribuição de frequência para dados
quantitativos. Recomenda-se que a largura seja a mesma para cada
uma das classes.
𝐿𝑎𝑟𝑔𝑢𝑟𝑎 𝐴𝑝𝑟𝑜𝑥𝑖𝑚𝑎𝑑𝑎 𝑑𝑒 𝐶𝑙𝑎𝑠𝑠𝑒 =
𝑀á𝑥𝑖𝑚𝑜 − 𝑀í𝑛𝑖𝑚𝑜
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑠𝑒𝑠
Para o exemplo das alturas temos:
1,88−1,60
5
= 0,056
Que arredondando transforma-se em 0,06
Distribuição de Frequências
Obs. 1: Na amplitude das classes (h), observe que aumentamos
uma unidade, não seguindo, portanto, as regras de arredondamento.
Esta é uma regra que deve ser sempre seguida no cálculo da
amplitude da classe. Você saberia me dizer por quê?
Obs. 2: Deve-se conservar o número de casas decimais dos dados
observados. Por exemplo, se os dados se referem à massa de
indivíduos em kg e forem expressos com uma casa após a vírgula
(por exemplo, 60,5 kg), então a amplitude deverá ter uma casa após
a vírgula.
Obs. 3: Usando o bom-senso e a experiência, poderá ser
conveniente , quando possível, a utilização da amplitude de um
intervalo de classe igual a 10 ou 5, facilitando as operações
posteriores.
Distribuição de Frequências
Para os dados das alturas teremos:
1,59 --| 1,66
1,66 --| 1,72
1,72 --| 1,78
1,78 --| 1,84
1,84 --| 1,90
Distribuição de Frequências
Ponto Médio das Classes (𝑿𝒊): É a média aritmética entre o limite
superior e o limite inferior da classe. Assim, se a classe for 0--|10,
teremos
0+10
2
= 5, que será o ponto médio da classe.
Limites de Classe: São os números extremos de cada intervalo:
sendo assim, temos um limite inferior e um superior. Se a primeira
classe tiver um intervalo de notas de 0 até 10, o 0 será o limite
inferior enquanto que o 10 será o limite superior desta classe.
Distribuição de Frequências
Frequência Acumulada (𝑭𝒊): Corresponde à soma das freqüências
de determinada classe com as anteriores. No exemplo, vejamos
como fica a frequência acumulada de cada classe:
Altura Fi
1,59 --| 1,66 1
1,66 --| 1,72 2
1,72 --| 1,78 10
1,78 --| 1,84 4
1,84 --| 1,90 1
Total 18
Distribuição de Frequências
Frequência relativa ( 𝒇𝒊 ):Corresponde ao quociente entre a
freqüência absoluta da classe e o total de elementos.
𝑓𝑖 =
𝑓𝑖
𝑛
Altura Fi fi
1,59 --| 1,66 1 0,06
1,66 --| 1,72 2 0,11
1,72 --| 1,78 10 0,56
1,78 --| 1,84 4 0,22
1,84 --| 1,90 1 0,06
Total 18 1,00
Distribuição de Frequências
Distribuições cumulativas: São as somas das ocorrências de dados
cumulativamente às classes. Também é importante mostrar os
termos em percentuais tanto na relativa quanto na acumulada
Altura Fi fi %fi FA %FA
1,59 --| 1,66 1 0,06 5,56 0,06 5,56
1,66 --| 1,72 2 0,11 11,11 0,17 16,67
1,72 --| 1,78 10 0,56 55,56 0,72 72,22
1,78 --| 1,84 4 0,22 22,22 0,94 94,44
1,84 --| 1,90 1 0,06 5,56 1,00 100,00
Total 18 1,00 100,00
Distribuição de Frequências
Gráficos: Histograma: Também conhecido como Distribuição de
Frequências ou Diagrama das Frequências, é uma representação gráfica na
qual um conjunto de dados é agrupado em classes uniformes,
representado por um retângulo cuja base horizontal são as classes e seu
intervalo e a altura vertical representa a frequência com que os valores
desta classe estão presente no conjunto de dados . É uma das Sete
Ferramentas da Qualidade. O histograma é um gráfico composto por
retângulos justapostos em que a base de cada um deles corresponde ao
intervalo de classe e a sua altura à respectiva frequência. Quando o
número de dados aumenta indefinidamente e o intervalo de classe tende a
zero, a distribuição de frequência passa para uma distribuição de
densidade de probabilidades. A construção de histogramas tem caráter
preliminar em qualquer estudo e é um importante indicador da
distribuição de dados. Podem indicar se uma distribuição aproxima-se de
uma FUNÇÃO NORMAL, como pode indicar mistura de populações quando
se apresentam bimodais.
Distribuição de Frequências
Passos para a construção do histograma:
1) Na abscissas, distribua as classes
2) Na ordenada da esquerda, as frequências absolutas
3) Construa um gráfico de barras para as frequências
4) Construa um gráfico de linha para a frequência acumulada
(utilize a escala da direita)
Distribuição de Frequências
Distribuição de Frequências
Ogivas
0
5
10
15
20
1,59 --| 1,66 1,66 --| 1,72 1,72 --| 1,78 1,78 --| 1,84 1,84 --| 1,90
Distribuição de Frequências
Gráfico de Pizza
Distribuição de Frequências
Média Ponderada de uma Frequência:
𝒙 =
𝑭𝒊 𝒙
𝒇
Onde:
𝒙 – Ponto Médio da Classe
𝒇𝒊 - Frequência acumulada
𝒇 - n
Distribuição de Frequências
Altura Fi fi %fi FA %FA
Ponto
Médio
x*fi
1,59 1,65 1 0.06 5.56 0.06 5.56 1,62 1.62
1,65 1,71 1 0.06 5.56 0.11 11.11 1,68 1.68
1,71 1,77 10 0.56 55.56 0.67 66.67 1,74 17.4
1,77 1,83 4 0.22 22.22 0.89 88.89 1,80 7.2
1,83 1,89 2 0.11 11.11 1.00 100.00 1,86 3.72
Total 18 1,00 100,00 8,75 31,62
Média 1,7564
Média
real
1,7589
Distribuição de Frequências
Podemos além da média, encontrar a mediana e a moda para
distribuições de frequência, bem como a variância e o desvio padrão.
Distribuição de Frequências
Para dados agrupados em intervalos de classes, você pode calcular
a moda por meio do método de Czuber, que se baseia na influência
das classes adjacente na moda deslocando-se no sentido da classe
de maior frequência. A expressão que você utilizará é:
𝑀𝑜 = 𝐿𝑖 +
𝑑1
𝑑1 + 𝑑2
× 𝑐
Li : limite inferior da classe modal;
𝑑1 : diferença entre a frequência da classe modal e a
imediatamente anterior;
𝑑2 : diferença entre a frequência da classe modal e a
imediatamente posterior; e
c : amplitude da classe modal
Para a tabela de alturas temos: 1.71 +
9
9+6
× 0,06 = 1,746 ≅ 1,75
Distribuição de Frequências
Quando os dados estão agrupados na mediana, devemos
encontrar a classe mediana. Se os dados estão agrupados em
intervalos de classe, como no caso do número de casa por rua,
utilizaremos a seguinte expressão:
𝑀𝑑 = 𝑙𝑖 +
𝑛
2
− 𝑓𝑎𝑛𝑡𝑎𝑐
𝑓 𝑚𝑒𝑑
× 𝑐
li : limite inferior da classe mediana;
n : número total de elementos;
𝑓𝑎𝑛𝑡𝑎𝑐 : frequência acumulada anterior à classe mediana;
𝑓 𝑚𝑒𝑑 : frequência absoluta da classe mediana; e
c: amplitude da classe mediana.
Distribuição de Frequências
Porém é importante definir a classe mediana, para tanto devemos
usar a seguinte fórmula (n/2) para definir a classe mediana
Utilizando os dados das alturas teremos:
Classe mediana =
18
2
= 9 logo temos que examinar o 9º
elemento, onde o mesmo se encontra na classe 1,71--|1,77
Aplicando a fórmula da mediana temos:
𝑀𝑑 = 1,71 +
18
2
− 0,11
10
× 0,06 = 1,763 ≅ 1,76
Distribuição de Frequências
Em um conjunto de dados, a mediana, a moda e a média não
necessariamente devem apresentar o mesmo valor. Uma informação
importante é que a mediana não é influenciada pelos valores
extremos. Comparando os resultados encontrados para uma
amostra em relação às medidas de posição estudadas e verificando a
inter-relação entre elas, você pode concluir que seus valores podem
nos dar um indicativo da natureza da distribuição dos dados, em
função das regras definidas pela Figura seguinte:
Distribuição de Frequências
Distribuição de Frequências
Com relação a Variância para dados agrupados em classes, pode-se utilizar a
seguinte expressão a partir dos desvio padrão:
𝑠 =
1
𝑛 − 1
𝑖=1
𝑛
𝑥𝑖 − 𝑥 2 𝑓𝑎
Onde
n – Nº de Observações
𝑥𝑖 − 𝑥 2 - Os desvios em torno da média ao quadrado. Onde 𝑥𝑖 são os pontos
médios de cada classe;
𝑓𝑎 - Frequências absolutas de cada classe.
Para as alturas temos:
𝑠 =
1
18 − 1
{ 1,62 − 1,76 2 × 1 + 1,68 − 1,76 2 × 1 + 1,74 − 1,76 2 × 10 + 1,8 − 1,76 2 × 4 + [ 1,86 − 1,76 2 × 2]
s=0,058
𝑠2
= 0,03
1 sur 60

Recommandé

Estatistica descritiva par
Estatistica descritiva Estatistica descritiva
Estatistica descritiva Geisla Maia Gomes
5.1K vues21 diapositives
Estatística par
EstatísticaEstatística
Estatísticaaldaalves
68.7K vues87 diapositives
Medidas de tendencia central par
Medidas de tendencia centralMedidas de tendencia central
Medidas de tendencia centralrosania39
6.5K vues41 diapositives
Fórmulas estatística - medidas - central e dispersão par
Fórmulas   estatística - medidas - central e dispersãoFórmulas   estatística - medidas - central e dispersão
Fórmulas estatística - medidas - central e dispersãomarioferreiraneto
51.4K vues23 diapositives
Estatística básica par
Estatística básicaEstatística básica
Estatística básicaHoracimar Cotrim
2.1K vues43 diapositives
Estatística básica par
Estatística básicaEstatística básica
Estatística básicaJose_ferreira
14.4K vues25 diapositives

Contenu connexe

Tendances

Probabilidade e estatística - Variáveis Aleatórias par
Probabilidade e estatística - Variáveis AleatóriasProbabilidade e estatística - Variáveis Aleatórias
Probabilidade e estatística - Variáveis AleatóriasLucas Vinícius
4.9K vues47 diapositives
Moda, Média e Mediana par
Moda, Média e MedianaModa, Média e Mediana
Moda, Média e MedianaJuliana Perleto
96.6K vues10 diapositives
Estatística par
EstatísticaEstatística
EstatísticaLiliana Carvalho
23.4K vues12 diapositives
Conceitos Básicos de Estatística II par
Conceitos Básicos de Estatística IIConceitos Básicos de Estatística II
Conceitos Básicos de Estatística IIVitor Vieira Vasconcelos
11.4K vues38 diapositives
Estatística Básica - Ensino médio, concursos, 6 Sigma, Qualidade par
Estatística Básica - Ensino médio, concursos, 6 Sigma, QualidadeEstatística Básica - Ensino médio, concursos, 6 Sigma, Qualidade
Estatística Básica - Ensino médio, concursos, 6 Sigma, QualidadeHoracimar Cotrim
7.6K vues51 diapositives

Tendances(20)

Probabilidade e estatística - Variáveis Aleatórias par Lucas Vinícius
Probabilidade e estatística - Variáveis AleatóriasProbabilidade e estatística - Variáveis Aleatórias
Probabilidade e estatística - Variáveis Aleatórias
Lucas Vinícius4.9K vues
Estatística Básica - Ensino médio, concursos, 6 Sigma, Qualidade par Horacimar Cotrim
Estatística Básica - Ensino médio, concursos, 6 Sigma, QualidadeEstatística Básica - Ensino médio, concursos, 6 Sigma, Qualidade
Estatística Básica - Ensino médio, concursos, 6 Sigma, Qualidade
Horacimar Cotrim7.6K vues
Modelo de regressão linear: aspectos teóricos e computacionais par Rodrigo Rodrigues
Modelo de regressão linear: aspectos teóricos e computacionais Modelo de regressão linear: aspectos teóricos e computacionais
Modelo de regressão linear: aspectos teóricos e computacionais
Rodrigo Rodrigues16.5K vues
Desvios médios, variância e desvios padrões par Gabriel Passeri
Desvios médios, variância e desvios padrõesDesvios médios, variância e desvios padrões
Desvios médios, variância e desvios padrões
Gabriel Passeri205.8K vues
Estatistica aplicada exercicios resolvidos manual tecnico formando par Antonio Mankumbani Chora
Estatistica aplicada exercicios resolvidos manual tecnico formandoEstatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formando
Aula 1 introdução e estatística descritiva par Rodrigo Rodrigues
Aula 1   introdução e  estatística descritivaAula 1   introdução e  estatística descritiva
Aula 1 introdução e estatística descritiva
Rodrigo Rodrigues2.3K vues
Porcentagem par Letinha47
PorcentagemPorcentagem
Porcentagem
Letinha4748.4K vues
Distribuição de frequencia par Asafe Salomao
Distribuição de frequenciaDistribuição de frequencia
Distribuição de frequencia
Asafe Salomao11.6K vues
amostragem par socram01
amostragemamostragem
amostragem
socram0115.2K vues
Distribuição normal par joseagrosa
Distribuição normalDistribuição normal
Distribuição normal
joseagrosa61.9K vues

En vedette

Estatística - Aula 2 - Estatística descritiva par
Estatística - Aula 2 - Estatística descritivaEstatística - Aula 2 - Estatística descritiva
Estatística - Aula 2 - Estatística descritivaHelder Lopes
35.8K vues26 diapositives
estatis par
estatisestatis
estatisLiliana
848 vues8 diapositives
Estatística 10 Ano par
Estatística 10 Ano Estatística 10 Ano
Estatística 10 Ano João Afonso Pires
16.4K vues19 diapositives
Probabilidade história par
Probabilidade históriaProbabilidade história
Probabilidade históriamarinaforcato
19.2K vues7 diapositives
Distribuição normal par
Distribuição normalDistribuição normal
Distribuição normalRicardo Bruno - Universidade Federal do Pará
9.4K vues31 diapositives
Tópico 4 regressão linear simples 02 par
Tópico 4   regressão linear simples 02Tópico 4   regressão linear simples 02
Tópico 4 regressão linear simples 02Ricardo Bruno - Universidade Federal do Pará
3K vues50 diapositives

En vedette(20)

Estatística - Aula 2 - Estatística descritiva par Helder Lopes
Estatística - Aula 2 - Estatística descritivaEstatística - Aula 2 - Estatística descritiva
Estatística - Aula 2 - Estatística descritiva
Helder Lopes35.8K vues
estatis par Liliana
estatisestatis
estatis
Liliana848 vues
Probabilidade história par marinaforcato
Probabilidade históriaProbabilidade história
Probabilidade história
marinaforcato19.2K vues
Genética probabilidade slides par Fabiano Reis
Genética probabilidade slidesGenética probabilidade slides
Genética probabilidade slides
Fabiano Reis9.2K vues
IESB Logística Empresarial - Métodos Quantitativos - Volume I par Rafael José Rorato
IESB Logística Empresarial - Métodos Quantitativos - Volume IIESB Logística Empresarial - Métodos Quantitativos - Volume I
IESB Logística Empresarial - Métodos Quantitativos - Volume I
Retas e planos no espaço: Geometria de Posição par Bruno Cavalcanti
Retas e planos no espaço: Geometria de PosiçãoRetas e planos no espaço: Geometria de Posição
Retas e planos no espaço: Geometria de Posição
Bruno Cavalcanti15.6K vues
Tabela de distribuição de frequências para variáveis quantitativas contínuas.... par Alberto Tchivinda
Tabela de distribuição de frequências para variáveis quantitativas contínuas....Tabela de distribuição de frequências para variáveis quantitativas contínuas....
Tabela de distribuição de frequências para variáveis quantitativas contínuas....
Alberto Tchivinda19.9K vues
Probabilidade resolvidos par resolvidos
Probabilidade resolvidosProbabilidade resolvidos
Probabilidade resolvidos
resolvidos33.2K vues
Aula 01: Conceitos básicos de Estatística par Josimar M. Rocha
Aula 01: Conceitos básicos de EstatísticaAula 01: Conceitos básicos de Estatística
Aula 01: Conceitos básicos de Estatística
Josimar M. Rocha18.3K vues
Cap2 - Parte 5 - Medidas Para Dados Agrupados par Regis Andrade
Cap2 - Parte 5 - Medidas Para Dados AgrupadosCap2 - Parte 5 - Medidas Para Dados Agrupados
Cap2 - Parte 5 - Medidas Para Dados Agrupados
Regis Andrade71.1K vues
Exemplo de cálculo média,moda e mediana com distribuição frequencia par Renato Ribeiro Soares
Exemplo de cálculo média,moda e mediana com distribuição frequenciaExemplo de cálculo média,moda e mediana com distribuição frequencia
Exemplo de cálculo média,moda e mediana com distribuição frequencia

Similaire à Estatística Descritiva

Organização tratamento de_dados par
Organização tratamento de_dadosOrganização tratamento de_dados
Organização tratamento de_dadosHelena Borralho
2.8K vues37 diapositives
Aula de Estatística Básica -Aula 4 par
Aula de Estatística Básica -Aula  4Aula de Estatística Básica -Aula  4
Aula de Estatística Básica -Aula 4Luiz Martins Souza
5.6K vues52 diapositives
XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz] par
XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz]XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz]
XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz]Dafmet Ufpel
1.6K vues78 diapositives
Probabilidade e Estatística - Aula 03 par
Probabilidade e Estatística - Aula 03Probabilidade e Estatística - Aula 03
Probabilidade e Estatística - Aula 03Augusto Junior
2.6K vues68 diapositives
Estatística completa par
Estatística completaEstatística completa
Estatística completaRonne Seles
68.4K vues139 diapositives
Estatisticas petrobras par
Estatisticas petrobrasEstatisticas petrobras
Estatisticas petrobrasMárcia Teixeira
1.3K vues139 diapositives

Similaire à Estatística Descritiva(20)

XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz] par Dafmet Ufpel
XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz]XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz]
XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz]
Dafmet Ufpel1.6K vues
Probabilidade e Estatística - Aula 03 par Augusto Junior
Probabilidade e Estatística - Aula 03Probabilidade e Estatística - Aula 03
Probabilidade e Estatística - Aula 03
Augusto Junior2.6K vues
Estatística completa par Ronne Seles
Estatística completaEstatística completa
Estatística completa
Ronne Seles68.4K vues
Aprenda fazer uma distribuição de frequência, Estatistica par Pedro Kangombe
Aprenda fazer uma distribuição de frequência, EstatisticaAprenda fazer uma distribuição de frequência, Estatistica
Aprenda fazer uma distribuição de frequência, Estatistica
Pedro Kangombe1.1K vues
APOSTILA DE ESTATISTICA BASICA E SIMPLIFICADA.docx par MariaDeSousa41
APOSTILA DE ESTATISTICA BASICA E SIMPLIFICADA.docxAPOSTILA DE ESTATISTICA BASICA E SIMPLIFICADA.docx
APOSTILA DE ESTATISTICA BASICA E SIMPLIFICADA.docx
EstatíStica Aula 000 par educacao f
EstatíStica Aula 000EstatíStica Aula 000
EstatíStica Aula 000
educacao f8K vues
Prof.Dr.Nilo antonio de Souza Sampaio par Nilo Sampaio
Prof.Dr.Nilo antonio de Souza SampaioProf.Dr.Nilo antonio de Souza Sampaio
Prof.Dr.Nilo antonio de Souza Sampaio
Nilo Sampaio386 vues
Estatística - Nilo Antonio de Souza Sampaio par Nilo Sampaio
Estatística - Nilo Antonio de Souza SampaioEstatística - Nilo Antonio de Souza Sampaio
Estatística - Nilo Antonio de Souza Sampaio
Nilo Sampaio1.1K vues
4426477 matematica-e-realidade-aula-08-551 par Jenifer Ferreira
4426477 matematica-e-realidade-aula-08-5514426477 matematica-e-realidade-aula-08-551
4426477 matematica-e-realidade-aula-08-551
Jenifer Ferreira538 vues

Plus de Ricardo Bruno - Universidade Federal do Pará

Tópico 4 regressão linear simples 01 par
Tópico 4   regressão linear simples 01Tópico 4   regressão linear simples 01
Tópico 4 regressão linear simples 01Ricardo Bruno - Universidade Federal do Pará
5K vues41 diapositives
Tópico 3 Testes de Hipóteses - 2 amostras par
Tópico 3   Testes de Hipóteses - 2 amostrasTópico 3   Testes de Hipóteses - 2 amostras
Tópico 3 Testes de Hipóteses - 2 amostrasRicardo Bruno - Universidade Federal do Pará
10.7K vues44 diapositives
Tópico 3 testes de hípoteses - 1 amostra par
Tópico 3   testes de hípoteses - 1 amostraTópico 3   testes de hípoteses - 1 amostra
Tópico 3 testes de hípoteses - 1 amostraRicardo Bruno - Universidade Federal do Pará
5K vues47 diapositives
Tópico 2 Intervalo de Confiança par
Tópico 2   Intervalo de ConfiançaTópico 2   Intervalo de Confiança
Tópico 2 Intervalo de ConfiançaRicardo Bruno - Universidade Federal do Pará
13.3K vues55 diapositives
Variáveis Aleatórias Multidimensionais par
Variáveis Aleatórias MultidimensionaisVariáveis Aleatórias Multidimensionais
Variáveis Aleatórias MultidimensionaisRicardo Bruno - Universidade Federal do Pará
5.5K vues33 diapositives
Variáveis aleatórias contínuas - Estatística II par
Variáveis aleatórias contínuas - Estatística IIVariáveis aleatórias contínuas - Estatística II
Variáveis aleatórias contínuas - Estatística IIRicardo Bruno - Universidade Federal do Pará
13.9K vues44 diapositives

Plus de Ricardo Bruno - Universidade Federal do Pará(20)

Dernier

A partir de sua análise, responda: seria viável e mais eficiente substituir a... par
A partir de sua análise, responda: seria viável e mais eficiente substituir a...A partir de sua análise, responda: seria viável e mais eficiente substituir a...
A partir de sua análise, responda: seria viável e mais eficiente substituir a...azulassessoriaacadem3
90 vues3 diapositives
Apresentação Alunos SARESP 2023.pptx par
Apresentação Alunos SARESP 2023.pptxApresentação Alunos SARESP 2023.pptx
Apresentação Alunos SARESP 2023.pptxGlauber Eduardo Aragon Pereira
16 vues47 diapositives
ATIVIDADE 1 - SSOC - FUNDAMENTOS TEÓRICO-FILOSÓFICOS DO SERVIÇO SOCIAL - 54/2... par
ATIVIDADE 1 - SSOC - FUNDAMENTOS TEÓRICO-FILOSÓFICOS DO SERVIÇO SOCIAL - 54/2...ATIVIDADE 1 - SSOC - FUNDAMENTOS TEÓRICO-FILOSÓFICOS DO SERVIÇO SOCIAL - 54/2...
ATIVIDADE 1 - SSOC - FUNDAMENTOS TEÓRICO-FILOSÓFICOS DO SERVIÇO SOCIAL - 54/2...assessoriaff06
11 vues2 diapositives
SEGUNDO REINADO TRABALHO.pptx par
SEGUNDO REINADO TRABALHO.pptxSEGUNDO REINADO TRABALHO.pptx
SEGUNDO REINADO TRABALHO.pptxprofesfrancleite
53 vues13 diapositives
sorteados Livre Concorrência 2024.pdf par
sorteados Livre Concorrência 2024.pdfsorteados Livre Concorrência 2024.pdf
sorteados Livre Concorrência 2024.pdfJornal do Commercio
2.2K vues3 diapositives
a) ​DETERMINE quais as funções dos conceitos T1 e T2 e suas principais difere... par
a) ​DETERMINE quais as funções dos conceitos T1 e T2 e suas principais difere...a) ​DETERMINE quais as funções dos conceitos T1 e T2 e suas principais difere...
a) ​DETERMINE quais as funções dos conceitos T1 e T2 e suas principais difere...HelpEducacional
19 vues2 diapositives

Dernier(20)

A partir de sua análise, responda: seria viável e mais eficiente substituir a... par azulassessoriaacadem3
A partir de sua análise, responda: seria viável e mais eficiente substituir a...A partir de sua análise, responda: seria viável e mais eficiente substituir a...
A partir de sua análise, responda: seria viável e mais eficiente substituir a...
ATIVIDADE 1 - SSOC - FUNDAMENTOS TEÓRICO-FILOSÓFICOS DO SERVIÇO SOCIAL - 54/2... par assessoriaff06
ATIVIDADE 1 - SSOC - FUNDAMENTOS TEÓRICO-FILOSÓFICOS DO SERVIÇO SOCIAL - 54/2...ATIVIDADE 1 - SSOC - FUNDAMENTOS TEÓRICO-FILOSÓFICOS DO SERVIÇO SOCIAL - 54/2...
ATIVIDADE 1 - SSOC - FUNDAMENTOS TEÓRICO-FILOSÓFICOS DO SERVIÇO SOCIAL - 54/2...
assessoriaff0611 vues
a) ​DETERMINE quais as funções dos conceitos T1 e T2 e suas principais difere... par HelpEducacional
a) ​DETERMINE quais as funções dos conceitos T1 e T2 e suas principais difere...a) ​DETERMINE quais as funções dos conceitos T1 e T2 e suas principais difere...
a) ​DETERMINE quais as funções dos conceitos T1 e T2 e suas principais difere...
HelpEducacional19 vues
Olá, acadêmico(a)! O objetivo básico dos demonstrativos contábeis é fornecer ... par mariaclarinhaa2723
Olá, acadêmico(a)! O objetivo básico dos demonstrativos contábeis é fornecer ...Olá, acadêmico(a)! O objetivo básico dos demonstrativos contábeis é fornecer ...
Olá, acadêmico(a)! O objetivo básico dos demonstrativos contábeis é fornecer ...
Em continuidade aos estudos bíblicos iniciaremos a aplicação do método sêmio-... par IntegrareAcademy2
Em continuidade aos estudos bíblicos iniciaremos a aplicação do método sêmio-...Em continuidade aos estudos bíblicos iniciaremos a aplicação do método sêmio-...
Em continuidade aos estudos bíblicos iniciaremos a aplicação do método sêmio-...
5_02_a revolução francesa_RESUMO.pdf par Vítor Santos
5_02_a revolução francesa_RESUMO.pdf5_02_a revolução francesa_RESUMO.pdf
5_02_a revolução francesa_RESUMO.pdf
Vítor Santos39 vues
Considere o seguinte cenário: Um programador está realizando um trabalho para... par azulassessoriaacadem3
Considere o seguinte cenário: Um programador está realizando um trabalho para...Considere o seguinte cenário: Um programador está realizando um trabalho para...
Considere o seguinte cenário: Um programador está realizando um trabalho para...
Agora é o momento de estudarmos sobre a história da sua futura profissão, par... par IntegrareAcademy2
Agora é o momento de estudarmos sobre a história da sua futura profissão, par...Agora é o momento de estudarmos sobre a história da sua futura profissão, par...
Agora é o momento de estudarmos sobre a história da sua futura profissão, par...
paradigmas_de_programacao_3_X.pdf par ronaldo ramos
paradigmas_de_programacao_3_X.pdfparadigmas_de_programacao_3_X.pdf
paradigmas_de_programacao_3_X.pdf
ronaldo ramos18 vues
5) Anexo do folder e da foto de distribuição do folder: Após elaborado o fold... par azulassessoriaacadem3
5) Anexo do folder e da foto de distribuição do folder: Após elaborado o fold...5) Anexo do folder e da foto de distribuição do folder: Após elaborado o fold...
5) Anexo do folder e da foto de distribuição do folder: Após elaborado o fold...
ATIVIDADE 1 - RH - PSICOLOGIA ORGANIZACIONAL - 54/2023 par IntegrareAcademy2
ATIVIDADE 1 - RH - PSICOLOGIA ORGANIZACIONAL - 54/2023ATIVIDADE 1 - RH - PSICOLOGIA ORGANIZACIONAL - 54/2023
ATIVIDADE 1 - RH - PSICOLOGIA ORGANIZACIONAL - 54/2023
Etapa 3: - Definindo a localização da extremidade da sonda, ou seja, se vai f... par azulassessoriaacadem3
Etapa 3: - Definindo a localização da extremidade da sonda, ou seja, se vai f...Etapa 3: - Definindo a localização da extremidade da sonda, ou seja, se vai f...
Etapa 3: - Definindo a localização da extremidade da sonda, ou seja, se vai f...
a) ​DETERMINE quais as funções dos conceitos T1 e T2 e suas principais difere... par HelpEducacional
a) ​DETERMINE quais as funções dos conceitos T1 e T2 e suas principais difere...a) ​DETERMINE quais as funções dos conceitos T1 e T2 e suas principais difere...
a) ​DETERMINE quais as funções dos conceitos T1 e T2 e suas principais difere...
HelpEducacional12 vues
Olá, acadêmico(a)! O objetivo básico dos demonstrativos contábeis é fornecer ... par mariaclarinhaa2723
Olá, acadêmico(a)! O objetivo básico dos demonstrativos contábeis é fornecer ...Olá, acadêmico(a)! O objetivo básico dos demonstrativos contábeis é fornecer ...
Olá, acadêmico(a)! O objetivo básico dos demonstrativos contábeis é fornecer ...
A Lei da Libras nº 10.436, de 24 de abril de 2002 reconhece a Língua Brasilei... par pauladiasuni
A Lei da Libras nº 10.436, de 24 de abril de 2002 reconhece a Língua Brasilei...A Lei da Libras nº 10.436, de 24 de abril de 2002 reconhece a Língua Brasilei...
A Lei da Libras nº 10.436, de 24 de abril de 2002 reconhece a Língua Brasilei...
pauladiasuni62 vues

Estatística Descritiva

  • 1. CURSO DE ESTATÍSTICA I Ricardo Bruno N. dos Santos FACECON-PPGE (UFPA)
  • 2. O Que é a Estatística? • A Estatística originou-se com a coleta e construção de tabelas de dados para o governo. • A situação evoluiu e esta coleta de dados representa somente um dos aspectos da Estatística. • No século XIX, o desenvolvimento do cálculo de probabilidade e outras metodologias matemáticas, tais como a técnica de Mínimos Quadrados, foram fundamentais para o desenvolvimento da Estatística
  • 3. O Que é a Estatística? • Somente no século XX a Estatística desenvolve-se como uma área específica do conhecimento a partir do desenvolvimento da Inferência Estatística; uma metodologia baseada em probabilidade que tem ampla aplicação nas ciências experimentais. • A Estatística hoje consiste num metodologia científica para obtenção, organização e análise de dados, oriundos das mais variadas áreas das ciência experimentais, cujo objetivo principal é auxiliar a tomada de decisões em situações de incerteza.
  • 4. O Que é a Estatística? Etapa inicial da análise utilizada para descrever, organizar e resumir os dados coletados. A disponibilidade de uma grande quantidade de dados e de métodos computacionais muito eficientes revigorou esta área da Estatística.
  • 5. O Que é a Estatística? O que fazer com as observações que coletamos?
  • 6. 6 QUALITATIVA QUANTITATIVA NOMINAL ORDINAL CONTÍNUA DISCRETA peso, altura, salário, idade número de filhos, número de carros sexo, cor dos olhos classe social, grau de instrução Variável: Qualquer característica associada a uma população. Classificação das variáveis: O Que é a Estatística?
  • 7. 7 Amplitude, Intervalo-Interquartil, Variância, Desvio Padrão, Coeficiente de Variação. MEDIDAS DE DISPERSÃO: Mínimo, Máximo, Moda, Média, Mediana, Percentis MEDIDAS DE POSIÇÃO: O Que é a Estatística?
  • 8. Medidas de posição: Medidas de Tendência Central Resumos numéricos são ferramentas importantes para descrever a distribuição de uma variável quantitativa. Agora você vai trabalhar com medidas de posição que, como o próprio nome indica, são medidas que indicam a localização dos dados. O objetivo não é o cálculo das medidas, mas, sim, explorar propriedades e relações entre três das principais medidas de posição. Média Aritmética Simples: é calculada somando-se os valores de todas as observações e dividindo-se essa soma pelo número de observações. Equivale a dividir o total das n observações em n partes iguais. Mediana: é o valor que divide o conjunto de dados em duas partes tais que abaixo e acima da mediana encontram-se 50% das observações. O cálculo da mediana requer que os dados estejam ordenados. Se o número de observações for ímpar, a mediana é o valor central; se o número de observações for par, a mediana é a média dos dois valores centrais.
  • 9. Medidas de posição: Medidas de Tendência Central Moda: é o valor mais frequente. Média Amostral: A média amostral, aritmética, ou simplesmente média, é calculada somando-se os valores das observações da amostra e dividindo-se o resultado pelo número de valores. Assim, a média amostral é dada por: 𝒙 = 𝒙𝒊 𝒏 Média Populacional: A média populacional é calculada somando- se todos os valores da população e dividindo o resultado pelo total de elementos da população. Numa população de elementos, a média populacional é dada por 𝝁 = 𝒙𝒊 𝑵
  • 10. Medidas de posição: Medidas de Tendência Central Mediana: Para calcular a mediana devemos, em primeiro lugar, ordenar os dados do menor para o maior valor. Se o número de observações for ímpar, a mediana será a observação central. Se o número de observações for par, a mediana será a média aritmética das duas observações centrais. Notação: 𝑥 Exemplo: Salários mensais iniciais para uma amostra de 12 graduados em Administração
  • 11. Medidas de posição: Medidas de Tendência Central Percentis: Em estatística descritiva, o p-ésimo percentil Pk é o valor x (xk) que corresponde à frequência cumulativa de 𝑛 𝑝 100 , onde n é o tamanho amostral. 𝒊 = 𝒑 𝟏𝟎𝟎 𝒏 Calculando o p-ésimo percentil 1 – Arranje os dados na ordem ascendente (do menor para o maior) 2 – Calcule o índice 𝒊 = 𝒑 𝟏𝟎𝟎 𝒏 3 - (a) Se não for um inteiro, arredonde para cima. O próximo inteiro maior que i expressará a posição do p-ésimo percentil. - (b) Se i é impar, o p-ésimo percentil é a média dos valores dados nas posições i e i+1
  • 12. Medidas de posição: Medidas de Tendência Central Exemplo: para os dados de salários o 85º percentil será: 𝑖 = 85 100 12 = 10,2 Arredondando para mais teríamos então a 11ª posição.
  • 13. Medidas de posição: Medidas de Tendência Central Quartis: Na estatística descritiva, um quartil é qualquer um dos três valores que divide o conjunto ordenado de dados em quatro partes iguais, e assim cada parte representa 1/4 da amostra ou população. Assim, no caso duma amostra ordenada, primeiro quartil (designado por Q1/4) = quartil inferior = é o valor aos 25% da amostra ordenada = 25º percentil segundo quartil (designado por Q2/4) = mediana = é o valor até ao qual se encontra 50% da amostra ordenada = 50º percentil, ou 5º decil. terceiro quartil (designado por Q3/4) = quartil superior = valor a partir do qual se encontram 25% dos valores mais elevados = valor aos 75% da amostra ordenada = 75º percentil à diferença entre os quartis superior e inferior chama-se amplitude inter-quartil.
  • 14. Medidas de posição: Medidas de Tendência Central Exemplo 1: Amostra: 6, 47, 49, 15, 42, 41, 7, 39, 43, 40, 36 Amostra ordenada: 6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49 Q1/4 = 15 Q2/4 = 40 Q3/4 = 43 Exemplo 2: Amostra ordenada: 7, 15, 36, 39, 40, 41 Q1/4 = 15 Q2/4 = (39+36)/2 = 37.5 Q3/4 = 40
  • 15. Medidas de posição: Medidas de Tendência Central
  • 16. Medidas de posição: Medidas de Tendência CentralBox Plot (Diagrama de Caixa) Em estatística descritiva, diagrama de caixa, ou boxplot, box plot, é um gráfico no qual o: - eixo vertical representa a variável a ser analisada; - eixo horizontal um fator de interesse. O diagrama de caixa é uma ferramenta para localizar e analisar a variação de uma variável dentre diferentes grupos de dados. O diagrama de caixa procura obter as seguintes informações: - Calcular a mediana e os quartis ( o quartil inferior contém 25% ( 1/4) das menores medidas e o quartil superior contém 75 ( 3/4) de todas as medidas); - Plotar um símbolo onde se localiza a mediana e uma caixa, daí o nome de diagrama de caixas, onde a base representa o quartil inferior ( 25% ou 1/4) dos menores valores), e o topo da caixa o quartil superior (75% ou 3/4) dos valores observados. A caixa portanto representa 50% de todos os os valores observados ,concentrados na tendência central dos valores, eliminando os 25% menores valores e 25% maiores valores ( 75% - 25% = 50%); - Um segmento de reta vertical conecta o topo da caixa ao maior valor observado e outro segmento conecta a base da caixa ao menor valor observado, este segmento denomina-se Whisker, ou fio de bigode.
  • 18. Medidas de posição: Medidas de Tendência Central Média Geométrica: Este tipo de média é calculada multiplicando- se todos os valores e extraindo-se a raiz de índice n deste produto. Digamos que tenhamos os números 4, 6 e 9, para obtermos o valor médio aritmético deste conjunto, multiplicamos os elementos e obtemos o produto 216. Pegamos então este produto e extraímos a sua raiz cúbica, chegando ao valor médio 6. Extraímos a raiz cúbica, pois o conjunto é composto de 3 elementos. Se fossem n elementos, extrairíamos a raiz de índice n. Neste exemplo teríamos a seguinte solução 𝑮 = 𝒊=𝟏 𝒏 𝒙𝒊 𝟏 𝒏 = 𝒙 𝟏 𝒙 𝟐 . . . 𝒙 𝒏 𝟏 𝒏 = 𝒏 𝒙 𝟏 𝒙 𝟐 … 𝒙 𝒏
  • 19. Medidas de posição: Medidas de Tendência Central Média Harmônica: é o número de membros dividido pela soma do inverso dos membros 𝐻 = 1 𝑛 𝑖=1 𝑛 𝑥𝑖 −1 −1 Pode-se então estabelecer que: 𝐻 ≤ 𝐺 ≤ 𝑥
  • 20. A origem das médias Arquitas de Tarento, um matemático pitagórico que viveu por volta de 400 a.C., definiu que existiam três tipos de média. Um número é a média aritmética de dois outros quando o excesso do primeiro para o segundo é igual ao excesso do segundo para o terceiro, a média geométrica quando a proporção do segundo para o terceiro é igual à proporção do primeiro para o segundo, e a média harmônica quando a quantidade que o primeiro excede o segundo em relação ao primeiro é igual à quantidade que o segundo excede o terceiro em relação ao terceiro; em notação moderna, sendo o primeiro x, o segundo m e o terceiro y (x > m > y > 0):
  • 21. A origem das médias Logo
  • 23. Medidas de dispersão As medidas de posição apresentadas fornecem a informação dos dados apenas a nível pontual, sem ilustrar outros aspectos referentes à forma como os dados estão distribuídos na amostra. As medidas de dispersão são utilizadas para avaliar o grau de variabilidade, ou dispersão, dos valores em torno da média.
  • 24. Medidas de dispersão Qual a importância das medidas de dispersão na prática? Vejamos o exemplo das notas de três turmas (A, B e C) Essa tabela será o nosso mote para no final avaliar qual foi a melhor turma. Turma A Turma B Turma C 4 5 2 5 6 3 6 6 8 7 6 8 8 7 9
  • 25. Medidas de dispersão Amplitude total: é a diferença entre o menor e o maior valor observado. 𝑨𝑻 = 𝑿𝒊 𝒎𝒂𝒙 − 𝑿𝒊 𝒎𝒊𝒏 Verifica-se que a amplitude como medida de dispersão é limitada. Essa medida só depende dos valores extremos, ou seja, não é afetada pela dispersão dos valores internos. Quais os resultados para as notas das turmas? Amplitude interquartil: é a diferença entre o terceiro quartil e o primeiro.
  • 26. Medidas de dispersão Variância: A variância de um conjunto de dados (amostra ou população) é uma medida de “VARIABILIDADE ABSOLUTA”. Ela mede a variabilidade do conjunto em termos de desvios quadrados em relação à média aritmética. É uma quantidade sempre NÃO NEGATIVA e expressa em unidades quadradas do conjunto de dados, sendo de difícil interpretação. 𝜎2 = 𝑖=1 𝑛 𝑥𝑖 − 𝜇 2 𝑁 𝑠2 = 𝑖=1 𝑛 𝑥𝑖 − 𝑥 2 𝑛 − 1 Populacional Amostral
  • 27. Medidas de dispersão Desvio Padrão: É uma outra medida de dispersão mais comumente empregada do que a variância, por ser expressa na mesma unidade de medida do conjunto de dados. Mede a "DISPERSÃO ABSOLUTA" de um conjunto de valores e é obtida a partir da variância. Trata-se da raiz quadrada da variância 𝜎 = 𝑖=1 𝑛 𝑥𝑖 − 𝜇 2 𝑁 𝑠 = 𝑖=1 𝑛 𝑥𝑖 − 𝑥 2 𝑛 − 1
  • 28. Medidas de dispersão Coeficiente de variação: É uma medida de “VARIABILIDADE RELATIVA”, útil para comparar a variabilidade de observações com diferentes unidades de medida. 𝑐𝑣 = 𝜎 𝑥 (100)
  • 30. Medidas de dispersão Vamos avaliar qual a melhor Turma. Na sua opinião qual turma é melhor.
  • 33. Distribuição de Frequências Organização dos dados: Os métodos utilizados para organizar dados compreendem o arranjo desses dados em subconjuntos que apresentem características similares. mesma idade (ou “faixa etária”), mesma finalidade, mesma escola, mesmo bairro, etc Os DADOS AGRUPADOS podem ser resumidos em tabelas ou gráficos e, a partir desses, podemos obter as estatísticas descritivas já definidas: média, mediana, desvio, etc. Dados organizados em grupos ou categorias/classes são usualmente designados “DISTRIBUIÇÃO DE FREQUÊNCIA”.
  • 34. Distribuição de Frequências Uma distribuição de frequência é um método de se agrupar dados em classes de modo a fornecer a quantidade (e/ou a percentagem) de dados em cada classe. Com isso, podemos RESUMIR e VISUALIZAR um conjunto de dados sem precisar levar em conta os valores individuais. Construindo assim uma SÍNTESE dos DADOS QUANTITATIVOS. Uma distribuição de frequência (absoluta ou relativa ) pode ser apresentada em TABELAS ou GRÁFICOS.
  • 35. Distribuição de Frequências Uma distribuição de frequência agrupa os dados por classes de ocorrência, resumindo a análise de conjunto de dados grandes. Tipos de Frequência Simples Absolutas Relativas Acumuladas Crescente Absolutas Relativas Decrescente Absolutas Relativas
  • 36. Distribuição de Frequências Eventos Altura Aluno1 1,60 Aluno2 1,69 Aluno3 1,72 Aluno4 1,73 Aluno5 1,73 Aluno6 1,74 Aluno7 1,75 Aluno8 1,75 Aluno9 1,75 Aluno10 1,75 Aluno11 1,75 Aluno12 1,76 Aluno13 1,78 Aluno14 1,80 Aluno15 1,82 Aluno16 1,82 Aluno17 1,84 Aluno18 1,88
  • 37. Distribuição de Frequências Como construir uma distribuição de frequência a partir dessas informações? Primeiro reduzir o número de linhas da tabela, para isso temos que calcular o NÚMERO DE CLASSES. O Número de classes pode ser representado pela letra (k). Para o cálculo do número de classes pode-se utilizar algumas regras como: 1) Regra de Sturges (Regra do Logaritmo) 𝑘 = 1 + 3,3log(𝑛) 2) Regra da Raiz Quadrada 𝑘 = 𝑛 3) Bom Senso! Podemos decidir qual o melhor número de classes, muitos afirmam que devemos ter classes entre os tamanhos 5 a 20.
  • 39. Distribuição de Frequências Existem várias maneiras de apresentarmos o intervalo de classes: iguais ou diferentes entre si. Porém, sempre que possível, deveremos optar por intervalos iguais, o que facilitará os cálculos posteriores. Mas mesmo com intervalos iguais, as distribuições poderão apresentar-se da seguinte forma: 0 -- 10: compreende todos os valores entre 0 e 10, exclusive os extremos. 0 |--|10: compreende todos os valores entre 0 e 10, inclusive os extremos. 0 --|10: compreende todos os valores entre 0 e 10, inclusive o 10 e exclusive o 0. 010: compreende todos os valores entre 0 e 10, inclusive o 0 e exclusive o 10. Como optaremos por este último tipo (010), pode-se definir como intervalo de classe a diferença entre o limite superior e o limite inferior da classe. Portanto, no exemplo, 10 – 0 = 10 é o intervalo ou amplitude da classe que será representado pela letra h.
  • 40. Distribuição de Frequências Largura das classes (amplitude das classes (h)): É a segunda etapa da construção de uma distribuição de frequência para dados quantitativos. Recomenda-se que a largura seja a mesma para cada uma das classes. 𝐿𝑎𝑟𝑔𝑢𝑟𝑎 𝐴𝑝𝑟𝑜𝑥𝑖𝑚𝑎𝑑𝑎 𝑑𝑒 𝐶𝑙𝑎𝑠𝑠𝑒 = 𝑀á𝑥𝑖𝑚𝑜 − 𝑀í𝑛𝑖𝑚𝑜 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑠𝑒𝑠 Para o exemplo das alturas temos: 1,88−1,60 5 = 0,056 Que arredondando transforma-se em 0,06
  • 41. Distribuição de Frequências Obs. 1: Na amplitude das classes (h), observe que aumentamos uma unidade, não seguindo, portanto, as regras de arredondamento. Esta é uma regra que deve ser sempre seguida no cálculo da amplitude da classe. Você saberia me dizer por quê? Obs. 2: Deve-se conservar o número de casas decimais dos dados observados. Por exemplo, se os dados se referem à massa de indivíduos em kg e forem expressos com uma casa após a vírgula (por exemplo, 60,5 kg), então a amplitude deverá ter uma casa após a vírgula. Obs. 3: Usando o bom-senso e a experiência, poderá ser conveniente , quando possível, a utilização da amplitude de um intervalo de classe igual a 10 ou 5, facilitando as operações posteriores.
  • 42. Distribuição de Frequências Para os dados das alturas teremos: 1,59 --| 1,66 1,66 --| 1,72 1,72 --| 1,78 1,78 --| 1,84 1,84 --| 1,90
  • 43. Distribuição de Frequências Ponto Médio das Classes (𝑿𝒊): É a média aritmética entre o limite superior e o limite inferior da classe. Assim, se a classe for 0--|10, teremos 0+10 2 = 5, que será o ponto médio da classe. Limites de Classe: São os números extremos de cada intervalo: sendo assim, temos um limite inferior e um superior. Se a primeira classe tiver um intervalo de notas de 0 até 10, o 0 será o limite inferior enquanto que o 10 será o limite superior desta classe.
  • 44. Distribuição de Frequências Frequência Acumulada (𝑭𝒊): Corresponde à soma das freqüências de determinada classe com as anteriores. No exemplo, vejamos como fica a frequência acumulada de cada classe: Altura Fi 1,59 --| 1,66 1 1,66 --| 1,72 2 1,72 --| 1,78 10 1,78 --| 1,84 4 1,84 --| 1,90 1 Total 18
  • 45. Distribuição de Frequências Frequência relativa ( 𝒇𝒊 ):Corresponde ao quociente entre a freqüência absoluta da classe e o total de elementos. 𝑓𝑖 = 𝑓𝑖 𝑛 Altura Fi fi 1,59 --| 1,66 1 0,06 1,66 --| 1,72 2 0,11 1,72 --| 1,78 10 0,56 1,78 --| 1,84 4 0,22 1,84 --| 1,90 1 0,06 Total 18 1,00
  • 46. Distribuição de Frequências Distribuições cumulativas: São as somas das ocorrências de dados cumulativamente às classes. Também é importante mostrar os termos em percentuais tanto na relativa quanto na acumulada Altura Fi fi %fi FA %FA 1,59 --| 1,66 1 0,06 5,56 0,06 5,56 1,66 --| 1,72 2 0,11 11,11 0,17 16,67 1,72 --| 1,78 10 0,56 55,56 0,72 72,22 1,78 --| 1,84 4 0,22 22,22 0,94 94,44 1,84 --| 1,90 1 0,06 5,56 1,00 100,00 Total 18 1,00 100,00
  • 47. Distribuição de Frequências Gráficos: Histograma: Também conhecido como Distribuição de Frequências ou Diagrama das Frequências, é uma representação gráfica na qual um conjunto de dados é agrupado em classes uniformes, representado por um retângulo cuja base horizontal são as classes e seu intervalo e a altura vertical representa a frequência com que os valores desta classe estão presente no conjunto de dados . É uma das Sete Ferramentas da Qualidade. O histograma é um gráfico composto por retângulos justapostos em que a base de cada um deles corresponde ao intervalo de classe e a sua altura à respectiva frequência. Quando o número de dados aumenta indefinidamente e o intervalo de classe tende a zero, a distribuição de frequência passa para uma distribuição de densidade de probabilidades. A construção de histogramas tem caráter preliminar em qualquer estudo e é um importante indicador da distribuição de dados. Podem indicar se uma distribuição aproxima-se de uma FUNÇÃO NORMAL, como pode indicar mistura de populações quando se apresentam bimodais.
  • 48. Distribuição de Frequências Passos para a construção do histograma: 1) Na abscissas, distribua as classes 2) Na ordenada da esquerda, as frequências absolutas 3) Construa um gráfico de barras para as frequências 4) Construa um gráfico de linha para a frequência acumulada (utilize a escala da direita)
  • 50. Distribuição de Frequências Ogivas 0 5 10 15 20 1,59 --| 1,66 1,66 --| 1,72 1,72 --| 1,78 1,78 --| 1,84 1,84 --| 1,90
  • 52. Distribuição de Frequências Média Ponderada de uma Frequência: 𝒙 = 𝑭𝒊 𝒙 𝒇 Onde: 𝒙 – Ponto Médio da Classe 𝒇𝒊 - Frequência acumulada 𝒇 - n
  • 53. Distribuição de Frequências Altura Fi fi %fi FA %FA Ponto Médio x*fi 1,59 1,65 1 0.06 5.56 0.06 5.56 1,62 1.62 1,65 1,71 1 0.06 5.56 0.11 11.11 1,68 1.68 1,71 1,77 10 0.56 55.56 0.67 66.67 1,74 17.4 1,77 1,83 4 0.22 22.22 0.89 88.89 1,80 7.2 1,83 1,89 2 0.11 11.11 1.00 100.00 1,86 3.72 Total 18 1,00 100,00 8,75 31,62 Média 1,7564 Média real 1,7589
  • 54. Distribuição de Frequências Podemos além da média, encontrar a mediana e a moda para distribuições de frequência, bem como a variância e o desvio padrão.
  • 55. Distribuição de Frequências Para dados agrupados em intervalos de classes, você pode calcular a moda por meio do método de Czuber, que se baseia na influência das classes adjacente na moda deslocando-se no sentido da classe de maior frequência. A expressão que você utilizará é: 𝑀𝑜 = 𝐿𝑖 + 𝑑1 𝑑1 + 𝑑2 × 𝑐 Li : limite inferior da classe modal; 𝑑1 : diferença entre a frequência da classe modal e a imediatamente anterior; 𝑑2 : diferença entre a frequência da classe modal e a imediatamente posterior; e c : amplitude da classe modal Para a tabela de alturas temos: 1.71 + 9 9+6 × 0,06 = 1,746 ≅ 1,75
  • 56. Distribuição de Frequências Quando os dados estão agrupados na mediana, devemos encontrar a classe mediana. Se os dados estão agrupados em intervalos de classe, como no caso do número de casa por rua, utilizaremos a seguinte expressão: 𝑀𝑑 = 𝑙𝑖 + 𝑛 2 − 𝑓𝑎𝑛𝑡𝑎𝑐 𝑓 𝑚𝑒𝑑 × 𝑐 li : limite inferior da classe mediana; n : número total de elementos; 𝑓𝑎𝑛𝑡𝑎𝑐 : frequência acumulada anterior à classe mediana; 𝑓 𝑚𝑒𝑑 : frequência absoluta da classe mediana; e c: amplitude da classe mediana.
  • 57. Distribuição de Frequências Porém é importante definir a classe mediana, para tanto devemos usar a seguinte fórmula (n/2) para definir a classe mediana Utilizando os dados das alturas teremos: Classe mediana = 18 2 = 9 logo temos que examinar o 9º elemento, onde o mesmo se encontra na classe 1,71--|1,77 Aplicando a fórmula da mediana temos: 𝑀𝑑 = 1,71 + 18 2 − 0,11 10 × 0,06 = 1,763 ≅ 1,76
  • 58. Distribuição de Frequências Em um conjunto de dados, a mediana, a moda e a média não necessariamente devem apresentar o mesmo valor. Uma informação importante é que a mediana não é influenciada pelos valores extremos. Comparando os resultados encontrados para uma amostra em relação às medidas de posição estudadas e verificando a inter-relação entre elas, você pode concluir que seus valores podem nos dar um indicativo da natureza da distribuição dos dados, em função das regras definidas pela Figura seguinte:
  • 60. Distribuição de Frequências Com relação a Variância para dados agrupados em classes, pode-se utilizar a seguinte expressão a partir dos desvio padrão: 𝑠 = 1 𝑛 − 1 𝑖=1 𝑛 𝑥𝑖 − 𝑥 2 𝑓𝑎 Onde n – Nº de Observações 𝑥𝑖 − 𝑥 2 - Os desvios em torno da média ao quadrado. Onde 𝑥𝑖 são os pontos médios de cada classe; 𝑓𝑎 - Frequências absolutas de cada classe. Para as alturas temos: 𝑠 = 1 18 − 1 { 1,62 − 1,76 2 × 1 + 1,68 − 1,76 2 × 1 + 1,74 − 1,76 2 × 10 + 1,8 − 1,76 2 × 4 + [ 1,86 − 1,76 2 × 2] s=0,058 𝑠2 = 0,03