SlideShare une entreprise Scribd logo
1  sur  23
E.E. "Professor Astor Vianna"
APOSTILA DE ESTATÍSTICA
CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA
1.1 Conceito, Origem e Desenvolvimento da Estatística.
Vamos estudar o conceito de estatística a partir de três vertentes. Chama-se de estatística:
1. O conjunto de elementos numéricos relativos a um fato.
2. O conjunto de técnicas para fazer predições com base em probabilidades.
3. O conjunto de técnicas para fazer inferências com base em amostras.
Estatística é a ciência que investiga os processos de obtenção, organização e análise de dados
sobre uma população e os métodos para tirar conclusões e fazer predições com base nesses dados.
1.2 Um Pouco de História
No século XI, Guilherme, o conquistador, ordenou que fosse feito um censo das propriedades No
princípio a estatística referia-se apenas a informações de interesse do estado (nação) para exercer
controle fiscal ou para segurança nacional. Por isso o nome estatística: ciência do estado.
1.3 Porque Utilizar Estatística
A estatística está presente no nosso dia a dia. A todo o momento fazemos estimativas e predições
com base em informações que dispomos. Esta ciência é útil para conhecer determinada situação.
É uma forma de representar e simplificar determinada realidade, a partir de dados nela coletados
com a finalidade de planejar e tomar decisões.
1.4 Estatística nas Empresas
No mundo atual, a empresa é uma das vigas-mestras da economia dos povos.
A direção de uma empresa exige de seu(s) administrador(es) a importante tarefa de tomar
decisões. O conhecimento e o uso da estatística facilitarão esse trabalho. Por meio de
experimentos, sondagens, coleta de dados ou opiniões; podemos conhecer a realidade geográfica
e social, os recursos naturais, humanos e financeiros; estabelecer metas e objetivos. Fatores muito
importantes e muito utilizados por EMPREENDEDORES e pelos GOVERNOS.
Exercícios:
1. Cite exemplos de utilização da estatística.
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
2. Você utiliza ou já utilizou estatística em sua vida acadêmica ou profissional?
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
2
CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA
2. Variáveis
Variável é, convencionalmente, o conjunto de resultados possíveis de um fenômeno e se
dividem em QUALITATIVAS E QUANTITATIVAS.
2.1 Variável Qualitativa – quando se refere à qualidade, estará sempre associada a um
atributo e podem ser nominais e ordinais.
• Variável qualitativa nominal – quando respostas podem ser encaixadas em categorias,
independentes uma das outras, sem nenhuma relação com as outras.
Ex: Time de futebol (flamengo, Vasco, fluminense, etc), Causa morte (câncer,
tuberculose, etc)
• Variável qualitativa ordinal – mantém uma relação de ordem uma com as outras.
Ex: Classe social (alta, média, baixa), Conceitos obtidos em uma disciplina (A, B, C, D).
2.2 Variável Quantitativa – Quando se refere à quantidade, seus valores são expressos por
números e podem ser discreta ou contínua.
• Variável quantitativa discreta – relacionada a contagens ou enumerações, não admite
decimais.
Ex: Quantidade de alunos, Número de cadeiras, etc.
• Variável quantitativa contínua – Relacionada a medições, onde a variável pode assumir
qualquer valor dentro de um intervalo.
Ex: Altura, idade, etc.
Exercícios
1. Classifique as variáveis:
α) Número de clientes.
β) Produção agrícola de arroz.
χ) Sexo.
δ) Raça de cães.
ε) Grupo sanguíneo.
φ) Velocidade de um veículo.
γ) Partido político.
3
CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA
h) N° de hemácias por mm 2
η) Didática de um professor.
ι) Temperatura.
ϕ) Salário.
2. Dê exemplos de:
a) Variável qualitativa nominal
b) Variável quantitativa contínua
c) Variável quantitativa discreta
d) Variável qualitativa ordinal
3 - POPULAÇÃO E AMOSTRA
3.1 População Estatística – É o conjunto de indivíduos portadores de pelo menos uma
característica comum, onde sempre é possível considerar todos os elementos. O pesquisador é
quem define a população estatística principalmente pela atribuição de características a essa
população.
3.2 Amostra – É o subconjunto finito de uma população, isto é, uma pequena parte do todo. Mas
para que as inferências sejam corretas é necessário que tenhamos uma amostra significativa da
população e que as amostras sejam obtidas por processos adequados. Assim, pode-se dizer que
trabalhar com amostras é bem mais fácil, mais econômico e mais rápido. A amostra deve
representar fidedignamente a população, por isso, exigi-se certas técnicas para a obtenção de
amostras não tendenciosas e imparciais, como deve ser todo trabalho estatístico, estas técnicas
são obtidas através da amostragem.
4 - PRINCIPAIS TÉCNICAS DE AMOSTRAGEM
4.1 Amostra Casualizada – É quando todos os elementos da população tem a mesma
probabilidade de participarem da amostra. Equivalente a um sorteio.
Por exemplo, uma clínica com 100 pacientes, onde se deseja uma amostra de 20 elementos.
Colocamos todos os nomes em uma urna e aleatoriamente retiramos os 20 nomes
4
CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA
4.2 Amostra Sistemática – É aquela que se adota um sistema intervalar (tempo ou espaço) para a
obtenção dos dados, ou seja, quando os elementos da população já se acham ordenados e o
pesquisador determina o sistema.
Por exemplo, Prontuários médicos, 1 a cada 5; Linhas de produção 1 a cada 100.
4.3 Amostra Estratificada – Ocorre quando dividimos a população em sub populações
(estratos), e dentro de cada estrato retiramos uma certa quantidade de elementos. Essa retirada
pode ser casualizada ou sistemática.
Por exemplo, supondo que dos 100 pacientes do primeiro exemplo utilizado, 60 sejam homens e
40 mulheres são, portanto dois estratos (masculino e feminino). Se queremos uma amostra de
20%, logo: Amostragem masculina = 12 elementos;
Amostragem feminina = 8 elementos.
4.4 Amostra por Conglomerado – É aquela onde dividimos a população em conglomerados
(seções) e sorteamos uma certa quantidade de conglomerados, trabalhando com todos os
elementos das seções sorteadas.
Por exemplo, estudo sobre a estatura dos alunos da UCB, dividiríamos a população em seções
(cursos) e realizaríamos um sorteio para saber com que cursos iriam trabalhar.
4.5 Amostra por Conveniência – É aquela que se obtém os dados por comodidade.
Por exemplo, para realizar uma pesquisa com alunos do curso de Educação Física. Realizaríamos
em nossa instituição.
Exercícios
1. A carteira de clientes de uma agência está organizada em um arquivo, por ordem alfabética.
Qual o tipo de amostra e a maneira mais simples de amostrar 1/ 3 dos clientes?
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
2. Defina população estatística, exemplifique e atribua TRÊS características a essa população.
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
3. Relacione:
1. Amostra sistemática.
2. Amostra por conglomerado.
3. Amostra estratificada.
4. Amostra casualizada.
5. Amostra por conveniência.
( ) Quando divide a população em sub populações.
( ) Quando a população já se acha ordenada.
( ) Quando se obtém por comodidade.
( ) Quando se assemelha a um sorteio.
( ) Quando se seleciona apenas parte da população.
5
CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA
( ) Quando dividimos a população em conglomerado
4. Alunos de uma universidade resolveram realizar uma pesquisa de intenção de votos para a
eleição de um novo reitor daquela instituição. O trabalho foi realizado no período de 10 a 15 de
junho de 2012 com toda a comunidade acadêmica. Foram ouvidos, de forma aleatória, 236
eleitores sendo o mesmo percentual para alunos e funcionários.
Responda:
a) A população estatística;
______________________________________________________________________________
______________________________________________________________________________
b) A técnica de amostragem utilizada.
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
5. MÉTODO ESTATÍSTICO
O método estatístico compreende um ciclo que vai da concepção do problema até as conclusões.
Realiza-se pela aplicação do método cientifico, pelas fases a seguir:
Definição do __ Coleta de __ Análise de __ Conclusões
Problema Dados Dados
Vejamos cada fase.
5.1 Definição do Problema
Esta fase é a mais importante. Onde é claramente definido o problema e o objetivo a ser
alcançado. Hipóteses são levantadas. Essas definições irão conduzir as fases subseqüentes. Para
estatística, o produto importante da definição do problema é a delimitação da população. Outro
aspecto importante da definição de problema é o levantamento de hipóteses. Fazem-se perguntas
ou afirmações sobre a população, originadas em conhecimentos anteriores ou na percepção dos
pesquisadores. Definida a população e formuladas as hipóteses precisamos elaborar um
instrumento para coleta de dados.
5.2 Coleta de Dados
Há várias maneiras de coletar dados. O meio mais comum é o uso de questionários ou
formulários, compostos por perguntas.
Elaborar um questionário é uma das tarefas mais importantes em um trabalho de pesquisa, é por
meio deles que os dados serão obtidos e registrados. Ele precisa ser claro, objetivo e não dar
margem a dúvidas ou a má interpretação. O questionário pode ser preenchido pelo entrevistador
ou pelo entrevistado. A maior vantagem no uso do questionário é o anonimato do entrevistado o
que possibilita respostas muito mais verdadeiras.
As partes que compõem um questionário são:
1. Cabeçalho – Serve para identificar quem promove a pesquisa;
6
CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA
2. Textos de instruções e apresentação do entrevistador – Contém orientações e avisos
para o entrevistado.
3. Variáveis de identificação da unidade pesquisada ou da entrevista – Localizar a
unidade amostral ordenando os questionários.
4. Perguntas - Conjunto de questões.
5. Agradecimento – Agradecer a contribuição do entrevistado para o trabalho.
5.3 Análise de dados
Analisar dados consiste em aplicar técnicas estatísticas para interpretar os resultados obtidos.
Nesta fase procura-se responder às perguntas de pesquisa e confirmar ou refutar as hipóteses,
para isso utilizam representações dos dados em tabelas e/ou gráficos.
5.4 Conclusões
Feita a análise dos dados coletados, chega-se á última fase de um trabalho de pesquisa. As
conclusões são feitas na forma de afirmações sobre os dados, baseada nas análises. Nessa etapa as
hipóteses serão confirmadas ou refutadas. As conclusões baseiam-se nos resultados das análises e
de conhecimentos anteriores sobre o tema. Não podem decorrer de interpretações subjetivas.
6. TABELAS
Tem o objetivo de sintetizar os valores que uma ou mais variáveis podem assumir, para que
tenhamos uma visão global da avaliação dessa ou dessas variáveis. Fornecendo rápidas e seguras
informações.
Uma tabela compõe-se de:
• Título – Explica o que o trabalho contém, devendo responder as seguintes perguntas: O
que?, Onde? e Quando?
• Cabeçalho – especifica o conteúdo das colunas.
• Corpo – Formado por linhas e colunas de dados.
• Rodapé – Pode apresentar chamadas e notas, além da Fonte que não deve deixar de ser
exibida já que Identifica o responsável (is) pelo trabalho.
7
CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA
A tabela deve ser delimitada por traços horizontais, traços verticais somente para separar colunas,
nunca para delimitar a tabela.
Observe o modelo:
Título
Cabeçalho Cabeçalho
C o r p o
Rodapé
7. GRÁFICOS
Os resultados de uma pesquisa podem ser apresentados por meio de gráficos, porém estes devem ser:
simples, bonitos e fáceis de serem interpretados. Caso contrário, a apresentação a apresentação
por meio de gráfico não faz sentido. Os gráficos mais comuns são: EM COLUNAS, BARRAS,
LINHAS E ÁREA ou PIZZA.
7.1 Normas de Representação Gráfica
Não há normas rígidas para a representação gráfica de dados. São indispensáveis apenas título e fonte dos
dados, recomendando-se a adequação ao tipo de variável.
7.2 Construção de gráficos utilizando o programa Microsoft XP
1° Passo – Clicar em INICIAR; PROGRAMAS; EXCEL ou atalho EXCEL na área de trabalho.
2° Passo – Inserir dados.
3° Passo – Selecionar as células utilizadas.
4° Passo – Clicar ASSISTENTE DE GRÁFICO na barra de ferramentas.
5° Passo – Escolher o tipo de gráfico e AVANÇAR.
6° Passo – Verificar se as séries estão em colunas e AVANÇAR.
8
CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA
7° Passo – TÍTULO digitar o título do gráfico e se necessário informações para o eixo de
categorias e valores.
8° Passo – EIXOS a opção de apresentação de identificação das categorias e valores.
9° Passo – LINHAS DE GRADE opção de retirar ou inserir linhas para auxílio na leitura de
gráficos.
10° Passo – LEGENDA quando houver necessidade de informações quanto as colunas.
11° Passo – RÓTULO DE DADOS para que o valor referente a cada categoria apareça.
12° Passo – TABELA DE DADOS não utilizar.
13° Passo – POSICIONAR COMO PLANILHA OU COMO OBJETO planilha o gráfico a
exibição se da em tela inteira e como objeto se da como janela.
14° Passo – CONCLUIR.
* Para trocar a cor de todas as colunas, clicar uma vez sobre uma das colunas em seguida dois
cliques sobre qualquer coluna e abrirá um menu de cores. Selecionar a cor e clicar OK.
** Para trocar a cor de cada coluna individualmente, clicar uma vez sobre qualquer coluna em
seguida um clicar sobre a coluna que deseja alterar a cor e dois cliques para abrir o menu de
cores. Selecionar a cor desejada e clicar OK.
*** Para voltar em OPÇÕES DE GRÁFICO depois de concluído, clicar com o botão direito
sobre área do gráfico.
8. ARREDONDAMENTO DE DADOS
Arredondar um número significa reduzir a quantidade de algarismos após a vírgula, deste
número. O arredondamento de dados ocorre de duas formas, a saber:
a) Quando o algarismo a ser abandonado é 0,1, 2, 3 ou 4.
ex: 2,764 para centésimos 2,76
b) Quando o algarismo a ser abandonado é 5,6,7,8 ou 9.
ex: 8,957 para centésimos 8,96
Obs: Não devemos realizar arredondamentos sucessivos.
ex de arredondamentos sucessivos: 0,2685485 para centésimos 0,26859
0,2686
0,269
0,27
Nesses casos devemos conservar apenas o primeiro algarismo após a unidade que deseja
arredondar e desprezar as demais, em seguida aplicar uma das técnicas informadas
anteriormente.
9
CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA
ex: 0,2685485 para centésimos 0,27
NOSSAS ATIVIDADES DEVERÃO SER ARREDONDADAS PARA DÉCIMOS
Exercício
Aplique o arredondamento:
a) 15,2586
b) 4.056
c) 1,3333333...
d) 29,899
e) 8,964012
f) 9.95
9. DISTRIBUIÇÃO DE FREQÜÊNCIA
Determinamos distribuição de freqüência o número que fica relacionado a um determinado valor
da variável. Obtemos, assim, uma tabela que recebe o nome de DISTRIBUIÇÃO DE
FREQUÊNCIA.
9.1 Métodos Para a Distribuição de Freqüência
Tabela primitiva – É a tabela cujos elementos não foram numericamente organizados.
Exemplo:
Estatura, em cm, de participantes do projeto
“Micro Escola da UCB” jul / 2011.
166 160 161 150 162 160 163
162 161 168 163 156 170
155 152 190 189 155 190
154 161 156 172 153 181
Rol – É a maneira mais simples de organizar os dados através de uma ordenação CRESCENTE
OU DECRESCENTE.
Exemplo:
Estatura, em cm, de participantes do projeto
“Micro Escola da UCB” jul / 2011.
150 155 160 161 163 172 190
152 155 160 162 166 181
153 156 161 162 168 189
154 156 161 163 170 190
Freqüência de uma classe – O número de valores da variável pertencente à classe. O que passará
a se chamar distribuição de freqüência com intervalos de classe.
Exemplo: Tabela 1
1
CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA
Estatura, em cm, de participantes do projeto
“Micro Escola da UCB” jul / 2011.
Estatura (cm) Freqüência
150  158 8
158  166 9
166  174 4
174  182 1
182 !--! 190 3
Total 25
Nota: Os intervalos devem ser escritos de acordo com a resolução do IBGE, em termos de:
DESTA QUANTIDADE ATÉ MENOS AQUELA ( inclusão  exclusão).
9.2 Frequencia Absoluta –F(abs)
É o número de vezes que cada variável estatística assume, o mesmo que freqüência.
9.3 Frequencia Relativa - F(%)
Calculada a partir da divisão de freqüência absoluta pelo N multiplicado por 100, pois o resultado
em percentual é mais fácil de ser interpretado.
F(%)= F (abs) . 100
N
Estatura, em cm, de participantes do projeto
“Micro Escola da UCB” jul / 2011.
Estatura (cm) F (abs) F (%)
150  158 8 32
158  166 9 36
166  174 4 16
174  182 1 4
182 !--! 190 3 12
Total 25 100
9.4 Freqüência Acumulada (Fac)
Freqüência Acumulada Crescente (ou Freqüência acumulada ”abaixo de”, ou Freqüência
acumulada ”até”) que representaremos por Fac é a soma das freqüências absolutas anteriores de
uma determinada classe.
1
CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA
Por exemplo, na tabela acima, a Freqüência acumulada crescente é: 8+9=17; 17+4=21; 21+1=22;
22+3=25
Estatura, em cm, de participantes do projeto“Micro Escola da UCB” jul / 2011.
Estatura (cm) F (abs) F (%) Fac
150  158 8 32 8
158  166 9 36 17
166  174 4 16 21
174  182 1 4 22
182 !--! 190 3 12 25
Total 25 100 ---
10. ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA
10.1 Classes
São intervalos de variação da variável. Representadas por i.
Sendo i = 1, 2, 3, ... , k
10.2 Como determinar o número de classes para agrupamento de dados.
Sendo: k – Número de classes;
n – Número de dados da variável.
Fórmula para quantidade de classes:
nk =
Recomenda-se que o número de classes esteja entre 5 e 15.
Exemplo:
Utilizando dados do exemplo anterior:
n = 25
25=k ⇒ 5 logo k = 5 classes
Se k for maior que 15, use k=15. Caso seja menor que 5 usar k=5.
10.3 Como determinar a amplitude dos limites de classes.
Sendo: Max: Menor dado da série
Min: Maior dado da série
Fórmula para limite de classe:
lim classe = (max – min)
k
Exemplo:
1
CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA
Aplicando a fórmula utilizando dados da tabela 1:
lim classe = 191 – 150 = 41 / 5 = 8,2
5
Os limites das classes deverão apresentar amplitude de 8 cm
Limite de classe – São os limites de cada classe. Sendo o menor número limite inferior da classe
e o maior número limite superior da classe.
10.4 Amplitude
10.4.1 Do intervalo de classe – É a medida do intervalo de cada classe, obtida pela diferença
entre os limites, SUPERIOR e INFERIOR da classe representada por h. Assim: h = L – l
10.4.2 Total da distribuição – è a diferença entre o limite superior máximo e o limite inferior
mínimo, ou seja, o maior e o menor valor da variável. Representada por AT, pode ser
calculada por AT = L(Max) – l(min)
10.4.3 Amplitude amostral (AA) – é a diferença entre o valor máximo e o valor mínimo da
amostral AA= x(Max.) – x(min.)
EXERCÍCIOS
1. A tabela abaixo apresenta o número de atendimentos na clínica “bela” no mês de maio /
2011:
14 21 11 13 14 13
12 14 13 20 11 12
06 10 09 18 15 19
16 12 11 14 14 13
15 12 14 08 11 14
Construa uma DISTRIBUIÇÃO DE FREQÜÊNCIA com intervalo de classe CINCO
2. A tabela abaixo apresenta a IDADE de alunos da turma 502 da Escola Municipal Pará
Cidade do Rio de Janeiro 2010:
14 12 11 13 14 13
12 09 13 20 11 12
17 13 10 18 15 19
16 12 11 14 14 08
15 12 14 08 11 14
Construa uma distribuição de freqüência, calcule os limites de classe, amplitude do intervalo,
amplitude total da distribuição, amplitude amostral e uma distribuição de freqüência.
3. Conhecidas as notas em uma avaliação de ESTATÍSTICA: 85, 75, 25, 45, 10, 55, 50, 55,
80, 55, 40, 60, 50, 45, 45, 35, 90, 70, 85, 80, 70, 45, 30,100, 30.
Obtenha uma DISTRIBUIÇÃO DE FREQÜÊNCIA.
1
CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA
4. Crie uma situação problema e construa:
a. Uma tabela primitiva;
b. Um ROL;
c. Uma distribuição de freqüência.
11. Medidas de Tendência Central Para uma Amostra
Os dados quantitativos, apresentados em tabelas e gráficos, constituem a informação básica do
problema em estudo. Mas é conveniente apresentar, além dos dados, medidas que mostrem a
informação de maneira resumida. As medidas de tendência central dão valor ao ponto em torno
do qual os dados se distribuem. São as medidas de tendência central, MÉDIA ARITMÉTICA,
MEDIANA E A MODA.
11.1 Média ( x )
A média é uma medida de tendência central que caracteriza, em parte, uma distribuição de
dados.
11.1.1 Média Aritmética Simples - É o quociente da divisão da soma dos valores da variável
pelo número deles.
Representada por x
Exemplo:
A = {2, 3, 4, 5, 6}
x = 2 + 3 + 4 + 5 + 6 = 20 / 5 = 4
5
Fórmula da Média Simples: x =
n
xi
n
i
∑=1
11.1.2 Média Aritmética Ponderada – É o quociente da soma dos produtos desses números
pela soma das respectivas freqüências ou pesos.
Exemplo:
xi 0 1 2 3 4 5
fi 2 3 5 4 0 1
x = (2 x 0) + (3 x 1) + (5 x 2) + (4 x 3) + (0 x 4) + (1 x 5) =
2 + 3 + 5 + 4 + 0 + 1
x = 0 + 3 + 10 + 12 + 0 + 5 = 30 = 2
15 15
Logo: x = 2
1
CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA
Fórmula da média aritmética ponderada:
∑
∑
=
=
= n
i
i
n
i
ii
p
p
px
m
1
1
11.1.3 Desvio em Relação à Média – É a diferença entre cada elemento de um conjunto de
valores e a média aritmética desse conjunto.
Desvio = xxi
−
Lembrando que a soma dos desvios será sempre igual a zero.
Exemplo:
C = {2, 3, 4, 5, 6}
x = 2 + 3 + 4 + 5 + 6 = 20 / 5 = 4
5
Desvios em relação à média:
D1 = 2 – 4 = -2
D2 = 3 – 4 = -1
D3 = 4 – 4 = 0
D4 = 5 – 4 = 1
D5 = 6 – 4 = 2
Soma dos desvios: (-2) + (-1) + (0) + ( 1) + (2) = 0
0)(
1
=−∑=
n
i
xxi
A média é utilizada quando:
a) Desejamos uma medida de posição que possui maior estabilidade;
b) Houver necessidade de um tratamento algébrico.
11.2 Mediana
Representada por Md, a mediana é definida como sendo a realização que ocupa a posição central
de uma série de observações quando estas estão ordenadas segundo as suas grandezas. Para
determinar a mediana temos dois casos:
11.2.1 Quando a variável apresentar uma quantidade ÍMPAR de parcelas devemos identificar o
valor que ocupa posição central dessa distribuição.
Fórmula: Md =
2
1+n
Exemplo:
{2, 3, 4, 5, 6}
1
CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA
n = 5 Md = 3
2
15
=
+
° *
Md = 4
*A aplicação da fórmula indicará a posição da parcela mediana e não o valor.
11.2.2 Quando a variável apresentar uma quantidade PAR de parcelas, não teremos UM valor
para representar a mediana e sim DOIS valores. Devemos então, identificar os valores que
ocupam a posição central dessa distribuição e calcular a média aritmética desses valores.
Fórmula: Md = 1
22
+
n
e
n
Exemplo:
{2, 3, 4, 5, 6, 7}
n = 6 Md = 1
2
6
2
6
+e
Md = 3° e 4° **
Md = 4 e 5 ⇒ 4 + 5 = 4,5
2
** A aplicação da fórmula indicará a posição da parcela mediana e não o valor.
Empregamos a mediana quando:
a) Desejamos obter o ponto que divide a distribuição em partes iguais;
b) Há valores extremos que afetam de uma maneira acentuada a média.
11.3 Moda
Denominamos moda o valor que ocorre com maior freqüência em uma série de valores.
Representada por Mo Denominamos moda o valor que ocorre com maior freqüência em uma
série de valores. Representada por Mo
Ela pode ser:
• Modal, quando apresenta apenas uma moda (freqüência);
Exemplo:
{2, 1, 7, 6, 9, 2, 3, 2} Mo = modal em 2
• Amodal, quando não tem moda (freqüência);
Exemplo:
{5, 3, 9, 8, 2, 10, 1} Mo = amodal
• Bimodal, quando tem duas modas (freqüências);
Exemplo:
{8, 6, 2, 5, 15, 7, 2, 1, 5} Mo = bimodal em 2 e 5
1
CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA
• Multimodal, quando apresenta três ou mais modas.
Exemplo:
{8, 6, 2, 5, 15, 7, 2, 1, 5, 3, 8} Mo = Multimodal em 2, 5 e 8
EXERCÍCIOS
1. Sabendo que a freqüência de pacientes em uma determinada semana na clínica “up” foi de 15,
17, 25, 12, 19, 11, 12. Calcule:
a) Média;
b) Mediana;
c) Moda
d) Desvio em relação à média.
2. Determinar a moda, média e mediana nos seguintes casos:
α) 3, 5, 15, 4, 9, 10, 6.
β) 1, 7, 7, 9, 8, 3, 7, 9, 5, 6, 4.
χ) 28, 11, 65, 48, 100, 51, 78, 24.
3. As notas de um candidato, em seis provas de um concurso, foram: 8,4; 9,1; 7,2; 6,8; 8,7; 7,2.
Sabendo-se que as TRÊS primeiras apresentam peso 2 e as TRÊS últimas peso 3. Determine:
a) Nota média;
b) Nota mediana;
c) Nota modal;
d) Desvio em relação à média.
12. Medida de Dispersão Para uma Amostra
As medidas de dispersão indicam a variação dos dados, demonstrando se os elementos estão
próximos entre si ou não. Algumas medidas de dispersão dão uma idéia do quanto à média é
adequada para representar um conjunto. Quando um conjunto de dados varia pouco em relação à
Média, ela representa bem o conjunto. Ao contrário, se os elementos de um conjunto são muito
dispersos a Média não é uma boa representante.
Exemplo:
A = {50, 55, 65, 65, 70, 75} Média = 63,3 (Indicado para medida de tendência central)
B = {9, 9, 40, 80, 81, 88, 100} Média = 58,1 (Indicado para medida de dispersão)
A Média 63,3 representa os valores do conjunto A.
A Média 58,1 representa os valores do conjunto B. É razoável pensar que esta Média inclui dados
como o 9 ou o 100? Não, pois esses números estão distantes da Média.
Com isso fica demonstrado que é preciso medir essa dispersão, para dar mais informações sobe o
conjunto. Só a Media não basta. Ela deve ser apresentada em conjunto com alguma MEDIDA DE
DISPERSÃO, que vai indicar o quanto ela é representativa do conjunto de dados.
1
CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA
Conhecendo as medidas de dispersão em relação à Média aritmética:
Amplitude
Variância
Desvio padrão
Coeficiente de variação
Entendendo melhor as medidas de dispersão:
Nota de quatro alunos em cinco provas
NOME NOTAS MÉDIA
Antônio
João
José
Pedro
5
6
10
10
5
4
5
10
5
5
5
5
5
4
5
0
5
6
0
0
5
5
5
5
Todos obtiveram MÉDIA igual a cinco, mas a dispersão das notas em torno da média não é a
mesma para todos os alunos.
a) As notas de Antônio não variam (dispersão nula)
b) As notas de João variam menos que as de José (dispersão de João menor que a dispersão
de José)
c) As notas de Pedro variam mais do que as notas de todos (maior dispersão)
12.1 AMPLITUDE
Amplitude é a diferença entre o maior e o menor dado observado. Dados da tabela acima:
Exemplo: (a) Amplitude das notas de Antônio
a) = 5 – 5 = 0
b) Amplitude das notas de João
a = 6 – 4 = 2
c) Amplitude das notas de José
a = 10 – 0 = 10
d) Amplitude das notas de Pedro
a = 10 - 0 = 10
1
CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA
A Amplitude não mede bem a dispersão, porque seu cálculo usa valores extremos. Mesmo assim
é muito usado por ser fácil de calcular e interpretar.
12.2 VARIÂNCIA
Calculados os desvios em relação à Média, variância é a diferença entre cada dado e a Média.
Para evitar que a soma dos desvios seja nula, podemos usar o quadrado dos desvios. Lembrando
que há desvios positivos e negativos, pois a média fica no centro do conjunto. Se elevarmos os
desvios ao quadrado, eliminaremos todos os sinais negativos. E assim definimos a variância (
s
2
) como a média do quadrado do desvios.
Exemplo:
Dados: 0, 4, 6, 8, 7
Média: 5
Desvios: -5, -1, 1, 3, 2
Cálculo da soma de quadrados dos desvios
Dados
(X)
Desvios
(X - X )
Quadrado dos desvios
(X - X ) 2
0
4
6
8
7
-5
-1
1
3
2
25
1
1
9
4
X =5 ∑ −x( x )=0 40)( 2
=−∑ xx
A soma do quadrado dos desvios não é usada como medida de dispersão.
Fórmula para cálculo da variância:
1
)( 2
2
2
−
−
=
∑ ∑
n
n
x
x
s
1
CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA
Aplicando a fórmula:
x
x
2
0
4
6
8
7
0
16
36
64
49
Substituindo:
n = 5
10
4
40
4
125165
4
5
625
165
4
5
25
165
2
2
==
−
=
−
=
−
=s
Para entender melhor a variância:
α) Para as notas de Antônio que não variam, 0
2
=s
β) Para as notas de João, que variam menos que as notas de José, 1
2
=s , menor que a
variância das notas de José, que é .5,12
2
=s
χ) Para as notas de Pedro, que variam mais do que as outras, a variância é 25
2
=s , maior
que todas as outras variâncias.
Aluno Notas Média Variância
Antônio
João
José
Pedro
5
6
10
10
5
4
5
10
5
5
5
5
5
4
5
0
5
6
0
0
5
5
5
5
0
1
12,5
25
12.3 DESVIO PADRÃO
2
CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA
Como medida de dispersão, a variância tem a desvantagem de apresentar unidade de medida
igual ao quadrado da unidade de medida dos dados. Por exemplo, se os dados estão em metros a
variância fica em metros ao quadrado.
Mas existe uma medida de dispersão que apresenta as propriedades da variância e tem a mesma
unidade de medida dos dados. É o desvio padrão definido como RAIZ QUADRADA DA
VARIÂNCIA, com sinal positivo. O desvio padrão é representado por s.
Fórmula do desvio padrão:
ss
2
= , ou seja,
1
)(
2
2
−
−
=
∑ ∑
n
ns
xx
Para as notas do aluno José, cuja variância já foi calculada, tem-se o DESVIO PADRÃO:
5,12=S = 3,54
12.4 Coeficiente de Variação
O Coeficiente de Variação é a razão entre o desvio padrão e a Média. O resultado é multiplicado
por 100, para que o coeficiente de variação seja dado em porcentagem.
CV = 100.
X
S
Para se entender como se interpreta o coeficiente de variação, imagine dois grupos de pessoas.
No primeiro grupo, as pessoas têm idades:
3, 1 e 5
E no segundo grupo as pessoas têm idades:
55, 57 e 53
No primeiro grupo a média é 3 anos, e no segundo grupo média 55 anos. Com a mesma
dispersão, A variância de ambos é 4
2
=s . Vejamos os coeficientes de variação:
No primeiro grupo, o Coeficiente de Variação é:
CV = 6,66100.
3
2
= 7%
No segundo grupo, o Coeficiente de Variação é:
CV = 64,3100.
55
2
= %
2
CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA
Um coeficiente de variação igual a 66,67% indica que a dispersão dos dados em relação à média
é muito grande. Já um coeficiente de variação 3,64% indica que a dispersão dos dados em relação
à média é pequena. Em outras palavras, diferenças de 2 anos são relativamente mais importantes
no primeiro grupo, que tem média 3 (coeficiente de variação é 66,67%0 do que no segundo
grupo, que tem média 55 (o coeficiente de variação é 3,64%). Então coeficiente de variação mede
DISPERSÃO EM RELAÇÃO À MÉDIA.
EXERCÍCIOS
1. Calcule a amplitude total dos conjuntos de dados:
a) 1, 3, 5, 9.
b) 20, 14, 15, 19, 21, 22, 20.
c) –10, -6, 2, 3, 7, 9, 10.
2. Sabendo que um conjunto de dados apresenta para média aritmética e para desvio padrão,
respectivamente, 18,3 e 1,47, calcular o COEFICIENTE DE VARIAÇÃO.
3. Um grupo de 100 estudantes tem uma estatura média de 163,8 cm, com um coeficiente de
variação de 3,3%. Calcular o desvio padrão.
4. Dada a distribuição relativa de 100 notas de avaliação realizada por um fisioterapeuta, segundo
critérios próprios, para o desempenho de atletas.
Notas (xi) 0 1 2 3 4 5
Freqüência (yi) 4 14 34 29 16 6
Calcule o desvio padrão.
2
CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA
REFERÊNCIAS
VIEIRA, Sonia. Introdução à bioestatística, 3ed, Rio de Janeiro, 2004.
MARIA, Inez M. Estatística Básica. Brasília, MSD, 2005.
RODRIGUES, Pedro C. Bioestatística. Niterói: EDUFF, 1983.
CRESPO, Antonio A. Estatística Fácil. São Paulo, ed Saraiva, 2001
2

Contenu connexe

Tendances

1 estatística descritiva, distribuição de frequência v discreta e continua
1   estatística descritiva, distribuição de frequência v discreta e continua1   estatística descritiva, distribuição de frequência v discreta e continua
1 estatística descritiva, distribuição de frequência v discreta e continuaNilson Costa
 
1ª apostila de estatística quimica
1ª apostila de estatística  quimica1ª apostila de estatística  quimica
1ª apostila de estatística quimicaMarianne Soares
 
Estatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formandoEstatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formandoAntonio Mankumbani Chora
 
Estatística 8.º ano
Estatística 8.º anoEstatística 8.º ano
Estatística 8.º anoaldaalves
 
Apostila estatistica descritiva ii
Apostila estatistica descritiva iiApostila estatistica descritiva ii
Apostila estatistica descritiva iisimuladocontabil
 
Apostila5 ine5102 quimica
Apostila5 ine5102 quimicaApostila5 ine5102 quimica
Apostila5 ine5102 quimicasmpgiacobbo
 
35302050 apostila-de-estatistica-basica (1)
35302050 apostila-de-estatistica-basica (1)35302050 apostila-de-estatistica-basica (1)
35302050 apostila-de-estatistica-basica (1)Luccy Crystal
 
Estatística eco escolas 6ºano
Estatística eco escolas 6ºanoEstatística eco escolas 6ºano
Estatística eco escolas 6ºanodavidjpereira
 
Resumo aulas (daniela gomes)
Resumo aulas (daniela gomes)Resumo aulas (daniela gomes)
Resumo aulas (daniela gomes)Daniela Gomes
 
Apostila de estatística descritiva
Apostila de estatística descritivaApostila de estatística descritiva
Apostila de estatística descritivaFabiano Oliveira
 

Tendances (19)

1 estatística descritiva, distribuição de frequência v discreta e continua
1   estatística descritiva, distribuição de frequência v discreta e continua1   estatística descritiva, distribuição de frequência v discreta e continua
1 estatística descritiva, distribuição de frequência v discreta e continua
 
5127 apostila-de-estatistica
5127 apostila-de-estatistica5127 apostila-de-estatistica
5127 apostila-de-estatistica
 
Noções Básicas de Estatística
Noções Básicas de EstatísticaNoções Básicas de Estatística
Noções Básicas de Estatística
 
Ou estatistica
Ou estatisticaOu estatistica
Ou estatistica
 
1ª apostila de estatística quimica
1ª apostila de estatística  quimica1ª apostila de estatística  quimica
1ª apostila de estatística quimica
 
Estatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formandoEstatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formando
 
Estatística 8.º ano
Estatística 8.º anoEstatística 8.º ano
Estatística 8.º ano
 
Estatistica
EstatisticaEstatistica
Estatistica
 
Apostila estatística 1
Apostila estatística   1Apostila estatística   1
Apostila estatística 1
 
2 em 1mat_41b
2 em 1mat_41b2 em 1mat_41b
2 em 1mat_41b
 
Amostragem - estatistica
Amostragem - estatisticaAmostragem - estatistica
Amostragem - estatistica
 
Apostila estatistica descritiva ii
Apostila estatistica descritiva iiApostila estatistica descritiva ii
Apostila estatistica descritiva ii
 
Apostila5 ine5102 quimica
Apostila5 ine5102 quimicaApostila5 ine5102 quimica
Apostila5 ine5102 quimica
 
35302050 apostila-de-estatistica-basica (1)
35302050 apostila-de-estatistica-basica (1)35302050 apostila-de-estatistica-basica (1)
35302050 apostila-de-estatistica-basica (1)
 
Estatística eco escolas 6ºano
Estatística eco escolas 6ºanoEstatística eco escolas 6ºano
Estatística eco escolas 6ºano
 
Resumo aulas (daniela gomes)
Resumo aulas (daniela gomes)Resumo aulas (daniela gomes)
Resumo aulas (daniela gomes)
 
Apostila de estat_stica
Apostila de estat_sticaApostila de estat_stica
Apostila de estat_stica
 
Apostila de estatística descritiva
Apostila de estatística descritivaApostila de estatística descritiva
Apostila de estatística descritiva
 
Estatistica trab
Estatistica trab Estatistica trab
Estatistica trab
 

Similaire à Introdução Estatística

Capítulo ii estatística iniciais
Capítulo ii   estatística  iniciaisCapítulo ii   estatística  iniciais
Capítulo ii estatística iniciaiscon_seguir
 
Unidade i conceitos fundamentais de estatística
Unidade i   conceitos fundamentais de estatísticaUnidade i   conceitos fundamentais de estatística
Unidade i conceitos fundamentais de estatísticaCristiano Martinez
 
Profsidineiindoleonardo 6m1
Profsidineiindoleonardo 6m1Profsidineiindoleonardo 6m1
Profsidineiindoleonardo 6m1carolineborba
 
Tecnicas de pesquisa de mercado - Amostragem - Aula 5
Tecnicas de pesquisa de mercado - Amostragem - Aula 5Tecnicas de pesquisa de mercado - Amostragem - Aula 5
Tecnicas de pesquisa de mercado - Amostragem - Aula 5Ueliton da Costa Leonidio
 
4 apostila de estatística i
4 apostila de estatística i4 apostila de estatística i
4 apostila de estatística iJonnas Calado
 
EstatisticaConceitos.pptx
EstatisticaConceitos.pptxEstatisticaConceitos.pptx
EstatisticaConceitos.pptxReginaSmith66
 
amostragem.ppt
amostragem.pptamostragem.ppt
amostragem.pptwfkam
 
Apostila teoria da amostragem
Apostila   teoria da  amostragemApostila   teoria da  amostragem
Apostila teoria da amostragemAroldo Costa
 
Capítulo 1 livro básico probabiliade
Capítulo 1  livro básico probabiliadeCapítulo 1  livro básico probabiliade
Capítulo 1 livro básico probabiliadeWodson Vieira Gomes
 
Introdução à estatística 01 alunos
Introdução à estatística 01 alunosIntrodução à estatística 01 alunos
Introdução à estatística 01 alunosCézar Guerra
 
Intro infestat
Intro infestatIntro infestat
Intro infestatamfsousa79
 
estatistica discreta, estatistica inferencial
estatistica discreta, estatistica inferencialestatistica discreta, estatistica inferencial
estatistica discreta, estatistica inferencialElizeuNetto2
 

Similaire à Introdução Estatística (20)

Capítulo ii estatística iniciais
Capítulo ii   estatística  iniciaisCapítulo ii   estatística  iniciais
Capítulo ii estatística iniciais
 
Unidade i conceitos fundamentais de estatística
Unidade i   conceitos fundamentais de estatísticaUnidade i   conceitos fundamentais de estatística
Unidade i conceitos fundamentais de estatística
 
Profsidineiindoleonardo 6m1
Profsidineiindoleonardo 6m1Profsidineiindoleonardo 6m1
Profsidineiindoleonardo 6m1
 
Tecnicas de pesquisa de mercado - Amostragem - Aula 5
Tecnicas de pesquisa de mercado - Amostragem - Aula 5Tecnicas de pesquisa de mercado - Amostragem - Aula 5
Tecnicas de pesquisa de mercado - Amostragem - Aula 5
 
4 apostila de estatística i
4 apostila de estatística i4 apostila de estatística i
4 apostila de estatística i
 
EstatisticaConceitos.pptx
EstatisticaConceitos.pptxEstatisticaConceitos.pptx
EstatisticaConceitos.pptx
 
Apostila de estatística i
Apostila de estatística iApostila de estatística i
Apostila de estatística i
 
amostragem.ppt
amostragem.pptamostragem.ppt
amostragem.ppt
 
Apostila teoria da amostragem
Apostila   teoria da  amostragemApostila   teoria da  amostragem
Apostila teoria da amostragem
 
Apos est i_fev04_c1
Apos est i_fev04_c1Apos est i_fev04_c1
Apos est i_fev04_c1
 
Capítulo 1 livro básico probabiliade
Capítulo 1  livro básico probabiliadeCapítulo 1  livro básico probabiliade
Capítulo 1 livro básico probabiliade
 
Apostila bioestatistica 2018
Apostila bioestatistica 2018Apostila bioestatistica 2018
Apostila bioestatistica 2018
 
Estatistica.pptx
Estatistica.pptxEstatistica.pptx
Estatistica.pptx
 
ESTATISTICA.pptx
ESTATISTICA.pptxESTATISTICA.pptx
ESTATISTICA.pptx
 
Introdução à estatística 01 alunos
Introdução à estatística 01 alunosIntrodução à estatística 01 alunos
Introdução à estatística 01 alunos
 
Intro infestat
Intro infestatIntro infestat
Intro infestat
 
Apostila estatistica1
Apostila estatistica1Apostila estatistica1
Apostila estatistica1
 
estatística
estatísticaestatística
estatística
 
Estatistica
EstatisticaEstatistica
Estatistica
 
estatistica discreta, estatistica inferencial
estatistica discreta, estatistica inferencialestatistica discreta, estatistica inferencial
estatistica discreta, estatistica inferencial
 

Introdução Estatística

  • 1. E.E. "Professor Astor Vianna" APOSTILA DE ESTATÍSTICA
  • 2. CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA 1.1 Conceito, Origem e Desenvolvimento da Estatística. Vamos estudar o conceito de estatística a partir de três vertentes. Chama-se de estatística: 1. O conjunto de elementos numéricos relativos a um fato. 2. O conjunto de técnicas para fazer predições com base em probabilidades. 3. O conjunto de técnicas para fazer inferências com base em amostras. Estatística é a ciência que investiga os processos de obtenção, organização e análise de dados sobre uma população e os métodos para tirar conclusões e fazer predições com base nesses dados. 1.2 Um Pouco de História No século XI, Guilherme, o conquistador, ordenou que fosse feito um censo das propriedades No princípio a estatística referia-se apenas a informações de interesse do estado (nação) para exercer controle fiscal ou para segurança nacional. Por isso o nome estatística: ciência do estado. 1.3 Porque Utilizar Estatística A estatística está presente no nosso dia a dia. A todo o momento fazemos estimativas e predições com base em informações que dispomos. Esta ciência é útil para conhecer determinada situação. É uma forma de representar e simplificar determinada realidade, a partir de dados nela coletados com a finalidade de planejar e tomar decisões. 1.4 Estatística nas Empresas No mundo atual, a empresa é uma das vigas-mestras da economia dos povos. A direção de uma empresa exige de seu(s) administrador(es) a importante tarefa de tomar decisões. O conhecimento e o uso da estatística facilitarão esse trabalho. Por meio de experimentos, sondagens, coleta de dados ou opiniões; podemos conhecer a realidade geográfica e social, os recursos naturais, humanos e financeiros; estabelecer metas e objetivos. Fatores muito importantes e muito utilizados por EMPREENDEDORES e pelos GOVERNOS. Exercícios: 1. Cite exemplos de utilização da estatística. ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ 2. Você utiliza ou já utilizou estatística em sua vida acadêmica ou profissional? ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ 2
  • 3. CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA 2. Variáveis Variável é, convencionalmente, o conjunto de resultados possíveis de um fenômeno e se dividem em QUALITATIVAS E QUANTITATIVAS. 2.1 Variável Qualitativa – quando se refere à qualidade, estará sempre associada a um atributo e podem ser nominais e ordinais. • Variável qualitativa nominal – quando respostas podem ser encaixadas em categorias, independentes uma das outras, sem nenhuma relação com as outras. Ex: Time de futebol (flamengo, Vasco, fluminense, etc), Causa morte (câncer, tuberculose, etc) • Variável qualitativa ordinal – mantém uma relação de ordem uma com as outras. Ex: Classe social (alta, média, baixa), Conceitos obtidos em uma disciplina (A, B, C, D). 2.2 Variável Quantitativa – Quando se refere à quantidade, seus valores são expressos por números e podem ser discreta ou contínua. • Variável quantitativa discreta – relacionada a contagens ou enumerações, não admite decimais. Ex: Quantidade de alunos, Número de cadeiras, etc. • Variável quantitativa contínua – Relacionada a medições, onde a variável pode assumir qualquer valor dentro de um intervalo. Ex: Altura, idade, etc. Exercícios 1. Classifique as variáveis: α) Número de clientes. β) Produção agrícola de arroz. χ) Sexo. δ) Raça de cães. ε) Grupo sanguíneo. φ) Velocidade de um veículo. γ) Partido político. 3
  • 4. CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA h) N° de hemácias por mm 2 η) Didática de um professor. ι) Temperatura. ϕ) Salário. 2. Dê exemplos de: a) Variável qualitativa nominal b) Variável quantitativa contínua c) Variável quantitativa discreta d) Variável qualitativa ordinal 3 - POPULAÇÃO E AMOSTRA 3.1 População Estatística – É o conjunto de indivíduos portadores de pelo menos uma característica comum, onde sempre é possível considerar todos os elementos. O pesquisador é quem define a população estatística principalmente pela atribuição de características a essa população. 3.2 Amostra – É o subconjunto finito de uma população, isto é, uma pequena parte do todo. Mas para que as inferências sejam corretas é necessário que tenhamos uma amostra significativa da população e que as amostras sejam obtidas por processos adequados. Assim, pode-se dizer que trabalhar com amostras é bem mais fácil, mais econômico e mais rápido. A amostra deve representar fidedignamente a população, por isso, exigi-se certas técnicas para a obtenção de amostras não tendenciosas e imparciais, como deve ser todo trabalho estatístico, estas técnicas são obtidas através da amostragem. 4 - PRINCIPAIS TÉCNICAS DE AMOSTRAGEM 4.1 Amostra Casualizada – É quando todos os elementos da população tem a mesma probabilidade de participarem da amostra. Equivalente a um sorteio. Por exemplo, uma clínica com 100 pacientes, onde se deseja uma amostra de 20 elementos. Colocamos todos os nomes em uma urna e aleatoriamente retiramos os 20 nomes 4
  • 5. CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA 4.2 Amostra Sistemática – É aquela que se adota um sistema intervalar (tempo ou espaço) para a obtenção dos dados, ou seja, quando os elementos da população já se acham ordenados e o pesquisador determina o sistema. Por exemplo, Prontuários médicos, 1 a cada 5; Linhas de produção 1 a cada 100. 4.3 Amostra Estratificada – Ocorre quando dividimos a população em sub populações (estratos), e dentro de cada estrato retiramos uma certa quantidade de elementos. Essa retirada pode ser casualizada ou sistemática. Por exemplo, supondo que dos 100 pacientes do primeiro exemplo utilizado, 60 sejam homens e 40 mulheres são, portanto dois estratos (masculino e feminino). Se queremos uma amostra de 20%, logo: Amostragem masculina = 12 elementos; Amostragem feminina = 8 elementos. 4.4 Amostra por Conglomerado – É aquela onde dividimos a população em conglomerados (seções) e sorteamos uma certa quantidade de conglomerados, trabalhando com todos os elementos das seções sorteadas. Por exemplo, estudo sobre a estatura dos alunos da UCB, dividiríamos a população em seções (cursos) e realizaríamos um sorteio para saber com que cursos iriam trabalhar. 4.5 Amostra por Conveniência – É aquela que se obtém os dados por comodidade. Por exemplo, para realizar uma pesquisa com alunos do curso de Educação Física. Realizaríamos em nossa instituição. Exercícios 1. A carteira de clientes de uma agência está organizada em um arquivo, por ordem alfabética. Qual o tipo de amostra e a maneira mais simples de amostrar 1/ 3 dos clientes? ______________________________________________________________________________ ______________________________________________________________________________ ______________________________________________________________________________ 2. Defina população estatística, exemplifique e atribua TRÊS características a essa população. ______________________________________________________________________________ ______________________________________________________________________________ ______________________________________________________________________________ ______________________________________________________________________________ 3. Relacione: 1. Amostra sistemática. 2. Amostra por conglomerado. 3. Amostra estratificada. 4. Amostra casualizada. 5. Amostra por conveniência. ( ) Quando divide a população em sub populações. ( ) Quando a população já se acha ordenada. ( ) Quando se obtém por comodidade. ( ) Quando se assemelha a um sorteio. ( ) Quando se seleciona apenas parte da população. 5
  • 6. CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA ( ) Quando dividimos a população em conglomerado 4. Alunos de uma universidade resolveram realizar uma pesquisa de intenção de votos para a eleição de um novo reitor daquela instituição. O trabalho foi realizado no período de 10 a 15 de junho de 2012 com toda a comunidade acadêmica. Foram ouvidos, de forma aleatória, 236 eleitores sendo o mesmo percentual para alunos e funcionários. Responda: a) A população estatística; ______________________________________________________________________________ ______________________________________________________________________________ b) A técnica de amostragem utilizada. ______________________________________________________________________________ ______________________________________________________________________________ ______________________________________________________________________________ 5. MÉTODO ESTATÍSTICO O método estatístico compreende um ciclo que vai da concepção do problema até as conclusões. Realiza-se pela aplicação do método cientifico, pelas fases a seguir: Definição do __ Coleta de __ Análise de __ Conclusões Problema Dados Dados Vejamos cada fase. 5.1 Definição do Problema Esta fase é a mais importante. Onde é claramente definido o problema e o objetivo a ser alcançado. Hipóteses são levantadas. Essas definições irão conduzir as fases subseqüentes. Para estatística, o produto importante da definição do problema é a delimitação da população. Outro aspecto importante da definição de problema é o levantamento de hipóteses. Fazem-se perguntas ou afirmações sobre a população, originadas em conhecimentos anteriores ou na percepção dos pesquisadores. Definida a população e formuladas as hipóteses precisamos elaborar um instrumento para coleta de dados. 5.2 Coleta de Dados Há várias maneiras de coletar dados. O meio mais comum é o uso de questionários ou formulários, compostos por perguntas. Elaborar um questionário é uma das tarefas mais importantes em um trabalho de pesquisa, é por meio deles que os dados serão obtidos e registrados. Ele precisa ser claro, objetivo e não dar margem a dúvidas ou a má interpretação. O questionário pode ser preenchido pelo entrevistador ou pelo entrevistado. A maior vantagem no uso do questionário é o anonimato do entrevistado o que possibilita respostas muito mais verdadeiras. As partes que compõem um questionário são: 1. Cabeçalho – Serve para identificar quem promove a pesquisa; 6
  • 7. CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA 2. Textos de instruções e apresentação do entrevistador – Contém orientações e avisos para o entrevistado. 3. Variáveis de identificação da unidade pesquisada ou da entrevista – Localizar a unidade amostral ordenando os questionários. 4. Perguntas - Conjunto de questões. 5. Agradecimento – Agradecer a contribuição do entrevistado para o trabalho. 5.3 Análise de dados Analisar dados consiste em aplicar técnicas estatísticas para interpretar os resultados obtidos. Nesta fase procura-se responder às perguntas de pesquisa e confirmar ou refutar as hipóteses, para isso utilizam representações dos dados em tabelas e/ou gráficos. 5.4 Conclusões Feita a análise dos dados coletados, chega-se á última fase de um trabalho de pesquisa. As conclusões são feitas na forma de afirmações sobre os dados, baseada nas análises. Nessa etapa as hipóteses serão confirmadas ou refutadas. As conclusões baseiam-se nos resultados das análises e de conhecimentos anteriores sobre o tema. Não podem decorrer de interpretações subjetivas. 6. TABELAS Tem o objetivo de sintetizar os valores que uma ou mais variáveis podem assumir, para que tenhamos uma visão global da avaliação dessa ou dessas variáveis. Fornecendo rápidas e seguras informações. Uma tabela compõe-se de: • Título – Explica o que o trabalho contém, devendo responder as seguintes perguntas: O que?, Onde? e Quando? • Cabeçalho – especifica o conteúdo das colunas. • Corpo – Formado por linhas e colunas de dados. • Rodapé – Pode apresentar chamadas e notas, além da Fonte que não deve deixar de ser exibida já que Identifica o responsável (is) pelo trabalho. 7
  • 8. CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA A tabela deve ser delimitada por traços horizontais, traços verticais somente para separar colunas, nunca para delimitar a tabela. Observe o modelo: Título Cabeçalho Cabeçalho C o r p o Rodapé 7. GRÁFICOS Os resultados de uma pesquisa podem ser apresentados por meio de gráficos, porém estes devem ser: simples, bonitos e fáceis de serem interpretados. Caso contrário, a apresentação a apresentação por meio de gráfico não faz sentido. Os gráficos mais comuns são: EM COLUNAS, BARRAS, LINHAS E ÁREA ou PIZZA. 7.1 Normas de Representação Gráfica Não há normas rígidas para a representação gráfica de dados. São indispensáveis apenas título e fonte dos dados, recomendando-se a adequação ao tipo de variável. 7.2 Construção de gráficos utilizando o programa Microsoft XP 1° Passo – Clicar em INICIAR; PROGRAMAS; EXCEL ou atalho EXCEL na área de trabalho. 2° Passo – Inserir dados. 3° Passo – Selecionar as células utilizadas. 4° Passo – Clicar ASSISTENTE DE GRÁFICO na barra de ferramentas. 5° Passo – Escolher o tipo de gráfico e AVANÇAR. 6° Passo – Verificar se as séries estão em colunas e AVANÇAR. 8
  • 9. CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA 7° Passo – TÍTULO digitar o título do gráfico e se necessário informações para o eixo de categorias e valores. 8° Passo – EIXOS a opção de apresentação de identificação das categorias e valores. 9° Passo – LINHAS DE GRADE opção de retirar ou inserir linhas para auxílio na leitura de gráficos. 10° Passo – LEGENDA quando houver necessidade de informações quanto as colunas. 11° Passo – RÓTULO DE DADOS para que o valor referente a cada categoria apareça. 12° Passo – TABELA DE DADOS não utilizar. 13° Passo – POSICIONAR COMO PLANILHA OU COMO OBJETO planilha o gráfico a exibição se da em tela inteira e como objeto se da como janela. 14° Passo – CONCLUIR. * Para trocar a cor de todas as colunas, clicar uma vez sobre uma das colunas em seguida dois cliques sobre qualquer coluna e abrirá um menu de cores. Selecionar a cor e clicar OK. ** Para trocar a cor de cada coluna individualmente, clicar uma vez sobre qualquer coluna em seguida um clicar sobre a coluna que deseja alterar a cor e dois cliques para abrir o menu de cores. Selecionar a cor desejada e clicar OK. *** Para voltar em OPÇÕES DE GRÁFICO depois de concluído, clicar com o botão direito sobre área do gráfico. 8. ARREDONDAMENTO DE DADOS Arredondar um número significa reduzir a quantidade de algarismos após a vírgula, deste número. O arredondamento de dados ocorre de duas formas, a saber: a) Quando o algarismo a ser abandonado é 0,1, 2, 3 ou 4. ex: 2,764 para centésimos 2,76 b) Quando o algarismo a ser abandonado é 5,6,7,8 ou 9. ex: 8,957 para centésimos 8,96 Obs: Não devemos realizar arredondamentos sucessivos. ex de arredondamentos sucessivos: 0,2685485 para centésimos 0,26859 0,2686 0,269 0,27 Nesses casos devemos conservar apenas o primeiro algarismo após a unidade que deseja arredondar e desprezar as demais, em seguida aplicar uma das técnicas informadas anteriormente. 9
  • 10. CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA ex: 0,2685485 para centésimos 0,27 NOSSAS ATIVIDADES DEVERÃO SER ARREDONDADAS PARA DÉCIMOS Exercício Aplique o arredondamento: a) 15,2586 b) 4.056 c) 1,3333333... d) 29,899 e) 8,964012 f) 9.95 9. DISTRIBUIÇÃO DE FREQÜÊNCIA Determinamos distribuição de freqüência o número que fica relacionado a um determinado valor da variável. Obtemos, assim, uma tabela que recebe o nome de DISTRIBUIÇÃO DE FREQUÊNCIA. 9.1 Métodos Para a Distribuição de Freqüência Tabela primitiva – É a tabela cujos elementos não foram numericamente organizados. Exemplo: Estatura, em cm, de participantes do projeto “Micro Escola da UCB” jul / 2011. 166 160 161 150 162 160 163 162 161 168 163 156 170 155 152 190 189 155 190 154 161 156 172 153 181 Rol – É a maneira mais simples de organizar os dados através de uma ordenação CRESCENTE OU DECRESCENTE. Exemplo: Estatura, em cm, de participantes do projeto “Micro Escola da UCB” jul / 2011. 150 155 160 161 163 172 190 152 155 160 162 166 181 153 156 161 162 168 189 154 156 161 163 170 190 Freqüência de uma classe – O número de valores da variável pertencente à classe. O que passará a se chamar distribuição de freqüência com intervalos de classe. Exemplo: Tabela 1 1
  • 11. CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA Estatura, em cm, de participantes do projeto “Micro Escola da UCB” jul / 2011. Estatura (cm) Freqüência 150  158 8 158  166 9 166  174 4 174  182 1 182 !--! 190 3 Total 25 Nota: Os intervalos devem ser escritos de acordo com a resolução do IBGE, em termos de: DESTA QUANTIDADE ATÉ MENOS AQUELA ( inclusão  exclusão). 9.2 Frequencia Absoluta –F(abs) É o número de vezes que cada variável estatística assume, o mesmo que freqüência. 9.3 Frequencia Relativa - F(%) Calculada a partir da divisão de freqüência absoluta pelo N multiplicado por 100, pois o resultado em percentual é mais fácil de ser interpretado. F(%)= F (abs) . 100 N Estatura, em cm, de participantes do projeto “Micro Escola da UCB” jul / 2011. Estatura (cm) F (abs) F (%) 150  158 8 32 158  166 9 36 166  174 4 16 174  182 1 4 182 !--! 190 3 12 Total 25 100 9.4 Freqüência Acumulada (Fac) Freqüência Acumulada Crescente (ou Freqüência acumulada ”abaixo de”, ou Freqüência acumulada ”até”) que representaremos por Fac é a soma das freqüências absolutas anteriores de uma determinada classe. 1
  • 12. CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA Por exemplo, na tabela acima, a Freqüência acumulada crescente é: 8+9=17; 17+4=21; 21+1=22; 22+3=25 Estatura, em cm, de participantes do projeto“Micro Escola da UCB” jul / 2011. Estatura (cm) F (abs) F (%) Fac 150  158 8 32 8 158  166 9 36 17 166  174 4 16 21 174  182 1 4 22 182 !--! 190 3 12 25 Total 25 100 --- 10. ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA 10.1 Classes São intervalos de variação da variável. Representadas por i. Sendo i = 1, 2, 3, ... , k 10.2 Como determinar o número de classes para agrupamento de dados. Sendo: k – Número de classes; n – Número de dados da variável. Fórmula para quantidade de classes: nk = Recomenda-se que o número de classes esteja entre 5 e 15. Exemplo: Utilizando dados do exemplo anterior: n = 25 25=k ⇒ 5 logo k = 5 classes Se k for maior que 15, use k=15. Caso seja menor que 5 usar k=5. 10.3 Como determinar a amplitude dos limites de classes. Sendo: Max: Menor dado da série Min: Maior dado da série Fórmula para limite de classe: lim classe = (max – min) k Exemplo: 1
  • 13. CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA Aplicando a fórmula utilizando dados da tabela 1: lim classe = 191 – 150 = 41 / 5 = 8,2 5 Os limites das classes deverão apresentar amplitude de 8 cm Limite de classe – São os limites de cada classe. Sendo o menor número limite inferior da classe e o maior número limite superior da classe. 10.4 Amplitude 10.4.1 Do intervalo de classe – É a medida do intervalo de cada classe, obtida pela diferença entre os limites, SUPERIOR e INFERIOR da classe representada por h. Assim: h = L – l 10.4.2 Total da distribuição – è a diferença entre o limite superior máximo e o limite inferior mínimo, ou seja, o maior e o menor valor da variável. Representada por AT, pode ser calculada por AT = L(Max) – l(min) 10.4.3 Amplitude amostral (AA) – é a diferença entre o valor máximo e o valor mínimo da amostral AA= x(Max.) – x(min.) EXERCÍCIOS 1. A tabela abaixo apresenta o número de atendimentos na clínica “bela” no mês de maio / 2011: 14 21 11 13 14 13 12 14 13 20 11 12 06 10 09 18 15 19 16 12 11 14 14 13 15 12 14 08 11 14 Construa uma DISTRIBUIÇÃO DE FREQÜÊNCIA com intervalo de classe CINCO 2. A tabela abaixo apresenta a IDADE de alunos da turma 502 da Escola Municipal Pará Cidade do Rio de Janeiro 2010: 14 12 11 13 14 13 12 09 13 20 11 12 17 13 10 18 15 19 16 12 11 14 14 08 15 12 14 08 11 14 Construa uma distribuição de freqüência, calcule os limites de classe, amplitude do intervalo, amplitude total da distribuição, amplitude amostral e uma distribuição de freqüência. 3. Conhecidas as notas em uma avaliação de ESTATÍSTICA: 85, 75, 25, 45, 10, 55, 50, 55, 80, 55, 40, 60, 50, 45, 45, 35, 90, 70, 85, 80, 70, 45, 30,100, 30. Obtenha uma DISTRIBUIÇÃO DE FREQÜÊNCIA. 1
  • 14. CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA 4. Crie uma situação problema e construa: a. Uma tabela primitiva; b. Um ROL; c. Uma distribuição de freqüência. 11. Medidas de Tendência Central Para uma Amostra Os dados quantitativos, apresentados em tabelas e gráficos, constituem a informação básica do problema em estudo. Mas é conveniente apresentar, além dos dados, medidas que mostrem a informação de maneira resumida. As medidas de tendência central dão valor ao ponto em torno do qual os dados se distribuem. São as medidas de tendência central, MÉDIA ARITMÉTICA, MEDIANA E A MODA. 11.1 Média ( x ) A média é uma medida de tendência central que caracteriza, em parte, uma distribuição de dados. 11.1.1 Média Aritmética Simples - É o quociente da divisão da soma dos valores da variável pelo número deles. Representada por x Exemplo: A = {2, 3, 4, 5, 6} x = 2 + 3 + 4 + 5 + 6 = 20 / 5 = 4 5 Fórmula da Média Simples: x = n xi n i ∑=1 11.1.2 Média Aritmética Ponderada – É o quociente da soma dos produtos desses números pela soma das respectivas freqüências ou pesos. Exemplo: xi 0 1 2 3 4 5 fi 2 3 5 4 0 1 x = (2 x 0) + (3 x 1) + (5 x 2) + (4 x 3) + (0 x 4) + (1 x 5) = 2 + 3 + 5 + 4 + 0 + 1 x = 0 + 3 + 10 + 12 + 0 + 5 = 30 = 2 15 15 Logo: x = 2 1
  • 15. CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA Fórmula da média aritmética ponderada: ∑ ∑ = = = n i i n i ii p p px m 1 1 11.1.3 Desvio em Relação à Média – É a diferença entre cada elemento de um conjunto de valores e a média aritmética desse conjunto. Desvio = xxi − Lembrando que a soma dos desvios será sempre igual a zero. Exemplo: C = {2, 3, 4, 5, 6} x = 2 + 3 + 4 + 5 + 6 = 20 / 5 = 4 5 Desvios em relação à média: D1 = 2 – 4 = -2 D2 = 3 – 4 = -1 D3 = 4 – 4 = 0 D4 = 5 – 4 = 1 D5 = 6 – 4 = 2 Soma dos desvios: (-2) + (-1) + (0) + ( 1) + (2) = 0 0)( 1 =−∑= n i xxi A média é utilizada quando: a) Desejamos uma medida de posição que possui maior estabilidade; b) Houver necessidade de um tratamento algébrico. 11.2 Mediana Representada por Md, a mediana é definida como sendo a realização que ocupa a posição central de uma série de observações quando estas estão ordenadas segundo as suas grandezas. Para determinar a mediana temos dois casos: 11.2.1 Quando a variável apresentar uma quantidade ÍMPAR de parcelas devemos identificar o valor que ocupa posição central dessa distribuição. Fórmula: Md = 2 1+n Exemplo: {2, 3, 4, 5, 6} 1
  • 16. CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA n = 5 Md = 3 2 15 = + ° * Md = 4 *A aplicação da fórmula indicará a posição da parcela mediana e não o valor. 11.2.2 Quando a variável apresentar uma quantidade PAR de parcelas, não teremos UM valor para representar a mediana e sim DOIS valores. Devemos então, identificar os valores que ocupam a posição central dessa distribuição e calcular a média aritmética desses valores. Fórmula: Md = 1 22 + n e n Exemplo: {2, 3, 4, 5, 6, 7} n = 6 Md = 1 2 6 2 6 +e Md = 3° e 4° ** Md = 4 e 5 ⇒ 4 + 5 = 4,5 2 ** A aplicação da fórmula indicará a posição da parcela mediana e não o valor. Empregamos a mediana quando: a) Desejamos obter o ponto que divide a distribuição em partes iguais; b) Há valores extremos que afetam de uma maneira acentuada a média. 11.3 Moda Denominamos moda o valor que ocorre com maior freqüência em uma série de valores. Representada por Mo Denominamos moda o valor que ocorre com maior freqüência em uma série de valores. Representada por Mo Ela pode ser: • Modal, quando apresenta apenas uma moda (freqüência); Exemplo: {2, 1, 7, 6, 9, 2, 3, 2} Mo = modal em 2 • Amodal, quando não tem moda (freqüência); Exemplo: {5, 3, 9, 8, 2, 10, 1} Mo = amodal • Bimodal, quando tem duas modas (freqüências); Exemplo: {8, 6, 2, 5, 15, 7, 2, 1, 5} Mo = bimodal em 2 e 5 1
  • 17. CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA • Multimodal, quando apresenta três ou mais modas. Exemplo: {8, 6, 2, 5, 15, 7, 2, 1, 5, 3, 8} Mo = Multimodal em 2, 5 e 8 EXERCÍCIOS 1. Sabendo que a freqüência de pacientes em uma determinada semana na clínica “up” foi de 15, 17, 25, 12, 19, 11, 12. Calcule: a) Média; b) Mediana; c) Moda d) Desvio em relação à média. 2. Determinar a moda, média e mediana nos seguintes casos: α) 3, 5, 15, 4, 9, 10, 6. β) 1, 7, 7, 9, 8, 3, 7, 9, 5, 6, 4. χ) 28, 11, 65, 48, 100, 51, 78, 24. 3. As notas de um candidato, em seis provas de um concurso, foram: 8,4; 9,1; 7,2; 6,8; 8,7; 7,2. Sabendo-se que as TRÊS primeiras apresentam peso 2 e as TRÊS últimas peso 3. Determine: a) Nota média; b) Nota mediana; c) Nota modal; d) Desvio em relação à média. 12. Medida de Dispersão Para uma Amostra As medidas de dispersão indicam a variação dos dados, demonstrando se os elementos estão próximos entre si ou não. Algumas medidas de dispersão dão uma idéia do quanto à média é adequada para representar um conjunto. Quando um conjunto de dados varia pouco em relação à Média, ela representa bem o conjunto. Ao contrário, se os elementos de um conjunto são muito dispersos a Média não é uma boa representante. Exemplo: A = {50, 55, 65, 65, 70, 75} Média = 63,3 (Indicado para medida de tendência central) B = {9, 9, 40, 80, 81, 88, 100} Média = 58,1 (Indicado para medida de dispersão) A Média 63,3 representa os valores do conjunto A. A Média 58,1 representa os valores do conjunto B. É razoável pensar que esta Média inclui dados como o 9 ou o 100? Não, pois esses números estão distantes da Média. Com isso fica demonstrado que é preciso medir essa dispersão, para dar mais informações sobe o conjunto. Só a Media não basta. Ela deve ser apresentada em conjunto com alguma MEDIDA DE DISPERSÃO, que vai indicar o quanto ela é representativa do conjunto de dados. 1
  • 18. CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA Conhecendo as medidas de dispersão em relação à Média aritmética: Amplitude Variância Desvio padrão Coeficiente de variação Entendendo melhor as medidas de dispersão: Nota de quatro alunos em cinco provas NOME NOTAS MÉDIA Antônio João José Pedro 5 6 10 10 5 4 5 10 5 5 5 5 5 4 5 0 5 6 0 0 5 5 5 5 Todos obtiveram MÉDIA igual a cinco, mas a dispersão das notas em torno da média não é a mesma para todos os alunos. a) As notas de Antônio não variam (dispersão nula) b) As notas de João variam menos que as de José (dispersão de João menor que a dispersão de José) c) As notas de Pedro variam mais do que as notas de todos (maior dispersão) 12.1 AMPLITUDE Amplitude é a diferença entre o maior e o menor dado observado. Dados da tabela acima: Exemplo: (a) Amplitude das notas de Antônio a) = 5 – 5 = 0 b) Amplitude das notas de João a = 6 – 4 = 2 c) Amplitude das notas de José a = 10 – 0 = 10 d) Amplitude das notas de Pedro a = 10 - 0 = 10 1
  • 19. CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA A Amplitude não mede bem a dispersão, porque seu cálculo usa valores extremos. Mesmo assim é muito usado por ser fácil de calcular e interpretar. 12.2 VARIÂNCIA Calculados os desvios em relação à Média, variância é a diferença entre cada dado e a Média. Para evitar que a soma dos desvios seja nula, podemos usar o quadrado dos desvios. Lembrando que há desvios positivos e negativos, pois a média fica no centro do conjunto. Se elevarmos os desvios ao quadrado, eliminaremos todos os sinais negativos. E assim definimos a variância ( s 2 ) como a média do quadrado do desvios. Exemplo: Dados: 0, 4, 6, 8, 7 Média: 5 Desvios: -5, -1, 1, 3, 2 Cálculo da soma de quadrados dos desvios Dados (X) Desvios (X - X ) Quadrado dos desvios (X - X ) 2 0 4 6 8 7 -5 -1 1 3 2 25 1 1 9 4 X =5 ∑ −x( x )=0 40)( 2 =−∑ xx A soma do quadrado dos desvios não é usada como medida de dispersão. Fórmula para cálculo da variância: 1 )( 2 2 2 − − = ∑ ∑ n n x x s 1
  • 20. CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA Aplicando a fórmula: x x 2 0 4 6 8 7 0 16 36 64 49 Substituindo: n = 5 10 4 40 4 125165 4 5 625 165 4 5 25 165 2 2 == − = − = − =s Para entender melhor a variância: α) Para as notas de Antônio que não variam, 0 2 =s β) Para as notas de João, que variam menos que as notas de José, 1 2 =s , menor que a variância das notas de José, que é .5,12 2 =s χ) Para as notas de Pedro, que variam mais do que as outras, a variância é 25 2 =s , maior que todas as outras variâncias. Aluno Notas Média Variância Antônio João José Pedro 5 6 10 10 5 4 5 10 5 5 5 5 5 4 5 0 5 6 0 0 5 5 5 5 0 1 12,5 25 12.3 DESVIO PADRÃO 2
  • 21. CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA Como medida de dispersão, a variância tem a desvantagem de apresentar unidade de medida igual ao quadrado da unidade de medida dos dados. Por exemplo, se os dados estão em metros a variância fica em metros ao quadrado. Mas existe uma medida de dispersão que apresenta as propriedades da variância e tem a mesma unidade de medida dos dados. É o desvio padrão definido como RAIZ QUADRADA DA VARIÂNCIA, com sinal positivo. O desvio padrão é representado por s. Fórmula do desvio padrão: ss 2 = , ou seja, 1 )( 2 2 − − = ∑ ∑ n ns xx Para as notas do aluno José, cuja variância já foi calculada, tem-se o DESVIO PADRÃO: 5,12=S = 3,54 12.4 Coeficiente de Variação O Coeficiente de Variação é a razão entre o desvio padrão e a Média. O resultado é multiplicado por 100, para que o coeficiente de variação seja dado em porcentagem. CV = 100. X S Para se entender como se interpreta o coeficiente de variação, imagine dois grupos de pessoas. No primeiro grupo, as pessoas têm idades: 3, 1 e 5 E no segundo grupo as pessoas têm idades: 55, 57 e 53 No primeiro grupo a média é 3 anos, e no segundo grupo média 55 anos. Com a mesma dispersão, A variância de ambos é 4 2 =s . Vejamos os coeficientes de variação: No primeiro grupo, o Coeficiente de Variação é: CV = 6,66100. 3 2 = 7% No segundo grupo, o Coeficiente de Variação é: CV = 64,3100. 55 2 = % 2
  • 22. CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA Um coeficiente de variação igual a 66,67% indica que a dispersão dos dados em relação à média é muito grande. Já um coeficiente de variação 3,64% indica que a dispersão dos dados em relação à média é pequena. Em outras palavras, diferenças de 2 anos são relativamente mais importantes no primeiro grupo, que tem média 3 (coeficiente de variação é 66,67%0 do que no segundo grupo, que tem média 55 (o coeficiente de variação é 3,64%). Então coeficiente de variação mede DISPERSÃO EM RELAÇÃO À MÉDIA. EXERCÍCIOS 1. Calcule a amplitude total dos conjuntos de dados: a) 1, 3, 5, 9. b) 20, 14, 15, 19, 21, 22, 20. c) –10, -6, 2, 3, 7, 9, 10. 2. Sabendo que um conjunto de dados apresenta para média aritmética e para desvio padrão, respectivamente, 18,3 e 1,47, calcular o COEFICIENTE DE VARIAÇÃO. 3. Um grupo de 100 estudantes tem uma estatura média de 163,8 cm, com um coeficiente de variação de 3,3%. Calcular o desvio padrão. 4. Dada a distribuição relativa de 100 notas de avaliação realizada por um fisioterapeuta, segundo critérios próprios, para o desempenho de atletas. Notas (xi) 0 1 2 3 4 5 Freqüência (yi) 4 14 34 29 16 6 Calcule o desvio padrão. 2
  • 23. CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA REFERÊNCIAS VIEIRA, Sonia. Introdução à bioestatística, 3ed, Rio de Janeiro, 2004. MARIA, Inez M. Estatística Básica. Brasília, MSD, 2005. RODRIGUES, Pedro C. Bioestatística. Niterói: EDUFF, 1983. CRESPO, Antonio A. Estatística Fácil. São Paulo, ed Saraiva, 2001 2