SlideShare une entreprise Scribd logo
1  sur  37
Estatística

         4º Período ADS
Prof. Aristóteles Meneses Lima
Frequência e Histogramas
• Imagine que você estava lendo uma revista
  para descobrir o melhor lugar para se comer
  algo;
• Imagine que você goste de Lámen, com isso,
  você faz uma tabela de preços.
• Como será essa tabela?
PREÇOS DE LÁMEN NOS 50 MELHORES RESTAURANTES
RESTAURANTE     PREÇO          RESTAURANTE    PREÇO
1                         700 26                       780
2                         850 27                       590
3                         600 28                       650
4                         650 29                       580
5                         980 30                       750
6                         750 31                       800
7                         500 32                       550
8                         890 33                       750
9                         880 34                       700
10                        700 35                       600
11                        890 36                       800
12                        720 37                       800
13                        680 38                       880
14                        650 39                       790
15                        790 40                       790
16                        670 41                       780
17                        680 42                       600
18                        900 43                       670
19                        880 44                       680
20                        720 45                       650
21                        850 46                       890
22                        700 47                       930
23                        780 48                       650
24                        850 49                       777
25                        750 50                       700
Como podemos tornar essa tabela
          mais significativa?
• Transformá-la em um gráfico;
• Para fazer um gráfico primeiro temos que dividir os
  preços em grupos.
• Vamos supor que....
• Há um shopping center gigante composto de 50
  restaurantes de Lámen...e somente restaurantes de
  Lámen!
• Cada restaurante serve apenas um tipo de Lámen, e
  os restaurante são distribuídos em diferentes pisos
  de acordo com o preço do Lámen.
• Essa divisão de grupos é chamada de classe em
  Estatística.
Piso (Classe)
Igual ou Maior
que/Menor que



 5P              5 18 47
 900-1000


 4P              37 38 46
 800-900         2 8 9 11 19 21 24 31 36


 3P              26 30 33 34 39 40 41 49 50
 700-800         1 6 10 12 15 20 22 23 25


 4P              43 44 45 48
 600-700         3 4 13 14 16 17 28 35 42


 1P              7 27 29 32
 500-600
GUIA DE PISOS
PISO               NOME DO RESTAURANTE    MÉDIA DA CLASSE
>=         <
5P                 XXX                    950
900-1000
4P                 XXX                    850
800-900            XXXXXXXXX
3P                 XXXXXXXXX              750
700-800            XXXXXXXXX
2P                 XXXX                   650
600-700            XXXXXXXXX
1P                 XXXX                   550
500-600

• EM CADA PISO, UMA PLACA INDICA O PREÇO CENTRAL DE CADA
  CLASSE.
• O SEGUNDO PISO É A CLASSE DO INTERVALO ENTRE 600 E 700,
  ONDE SE TEM UMA LOJA COM UMA PLACA DE 650.
• ISSO RECEBE O NOME PONTO MÉDIO DA CLASSE.
• Uma vez que este shopping center distribui
  cada loja em um piso diferente de acordo com
  o preço, o número de lojas em cada piso varia.
• O número de restaurantes em cada piso
  recebe o nome de frequência.
• Agora, tente calcular a frequência relativa de
  restaurantes no terceiro piso.
• Frequência Relativa é parecido com
  porcentagem, é a proporção em relação ao
  total, quando o total é considerado como 1.
TABELA DE FREQUÊNCIA DOS 50 MELHORES RESTAURANTES DE LÁMEN
CLASSE             MÉDIA DA CLASSE   FREQUÊNCIA       FREQUÊNCIA
                                                      RELATIVA
500-600            550               4                0,08
600-700            650               13               0,26
700-800            750               18               0,36
800-900            850               12               0,24
900-1000           950               3                0,06
SOMA                                 50               1,00
• Agora se descrevermos tudo isso usando um
  gráfico de barras chamado HISTOGRAMA...

             HISTOGRAMA (O EIXO VERTICAL É A
                     FREQUÊNCIA)
      20

      15

      10                                 HISTOGRAMA (O
                                         EIXO VERTICAL É A
                                         FREQUÊNCIA)
       5

       0
           550   650   750   850   950
HISTOGRAMA (O EIXO VERTICAL É A FREQUÊNCIA
                         RELATIVA)
 0.4
0.35
 0.3
0.25
 0.2                                       HISTOGRAMA (O EIXO
                                           VERTICAL É A
0.15
                                           FREQUÊNCIA RELATIVA)
 0.1
0.05
  0
       550    650    750    850    950
Média (Valor Médio)
• Observe a tabela:
                 RESULTADO DO TORNEIO DE BOLICHE
EQUIPE A               EQUIPE B               EQUIPE C
Jogadora   Pontuação   Jogadora   Pontuação   Jogadora   Pontuação
LUY-LUY    86          KIMIKO     84          SHINOBU    229
JUN        73          MEGUME     71          YUKA       77
YUMI       124         YOSHIMI    103         SAKURA     59
SHIZUKA    111         MEI        85          KANAKO     95
TOUKO      90          KAORI      90          KUMIKO     70
KAEDE      38          YUKIKO     89          HIRONO     88


• Você sabe o que é Valor Médio?
• O Valor Médio é chamado de Média em
  Estatística. E a média em questão agora é o
  que chamamos de MÉDIA ARITMÉTICA, para
  ser exato.
• Há outros tipos de Média, como MÉDIA
  GEOMÉTRICA e MÉDIA HARMÔNICA, você não
  precisa aprender as fórmulas agora, mas
  sugiro que se lembre desses nomes.
Mediana
                      RESULTADO DO TORNEIO DE BOLICHE
    EQUIPE A               EQUIPE B                EQUIPE C
    Jogadora   Pontuação   Jogadora    Pontuação   Jogadora    Pontuação
    LUY-LUY    86          KIMIKO      84          SHINOBU     229
    JUN        73          MEGUME      71          YUKA        77
    YUMI       124         YOSHIMI     103         SAKURA      59
    SHIZUKA    111         MEI         85          KANAKO      95
    TOUKO      90          KAORI       90          KUMIKO      70
    KAEDE      38          YUKIKO      89          HIRONO      88


• VAMOS DEIXAR DE LADO AS EQUIPES A E B E PRESTAR ATENÇÃO À EQUIPE C.
• A Mediana é o valos central quando se coloca
  os valores em ordem do menor ao maior.
• Primeiro organizamos as pontuações de cada
  equipe.
Equipe A
38 73 86 90 111 124
Equipe B
71 84 85 89 90 103
Equipe C
59 70 77 88 95 229
Dedução
• Número de Valores = Ímpar
               -1041,6 -39,0        -5,7          60,4      77,3


                               MEDIANA


• Número de Valores=Par
        -0,4      35,2       37,8          42,2      46,1      910,3


                         A MEDIANA É O VALOR MÉDIO
                            DESSES DOIS VALORES
Com isso....
Imagine
• Então, você já deve se perguntar porque a
  “Poupança Média” anunciada nos jornais e na
  tv é tão alta.
• A média é alta por causa de alguns
  milionários.
• Nesses casos, a Mediana está bem mais
  próxima das pessoas comuns.
Desvio-Padrão
• Equipes A e B
• Desenhe uma reta numérica e escreva os nomes
  dos jogadores de acordo com suas pontuações.
EQUIPE A                    MÉDIA

                      LUY-LUY

         KAEDE        JUN       TOUKO   SHIZUK
                                                 YUMI
                                          A



0                50               100
EQUIPE B
                    MÉDIA

                        KAORI

                        YUKIKO
                  MEI

                  KIMIKO
         MEGUMI                   YOSHIMI


0   50                      100
• Apesar de a pontuação média de cada equipe
  ser de 87....
• As tendências descritas pelas linhas numéricas
  são bem diferentes.
• O Desvio-Padrão é usado para descrever essa
  dispersão dos dados.
• Em resumo, Desvio-Padrão é um indicador que
  mostra a diferença da média de cada valor
  nesse conjunto.
• O desvio-padrão mínimo é o zero, e na medida
  que a “dispersão dos dados” aumenta, o
  mesmo ocorre com o desvio-padrão.



0 (mínimo)

Sem dispersão
(todos os valores                   dispersos
 são iguais)
Agora responda...
Calculando...
De uma maneira geral...
• A primeira fórmula é aplicada quando se
  calcula o Desvio-padrão de uma população
  inteira.
• A segunda fórmula é usada quando se calcula
  o Desvio-padrão de uma amostra.
Recapitulando....
• Se você acha que algo não ficou claro em
  “Tabelas de distribuição de frequência e
  histogramas”. Vamos rever uma tabela
  apresentada.
       TABELA DE FREQUÊNCIA DOS 50 MELHORES RESTAURANTES DE LÁMEN
CLASSE             MÉDIA DA CLASSE   FREQUÊNCIA       FREQUÊNCIA
                                                      RELATIVA
500-600            550               4                0,08
600-700            650               13               0,26
700-800            750               18               0,36
800-900            850               12               0,24
900-1000           950               3                0,06
SOMA                                 50               1,00
• Como você pode ver, o intervalo de classe
  nessa tabela é 100.
• O intervalo não foi determinado de acordo
  com nenhum tipo padrão matemático – foi
  definido de forma subjetiva. Determinar o
  intervalo de classe cabe a quem está
  analisando os dados.
• Há um jeito de definir o intervalo de classe
  matematicamente.
• Usa-se a Regra de Sturges.
Exercício
• A tabela seguinte é o registro de corrida de 100m de
  várias meninas.
• Atleta     Corrida de 100m
• A          16,3
• B          22,4
• C          18,5
• D          18,7
• E          20,1
1. Qual o valor médio?
2. Qual a mediana?
3. Qual é o desvio-padrão?
Resumo
• Para visualizar o panorama geral dos dados
  intuitivamente, crie uma tabela de frequência ou
  desenhe um histograma;
• Ao fazer uma tabela de frequência, o intervalo de
  classe pode ser determinado pela regra de Sturges;
• Para visualizar os dados matematicamente, calcule
  a média, mediana e o desvio-padrão;
• Quando há um valor muito grande ou pequeno no
  conjunto de dados, é mais adequado utilizar a
  mediana que a média aritmética.
• Desvio-padrão é um índice para descrever “o grau
  de dispersão” dos dados.

Contenu connexe

Plus de Aristóteles Meneses

Estatística tabulações valor-padrão
Estatística tabulações valor-padrãoEstatística tabulações valor-padrão
Estatística tabulações valor-padrãoAristóteles Meneses
 
Tautologias, contradições, contigências e equivalências
Tautologias, contradições, contigências e equivalênciasTautologias, contradições, contigências e equivalências
Tautologias, contradições, contigências e equivalênciasAristóteles Meneses
 
Permutação circulares repetição
Permutação circulares repetiçãoPermutação circulares repetição
Permutação circulares repetiçãoAristóteles Meneses
 
Introdução à logica conceitos e exemplos
Introdução à logica   conceitos e exemplosIntrodução à logica   conceitos e exemplos
Introdução à logica conceitos e exemplosAristóteles Meneses
 
Aula introdução à lógica matemática
Aula introdução à lógica matemáticaAula introdução à lógica matemática
Aula introdução à lógica matemáticaAristóteles Meneses
 
Quantificadores, predicados e validade
Quantificadores, predicados e validadeQuantificadores, predicados e validade
Quantificadores, predicados e validadeAristóteles Meneses
 
Conjuntos numéricos – parte ii 29 02
Conjuntos numéricos – parte ii 29 02Conjuntos numéricos – parte ii 29 02
Conjuntos numéricos – parte ii 29 02Aristóteles Meneses
 

Plus de Aristóteles Meneses (20)

Estatística tabulações valor-padrão
Estatística tabulações valor-padrãoEstatística tabulações valor-padrão
Estatística tabulações valor-padrão
 
Estatística parte1
Estatística parte1Estatística parte1
Estatística parte1
 
Tautologias, contradições, contigências e equivalências
Tautologias, contradições, contigências e equivalênciasTautologias, contradições, contigências e equivalências
Tautologias, contradições, contigências e equivalências
 
Permutação circulares repetição
Permutação circulares repetiçãoPermutação circulares repetição
Permutação circulares repetição
 
Construção da tabela verdade
Construção da tabela verdadeConstrução da tabela verdade
Construção da tabela verdade
 
Contrução da tabela verdade
Contrução da tabela verdadeContrução da tabela verdade
Contrução da tabela verdade
 
Introdução à logica conceitos e exemplos
Introdução à logica   conceitos e exemplosIntrodução à logica   conceitos e exemplos
Introdução à logica conceitos e exemplos
 
Aula introdução à lógica matemática
Aula introdução à lógica matemáticaAula introdução à lógica matemática
Aula introdução à lógica matemática
 
Log1 introducao
Log1 introducaoLog1 introducao
Log1 introducao
 
Limite
LimiteLimite
Limite
 
Permutação simples
Permutação simplesPermutação simples
Permutação simples
 
A álgebra de funções
A álgebra de funçõesA álgebra de funções
A álgebra de funções
 
Quantificadores, predicados e validade
Quantificadores, predicados e validadeQuantificadores, predicados e validade
Quantificadores, predicados e validade
 
Funções parte 1
Funções parte 1Funções parte 1
Funções parte 1
 
Lógica proposicional
Lógica proposicionalLógica proposicional
Lógica proposicional
 
Relações
RelaçõesRelações
Relações
 
Revisão de álgebra ii
Revisão de álgebra iiRevisão de álgebra ii
Revisão de álgebra ii
 
Conjuntos numéricos – parte ii 29 02
Conjuntos numéricos – parte ii 29 02Conjuntos numéricos – parte ii 29 02
Conjuntos numéricos – parte ii 29 02
 
Aula dia 27 02 conj, numéricos
Aula dia 27 02   conj, numéricosAula dia 27 02   conj, numéricos
Aula dia 27 02 conj, numéricos
 
Noções de lógica tautologias
Noções de lógica   tautologiasNoções de lógica   tautologias
Noções de lógica tautologias
 

Estatística descritiva: média, mediana, desvio-padrão e histogramas

  • 1. Estatística 4º Período ADS Prof. Aristóteles Meneses Lima
  • 2. Frequência e Histogramas • Imagine que você estava lendo uma revista para descobrir o melhor lugar para se comer algo; • Imagine que você goste de Lámen, com isso, você faz uma tabela de preços. • Como será essa tabela?
  • 3. PREÇOS DE LÁMEN NOS 50 MELHORES RESTAURANTES RESTAURANTE PREÇO RESTAURANTE PREÇO 1 700 26 780 2 850 27 590 3 600 28 650 4 650 29 580 5 980 30 750 6 750 31 800 7 500 32 550 8 890 33 750 9 880 34 700 10 700 35 600 11 890 36 800 12 720 37 800 13 680 38 880 14 650 39 790 15 790 40 790 16 670 41 780 17 680 42 600 18 900 43 670 19 880 44 680 20 720 45 650 21 850 46 890 22 700 47 930 23 780 48 650 24 850 49 777 25 750 50 700
  • 4. Como podemos tornar essa tabela mais significativa? • Transformá-la em um gráfico; • Para fazer um gráfico primeiro temos que dividir os preços em grupos. • Vamos supor que.... • Há um shopping center gigante composto de 50 restaurantes de Lámen...e somente restaurantes de Lámen! • Cada restaurante serve apenas um tipo de Lámen, e os restaurante são distribuídos em diferentes pisos de acordo com o preço do Lámen. • Essa divisão de grupos é chamada de classe em Estatística.
  • 5. Piso (Classe) Igual ou Maior que/Menor que 5P 5 18 47 900-1000 4P 37 38 46 800-900 2 8 9 11 19 21 24 31 36 3P 26 30 33 34 39 40 41 49 50 700-800 1 6 10 12 15 20 22 23 25 4P 43 44 45 48 600-700 3 4 13 14 16 17 28 35 42 1P 7 27 29 32 500-600
  • 6. GUIA DE PISOS PISO NOME DO RESTAURANTE MÉDIA DA CLASSE >= < 5P XXX 950 900-1000 4P XXX 850 800-900 XXXXXXXXX 3P XXXXXXXXX 750 700-800 XXXXXXXXX 2P XXXX 650 600-700 XXXXXXXXX 1P XXXX 550 500-600 • EM CADA PISO, UMA PLACA INDICA O PREÇO CENTRAL DE CADA CLASSE. • O SEGUNDO PISO É A CLASSE DO INTERVALO ENTRE 600 E 700, ONDE SE TEM UMA LOJA COM UMA PLACA DE 650. • ISSO RECEBE O NOME PONTO MÉDIO DA CLASSE.
  • 7. • Uma vez que este shopping center distribui cada loja em um piso diferente de acordo com o preço, o número de lojas em cada piso varia. • O número de restaurantes em cada piso recebe o nome de frequência. • Agora, tente calcular a frequência relativa de restaurantes no terceiro piso. • Frequência Relativa é parecido com porcentagem, é a proporção em relação ao total, quando o total é considerado como 1.
  • 8.
  • 9. TABELA DE FREQUÊNCIA DOS 50 MELHORES RESTAURANTES DE LÁMEN CLASSE MÉDIA DA CLASSE FREQUÊNCIA FREQUÊNCIA RELATIVA 500-600 550 4 0,08 600-700 650 13 0,26 700-800 750 18 0,36 800-900 850 12 0,24 900-1000 950 3 0,06 SOMA 50 1,00
  • 10. • Agora se descrevermos tudo isso usando um gráfico de barras chamado HISTOGRAMA... HISTOGRAMA (O EIXO VERTICAL É A FREQUÊNCIA) 20 15 10 HISTOGRAMA (O EIXO VERTICAL É A FREQUÊNCIA) 5 0 550 650 750 850 950
  • 11. HISTOGRAMA (O EIXO VERTICAL É A FREQUÊNCIA RELATIVA) 0.4 0.35 0.3 0.25 0.2 HISTOGRAMA (O EIXO VERTICAL É A 0.15 FREQUÊNCIA RELATIVA) 0.1 0.05 0 550 650 750 850 950
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
  • 17. Média (Valor Médio) • Observe a tabela: RESULTADO DO TORNEIO DE BOLICHE EQUIPE A EQUIPE B EQUIPE C Jogadora Pontuação Jogadora Pontuação Jogadora Pontuação LUY-LUY 86 KIMIKO 84 SHINOBU 229 JUN 73 MEGUME 71 YUKA 77 YUMI 124 YOSHIMI 103 SAKURA 59 SHIZUKA 111 MEI 85 KANAKO 95 TOUKO 90 KAORI 90 KUMIKO 70 KAEDE 38 YUKIKO 89 HIRONO 88 • Você sabe o que é Valor Médio?
  • 18.
  • 19. • O Valor Médio é chamado de Média em Estatística. E a média em questão agora é o que chamamos de MÉDIA ARITMÉTICA, para ser exato. • Há outros tipos de Média, como MÉDIA GEOMÉTRICA e MÉDIA HARMÔNICA, você não precisa aprender as fórmulas agora, mas sugiro que se lembre desses nomes.
  • 20. Mediana RESULTADO DO TORNEIO DE BOLICHE EQUIPE A EQUIPE B EQUIPE C Jogadora Pontuação Jogadora Pontuação Jogadora Pontuação LUY-LUY 86 KIMIKO 84 SHINOBU 229 JUN 73 MEGUME 71 YUKA 77 YUMI 124 YOSHIMI 103 SAKURA 59 SHIZUKA 111 MEI 85 KANAKO 95 TOUKO 90 KAORI 90 KUMIKO 70 KAEDE 38 YUKIKO 89 HIRONO 88 • VAMOS DEIXAR DE LADO AS EQUIPES A E B E PRESTAR ATENÇÃO À EQUIPE C.
  • 21. • A Mediana é o valos central quando se coloca os valores em ordem do menor ao maior. • Primeiro organizamos as pontuações de cada equipe. Equipe A 38 73 86 90 111 124 Equipe B 71 84 85 89 90 103 Equipe C 59 70 77 88 95 229
  • 22. Dedução • Número de Valores = Ímpar -1041,6 -39,0 -5,7 60,4 77,3 MEDIANA • Número de Valores=Par -0,4 35,2 37,8 42,2 46,1 910,3 A MEDIANA É O VALOR MÉDIO DESSES DOIS VALORES
  • 24. Imagine • Então, você já deve se perguntar porque a “Poupança Média” anunciada nos jornais e na tv é tão alta. • A média é alta por causa de alguns milionários. • Nesses casos, a Mediana está bem mais próxima das pessoas comuns.
  • 25. Desvio-Padrão • Equipes A e B • Desenhe uma reta numérica e escreva os nomes dos jogadores de acordo com suas pontuações. EQUIPE A MÉDIA LUY-LUY KAEDE JUN TOUKO SHIZUK YUMI A 0 50 100
  • 26. EQUIPE B MÉDIA KAORI YUKIKO MEI KIMIKO MEGUMI YOSHIMI 0 50 100
  • 27. • Apesar de a pontuação média de cada equipe ser de 87.... • As tendências descritas pelas linhas numéricas são bem diferentes. • O Desvio-Padrão é usado para descrever essa dispersão dos dados. • Em resumo, Desvio-Padrão é um indicador que mostra a diferença da média de cada valor nesse conjunto.
  • 28. • O desvio-padrão mínimo é o zero, e na medida que a “dispersão dos dados” aumenta, o mesmo ocorre com o desvio-padrão. 0 (mínimo) Sem dispersão (todos os valores dispersos são iguais)
  • 31.
  • 32. De uma maneira geral... • A primeira fórmula é aplicada quando se calcula o Desvio-padrão de uma população inteira. • A segunda fórmula é usada quando se calcula o Desvio-padrão de uma amostra.
  • 33. Recapitulando.... • Se você acha que algo não ficou claro em “Tabelas de distribuição de frequência e histogramas”. Vamos rever uma tabela apresentada. TABELA DE FREQUÊNCIA DOS 50 MELHORES RESTAURANTES DE LÁMEN CLASSE MÉDIA DA CLASSE FREQUÊNCIA FREQUÊNCIA RELATIVA 500-600 550 4 0,08 600-700 650 13 0,26 700-800 750 18 0,36 800-900 850 12 0,24 900-1000 950 3 0,06 SOMA 50 1,00
  • 34. • Como você pode ver, o intervalo de classe nessa tabela é 100. • O intervalo não foi determinado de acordo com nenhum tipo padrão matemático – foi definido de forma subjetiva. Determinar o intervalo de classe cabe a quem está analisando os dados. • Há um jeito de definir o intervalo de classe matematicamente. • Usa-se a Regra de Sturges.
  • 35.
  • 36. Exercício • A tabela seguinte é o registro de corrida de 100m de várias meninas. • Atleta Corrida de 100m • A 16,3 • B 22,4 • C 18,5 • D 18,7 • E 20,1 1. Qual o valor médio? 2. Qual a mediana? 3. Qual é o desvio-padrão?
  • 37. Resumo • Para visualizar o panorama geral dos dados intuitivamente, crie uma tabela de frequência ou desenhe um histograma; • Ao fazer uma tabela de frequência, o intervalo de classe pode ser determinado pela regra de Sturges; • Para visualizar os dados matematicamente, calcule a média, mediana e o desvio-padrão; • Quando há um valor muito grande ou pequeno no conjunto de dados, é mais adequado utilizar a mediana que a média aritmética. • Desvio-padrão é um índice para descrever “o grau de dispersão” dos dados.