SlideShare une entreprise Scribd logo
1  sur  49
Télécharger pour lire hors ligne
Análise Exploratória
de Dados no SPSS
Gráficos e Estatísticas Descritivas
Vitor Vieira Vasconcelos
Flávia da Fonseca Feitosa
BH1350 – Métodos e Técnicas de Análise da Informação para o Planejamento
Junho de 2017
O que nós vimos na aula passada
 Distribuição Amostral
 Erro padrão da Média
 Intervalos de Confiança
 Distribuição t
 Comparação de Intervalos de Confiança (SPSS)
Conteúdo
 Inferência estatística
 Normalidade de dados
 Gráficos de caixas e bigodes (boxplot)
 Valores discrepantes (outliers)
 Gráficos Q-Q
 Transformações de dados
Leitura de Referência
Capítulo 1 – p. 47-59
Capítulo 3
Explorando Dados
(p. 85 – 124)
Comparando médias e erros padrão
 Abra o arquivo
“Agua2010_SNIS.sav”
 Gráficos -> Caixas de
diálogo legadas -> Barras
Comparando médias e erros padrão
Comparando médias e erros padrão
Comparando médias e erros padrão
Método científico para tirar conclusões sobre os
parâmetros da população a partir da coleta,
tratamento e análise dos dados de uma amostra
recolhida dessa população.
Inferência Estatística
Inferência Estatística
PARAMÉTRICA: Admite que a distribuição da
população tem uma forma matemática
conhecida, embora contendo um ou mais
parâmetros desconhecidos.
NÃO-PARAMÉTRICA: Pretende-se conhecer a
forma da distribuição
Inferência Estatística
PARAMÉTRICA: Admite que a distribuição da
população tem uma forma matemática
conhecida, embora contendo um ou mais
parâmetros desconhecidos.
Inferência Estatística
Em muitos casos, uma distribuição normal.
Normalidade dos Dados
Assume-se que os dados foram obtidos de uma ou
mais populações normais.
Pesquisadores verificam suas amostras
(histograma e outros testes) e se a amostra
assemelha-se a uma normal, assume-se que a
população também o é.
Explorando Dados no SPSS
1. Distribuição dos Escores e Valores Atípicos
(verificação da normalidade dos dados)
2. Corrigindo problemas nos dados
3. Transformando dados
Explorando Dados
 Analisar> Estatísticas Descritivas > Explorar > Estatísticas… >
Gráficos…
Explorando Dados
Explorando Dados
Explorando Dados
Positivamente assimétrica
Leptocúrtica
A Distribuição é Normal?
Converter assimetria e curtose em
escores-z
Uma distribuição normal deverá ter
assimetria e curtose nulas. Será possível que a distribuição
da população assemelhe-se a uma normal?
Explorando Dados
Positivamente assimétrica
Leptocúrtica
A Distribuição é Normal?
zs=(1.532-0)/0.037=41.4
zk=(7.097-0)/0.074=95.9
Curtose e
Assimetria
Significativa
Converter assimetria e curtose em
escores-z
Uma distribuição normal deverá ter
assimetria e curtose nulas. Será possível que a distribuição
da população assemelhe-se a uma normal?
Histograma - Outliers
Valores atípicos (outliers)
Distorcem a média e
inflacionam o desvio padrão
Importante para a detecção
de erros, valores atípicos e
observação da forma da
distribuição dos dados
Diagrama de Caixas e Bigodes
(boxplot)
Explorando Dados – Box Plot
Gráficos-> Caixas de Diálogo Legadas-> Boxplot
Resumo de variáveis separadas -> Consumo de Água Percapita – População Total
Explorando Dados – Box Plot
Boxplot
Gráficos-> Caixas de Diálogo Legadas-> Boxplot
Resumo de variáveis separadas -> Consumo de Água Percapita – População Total
Explorando Dados – Box Plot
Boxplot
Outliers – Valores Discrepantes
Explorando Dados – Q-Q Plot
(quantil-quantil plot)
Valores Observados na Amostra
Valores
esperados caso a
variável tenha
uma distribuição
normal
Explorando Dados por Regiões
 Gráficos> Histograma
Histograma por Regiões
Estatísticas por Regiões
 Analisar> Estatísticas Descritivas> Explorar
 Lista de fatores: Região
z=.294/.168= 1.75
z=-.077/.334= 0.23
Z=1.339/.063=21.25
z=-5.378/.127=42.35
Z=1.225/.067=18.3
z=-6.499/.135=48.1
!!!
z=2.671/.076=35.1
z=18.517/.153= 121
z=2.315/.126=18.4
z=14.757/.252= 58.6
No histograma parece simétrica, mas
nas estatísticas não. Pq?
Boxplot (Caixa e Bigodes)
Discrepantes!!!
Poucos
outliers
Q-Q Plots
CORRIGINDO PROBLEMAS NOS
DADOS
Observou algum erro de digitação
que gostaria de corrigir?
 Vá para o editor de dados, em “ir para o caso”
 Edite o valor desejado
Reduzindo o Impacto de Outliers
1. Remover o caso
Só deve ser feito se tiver uma boa razão para acreditar que esse
valor não é representante da população.
2. Transformar os dados
Deverá ser feito no caso de termos uma distribuição não normal.
Costumam reduzir o impacto de outliers.
3. Substituir o valor
 O próximo escore mais alto adicionado de 1
 Inverter o valor do escore-z (adicionar o triplo do desvio
padrão à média e substituir o valor atípico por esse)
 A média mais dois desvios padrão (variação do método acima)
Transformação dos Dados
Para corrigir problemas relacionados à não-normalidade da
distribuição ou valores atípicos (outliers)
a. Transformação logaritmica (log(Xi))
Tomar o logaritmo de um conjunto de números “esmaga” a cauda direita da
distribuição. É uma boa maneira de reduzir uma assimetria positiva.
Atenção: Não podemos obter logaritmo de zero ou valores negativos. Se tiver
zero nos dados, faça log(Xi+1)
Transformação dos Dados
Para corrigir problemas relacionados à não-normalidade da
distribuição ou valores atípicos (outliers)
b. Transformação por radiciação (sqr(Xi))
Tomar a raiz quadrada de valores grandes tem efeito maior do que extrair a
raiz de efeitos pequenos. Útil para dados com assimetria positiva.
Problemas com números negativos.
Somar um valor aos elementos (X + a) para não ter mais números negativos.
c. Transformação recíproca (1/Xi)
Dividir 1 por cada escore reduz o impacto dos grandes valores. A variável
transformada terá um limite inferior de zero (grandes valores ficarão
próximos de zero.
Atenção: Este tipo de transformação reverte os escores (valores grandes se
tornarão pequenos e vice-versa)
Para desinverter, utilizar a fómula: 1/(Xmáximo – X)
Transformando Dados no SPSS
Transformar > Calcular Variável
Transformando Dados no SPSS
Analisar > Frequências
Transformando Dados no SPSS
Analisar > Frequências
Transformando Dados no SPSS
CONSUMO LOG(CONSUMO + 1)
Transformando Dados no SPSS
Transformar> Calcular variável
Transformando Dados no SPSS
CONSUMO SQRT(CONSUMO)
Transformando Dados no SPSS
Vocês podem usar o comando “Transformar >
Calcular Variável” para realizar as mais
diversas transformações nos dados!
Por exemplo: Normalizar os dados, calcular
taxas e proporções, etc.
PARTE II
Realizar análises exploratórias sobre
os dados do trabalho do curso!!!
Para importar um arquivo .csv ou .dbf para o SPSS, vá em:
Arquivo> Abrir> Dados…
DICA: Vocês podem importar o arquivo .dbf que compõe o
arquivo vetorial (shapefile)
Atividade
Utilizando os dados que pretende usar no trabalho final da disciplina,
cada integrante do grupo escolherá ao menos uma variável e fará as
atividades a seguir.
a. Calcule as estatísticas descritivas de uma variável de sua escolha.
Explique cada uma delas.
b. Apresente o histograma, box-plot e Q-Q Plot. Explique.
c. Realize alguma(s) transformação(ões) em uma ou mais variáveis
selecionadas (ex: log, raiz quadrada…). Explique qual se
aproximou mais da distribuição normal.
d. Se houver grupos distintos (bairros, distritos), repita os itens (a) e
(b) para cada grupo. Compare intervalos de confiança da média
de uma variável de interesse. Há sobreposições? O que isso
significa? Interprete!
Já estamos elaborando o trabalho final da disciplina!!!

Contenu connexe

Tendances

Aula bioestatistica
Aula bioestatisticaAula bioestatistica
Aula bioestatistica
AleNiv
 
Estatística
EstatísticaEstatística
Estatística
aldaalves
 
Termos e conceitos estatísticos
Termos e conceitos estatísticosTermos e conceitos estatísticos
Termos e conceitos estatísticos
Helena Borralho
 
19 elaboração da metodologia
19 elaboração da metodologia19 elaboração da metodologia
19 elaboração da metodologia
Joao Balbi
 

Tendances (20)

SPSS – Tutorial para Iniciantes
SPSS – Tutorial para IniciantesSPSS – Tutorial para Iniciantes
SPSS – Tutorial para Iniciantes
 
Conceitos Básicos de Estatística I
Conceitos Básicos de Estatística IConceitos Básicos de Estatística I
Conceitos Básicos de Estatística I
 
Aula bioestatistica
Aula bioestatisticaAula bioestatistica
Aula bioestatistica
 
Introdução à Estatística
Introdução à EstatísticaIntrodução à Estatística
Introdução à Estatística
 
Estatistica introdução
Estatistica introduçãoEstatistica introdução
Estatistica introdução
 
Estatística
EstatísticaEstatística
Estatística
 
Aula 12 medidas de dispersão
Aula 12   medidas de dispersãoAula 12   medidas de dispersão
Aula 12 medidas de dispersão
 
Estatistica descritiva
Estatistica descritiva Estatistica descritiva
Estatistica descritiva
 
Aula 02 população amostra e dados
Aula 02   população amostra e dadosAula 02   população amostra e dados
Aula 02 população amostra e dados
 
Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados
Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados
Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados
 
Estatística e Probabilidade - 6 Medidas de Posição
Estatística e Probabilidade - 6 Medidas de PosiçãoEstatística e Probabilidade - 6 Medidas de Posição
Estatística e Probabilidade - 6 Medidas de Posição
 
Slides de estatística aplicada
Slides de estatística aplicadaSlides de estatística aplicada
Slides de estatística aplicada
 
Aula 01 introdução a estatística
Aula 01   introdução a estatísticaAula 01   introdução a estatística
Aula 01 introdução a estatística
 
Aula 22 probabilidade - parte 1
Aula 22   probabilidade - parte 1Aula 22   probabilidade - parte 1
Aula 22 probabilidade - parte 1
 
Aula 01 09-15-graficos_estatisticos
Aula 01 09-15-graficos_estatisticosAula 01 09-15-graficos_estatisticos
Aula 01 09-15-graficos_estatisticos
 
Estatística Descritiva
Estatística DescritivaEstatística Descritiva
Estatística Descritiva
 
Estatística Descritiva
Estatística DescritivaEstatística Descritiva
Estatística Descritiva
 
Estatistica resumo
Estatistica   resumoEstatistica   resumo
Estatistica resumo
 
Termos e conceitos estatísticos
Termos e conceitos estatísticosTermos e conceitos estatísticos
Termos e conceitos estatísticos
 
19 elaboração da metodologia
19 elaboração da metodologia19 elaboração da metodologia
19 elaboração da metodologia
 

Similaire à Análise exploratória de dados no SPSS

Estatística completa
Estatística completaEstatística completa
Estatística completa
Ronne Seles
 
Organização tratamento de_dados
Organização tratamento de_dadosOrganização tratamento de_dados
Organização tratamento de_dados
Helena Borralho
 
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.pptCurso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
ssuser2b53fe
 
Aula 02 - Análise de dados e probabilidade.pptx
Aula 02 - Análise de dados e probabilidade.pptxAula 02 - Análise de dados e probabilidade.pptx
Aula 02 - Análise de dados e probabilidade.pptx
Joel Júnior
 
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.pptCurso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
ssuser2b53fe
 
EstatíStica Aula 000
EstatíStica Aula 000EstatíStica Aula 000
EstatíStica Aula 000
educacao f
 

Similaire à Análise exploratória de dados no SPSS (20)

Vizualização de dados Gráficos e Dashboards Aula 2.pdf
Vizualização de dados Gráficos e Dashboards Aula 2.pdfVizualização de dados Gráficos e Dashboards Aula 2.pdf
Vizualização de dados Gráficos e Dashboards Aula 2.pdf
 
Aula1 - estatística básica
Aula1 -  estatística básicaAula1 -  estatística básica
Aula1 - estatística básica
 
Estatística completa
Estatística completaEstatística completa
Estatística completa
 
Estdescr
EstdescrEstdescr
Estdescr
 
Organização tratamento de_dados
Organização tratamento de_dadosOrganização tratamento de_dados
Organização tratamento de_dados
 
Introdução a Estatistica 2.pdf
Introdução a Estatistica 2.pdfIntrodução a Estatistica 2.pdf
Introdução a Estatistica 2.pdf
 
Conceitos Básicos de Estatística II
Conceitos Básicos de Estatística IIConceitos Básicos de Estatística II
Conceitos Básicos de Estatística II
 
Fundamentos da bioestatística
Fundamentos da bioestatísticaFundamentos da bioestatística
Fundamentos da bioestatística
 
Programa de Equalização em Estatística - 2014 A
Programa de Equalização em Estatística - 2014 APrograma de Equalização em Estatística - 2014 A
Programa de Equalização em Estatística - 2014 A
 
Estatisticas petrobras
Estatisticas petrobrasEstatisticas petrobras
Estatisticas petrobras
 
Unidade ii tabelas e gráficos
Unidade ii   tabelas e gráficosUnidade ii   tabelas e gráficos
Unidade ii tabelas e gráficos
 
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.pptCurso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
 
Serie aula03 estatistica
Serie aula03 estatisticaSerie aula03 estatistica
Serie aula03 estatistica
 
Aula 02 - Análise de dados e probabilidade.pptx
Aula 02 - Análise de dados e probabilidade.pptxAula 02 - Análise de dados e probabilidade.pptx
Aula 02 - Análise de dados e probabilidade.pptx
 
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.pptCurso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
 
EstatíStica Aula 000
EstatíStica Aula 000EstatíStica Aula 000
EstatíStica Aula 000
 
Ficha de-trabalho-sobre-estatistica
Ficha de-trabalho-sobre-estatisticaFicha de-trabalho-sobre-estatistica
Ficha de-trabalho-sobre-estatistica
 
Atps estatistica
Atps estatisticaAtps estatistica
Atps estatistica
 
Apostila de estatistica
Apostila de estatisticaApostila de estatistica
Apostila de estatistica
 
Apostila de estatistica
Apostila de estatisticaApostila de estatistica
Apostila de estatistica
 

Plus de Vitor Vieira Vasconcelos

Relationships among socioeconomic affluence, yard management, and biodiversity
Relationships among socioeconomic affluence, yard management, and biodiversityRelationships among socioeconomic affluence, yard management, and biodiversity
Relationships among socioeconomic affluence, yard management, and biodiversity
Vitor Vieira Vasconcelos
 

Plus de Vitor Vieira Vasconcelos (20)

Relationships among socioeconomic affluence, yard management, and biodiversity
Relationships among socioeconomic affluence, yard management, and biodiversityRelationships among socioeconomic affluence, yard management, and biodiversity
Relationships among socioeconomic affluence, yard management, and biodiversity
 
Análise espacial de doenças transmissíveis
Análise espacial de doenças transmissíveisAnálise espacial de doenças transmissíveis
Análise espacial de doenças transmissíveis
 
Fishbanks! Jogo de simulação de gestão de recursos renováveis
Fishbanks! Jogo de simulação de gestão de recursos renováveisFishbanks! Jogo de simulação de gestão de recursos renováveis
Fishbanks! Jogo de simulação de gestão de recursos renováveis
 
Regimes de Apropriação de Recursos Naturais
Regimes de Apropriação de Recursos NaturaisRegimes de Apropriação de Recursos Naturais
Regimes de Apropriação de Recursos Naturais
 
Recursos Comuns e Tragédia dos Comuns
Recursos Comuns e Tragédia dos ComunsRecursos Comuns e Tragédia dos Comuns
Recursos Comuns e Tragédia dos Comuns
 
Relações entre sistemas naturais e sociais
Relações entre sistemas naturais e sociaisRelações entre sistemas naturais e sociais
Relações entre sistemas naturais e sociais
 
Valoração de Serviços Ecossistêmicos
Valoração de Serviços EcossistêmicosValoração de Serviços Ecossistêmicos
Valoração de Serviços Ecossistêmicos
 
Recursos Naturais e Serviços Ecossistêmicos
Recursos Naturais e Serviços EcossistêmicosRecursos Naturais e Serviços Ecossistêmicos
Recursos Naturais e Serviços Ecossistêmicos
 
Bases teóricas e conceituais do Planejamento e da Política Ambiental
Bases teóricas e conceituais do Planejamento e da Política AmbientalBases teóricas e conceituais do Planejamento e da Política Ambiental
Bases teóricas e conceituais do Planejamento e da Política Ambiental
 
Planejamento territorial
Planejamento territorialPlanejamento territorial
Planejamento territorial
 
Coremática e Mapeamento Participativo
Coremática e Mapeamento ParticipativoCoremática e Mapeamento Participativo
Coremática e Mapeamento Participativo
 
Cartografia Social
Cartografia SocialCartografia Social
Cartografia Social
 
MIgrações
MIgraçõesMIgrações
MIgrações
 
Conflitos fundiários
Conflitos fundiáriosConflitos fundiários
Conflitos fundiários
 
Conflitos Territoriais
Conflitos TerritoriaisConflitos Territoriais
Conflitos Territoriais
 
Chácara Baronesa - Haras São Bernardo
Chácara Baronesa - Haras São BernardoChácara Baronesa - Haras São Bernardo
Chácara Baronesa - Haras São Bernardo
 
Governo e Território
Governo e TerritórioGoverno e Território
Governo e Território
 
Segregação e Interação Territorial
Segregação e Interação TerritorialSegregação e Interação Territorial
Segregação e Interação Territorial
 
Território e Poder
Território e PoderTerritório e Poder
Território e Poder
 
Operações com dados espaciais (Vetor) em R
Operações com dados espaciais (Vetor) em ROperações com dados espaciais (Vetor) em R
Operações com dados espaciais (Vetor) em R
 

Dernier

Slide - SAEB. língua portuguesa e matemática
Slide - SAEB. língua portuguesa e matemáticaSlide - SAEB. língua portuguesa e matemática
Slide - SAEB. língua portuguesa e matemática
sh5kpmr7w7
 

Dernier (20)

aula de bioquímica bioquímica dos carboidratos.ppt
aula de bioquímica bioquímica dos carboidratos.pptaula de bioquímica bioquímica dos carboidratos.ppt
aula de bioquímica bioquímica dos carboidratos.ppt
 
Cartão de crédito e fatura do cartão.pptx
Cartão de crédito e fatura do cartão.pptxCartão de crédito e fatura do cartão.pptx
Cartão de crédito e fatura do cartão.pptx
 
Apresentação ISBET Jovem Aprendiz e Estágio 2023.pdf
Apresentação ISBET Jovem Aprendiz e Estágio 2023.pdfApresentação ISBET Jovem Aprendiz e Estágio 2023.pdf
Apresentação ISBET Jovem Aprendiz e Estágio 2023.pdf
 
Monoteísmo, Politeísmo, Panteísmo 7 ANO2.pptx
Monoteísmo, Politeísmo, Panteísmo 7 ANO2.pptxMonoteísmo, Politeísmo, Panteísmo 7 ANO2.pptx
Monoteísmo, Politeísmo, Panteísmo 7 ANO2.pptx
 
Produção de Texto - 5º ano - CRÔNICA.pptx
Produção de Texto - 5º ano - CRÔNICA.pptxProdução de Texto - 5º ano - CRÔNICA.pptx
Produção de Texto - 5º ano - CRÔNICA.pptx
 
Texto dramático com Estrutura e exemplos.ppt
Texto dramático com Estrutura e exemplos.pptTexto dramático com Estrutura e exemplos.ppt
Texto dramático com Estrutura e exemplos.ppt
 
P P P 2024 - *CIEJA Santana / Tucuruvi*
P P P 2024  - *CIEJA Santana / Tucuruvi*P P P 2024  - *CIEJA Santana / Tucuruvi*
P P P 2024 - *CIEJA Santana / Tucuruvi*
 
Seminário Biologia e desenvolvimento da matrinxa.pptx
Seminário Biologia e desenvolvimento da matrinxa.pptxSeminário Biologia e desenvolvimento da matrinxa.pptx
Seminário Biologia e desenvolvimento da matrinxa.pptx
 
PROJETO DE EXTENSÃO I - SERVIÇOS JURÍDICOS, CARTORÁRIOS E NOTARIAIS.pdf
PROJETO DE EXTENSÃO I - SERVIÇOS JURÍDICOS, CARTORÁRIOS E NOTARIAIS.pdfPROJETO DE EXTENSÃO I - SERVIÇOS JURÍDICOS, CARTORÁRIOS E NOTARIAIS.pdf
PROJETO DE EXTENSÃO I - SERVIÇOS JURÍDICOS, CARTORÁRIOS E NOTARIAIS.pdf
 
LISTA DE EXERCICIOS envolveto grandezas e medidas e notação cientifica 1 ANO ...
LISTA DE EXERCICIOS envolveto grandezas e medidas e notação cientifica 1 ANO ...LISTA DE EXERCICIOS envolveto grandezas e medidas e notação cientifica 1 ANO ...
LISTA DE EXERCICIOS envolveto grandezas e medidas e notação cientifica 1 ANO ...
 
E a chuva ... (Livro pedagógico para ser usado na educação infantil e trabal...
E a chuva ...  (Livro pedagógico para ser usado na educação infantil e trabal...E a chuva ...  (Livro pedagógico para ser usado na educação infantil e trabal...
E a chuva ... (Livro pedagógico para ser usado na educação infantil e trabal...
 
PRÁTICAS PEDAGÓGICAS GESTÃO DA APRENDIZAGEM
PRÁTICAS PEDAGÓGICAS GESTÃO DA APRENDIZAGEMPRÁTICAS PEDAGÓGICAS GESTÃO DA APRENDIZAGEM
PRÁTICAS PEDAGÓGICAS GESTÃO DA APRENDIZAGEM
 
TCC_MusicaComoLinguagemNaAlfabetização-ARAUJOfranklin-UFBA.pdf
TCC_MusicaComoLinguagemNaAlfabetização-ARAUJOfranklin-UFBA.pdfTCC_MusicaComoLinguagemNaAlfabetização-ARAUJOfranklin-UFBA.pdf
TCC_MusicaComoLinguagemNaAlfabetização-ARAUJOfranklin-UFBA.pdf
 
Projeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdf
Projeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdfProjeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdf
Projeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdf
 
LENDA DA MANDIOCA - leitura e interpretação
LENDA DA MANDIOCA - leitura e interpretaçãoLENDA DA MANDIOCA - leitura e interpretação
LENDA DA MANDIOCA - leitura e interpretação
 
PROJETO DE EXTENÇÃO - GESTÃO DE RECURSOS HUMANOS.pdf
PROJETO DE EXTENÇÃO - GESTÃO DE RECURSOS HUMANOS.pdfPROJETO DE EXTENÇÃO - GESTÃO DE RECURSOS HUMANOS.pdf
PROJETO DE EXTENÇÃO - GESTÃO DE RECURSOS HUMANOS.pdf
 
Slide - SAEB. língua portuguesa e matemática
Slide - SAEB. língua portuguesa e matemáticaSlide - SAEB. língua portuguesa e matemática
Slide - SAEB. língua portuguesa e matemática
 
EDUCAÇÃO ESPECIAL NA PERSPECTIVA INCLUSIVA
EDUCAÇÃO ESPECIAL NA PERSPECTIVA INCLUSIVAEDUCAÇÃO ESPECIAL NA PERSPECTIVA INCLUSIVA
EDUCAÇÃO ESPECIAL NA PERSPECTIVA INCLUSIVA
 
About Vila Galé- Cadeia Empresarial de Hotéis
About Vila Galé- Cadeia Empresarial de HotéisAbout Vila Galé- Cadeia Empresarial de Hotéis
About Vila Galé- Cadeia Empresarial de Hotéis
 
Slides Lição 6, CPAD, As Nossas Armas Espirituais, 2Tr24.pptx
Slides Lição 6, CPAD, As Nossas Armas Espirituais, 2Tr24.pptxSlides Lição 6, CPAD, As Nossas Armas Espirituais, 2Tr24.pptx
Slides Lição 6, CPAD, As Nossas Armas Espirituais, 2Tr24.pptx
 

Análise exploratória de dados no SPSS

  • 1. Análise Exploratória de Dados no SPSS Gráficos e Estatísticas Descritivas Vitor Vieira Vasconcelos Flávia da Fonseca Feitosa BH1350 – Métodos e Técnicas de Análise da Informação para o Planejamento Junho de 2017
  • 2. O que nós vimos na aula passada  Distribuição Amostral  Erro padrão da Média  Intervalos de Confiança  Distribuição t  Comparação de Intervalos de Confiança (SPSS)
  • 3. Conteúdo  Inferência estatística  Normalidade de dados  Gráficos de caixas e bigodes (boxplot)  Valores discrepantes (outliers)  Gráficos Q-Q  Transformações de dados
  • 4.
  • 5. Leitura de Referência Capítulo 1 – p. 47-59 Capítulo 3 Explorando Dados (p. 85 – 124)
  • 6. Comparando médias e erros padrão  Abra o arquivo “Agua2010_SNIS.sav”  Gráficos -> Caixas de diálogo legadas -> Barras
  • 7. Comparando médias e erros padrão
  • 8. Comparando médias e erros padrão
  • 9. Comparando médias e erros padrão
  • 10. Método científico para tirar conclusões sobre os parâmetros da população a partir da coleta, tratamento e análise dos dados de uma amostra recolhida dessa população. Inferência Estatística
  • 12. PARAMÉTRICA: Admite que a distribuição da população tem uma forma matemática conhecida, embora contendo um ou mais parâmetros desconhecidos. NÃO-PARAMÉTRICA: Pretende-se conhecer a forma da distribuição Inferência Estatística
  • 13. PARAMÉTRICA: Admite que a distribuição da população tem uma forma matemática conhecida, embora contendo um ou mais parâmetros desconhecidos. Inferência Estatística Em muitos casos, uma distribuição normal.
  • 14. Normalidade dos Dados Assume-se que os dados foram obtidos de uma ou mais populações normais. Pesquisadores verificam suas amostras (histograma e outros testes) e se a amostra assemelha-se a uma normal, assume-se que a população também o é.
  • 15. Explorando Dados no SPSS 1. Distribuição dos Escores e Valores Atípicos (verificação da normalidade dos dados) 2. Corrigindo problemas nos dados 3. Transformando dados
  • 16. Explorando Dados  Analisar> Estatísticas Descritivas > Explorar > Estatísticas… > Gráficos…
  • 19. Explorando Dados Positivamente assimétrica Leptocúrtica A Distribuição é Normal? Converter assimetria e curtose em escores-z Uma distribuição normal deverá ter assimetria e curtose nulas. Será possível que a distribuição da população assemelhe-se a uma normal?
  • 20. Explorando Dados Positivamente assimétrica Leptocúrtica A Distribuição é Normal? zs=(1.532-0)/0.037=41.4 zk=(7.097-0)/0.074=95.9 Curtose e Assimetria Significativa Converter assimetria e curtose em escores-z Uma distribuição normal deverá ter assimetria e curtose nulas. Será possível que a distribuição da população assemelhe-se a uma normal?
  • 21. Histograma - Outliers Valores atípicos (outliers) Distorcem a média e inflacionam o desvio padrão Importante para a detecção de erros, valores atípicos e observação da forma da distribuição dos dados
  • 22. Diagrama de Caixas e Bigodes (boxplot)
  • 23. Explorando Dados – Box Plot Gráficos-> Caixas de Diálogo Legadas-> Boxplot Resumo de variáveis separadas -> Consumo de Água Percapita – População Total
  • 24. Explorando Dados – Box Plot Boxplot Gráficos-> Caixas de Diálogo Legadas-> Boxplot Resumo de variáveis separadas -> Consumo de Água Percapita – População Total
  • 25. Explorando Dados – Box Plot Boxplot
  • 26.
  • 27. Outliers – Valores Discrepantes
  • 28. Explorando Dados – Q-Q Plot (quantil-quantil plot) Valores Observados na Amostra Valores esperados caso a variável tenha uma distribuição normal
  • 29. Explorando Dados por Regiões  Gráficos> Histograma
  • 31. Estatísticas por Regiões  Analisar> Estatísticas Descritivas> Explorar  Lista de fatores: Região
  • 33. z=2.671/.076=35.1 z=18.517/.153= 121 z=2.315/.126=18.4 z=14.757/.252= 58.6 No histograma parece simétrica, mas nas estatísticas não. Pq?
  • 34. Boxplot (Caixa e Bigodes) Discrepantes!!! Poucos outliers
  • 37. Observou algum erro de digitação que gostaria de corrigir?  Vá para o editor de dados, em “ir para o caso”  Edite o valor desejado
  • 38. Reduzindo o Impacto de Outliers 1. Remover o caso Só deve ser feito se tiver uma boa razão para acreditar que esse valor não é representante da população. 2. Transformar os dados Deverá ser feito no caso de termos uma distribuição não normal. Costumam reduzir o impacto de outliers. 3. Substituir o valor  O próximo escore mais alto adicionado de 1  Inverter o valor do escore-z (adicionar o triplo do desvio padrão à média e substituir o valor atípico por esse)  A média mais dois desvios padrão (variação do método acima)
  • 39. Transformação dos Dados Para corrigir problemas relacionados à não-normalidade da distribuição ou valores atípicos (outliers) a. Transformação logaritmica (log(Xi)) Tomar o logaritmo de um conjunto de números “esmaga” a cauda direita da distribuição. É uma boa maneira de reduzir uma assimetria positiva. Atenção: Não podemos obter logaritmo de zero ou valores negativos. Se tiver zero nos dados, faça log(Xi+1)
  • 40. Transformação dos Dados Para corrigir problemas relacionados à não-normalidade da distribuição ou valores atípicos (outliers) b. Transformação por radiciação (sqr(Xi)) Tomar a raiz quadrada de valores grandes tem efeito maior do que extrair a raiz de efeitos pequenos. Útil para dados com assimetria positiva. Problemas com números negativos. Somar um valor aos elementos (X + a) para não ter mais números negativos. c. Transformação recíproca (1/Xi) Dividir 1 por cada escore reduz o impacto dos grandes valores. A variável transformada terá um limite inferior de zero (grandes valores ficarão próximos de zero. Atenção: Este tipo de transformação reverte os escores (valores grandes se tornarão pequenos e vice-versa) Para desinverter, utilizar a fómula: 1/(Xmáximo – X)
  • 41. Transformando Dados no SPSS Transformar > Calcular Variável
  • 42. Transformando Dados no SPSS Analisar > Frequências
  • 43. Transformando Dados no SPSS Analisar > Frequências
  • 44. Transformando Dados no SPSS CONSUMO LOG(CONSUMO + 1)
  • 45. Transformando Dados no SPSS Transformar> Calcular variável
  • 46. Transformando Dados no SPSS CONSUMO SQRT(CONSUMO)
  • 47. Transformando Dados no SPSS Vocês podem usar o comando “Transformar > Calcular Variável” para realizar as mais diversas transformações nos dados! Por exemplo: Normalizar os dados, calcular taxas e proporções, etc.
  • 48. PARTE II Realizar análises exploratórias sobre os dados do trabalho do curso!!! Para importar um arquivo .csv ou .dbf para o SPSS, vá em: Arquivo> Abrir> Dados… DICA: Vocês podem importar o arquivo .dbf que compõe o arquivo vetorial (shapefile)
  • 49. Atividade Utilizando os dados que pretende usar no trabalho final da disciplina, cada integrante do grupo escolherá ao menos uma variável e fará as atividades a seguir. a. Calcule as estatísticas descritivas de uma variável de sua escolha. Explique cada uma delas. b. Apresente o histograma, box-plot e Q-Q Plot. Explique. c. Realize alguma(s) transformação(ões) em uma ou mais variáveis selecionadas (ex: log, raiz quadrada…). Explique qual se aproximou mais da distribuição normal. d. Se houver grupos distintos (bairros, distritos), repita os itens (a) e (b) para cada grupo. Compare intervalos de confiança da média de uma variável de interesse. Há sobreposições? O que isso significa? Interprete! Já estamos elaborando o trabalho final da disciplina!!!