SlideShare uma empresa Scribd logo
1 de 51
Baixar para ler offline
Curso de Ciência de Dados e Analytics
Estatística Computacional
Semana 2 - Aula 2 – Modelo de Regressão Logística
Prof. Dr. Rodrigo Lins Rodrigues
rodrigo.linsrodrigues@ufrpe.br
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística
...O que seria a
Regressão Logística?
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística
• É utilizada para prever a probabilidade de
um evento binário ocorrer.
• Segue a mesma lógica do modelo de
regressão linear com a particularidade da
variável alvo ser binária;
• É uma técnica muito utilizada quando não se
tem bases de dados muito grandes;
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística
• Não tem muitas exigências de pressupostos;
• Há uma infinidade de eventos de interesse
que podem ser modelados pela regressão
logística;
• Uma das grandes vantagens é a flexibilidade
de seus pressupostos, o que amplia sua
aplicabilidade.
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística
• Deriva seu nome da transformação logit usada como variável
dependente;
• Um modelo é definido como logístico se a função segue a
seguinte equação:
𝑙𝑜𝑔𝑖𝑡 𝑝𝑖 = ln
𝑝𝑖
1 − 𝑝𝑖
= 𝛽0 + 𝛽1 𝑥1 + ⋯ + 𝛽 𝑛 𝑥 𝑛
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística
• Um modelo é definido como logístico se a função segue a
seguinte equação:
• Em que 𝑝𝑖 indica a probabilidade de ocorrência, 𝑥1, … , 𝑥 𝑛
representa o vetor de variáveis explicativas (ou independentes) e
β0 e β 𝑥 indicam os coeficientes do modelo.
𝑙𝑜𝑔𝑖𝑡 𝑝𝑖 = ln
𝑝𝑖
1 − 𝑝𝑖
= 𝛽0 + 𝛽1 𝑥1 + ⋯ + 𝛽 𝑛 𝑥 𝑛
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística
• Os coeficientes logísticos são difíceis de interpretar em sua
forma original, pois são expressos em termos de logaritmos
quando usamos a função logit;
• E possível aplicar a transformação de anti-logaritmo por meio
da exponenciação dos coeficientes originais, gerando a razão de
desigualdades:
𝑅𝑎𝑧ã𝑜 𝑑𝑒 𝐷𝑒𝑠𝑖𝑔𝑢𝑎𝑙𝑑𝑎𝑑𝑒𝑠𝑖 (𝑜𝑑𝑑𝑠) = 𝑒 𝛽0+𝛽1 𝑥1+⋯+𝛽 𝑛 𝑥 𝑛
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística
• Para cada observação, é previsto um valor de probabilidade
entre 0 e 1;
• Os valores previstos para todos os valores da variável
independente gera a curva logística:
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística
• Se a probabilidade prevista é maior do que 0,50, então a
previsão é de que o resultado seja 1 (evento ocorreu);
• Caso a probabilidade prevista seja menor do que 0,50, então a
previsão é de que o resultado seja 0 (evento não ocorreu);
• Esse corte pode ser ajustado e faz parte das configurações de
parâmetros para melhorar o modelo.
Prof. Dr. Rodrigo Lins Rodrigues
Construção do modelo
de Regressão Logística
Prof. Dr. Rodrigo Lins Rodrigues
Construção do modelo
• A construção de um classificador por regressão logística pode ser
representado de forma simplificada por:
• Conjunto com n dados, onde cada observação 𝑥𝑖 possui m atributos e as
variáveis 𝑦𝑖 representam as classes ou rótulos.
Prof. Dr. Rodrigo Lins Rodrigues
Construção do modelo
• A tarefa de classificação pode ser dividida em duas categorias, a
classificação binária e a classificação multiclasses.
Regressão Logística Binária;
Regressão Logística Multimodal;
• Diversos algoritmos vêm sendo desenvolvidos ao longo de
pesquisas;
• A Regressão Logística é um algoritmo criado pela estatística.
Prof. Dr. Rodrigo Lins Rodrigues
• Construção de um classificador de forma computacional através
do software R:
Tabela de Análise
70%
30%
Treinamento
Teste
Algoritmos de Classificação
Métricas de Validação
Comparação de
classificadores
Modelagem Validação
Construção do modelo
Prof. Dr. Rodrigo Lins Rodrigues
Avaliação do Modelo
Logístico
Prof. Dr. Rodrigo Lins Rodrigues
Avaliação do Modelo Logístico
Para entender os erros gerados por um classificador é possível
visualizar por meio da construção da uma matriz de erros
denominada matriz de confusão;
A partir da matriz é possível obter métricas de qualidade para a
avaliação do desempenho de um classificador;
Resume o número de instâncias previstas corretas ou incorretas
por um modelo de classificação.
Prof. Dr. Rodrigo Lins Rodrigues
Avaliação do Modelo Logístico
Representação da matriz de confusão:
Matriz de Confusão
Classe Atual
Negativa (-) Positiva (+)
Classe
Prevista
Negativa (-) 𝑓 − − (𝑇𝑁) 𝑓 + − (𝐹𝑁)
Positiva (+) 𝑓 − + (𝐹𝑃) 𝑓 + + (𝑇𝑃)
Prof. Dr. Rodrigo Lins Rodrigues
Avaliação do Modelo Logístico
• As seguinte terminologias são usadas para o entendimento da
matriz de confusão:
Positivo verdadeiro (TP): é relacionado ao número de instâncias
positivas previstas corretamente pelo classificador;
Negativo falso (FN): é o número de instâncias previstas
erroneamente como negativos pelo classificador;
Positivo falso (FP): é o número de exemplos negativos previstos
erroneamente como positivos pelo classificador;
Falso verdadeiro (TN): é o número de exemplos negativos previstos
corretamente pelo classificador.Prof. Dr. Rodrigo Lins Rodrigues
Avaliação do Modelo Logístico
• Uma das maneiras mais comuns de avaliar modelos é por meio da
derivação de medidas que, tentam medir a “qualidade” do
modelo;
• Essas medidas geralmente podem ser obtidas a partir da matriz de
confusão:
A acurácia é definida como sendo o número de instâncias
corretas divididas pelo número total de instâncias;
𝐴𝑐𝑢𝑟á𝑐𝑖𝑎 =
𝑇𝑃 + 𝑇𝑁
(𝑇𝑃 + 𝑇𝑁 + 𝐹𝑁 + 𝐹𝑃)
Prof. Dr. Rodrigo Lins Rodrigues
Avaliação do Modelo Logístico
• A precisão determina o percentual de registros que são positivos
no grupo que o classificador previu como classe positiva.
𝑃𝑟𝑒𝑐𝑖𝑠ã𝑜 =
𝑇𝑃
𝑇𝑃 + 𝐹𝑃
• A lembrança (Recall) mede o percentual de instâncias positivas
previstas corretamente pelo classificador.
𝑅𝑒𝑐𝑎𝑙𝑙 =
𝑇𝑃
𝑇𝑃 + 𝐹𝑁Prof. Dr. Rodrigo Lins Rodrigues
Avaliação do Modelo Logístico
• Área da curva ROC:
Representação gráfica para descrever
o desempenho de um sistema
classificador binário;
É baseada na taxa de verdadeiros
positivos 𝑇𝑃𝑅, e na taxa de falsos
positivos 𝐹𝑃𝑅;
Prof. Dr. Rodrigo Lins Rodrigues
Avaliação do Modelo Logístico
• Área da curva ROC:
É muito utilizada quando queremos
comprar a performance entre diversos
classificadores;
Seus valores variam entre zero e um;
Muito utilizada quando se tem classe
desbalanceada. Prof. Dr. Rodrigo Lins Rodrigues
Avaliação do Modelo Logístico
• Utilização de métricas conjuntamente:
É comum encontrar situações em que um modelo aparenta ser
melhor que outro para algumas das métricas, mas pior com relação
a outras;
Nesses casos, utilizar uma única medida pode dar a falsa impressão
de que o desempenho pode ser avaliado utilizando-se apenas essa
medida;
Para uma avaliação mais precisa é ideal que seja utilizado um
conjunto de métricas levando em consideração o objetivo da
pesquisa.
Prof. Dr. Rodrigo Lins Rodrigues
Regressão
Logística em R
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística em R
• Exemplo:
Vamos continuar com exemplo relacionado a deslocamento de
alunos;
Agora temos o interesse em investigar se as variáveis explicativas
influenciam a probabilidade de um aluno chegar atrasado na
aula;
O fenômeno em estudo agora apresenta somente duas
categorias (atrasado e não atrasado);
O evento de interesse refere-se a chegar atrasado.
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística em R
• Exemplo:
Para realizar esse experimento fizemos uma pesquisa com 100 de uma
escola específica;
O aluno deveria informar se no dia da pesquisa chegou ou não atrasado;
Outras variáveis coletadas foram:
oDistância percorrida no trajeto (em quilómetros);
oNúmero de semáforos pelos quais o aluno passou;
oPeríodo de realização do trajeto (manhã ou tarde);
oE como cada aluno considera-se no volante (calmo, moderado ou agressivo);
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística em R
• Exemplo:
Tabela com as respostas de 100 alunos;
Estudante
Chegou atrasado à
escola (𝒀𝒊)
Distância percorrida
(𝑿 𝟏𝒊)
Quantidade de
semáforos (𝑿 𝟐𝒊)
Período do dia
(𝑿 𝟑𝒊)
Perfil ao volante
(𝑿 𝟒𝒊)
Gabriela Não 12.5 7 manhã calmo
Patrícia Não 13.3 10 manhã calmo
Gustavo Não 13.4 8 manhã moderado
Letícia Não 23.5 7 manhã calmo
Luiz Ovídio Não 9.5 8 manhã calmo
Leonor Não 13.5 10 manhã calmo
Dalila Não 13.5 10 manhã calmo
Antônio Não 15.4 10 manhã calmo
Júlia Não 14.7 10 manhã calmo
... ... ... ... ... ...
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística em R
• Exemplo:
Foi necessário aplicar algumas transformações nas variáveis;
A variável alvo (Chegou atrasado) recebeu valores de 0 para não
chegou e 1 para chegou atrasado;
Período do dia ficou: 0 para manhã, e 1 para tarde;
A variável (Perfil ao volante) foi transformada em variável binária:
0 calmo e 1 moderado;
Criou-se uma nova variável binária informando se o condutor se
considera agressivo ou não (1 ou 0);
Foi retirado espaços (renomeado) os nomes das variáveis.Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística em R
• Exemplo:
A nova tabela de dados ficou da seguinte forma;
Estudante chegou_atrasado distancia
quantidade_semaf
oros periodo perfil_volante2
Gabriela 0 12.5 7 1 0
Patrícia 0 13.3 10 1 0
Gustavo 0 13.4 8 1 1
Letícia 0 23.5 7 1 0
Luiz Ovídio 0 9.5 8 1 0
Leonor 0 13.5 10 1 0
Dalila 0 13.5 10 1 0
Antônio 0 15.4 10 1 0
Júlia 0 14.7 10 1 0
... ... ... ... ... ...
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística em R
• Exemplo:
Vamos abrir o script “scriptRegressaoLogistica.R”;
 Abrir a Base “atrasado.CSV”
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística em R
• Exemplo:
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística em R
• Exemplo:
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística em R
• Exemplo:
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística em R
• Exemplo:
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística em R
• Exemplo:
Prof. Dr. Rodrigo Lins Rodrigues
Agora é com vocês !
• Qual a diferença entre a Regressão Linear Múltipla e a
Regressão Logística ?
• Quais as formas de validar um modelo logístico ?
• Diga alguns fenômenos que podemos modelar através da
regressão logística ?
Prof. Dr. Rodrigo Lins Rodrigues
Dúvidas
o Contatos:
Email: rodrigo.linsrodrigues@ufrpe.br
Facebook: /rodrigomuribec
Prof. Dr. Rodrigo Lins Rodrigues
Curso de Ciência de Dados e Analytics
Estatística Computacional
Semana 2 - Aula 3 – Prática Computacional de Modelos de Regressão
Prof. Dr. Rodrigo Lins Rodrigues
rodrigo.linsrodrigues@ufrpe.br
Prof. Dr. Rodrigo Lins Rodrigues
Como será esta aula?
 Avaliação prática em laboratório;
 Deve ser realizada em grupos de 4 alunos;
 Serei o “mentor” na execução da avaliação
prática.
Prof. Dr. Rodrigo Lins Rodrigues
O que você aprenderá ?
Colocará em prática todo o
conhecimento adquirido sobre modelos
de regressão
Prof. Dr. Rodrigo Lins Rodrigues
Base de dados utilizada
Prof. Dr. Rodrigo Lins Rodrigues
Bases de Dados
• Plataformas de aprendizagem online e EAD.
Prof. Dr. Rodrigo Lins Rodrigues
Bases de Dados
• Comportamento de alunos em sistema de EAD.
Logs de acessos diários de alunos;
Interações com colegas;
Acesso a recursos e materiais;
Tempos de permanência na plataformas;
Desempenho dos alunos;
...
Prof. Dr. Rodrigo Lins Rodrigues
Bases de Dados
• Sobre a base de dados:
Foi realizada a junção das bases de dados referente a
um período de sete anos;
Dados armazenados em bases de dados relacionais;
Construção de 37 scripts SQL;
Prof. Dr. Rodrigo Lins Rodrigues
Bases de Dados
• Sobre as variáveis comportamentais:
Prof. Dr. Rodrigo Lins Rodrigues
Bases de Dados
• Sobre as variáveis comportamentais:
Prof. Dr. Rodrigo Lins Rodrigues
Projeto prático
Prof. Dr. Rodrigo Lins Rodrigues
• Proposta do projeto prático.
Construir um modelo de regressão, baseado em
dados comportamentais, capaz de predizer o
desempenho dos alunos;
Cada grupo deverá utilizar o máximo de
conhecimentos de pré-processamento para
otimizar o modelo.
Projeto prático
Prof. Dr. Rodrigo Lins Rodrigues
Projeto prático
• Fase de pré-processamento:
Quando necessário categorizar variáveis;
Retirar variáveis quando necessário;
Verificar variáveis que tem uma grande quantidade de
zeros e decidir o que fazer;
Verificar a presença de outliers;
...
Prof. Dr. Rodrigo Lins Rodrigues
Projeto prático
• Quais análises deverão ser feitas?
Inicialmente algumas análises descritivas;
Separar a base em treinamento e teste;
Construir o modelo de regressão logística;
Avaliar o modelo com as principais métricas;
Construir a matriz de confusão;
Construir a curva ROC;
Otimizar o modelo para o melhor valor de acurácia e ROC.
Prof. Dr. Rodrigo Lins Rodrigues
Dúvidas
o Contatos:
Email: rodrigo.linsrodrigues@ufrpe.br
Facebook: /rodrigomuribec
Prof. Dr. Rodrigo Lins Rodrigues

Mais conteúdo relacionado

Mais procurados

Determinar frequências absoluta, relativa e relativa percentual
Determinar frequências absoluta, relativa e relativa percentualDeterminar frequências absoluta, relativa e relativa percentual
Determinar frequências absoluta, relativa e relativa percentualdean dundas
 
Aula 6 análise de conglomerados
Aula 6  análise de conglomeradosAula 6  análise de conglomerados
Aula 6 análise de conglomeradosRodrigo Rodrigues
 
Medidas de comprimento e ttempo oficial
Medidas de comprimento e ttempo oficialMedidas de comprimento e ttempo oficial
Medidas de comprimento e ttempo oficialPedagogia Ufal
 
ÁREAS E PERÍMETROS
ÁREAS E PERÍMETROS ÁREAS E PERÍMETROS
ÁREAS E PERÍMETROS fabianamaia1
 
Exercícios Resolvidos: Frequência relativa, absoluta, acumulada
Exercícios Resolvidos: Frequência relativa, absoluta, acumuladaExercícios Resolvidos: Frequência relativa, absoluta, acumulada
Exercícios Resolvidos: Frequência relativa, absoluta, acumuladaDiego Oliveira
 
Medidas de tendencia central
Medidas de tendencia centralMedidas de tendencia central
Medidas de tendencia centralrosania39
 
Bancos de Dados Geográficos
Bancos de Dados GeográficosBancos de Dados Geográficos
Bancos de Dados GeográficosSuzana Viana Mota
 
Cartografia: Elementos do Mapa
Cartografia: Elementos do MapaCartografia: Elementos do Mapa
Cartografia: Elementos do MapaEduardo Mendes
 
Estatísticas: Média, Moda e Mediana
Estatísticas: Média, Moda e MedianaEstatísticas: Média, Moda e Mediana
Estatísticas: Média, Moda e MedianaSminorffa
 
Bioestatistica basica completa-apresentacao
Bioestatistica basica completa-apresentacaoBioestatistica basica completa-apresentacao
Bioestatistica basica completa-apresentacaoFabiano Reis
 

Mais procurados (20)

Tópico 4 regressão linear simples 01
Tópico 4   regressão linear simples 01Tópico 4   regressão linear simples 01
Tópico 4 regressão linear simples 01
 
Regressão Linear I
Regressão Linear IRegressão Linear I
Regressão Linear I
 
escalas
escalasescalas
escalas
 
Determinar frequências absoluta, relativa e relativa percentual
Determinar frequências absoluta, relativa e relativa percentualDeterminar frequências absoluta, relativa e relativa percentual
Determinar frequências absoluta, relativa e relativa percentual
 
Aula 6 análise de conglomerados
Aula 6  análise de conglomeradosAula 6  análise de conglomerados
Aula 6 análise de conglomerados
 
Medidas de comprimento e ttempo oficial
Medidas de comprimento e ttempo oficialMedidas de comprimento e ttempo oficial
Medidas de comprimento e ttempo oficial
 
ÁREAS E PERÍMETROS
ÁREAS E PERÍMETROS ÁREAS E PERÍMETROS
ÁREAS E PERÍMETROS
 
Conceitos Básicos de Estatística I
Conceitos Básicos de Estatística IConceitos Básicos de Estatística I
Conceitos Básicos de Estatística I
 
Estatística
EstatísticaEstatística
Estatística
 
Análise de Agrupamentos (Clusters)
Análise de Agrupamentos (Clusters)Análise de Agrupamentos (Clusters)
Análise de Agrupamentos (Clusters)
 
Análise de regressão linear
Análise de regressão linearAnálise de regressão linear
Análise de regressão linear
 
Exercícios Resolvidos: Frequência relativa, absoluta, acumulada
Exercícios Resolvidos: Frequência relativa, absoluta, acumuladaExercícios Resolvidos: Frequência relativa, absoluta, acumulada
Exercícios Resolvidos: Frequência relativa, absoluta, acumulada
 
Medidas de tendencia central
Medidas de tendencia centralMedidas de tendencia central
Medidas de tendencia central
 
Bancos de Dados Geográficos
Bancos de Dados GeográficosBancos de Dados Geográficos
Bancos de Dados Geográficos
 
Equação do 2º grau
Equação do 2º grauEquação do 2º grau
Equação do 2º grau
 
Cartografia: Elementos do Mapa
Cartografia: Elementos do MapaCartografia: Elementos do Mapa
Cartografia: Elementos do Mapa
 
Estatísticas: Média, Moda e Mediana
Estatísticas: Média, Moda e MedianaEstatísticas: Média, Moda e Mediana
Estatísticas: Média, Moda e Mediana
 
Geoprocessamento
GeoprocessamentoGeoprocessamento
Geoprocessamento
 
Bioestatistica basica completa-apresentacao
Bioestatistica basica completa-apresentacaoBioestatistica basica completa-apresentacao
Bioestatistica basica completa-apresentacao
 
Regressão Linear Simples
Regressão Linear SimplesRegressão Linear Simples
Regressão Linear Simples
 

Semelhante a Aula 5 modelo de regressão loística

Aula 4 modelos de regressão linear
Aula 4   modelos de regressão linearAula 4   modelos de regressão linear
Aula 4 modelos de regressão linearRodrigo Rodrigues
 
Análise de Regressão: aspectos teóricos e computacionais
Análise de Regressão: aspectos teóricos e computacionaisAnálise de Regressão: aspectos teóricos e computacionais
Análise de Regressão: aspectos teóricos e computacionaisRodrigo Rodrigues
 
Modelagem de Sistemas de Informação
Modelagem de Sistemas de InformaçãoModelagem de Sistemas de Informação
Modelagem de Sistemas de InformaçãoHelder Lopes
 
Pmi Global 2008 Portfolio
Pmi Global 2008 PortfolioPmi Global 2008 Portfolio
Pmi Global 2008 PortfolioPeter Mello
 
TDC2016SP - SparkMLlib Machine Learning na Prática
TDC2016SP -  SparkMLlib Machine Learning na PráticaTDC2016SP -  SparkMLlib Machine Learning na Prática
TDC2016SP - SparkMLlib Machine Learning na Práticatdc-globalcode
 
[TDC2016] Apache SparkMLlib: Machine Learning na Prática
[TDC2016] Apache SparkMLlib:  Machine Learning na Prática[TDC2016] Apache SparkMLlib:  Machine Learning na Prática
[TDC2016] Apache SparkMLlib: Machine Learning na PráticaEiti Kimura
 
Além do Método do Caminho Crítico: Success Driven Project Management
Além do Método do Caminho Crítico: Success Driven Project ManagementAlém do Método do Caminho Crítico: Success Driven Project Management
Além do Método do Caminho Crítico: Success Driven Project ManagementPeter Mello
 
Aula 2 prática computacional de estatística descritiva
Aula 2   prática computacional de estatística descritivaAula 2   prática computacional de estatística descritiva
Aula 2 prática computacional de estatística descritivaRodrigo Rodrigues
 
sap-hr-recursos-humanos
  sap-hr-recursos-humanos  sap-hr-recursos-humanos
sap-hr-recursos-humanosDenner Andrade
 
Seminario Riscos 2006 - Vladimir
Seminario Riscos 2006 - VladimirSeminario Riscos 2006 - Vladimir
Seminario Riscos 2006 - VladimirPeter Mello
 
Practice 4 :: Gestão de Projetos de SW OO :: Métricas, Estimação e Planificações
Practice 4 :: Gestão de Projetos de SW OO :: Métricas, Estimação e PlanificaçõesPractice 4 :: Gestão de Projetos de SW OO :: Métricas, Estimação e Planificações
Practice 4 :: Gestão de Projetos de SW OO :: Métricas, Estimação e PlanificaçõesRogerio P C do Nascimento
 
Treinamento MLOps Databricks 2023
Treinamento MLOps Databricks 2023Treinamento MLOps Databricks 2023
Treinamento MLOps Databricks 2023Douglas Mendes
 
vitoriadaconquista-gp2-pmo-olinadgroupco
vitoriadaconquista-gp2-pmo-olinadgroupcovitoriadaconquista-gp2-pmo-olinadgroupco
vitoriadaconquista-gp2-pmo-olinadgroupcoMarco Coghi
 
Vi Seminario Pmi (SP): Portfolio e Corrente Critica
Vi Seminario Pmi (SP): Portfolio e Corrente CriticaVi Seminario Pmi (SP): Portfolio e Corrente Critica
Vi Seminario Pmi (SP): Portfolio e Corrente CriticaPeter Mello
 
Gestão da evasão na EAD: discussão a partir de um modelo preditivo
Gestão da evasão na EAD: discussão a partir de um modelo preditivoGestão da evasão na EAD: discussão a partir de um modelo preditivo
Gestão da evasão na EAD: discussão a partir de um modelo preditivoANGRAD
 
Topicos de econometria de séries temporais 2020_1
Topicos de econometria de séries temporais 2020_1 Topicos de econometria de séries temporais 2020_1
Topicos de econometria de séries temporais 2020_1 Adriano Figueiredo
 

Semelhante a Aula 5 modelo de regressão loística (20)

Aula 4 modelos de regressão linear
Aula 4   modelos de regressão linearAula 4   modelos de regressão linear
Aula 4 modelos de regressão linear
 
Aula 7 análise fatorial
Aula 7  análise fatorialAula 7  análise fatorial
Aula 7 análise fatorial
 
Análise de Regressão: aspectos teóricos e computacionais
Análise de Regressão: aspectos teóricos e computacionaisAnálise de Regressão: aspectos teóricos e computacionais
Análise de Regressão: aspectos teóricos e computacionais
 
Modelagem de Sistemas de Informação
Modelagem de Sistemas de InformaçãoModelagem de Sistemas de Informação
Modelagem de Sistemas de Informação
 
Pmi Global 2008 Portfolio
Pmi Global 2008 PortfolioPmi Global 2008 Portfolio
Pmi Global 2008 Portfolio
 
TDC2016SP - SparkMLlib Machine Learning na Prática
TDC2016SP -  SparkMLlib Machine Learning na PráticaTDC2016SP -  SparkMLlib Machine Learning na Prática
TDC2016SP - SparkMLlib Machine Learning na Prática
 
[TDC2016] Apache SparkMLlib: Machine Learning na Prática
[TDC2016] Apache SparkMLlib:  Machine Learning na Prática[TDC2016] Apache SparkMLlib:  Machine Learning na Prática
[TDC2016] Apache SparkMLlib: Machine Learning na Prática
 
Além do Método do Caminho Crítico: Success Driven Project Management
Além do Método do Caminho Crítico: Success Driven Project ManagementAlém do Método do Caminho Crítico: Success Driven Project Management
Além do Método do Caminho Crítico: Success Driven Project Management
 
Aula 2 prática computacional de estatística descritiva
Aula 2   prática computacional de estatística descritivaAula 2   prática computacional de estatística descritiva
Aula 2 prática computacional de estatística descritiva
 
sap-hr-recursos-humanos
  sap-hr-recursos-humanos  sap-hr-recursos-humanos
sap-hr-recursos-humanos
 
Slideshow - Metodologias ágeis
Slideshow - Metodologias ágeisSlideshow - Metodologias ágeis
Slideshow - Metodologias ágeis
 
Seminario Riscos 2006 - Vladimir
Seminario Riscos 2006 - VladimirSeminario Riscos 2006 - Vladimir
Seminario Riscos 2006 - Vladimir
 
Practice 4 :: Gestão de Projetos de SW OO :: Métricas, Estimação e Planificações
Practice 4 :: Gestão de Projetos de SW OO :: Métricas, Estimação e PlanificaçõesPractice 4 :: Gestão de Projetos de SW OO :: Métricas, Estimação e Planificações
Practice 4 :: Gestão de Projetos de SW OO :: Métricas, Estimação e Planificações
 
Plano do Projeto
Plano do ProjetoPlano do Projeto
Plano do Projeto
 
Treinamento MLOps Databricks 2023
Treinamento MLOps Databricks 2023Treinamento MLOps Databricks 2023
Treinamento MLOps Databricks 2023
 
vitoriadaconquista-gp2-pmo-olinadgroupco
vitoriadaconquista-gp2-pmo-olinadgroupcovitoriadaconquista-gp2-pmo-olinadgroupco
vitoriadaconquista-gp2-pmo-olinadgroupco
 
Metricas lean
Metricas leanMetricas lean
Metricas lean
 
Vi Seminario Pmi (SP): Portfolio e Corrente Critica
Vi Seminario Pmi (SP): Portfolio e Corrente CriticaVi Seminario Pmi (SP): Portfolio e Corrente Critica
Vi Seminario Pmi (SP): Portfolio e Corrente Critica
 
Gestão da evasão na EAD: discussão a partir de um modelo preditivo
Gestão da evasão na EAD: discussão a partir de um modelo preditivoGestão da evasão na EAD: discussão a partir de um modelo preditivo
Gestão da evasão na EAD: discussão a partir de um modelo preditivo
 
Topicos de econometria de séries temporais 2020_1
Topicos de econometria de séries temporais 2020_1 Topicos de econometria de séries temporais 2020_1
Topicos de econometria de séries temporais 2020_1
 

Mais de Rodrigo Rodrigues

Aula 3 testes de hipóteses e anova
Aula 3   testes de hipóteses e anovaAula 3   testes de hipóteses e anova
Aula 3 testes de hipóteses e anovaRodrigo Rodrigues
 
Aula 1 introdução e estatística descritiva
Aula 1   introdução e  estatística descritivaAula 1   introdução e  estatística descritiva
Aula 1 introdução e estatística descritivaRodrigo Rodrigues
 
Desenvolvimento de um Assistente Virtual Integrado ao Moodle para Suporte a A...
Desenvolvimento de um Assistente Virtual Integrado ao Moodle para Suporte a A...Desenvolvimento de um Assistente Virtual Integrado ao Moodle para Suporte a A...
Desenvolvimento de um Assistente Virtual Integrado ao Moodle para Suporte a A...Rodrigo Rodrigues
 
Pesquisa Quantitativa: aspectos teóricos e computacionais
Pesquisa Quantitativa: aspectos teóricos e computacionaisPesquisa Quantitativa: aspectos teóricos e computacionais
Pesquisa Quantitativa: aspectos teóricos e computacionaisRodrigo Rodrigues
 
Teste de hipóteses - paramétricos
Teste de hipóteses - paramétricosTeste de hipóteses - paramétricos
Teste de hipóteses - paramétricosRodrigo Rodrigues
 
Modelo de Regressão Linear aplicado à previsão de desempenho de estudantes em...
Modelo de Regressão Linear aplicado à previsão de desempenho de estudantes em...Modelo de Regressão Linear aplicado à previsão de desempenho de estudantes em...
Modelo de Regressão Linear aplicado à previsão de desempenho de estudantes em...Rodrigo Rodrigues
 
Jogos Educativos - Nativos Digitais
Jogos Educativos - Nativos DigitaisJogos Educativos - Nativos Digitais
Jogos Educativos - Nativos DigitaisRodrigo Rodrigues
 
Introdução sobre desenvolvimento web
Introdução sobre desenvolvimento webIntrodução sobre desenvolvimento web
Introdução sobre desenvolvimento webRodrigo Rodrigues
 
Componentes do Sistema operacional
Componentes do Sistema operacional Componentes do Sistema operacional
Componentes do Sistema operacional Rodrigo Rodrigues
 
Infraestrutura de Software - Introdução
Infraestrutura de Software - IntroduçãoInfraestrutura de Software - Introdução
Infraestrutura de Software - IntroduçãoRodrigo Rodrigues
 
Revsão sobre sistemas operacionais
Revsão sobre sistemas operacionaisRevsão sobre sistemas operacionais
Revsão sobre sistemas operacionaisRodrigo Rodrigues
 
As novas perspectivas para informática na educação e o paradigma colaborativo
As novas perspectivas para informática na educação e o paradigma colaborativo As novas perspectivas para informática na educação e o paradigma colaborativo
As novas perspectivas para informática na educação e o paradigma colaborativo Rodrigo Rodrigues
 

Mais de Rodrigo Rodrigues (20)

Aula 3 testes de hipóteses e anova
Aula 3   testes de hipóteses e anovaAula 3   testes de hipóteses e anova
Aula 3 testes de hipóteses e anova
 
Aula 1 introdução e estatística descritiva
Aula 1   introdução e  estatística descritivaAula 1   introdução e  estatística descritiva
Aula 1 introdução e estatística descritiva
 
Desenvolvimento de um Assistente Virtual Integrado ao Moodle para Suporte a A...
Desenvolvimento de um Assistente Virtual Integrado ao Moodle para Suporte a A...Desenvolvimento de um Assistente Virtual Integrado ao Moodle para Suporte a A...
Desenvolvimento de um Assistente Virtual Integrado ao Moodle para Suporte a A...
 
Pesquisa Quantitativa: aspectos teóricos e computacionais
Pesquisa Quantitativa: aspectos teóricos e computacionaisPesquisa Quantitativa: aspectos teóricos e computacionais
Pesquisa Quantitativa: aspectos teóricos e computacionais
 
Teste de hipóteses - paramétricos
Teste de hipóteses - paramétricosTeste de hipóteses - paramétricos
Teste de hipóteses - paramétricos
 
Modelo de Regressão Linear aplicado à previsão de desempenho de estudantes em...
Modelo de Regressão Linear aplicado à previsão de desempenho de estudantes em...Modelo de Regressão Linear aplicado à previsão de desempenho de estudantes em...
Modelo de Regressão Linear aplicado à previsão de desempenho de estudantes em...
 
Jogos Educativos - Nativos Digitais
Jogos Educativos - Nativos DigitaisJogos Educativos - Nativos Digitais
Jogos Educativos - Nativos Digitais
 
Introdução sobre desenvolvimento web
Introdução sobre desenvolvimento webIntrodução sobre desenvolvimento web
Introdução sobre desenvolvimento web
 
Gerência de dispositivos
Gerência de dispositivosGerência de dispositivos
Gerência de dispositivos
 
Memória virtual
Memória virtualMemória virtual
Memória virtual
 
Memória virtual
Memória virtualMemória virtual
Memória virtual
 
Gerenciamento de memória
Gerenciamento de memóriaGerenciamento de memória
Gerenciamento de memória
 
Aula revisão ok
Aula revisão       okAula revisão       ok
Aula revisão ok
 
Gerência de memória
Gerência de memóriaGerência de memória
Gerência de memória
 
Escalonamento de processos
Escalonamento de processosEscalonamento de processos
Escalonamento de processos
 
Componentes do Sistema operacional
Componentes do Sistema operacional Componentes do Sistema operacional
Componentes do Sistema operacional
 
Infraestrutura de Software - Introdução
Infraestrutura de Software - IntroduçãoInfraestrutura de Software - Introdução
Infraestrutura de Software - Introdução
 
Revsão sobre sistemas operacionais
Revsão sobre sistemas operacionaisRevsão sobre sistemas operacionais
Revsão sobre sistemas operacionais
 
Introdução a IHC
Introdução a IHCIntrodução a IHC
Introdução a IHC
 
As novas perspectivas para informática na educação e o paradigma colaborativo
As novas perspectivas para informática na educação e o paradigma colaborativo As novas perspectivas para informática na educação e o paradigma colaborativo
As novas perspectivas para informática na educação e o paradigma colaborativo
 

Último

“Sobrou pra mim” - Conto de Ruth Rocha.pptx
“Sobrou pra mim” - Conto de Ruth Rocha.pptx“Sobrou pra mim” - Conto de Ruth Rocha.pptx
“Sobrou pra mim” - Conto de Ruth Rocha.pptxthaisamaral9365923
 
Slides Lição 5, CPAD, Os Inimigos do Cristão, 2Tr24, Pr Henrique.pptx
Slides Lição 5, CPAD, Os Inimigos do Cristão, 2Tr24, Pr Henrique.pptxSlides Lição 5, CPAD, Os Inimigos do Cristão, 2Tr24, Pr Henrique.pptx
Slides Lição 5, CPAD, Os Inimigos do Cristão, 2Tr24, Pr Henrique.pptxLuizHenriquedeAlmeid6
 
Guia completo da Previdênci a - Reforma .pdf
Guia completo da Previdênci a - Reforma .pdfGuia completo da Previdênci a - Reforma .pdf
Guia completo da Previdênci a - Reforma .pdfEyshilaKelly1
 
Época Realista y la obra de Madame Bovary.
Época Realista y la obra de Madame Bovary.Época Realista y la obra de Madame Bovary.
Época Realista y la obra de Madame Bovary.keislayyovera123
 
Sociologia Contemporânea - Uma Abordagem dos principais autores
Sociologia Contemporânea - Uma Abordagem dos principais autoresSociologia Contemporânea - Uma Abordagem dos principais autores
Sociologia Contemporânea - Uma Abordagem dos principais autoresaulasgege
 
Slides 1 - O gênero textual entrevista.pptx
Slides 1 - O gênero textual entrevista.pptxSlides 1 - O gênero textual entrevista.pptx
Slides 1 - O gênero textual entrevista.pptxSilvana Silva
 
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicasCenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicasRosalina Simão Nunes
 
A experiência amorosa e a reflexão sobre o Amor.pptx
A experiência amorosa e a reflexão sobre o Amor.pptxA experiência amorosa e a reflexão sobre o Amor.pptx
A experiência amorosa e a reflexão sobre o Amor.pptxfabiolalopesmartins1
 
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃOLEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃOColégio Santa Teresinha
 
E agora?! Já não avalio as atitudes e valores?
E agora?! Já não avalio as atitudes e valores?E agora?! Já não avalio as atitudes e valores?
E agora?! Já não avalio as atitudes e valores?Rosalina Simão Nunes
 
BRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdf
BRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdfBRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdf
BRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdfHenrique Pontes
 
Apresentação | Eleições Europeias 2024-2029
Apresentação | Eleições Europeias 2024-2029Apresentação | Eleições Europeias 2024-2029
Apresentação | Eleições Europeias 2024-2029Centro Jacques Delors
 
Cultura e Sociedade - Texto de Apoio.pdf
Cultura e Sociedade - Texto de Apoio.pdfCultura e Sociedade - Texto de Apoio.pdf
Cultura e Sociedade - Texto de Apoio.pdfaulasgege
 
Modelos de Desenvolvimento Motor - Gallahue, Newell e Tani
Modelos de Desenvolvimento Motor - Gallahue, Newell e TaniModelos de Desenvolvimento Motor - Gallahue, Newell e Tani
Modelos de Desenvolvimento Motor - Gallahue, Newell e TaniCassio Meira Jr.
 
COMPETÊNCIA 1 DA REDAÇÃO DO ENEM - REDAÇÃO ENEM
COMPETÊNCIA 1 DA REDAÇÃO DO ENEM - REDAÇÃO ENEMCOMPETÊNCIA 1 DA REDAÇÃO DO ENEM - REDAÇÃO ENEM
COMPETÊNCIA 1 DA REDAÇÃO DO ENEM - REDAÇÃO ENEMVanessaCavalcante37
 
Bullying - Atividade com caça- palavras
Bullying   - Atividade com  caça- palavrasBullying   - Atividade com  caça- palavras
Bullying - Atividade com caça- palavrasMary Alvarenga
 
Bullying - Texto e cruzadinha
Bullying        -     Texto e cruzadinhaBullying        -     Texto e cruzadinha
Bullying - Texto e cruzadinhaMary Alvarenga
 
CRÔNICAS DE UMA TURMA - TURMA DE 9ºANO - EASB
CRÔNICAS DE UMA TURMA - TURMA DE 9ºANO - EASBCRÔNICAS DE UMA TURMA - TURMA DE 9ºANO - EASB
CRÔNICAS DE UMA TURMA - TURMA DE 9ºANO - EASBAline Santana
 
Pedologia- Geografia - Geologia - aula_01.pptx
Pedologia- Geografia - Geologia - aula_01.pptxPedologia- Geografia - Geologia - aula_01.pptx
Pedologia- Geografia - Geologia - aula_01.pptxleandropereira983288
 

Último (20)

“Sobrou pra mim” - Conto de Ruth Rocha.pptx
“Sobrou pra mim” - Conto de Ruth Rocha.pptx“Sobrou pra mim” - Conto de Ruth Rocha.pptx
“Sobrou pra mim” - Conto de Ruth Rocha.pptx
 
Slides Lição 5, CPAD, Os Inimigos do Cristão, 2Tr24, Pr Henrique.pptx
Slides Lição 5, CPAD, Os Inimigos do Cristão, 2Tr24, Pr Henrique.pptxSlides Lição 5, CPAD, Os Inimigos do Cristão, 2Tr24, Pr Henrique.pptx
Slides Lição 5, CPAD, Os Inimigos do Cristão, 2Tr24, Pr Henrique.pptx
 
Guia completo da Previdênci a - Reforma .pdf
Guia completo da Previdênci a - Reforma .pdfGuia completo da Previdênci a - Reforma .pdf
Guia completo da Previdênci a - Reforma .pdf
 
Época Realista y la obra de Madame Bovary.
Época Realista y la obra de Madame Bovary.Época Realista y la obra de Madame Bovary.
Época Realista y la obra de Madame Bovary.
 
Em tempo de Quaresma .
Em tempo de Quaresma                            .Em tempo de Quaresma                            .
Em tempo de Quaresma .
 
Sociologia Contemporânea - Uma Abordagem dos principais autores
Sociologia Contemporânea - Uma Abordagem dos principais autoresSociologia Contemporânea - Uma Abordagem dos principais autores
Sociologia Contemporânea - Uma Abordagem dos principais autores
 
Slides 1 - O gênero textual entrevista.pptx
Slides 1 - O gênero textual entrevista.pptxSlides 1 - O gênero textual entrevista.pptx
Slides 1 - O gênero textual entrevista.pptx
 
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicasCenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
 
A experiência amorosa e a reflexão sobre o Amor.pptx
A experiência amorosa e a reflexão sobre o Amor.pptxA experiência amorosa e a reflexão sobre o Amor.pptx
A experiência amorosa e a reflexão sobre o Amor.pptx
 
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃOLEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
 
E agora?! Já não avalio as atitudes e valores?
E agora?! Já não avalio as atitudes e valores?E agora?! Já não avalio as atitudes e valores?
E agora?! Já não avalio as atitudes e valores?
 
BRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdf
BRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdfBRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdf
BRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdf
 
Apresentação | Eleições Europeias 2024-2029
Apresentação | Eleições Europeias 2024-2029Apresentação | Eleições Europeias 2024-2029
Apresentação | Eleições Europeias 2024-2029
 
Cultura e Sociedade - Texto de Apoio.pdf
Cultura e Sociedade - Texto de Apoio.pdfCultura e Sociedade - Texto de Apoio.pdf
Cultura e Sociedade - Texto de Apoio.pdf
 
Modelos de Desenvolvimento Motor - Gallahue, Newell e Tani
Modelos de Desenvolvimento Motor - Gallahue, Newell e TaniModelos de Desenvolvimento Motor - Gallahue, Newell e Tani
Modelos de Desenvolvimento Motor - Gallahue, Newell e Tani
 
COMPETÊNCIA 1 DA REDAÇÃO DO ENEM - REDAÇÃO ENEM
COMPETÊNCIA 1 DA REDAÇÃO DO ENEM - REDAÇÃO ENEMCOMPETÊNCIA 1 DA REDAÇÃO DO ENEM - REDAÇÃO ENEM
COMPETÊNCIA 1 DA REDAÇÃO DO ENEM - REDAÇÃO ENEM
 
Bullying - Atividade com caça- palavras
Bullying   - Atividade com  caça- palavrasBullying   - Atividade com  caça- palavras
Bullying - Atividade com caça- palavras
 
Bullying - Texto e cruzadinha
Bullying        -     Texto e cruzadinhaBullying        -     Texto e cruzadinha
Bullying - Texto e cruzadinha
 
CRÔNICAS DE UMA TURMA - TURMA DE 9ºANO - EASB
CRÔNICAS DE UMA TURMA - TURMA DE 9ºANO - EASBCRÔNICAS DE UMA TURMA - TURMA DE 9ºANO - EASB
CRÔNICAS DE UMA TURMA - TURMA DE 9ºANO - EASB
 
Pedologia- Geografia - Geologia - aula_01.pptx
Pedologia- Geografia - Geologia - aula_01.pptxPedologia- Geografia - Geologia - aula_01.pptx
Pedologia- Geografia - Geologia - aula_01.pptx
 

Aula 5 modelo de regressão loística

  • 1. Curso de Ciência de Dados e Analytics Estatística Computacional Semana 2 - Aula 2 – Modelo de Regressão Logística Prof. Dr. Rodrigo Lins Rodrigues rodrigo.linsrodrigues@ufrpe.br Prof. Dr. Rodrigo Lins Rodrigues
  • 2. Regressão Logística Prof. Dr. Rodrigo Lins Rodrigues
  • 3. Regressão Logística ...O que seria a Regressão Logística? Prof. Dr. Rodrigo Lins Rodrigues
  • 4. Regressão Logística • É utilizada para prever a probabilidade de um evento binário ocorrer. • Segue a mesma lógica do modelo de regressão linear com a particularidade da variável alvo ser binária; • É uma técnica muito utilizada quando não se tem bases de dados muito grandes; Prof. Dr. Rodrigo Lins Rodrigues
  • 5. Regressão Logística • Não tem muitas exigências de pressupostos; • Há uma infinidade de eventos de interesse que podem ser modelados pela regressão logística; • Uma das grandes vantagens é a flexibilidade de seus pressupostos, o que amplia sua aplicabilidade. Prof. Dr. Rodrigo Lins Rodrigues
  • 6. Regressão Logística • Deriva seu nome da transformação logit usada como variável dependente; • Um modelo é definido como logístico se a função segue a seguinte equação: 𝑙𝑜𝑔𝑖𝑡 𝑝𝑖 = ln 𝑝𝑖 1 − 𝑝𝑖 = 𝛽0 + 𝛽1 𝑥1 + ⋯ + 𝛽 𝑛 𝑥 𝑛 Prof. Dr. Rodrigo Lins Rodrigues
  • 7. Regressão Logística • Um modelo é definido como logístico se a função segue a seguinte equação: • Em que 𝑝𝑖 indica a probabilidade de ocorrência, 𝑥1, … , 𝑥 𝑛 representa o vetor de variáveis explicativas (ou independentes) e β0 e β 𝑥 indicam os coeficientes do modelo. 𝑙𝑜𝑔𝑖𝑡 𝑝𝑖 = ln 𝑝𝑖 1 − 𝑝𝑖 = 𝛽0 + 𝛽1 𝑥1 + ⋯ + 𝛽 𝑛 𝑥 𝑛 Prof. Dr. Rodrigo Lins Rodrigues
  • 8. Regressão Logística • Os coeficientes logísticos são difíceis de interpretar em sua forma original, pois são expressos em termos de logaritmos quando usamos a função logit; • E possível aplicar a transformação de anti-logaritmo por meio da exponenciação dos coeficientes originais, gerando a razão de desigualdades: 𝑅𝑎𝑧ã𝑜 𝑑𝑒 𝐷𝑒𝑠𝑖𝑔𝑢𝑎𝑙𝑑𝑎𝑑𝑒𝑠𝑖 (𝑜𝑑𝑑𝑠) = 𝑒 𝛽0+𝛽1 𝑥1+⋯+𝛽 𝑛 𝑥 𝑛 Prof. Dr. Rodrigo Lins Rodrigues
  • 9. Regressão Logística • Para cada observação, é previsto um valor de probabilidade entre 0 e 1; • Os valores previstos para todos os valores da variável independente gera a curva logística: Prof. Dr. Rodrigo Lins Rodrigues
  • 10. Regressão Logística • Se a probabilidade prevista é maior do que 0,50, então a previsão é de que o resultado seja 1 (evento ocorreu); • Caso a probabilidade prevista seja menor do que 0,50, então a previsão é de que o resultado seja 0 (evento não ocorreu); • Esse corte pode ser ajustado e faz parte das configurações de parâmetros para melhorar o modelo. Prof. Dr. Rodrigo Lins Rodrigues
  • 11. Construção do modelo de Regressão Logística Prof. Dr. Rodrigo Lins Rodrigues
  • 12. Construção do modelo • A construção de um classificador por regressão logística pode ser representado de forma simplificada por: • Conjunto com n dados, onde cada observação 𝑥𝑖 possui m atributos e as variáveis 𝑦𝑖 representam as classes ou rótulos. Prof. Dr. Rodrigo Lins Rodrigues
  • 13. Construção do modelo • A tarefa de classificação pode ser dividida em duas categorias, a classificação binária e a classificação multiclasses. Regressão Logística Binária; Regressão Logística Multimodal; • Diversos algoritmos vêm sendo desenvolvidos ao longo de pesquisas; • A Regressão Logística é um algoritmo criado pela estatística. Prof. Dr. Rodrigo Lins Rodrigues
  • 14. • Construção de um classificador de forma computacional através do software R: Tabela de Análise 70% 30% Treinamento Teste Algoritmos de Classificação Métricas de Validação Comparação de classificadores Modelagem Validação Construção do modelo Prof. Dr. Rodrigo Lins Rodrigues
  • 15. Avaliação do Modelo Logístico Prof. Dr. Rodrigo Lins Rodrigues
  • 16. Avaliação do Modelo Logístico Para entender os erros gerados por um classificador é possível visualizar por meio da construção da uma matriz de erros denominada matriz de confusão; A partir da matriz é possível obter métricas de qualidade para a avaliação do desempenho de um classificador; Resume o número de instâncias previstas corretas ou incorretas por um modelo de classificação. Prof. Dr. Rodrigo Lins Rodrigues
  • 17. Avaliação do Modelo Logístico Representação da matriz de confusão: Matriz de Confusão Classe Atual Negativa (-) Positiva (+) Classe Prevista Negativa (-) 𝑓 − − (𝑇𝑁) 𝑓 + − (𝐹𝑁) Positiva (+) 𝑓 − + (𝐹𝑃) 𝑓 + + (𝑇𝑃) Prof. Dr. Rodrigo Lins Rodrigues
  • 18. Avaliação do Modelo Logístico • As seguinte terminologias são usadas para o entendimento da matriz de confusão: Positivo verdadeiro (TP): é relacionado ao número de instâncias positivas previstas corretamente pelo classificador; Negativo falso (FN): é o número de instâncias previstas erroneamente como negativos pelo classificador; Positivo falso (FP): é o número de exemplos negativos previstos erroneamente como positivos pelo classificador; Falso verdadeiro (TN): é o número de exemplos negativos previstos corretamente pelo classificador.Prof. Dr. Rodrigo Lins Rodrigues
  • 19. Avaliação do Modelo Logístico • Uma das maneiras mais comuns de avaliar modelos é por meio da derivação de medidas que, tentam medir a “qualidade” do modelo; • Essas medidas geralmente podem ser obtidas a partir da matriz de confusão: A acurácia é definida como sendo o número de instâncias corretas divididas pelo número total de instâncias; 𝐴𝑐𝑢𝑟á𝑐𝑖𝑎 = 𝑇𝑃 + 𝑇𝑁 (𝑇𝑃 + 𝑇𝑁 + 𝐹𝑁 + 𝐹𝑃) Prof. Dr. Rodrigo Lins Rodrigues
  • 20. Avaliação do Modelo Logístico • A precisão determina o percentual de registros que são positivos no grupo que o classificador previu como classe positiva. 𝑃𝑟𝑒𝑐𝑖𝑠ã𝑜 = 𝑇𝑃 𝑇𝑃 + 𝐹𝑃 • A lembrança (Recall) mede o percentual de instâncias positivas previstas corretamente pelo classificador. 𝑅𝑒𝑐𝑎𝑙𝑙 = 𝑇𝑃 𝑇𝑃 + 𝐹𝑁Prof. Dr. Rodrigo Lins Rodrigues
  • 21. Avaliação do Modelo Logístico • Área da curva ROC: Representação gráfica para descrever o desempenho de um sistema classificador binário; É baseada na taxa de verdadeiros positivos 𝑇𝑃𝑅, e na taxa de falsos positivos 𝐹𝑃𝑅; Prof. Dr. Rodrigo Lins Rodrigues
  • 22. Avaliação do Modelo Logístico • Área da curva ROC: É muito utilizada quando queremos comprar a performance entre diversos classificadores; Seus valores variam entre zero e um; Muito utilizada quando se tem classe desbalanceada. Prof. Dr. Rodrigo Lins Rodrigues
  • 23. Avaliação do Modelo Logístico • Utilização de métricas conjuntamente: É comum encontrar situações em que um modelo aparenta ser melhor que outro para algumas das métricas, mas pior com relação a outras; Nesses casos, utilizar uma única medida pode dar a falsa impressão de que o desempenho pode ser avaliado utilizando-se apenas essa medida; Para uma avaliação mais precisa é ideal que seja utilizado um conjunto de métricas levando em consideração o objetivo da pesquisa. Prof. Dr. Rodrigo Lins Rodrigues
  • 24. Regressão Logística em R Prof. Dr. Rodrigo Lins Rodrigues
  • 25. Regressão Logística em R • Exemplo: Vamos continuar com exemplo relacionado a deslocamento de alunos; Agora temos o interesse em investigar se as variáveis explicativas influenciam a probabilidade de um aluno chegar atrasado na aula; O fenômeno em estudo agora apresenta somente duas categorias (atrasado e não atrasado); O evento de interesse refere-se a chegar atrasado. Prof. Dr. Rodrigo Lins Rodrigues
  • 26. Regressão Logística em R • Exemplo: Para realizar esse experimento fizemos uma pesquisa com 100 de uma escola específica; O aluno deveria informar se no dia da pesquisa chegou ou não atrasado; Outras variáveis coletadas foram: oDistância percorrida no trajeto (em quilómetros); oNúmero de semáforos pelos quais o aluno passou; oPeríodo de realização do trajeto (manhã ou tarde); oE como cada aluno considera-se no volante (calmo, moderado ou agressivo); Prof. Dr. Rodrigo Lins Rodrigues
  • 27. Regressão Logística em R • Exemplo: Tabela com as respostas de 100 alunos; Estudante Chegou atrasado à escola (𝒀𝒊) Distância percorrida (𝑿 𝟏𝒊) Quantidade de semáforos (𝑿 𝟐𝒊) Período do dia (𝑿 𝟑𝒊) Perfil ao volante (𝑿 𝟒𝒊) Gabriela Não 12.5 7 manhã calmo Patrícia Não 13.3 10 manhã calmo Gustavo Não 13.4 8 manhã moderado Letícia Não 23.5 7 manhã calmo Luiz Ovídio Não 9.5 8 manhã calmo Leonor Não 13.5 10 manhã calmo Dalila Não 13.5 10 manhã calmo Antônio Não 15.4 10 manhã calmo Júlia Não 14.7 10 manhã calmo ... ... ... ... ... ... Prof. Dr. Rodrigo Lins Rodrigues
  • 28. Regressão Logística em R • Exemplo: Foi necessário aplicar algumas transformações nas variáveis; A variável alvo (Chegou atrasado) recebeu valores de 0 para não chegou e 1 para chegou atrasado; Período do dia ficou: 0 para manhã, e 1 para tarde; A variável (Perfil ao volante) foi transformada em variável binária: 0 calmo e 1 moderado; Criou-se uma nova variável binária informando se o condutor se considera agressivo ou não (1 ou 0); Foi retirado espaços (renomeado) os nomes das variáveis.Prof. Dr. Rodrigo Lins Rodrigues
  • 29. Regressão Logística em R • Exemplo: A nova tabela de dados ficou da seguinte forma; Estudante chegou_atrasado distancia quantidade_semaf oros periodo perfil_volante2 Gabriela 0 12.5 7 1 0 Patrícia 0 13.3 10 1 0 Gustavo 0 13.4 8 1 1 Letícia 0 23.5 7 1 0 Luiz Ovídio 0 9.5 8 1 0 Leonor 0 13.5 10 1 0 Dalila 0 13.5 10 1 0 Antônio 0 15.4 10 1 0 Júlia 0 14.7 10 1 0 ... ... ... ... ... ... Prof. Dr. Rodrigo Lins Rodrigues
  • 30. Regressão Logística em R • Exemplo: Vamos abrir o script “scriptRegressaoLogistica.R”;  Abrir a Base “atrasado.CSV” Prof. Dr. Rodrigo Lins Rodrigues
  • 31. Regressão Logística em R • Exemplo: Prof. Dr. Rodrigo Lins Rodrigues
  • 32. Regressão Logística em R • Exemplo: Prof. Dr. Rodrigo Lins Rodrigues
  • 33. Regressão Logística em R • Exemplo: Prof. Dr. Rodrigo Lins Rodrigues
  • 34. Regressão Logística em R • Exemplo: Prof. Dr. Rodrigo Lins Rodrigues
  • 35. Regressão Logística em R • Exemplo: Prof. Dr. Rodrigo Lins Rodrigues
  • 36. Agora é com vocês ! • Qual a diferença entre a Regressão Linear Múltipla e a Regressão Logística ? • Quais as formas de validar um modelo logístico ? • Diga alguns fenômenos que podemos modelar através da regressão logística ? Prof. Dr. Rodrigo Lins Rodrigues
  • 37. Dúvidas o Contatos: Email: rodrigo.linsrodrigues@ufrpe.br Facebook: /rodrigomuribec Prof. Dr. Rodrigo Lins Rodrigues
  • 38. Curso de Ciência de Dados e Analytics Estatística Computacional Semana 2 - Aula 3 – Prática Computacional de Modelos de Regressão Prof. Dr. Rodrigo Lins Rodrigues rodrigo.linsrodrigues@ufrpe.br Prof. Dr. Rodrigo Lins Rodrigues
  • 39. Como será esta aula?  Avaliação prática em laboratório;  Deve ser realizada em grupos de 4 alunos;  Serei o “mentor” na execução da avaliação prática. Prof. Dr. Rodrigo Lins Rodrigues
  • 40. O que você aprenderá ? Colocará em prática todo o conhecimento adquirido sobre modelos de regressão Prof. Dr. Rodrigo Lins Rodrigues
  • 41. Base de dados utilizada Prof. Dr. Rodrigo Lins Rodrigues
  • 42. Bases de Dados • Plataformas de aprendizagem online e EAD. Prof. Dr. Rodrigo Lins Rodrigues
  • 43. Bases de Dados • Comportamento de alunos em sistema de EAD. Logs de acessos diários de alunos; Interações com colegas; Acesso a recursos e materiais; Tempos de permanência na plataformas; Desempenho dos alunos; ... Prof. Dr. Rodrigo Lins Rodrigues
  • 44. Bases de Dados • Sobre a base de dados: Foi realizada a junção das bases de dados referente a um período de sete anos; Dados armazenados em bases de dados relacionais; Construção de 37 scripts SQL; Prof. Dr. Rodrigo Lins Rodrigues
  • 45. Bases de Dados • Sobre as variáveis comportamentais: Prof. Dr. Rodrigo Lins Rodrigues
  • 46. Bases de Dados • Sobre as variáveis comportamentais: Prof. Dr. Rodrigo Lins Rodrigues
  • 47. Projeto prático Prof. Dr. Rodrigo Lins Rodrigues
  • 48. • Proposta do projeto prático. Construir um modelo de regressão, baseado em dados comportamentais, capaz de predizer o desempenho dos alunos; Cada grupo deverá utilizar o máximo de conhecimentos de pré-processamento para otimizar o modelo. Projeto prático Prof. Dr. Rodrigo Lins Rodrigues
  • 49. Projeto prático • Fase de pré-processamento: Quando necessário categorizar variáveis; Retirar variáveis quando necessário; Verificar variáveis que tem uma grande quantidade de zeros e decidir o que fazer; Verificar a presença de outliers; ... Prof. Dr. Rodrigo Lins Rodrigues
  • 50. Projeto prático • Quais análises deverão ser feitas? Inicialmente algumas análises descritivas; Separar a base em treinamento e teste; Construir o modelo de regressão logística; Avaliar o modelo com as principais métricas; Construir a matriz de confusão; Construir a curva ROC; Otimizar o modelo para o melhor valor de acurácia e ROC. Prof. Dr. Rodrigo Lins Rodrigues
  • 51. Dúvidas o Contatos: Email: rodrigo.linsrodrigues@ufrpe.br Facebook: /rodrigomuribec Prof. Dr. Rodrigo Lins Rodrigues