SlideShare une entreprise Scribd logo
1  sur  34
Télécharger pour lire hors ligne
Ciência de Dados no Combate à Corrupção
Dr. Rommel N. Carvalho | Coordenador-Geral do ODP/DIE/SE/MTFC
https://about.me/rommelnc | 15/06/2016 @ Ciência de Dados e Sociedade
O Observatório da Despesa Pública é uma
unidade de produção de informações
estratégicas e monitoramento dos gastos
públicos da Controladoria-Geral da União
Identificar riscos de fraude,
irregularidades e/ou mau
uso dos recursos públicos
Apoiar o processo de
tomada de decisão dos
gestores públicos
Especialistas
Auditores, TI, Analistas, Advogados, ...
Tecnologia
Técnicas e ferramentas avançadas
Metodologia
Objetivo comum
–Gartner
“Big data is high-volume, high-velocity and high-variety information
assets that demand cost-effective, innovative forms of information
processing for enhanced insight and decision making.”
– G A R T N E R
Banco de Vínculos
da APF
Mapa de Risco de
Fornecedores
Análise Preventiva
de Contratações
Triagem
Automática de
Denúncias
Identificação dos
Principais Pedidos
da LAI
Identificação das
Principais Constatações
nas Auditorias
Banco de Preços
da APF
Projetos de Big Data
Auditoria Contínua Classificação
Análise de Redes Sociais
Regressão
Detecção de Anomalia
Clusterização
Modelagem de TópicosMineração de Textos
Análise Multicritério
Inteligência de Negócio
Técnicas Utilizadas
Suporte Estatístico Inicial
 
2
1 12
k l
ij ij
i j
ij
O E
E
  



Embasamento Teórico
Agregação
Pivoteamento
Padronização
Atualização
Tratamento Básico
de Dados
Discretização
Normalização
Sampling
Datasets
Pré-Processamento
de Dados
Seleção de Atributos
Relevantes
Aprendizagem de Máquina
Validação de Modelos
Ajuste de Modelos
Teste de
Modelo Final
Implantação
de Modelo
no Sistema
Modelo
Final
Confiável?
SIM
Metodologia
Mapa de Risco de Irregularidades de
Fornecedores do Governo
Identificação de fornecedores com
perfil semelhante aos que receberam
punições nos contratos com governo
Ideia Principal
! F
o
r
n
e
c
e
d
o
r
C l i e n t e
Frutos de Parceria
83%$$ para avaliar
o impacto do ODP
Busca e Identificação de Padrões
no Banco de Vínculos da APF
Possibilitar a busca simples e rápida por
vínculos explícitos e implícitos, simples
e complexos, entre PFs e PJs que estão
associados às atividades da APF
• Bases da Administração possuem vínculos expressos
(PF-PF; PJ-PF; PJ-PJ):
– CPF: nome da mãe
– CNPJ e CNE: sócios e responsáveis
– RAIS: empregados
– ...
• É possível combinar todas essas bases em um único grafo
• Desafio: mais de um bilhão de vínculos
Banco de Vínculo
Análise Preventiva de
Contratações
Recuperação automática de
informações sobre compras, com
análise imediata de risco
Contexto
Incorporar modelagem de risco para prevenir situações já reportadas
Empresa fantasma
Baixa capacidade operacional
(comunicado CGU-R-AP)
• $$$ Contrato milionário
• Poucos funcionários
• Recém-criada
Contexto
Desafio: Como recuperar
dados em tempo hábil?
Automação
Risco: 1º lugar Planalto Service Ltda. Evolução dos negócios com o governo
desproporcional em relação à sua capacidade operacional.
Histórico operacional.Evolução comparada
(Faturamento x Empregados)
R$ 49 mi
R$ 164 mi
4,5 mil 6 mil
Volume de Contratos
2011 2014
R$ 112 milhõesR$ 14 milhões
Ocorrências nas trilhas de compras
Mesmo TelefonePlanalto
Service Ltda
Fortaleza serviços
Empresariais Ltda
6 ocorrências
17
vezes
Contou com a desistência
de outros participantes
pra vencer.
Pregão onde a melhor proposta não ganhou
Pregão nº. 15/2014. Venceu
após 9 desclassificações.
Estudo de Caso:
Dispensas (Jul/2015)
Triagem Automática de
Denúncias
Identificação e encaminhamento
automático de denúncia para as
principais áreas envolvidas de acordo
com texto informado na denúncia
Denúncias
PROTOCOLOo
Triagem
eletrônica
Lixo
Eletrônico
DSSAU
DSEDU
DRDAG
91 diferentes
áreas da
CGU
...
Arquivadas
Agrupa
similares
Dados
insuficientes
Não é
competência
CGU
Já foi
Ficalizada
...
Proposta
denunc escolc fraud ...
1 1 0 0
1 0 1 0
Identificação Automática de Tipos de
Pedidos mais Frequentes da LAI
Identificação dos principais assuntos
abordados nos mais de 300 mil
pedidos de informação no e-SIC
Tópicos - BACEN
9.220 pedidos (~3,06%)
Tópicos - Negado
44.322 pedidos (~14,71%)
"gostaria de ser informada sobre a minha
classificacao final no concurso ...
relativa ao edital ... ou seja quero a classificacao obtida apos
a eliminacao de 1715 candidatos nas provas de aptidao fisica
psicologica exames medicos e investigacao social
atenciosamente e desde ja agradeco ..."
"gostaria de obter as seguintes informacoes 01 quantidade de
servidores concursados do poder executivo federal e o
gasto mensal com os salarios destes servidores 02
quantidade de servidores nomeados em
cargo de confiaca do poder executivo federal e o gasto
mensal com os salarios destes servidores 03
quantidade de servidores aposentados
vinculados ao poder executivo federal e o gasto mensal com
a aposentadoria destes servidores"
"venho requerer minha classificacao apos
provas objetivas e subjetiva teste de
aptidao fisica e exames medico
considerando as eliminacoes no concurso no
concurso publico para provimento de vagas e formacao de
cadastro de reserva no cargo de ... da terceira classe prova
aplicada pela banca ... a banca examinadora se omite da
prestacao da informacao ou a presta equivocadamente ... "
"solicito informar a quantidade de empregados
do cargo de analista de sistemas que foram promovidos
de estagio do cargo conforme a seguir desde a
implantacao do ... analista de sistemas 1
do estagio jr para o pleno 2 do estagio jr para o
pleno 2 do estagio pl para o..."
Tópicos - Negado
Concurso Público
Análise de Recurso
0%
5%
10%
15%
20%
25%
30%
35%
40%
45%
60%20%
6%
14%
Atendido Negado
Recurso - Atendido Recurso - Negado
declaracao
2014
ano
imposto renda
numero recibo
exercicio
irpf
restituicao
...
"solicito resgate do numero de recibo
da declaracao de irpf referente ao
ano de 2014 por ter perdido os
dados no computador ficando assim
impossibilitada de realizar a
declaracao de 2015"
Desafios
Quantos Tópicos?Tempo de Execução?
0
100
200
300
400
500
600
700
10.000 20.000 130.000 300.000
Tempodeprocessamento(min)
Número de pedidos
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1 10 20 30 40 50 60 70 80 90 100
PontuaçãodoAgrupamento
Número de tópicos
Big Data?!
10 horas x 100 rodadas = 1.000 horas ou ~ 41 dias se 100 núcleos (paralelo)  10 horas
Identificação de Irregularidades Mais
Frequentes nas Auditorias
Identificação dos principais problemas
encontrados em constatações de
auditorias feitas e registradas no Novo
Ativa, por programa, órgão, tema, etc.
Avaliação de Gastos Públicos
através de Preços de Referência
O Banco de Preços do ODP/CGU permite o
auxílio à gestão, a pesquisa de mercado, o
controle social e a identificação de
anomalias, sobrepreços e melhores práticas
Consultar Preço de Referência
Calcular Preço de Referência
Gerar Ficha do Produto
Consultar Empenhos Vinculados
DW / Dashboards
Transparência e Prêmios
Funcionalidades Disponíveis
através do Portal ODP
Pesquise informações estratégicas e preços
de referência, acesse trilhas de auditoria e
painéis gerenciais, receba notificações e
realize consultas avançadas no DOU
Ferramentas Utilizadas
Expansão do ODP.estadual,
ODP.tce e ODP.Colômbia
Expansão do ODP para estados, municípios
e tribunais de contas estaduais, incluindo
metodologia e treinamento em análise e
cruzamento de dados. Piloto também
previsto para América Latina.
Publicações e Prêmios
Eficiência na Administração Pública Conhecimento Governamental
Governo para cidadãos Gestão da Informação Informação de Custos e Qualidade
do Gasto no Setor Público
Artigos Nacionais e Internacionais
Ciência de Dados no Combate à Corrupção
Dr. Rommel N. Carvalho | Coordenador-Geral do ODP/DIE/SE/MTFC
https://about.me/rommelnc | 15/06/2016 @ Ciência de Dados e Sociedade

Contenu connexe

Similaire à Ciência de Dados no Combate à Corrupção

Identificação automática de tipos de pedidos mais frequentes da LAI
Identificação automática de tipos de pedidos mais frequentes da LAIIdentificação automática de tipos de pedidos mais frequentes da LAI
Identificação automática de tipos de pedidos mais frequentes da LAIRommel Carvalho
 
Rh sistema de recursos humanos pagamentos _ e-social _ pessoas
Rh   sistema de recursos humanos   pagamentos _ e-social _ pessoasRh   sistema de recursos humanos   pagamentos _ e-social _ pessoas
Rh sistema de recursos humanos pagamentos _ e-social _ pessoasReginaldo Camargo
 
TechParty FACCAT 2015 - TI na Administração Pública
TechParty FACCAT 2015 - TI na Administração PúblicaTechParty FACCAT 2015 - TI na Administração Pública
TechParty FACCAT 2015 - TI na Administração Públicaeverton.berz
 
Curso de Análise de Informações p/ Concurso TCU
Curso de Análise de Informações p/ Concurso TCUCurso de Análise de Informações p/ Concurso TCU
Curso de Análise de Informações p/ Concurso TCUEstratégia Concursos
 
Agenda oficial - Fórum de TI e Inovação par Tribunais de Contas
Agenda oficial - Fórum de TI e Inovação par Tribunais de ContasAgenda oficial - Fórum de TI e Inovação par Tribunais de Contas
Agenda oficial - Fórum de TI e Inovação par Tribunais de ContasAna Carolina Giacomini Botta
 
Webinar cidades eficientes e inteligentes
Webinar cidades eficientes e inteligentesWebinar cidades eficientes e inteligentes
Webinar cidades eficientes e inteligentesLecom Tecnologia
 
Agenda Oficial - 1º Fórum de TI e Inovação para Tribunais de Contas
Agenda Oficial - 1º Fórum de TI e Inovação para Tribunais de ContasAgenda Oficial - 1º Fórum de TI e Inovação para Tribunais de Contas
Agenda Oficial - 1º Fórum de TI e Inovação para Tribunais de ContasAna Carolina Giacomini Botta
 
Plano de-negocio
Plano de-negocioPlano de-negocio
Plano de-negocioErick Alves
 
eSocial - Palestra de José Adriano no III Congresso de Contabilidade do Sul d...
eSocial - Palestra de José Adriano no III Congresso de Contabilidade do Sul d...eSocial - Palestra de José Adriano no III Congresso de Contabilidade do Sul d...
eSocial - Palestra de José Adriano no III Congresso de Contabilidade do Sul d...Jose Adriano Pinto
 
Engenharia de Requisitos com BPM
Engenharia de Requisitos com BPMEngenharia de Requisitos com BPM
Engenharia de Requisitos com BPMWilliam Santos
 
Compliance Partidário, Barbara Krysttal
Compliance Partidário, Barbara KrysttalCompliance Partidário, Barbara Krysttal
Compliance Partidário, Barbara KrysttalBarbara Krysttal
 
SPED: empreendedorismo e inovação - no mercado de serviços contábeis
SPED: empreendedorismo e inovação - no mercado de serviços contábeisSPED: empreendedorismo e inovação - no mercado de serviços contábeis
SPED: empreendedorismo e inovação - no mercado de serviços contábeisRoberto Dias Duarte
 
(2) Saneamento de Cadastros de Clientes e Fornecedores: o processo
(2) Saneamento de Cadastros de Clientes e Fornecedores: o processo(2) Saneamento de Cadastros de Clientes e Fornecedores: o processo
(2) Saneamento de Cadastros de Clientes e Fornecedores: o processoPortal KeyConsultas-web
 

Similaire à Ciência de Dados no Combate à Corrupção (20)

Painel 02 03 - Rommel Carvalho - identificação automática de tipos de pedid...
Painel 02   03 - Rommel Carvalho - identificação automática de tipos de pedid...Painel 02   03 - Rommel Carvalho - identificação automática de tipos de pedid...
Painel 02 03 - Rommel Carvalho - identificação automática de tipos de pedid...
 
Identificação automática de tipos de pedidos mais frequentes da LAI
Identificação automática de tipos de pedidos mais frequentes da LAIIdentificação automática de tipos de pedidos mais frequentes da LAI
Identificação automática de tipos de pedidos mais frequentes da LAI
 
Rh sistema de recursos humanos pagamentos _ e-social _ pessoas
Rh   sistema de recursos humanos   pagamentos _ e-social _ pessoasRh   sistema de recursos humanos   pagamentos _ e-social _ pessoas
Rh sistema de recursos humanos pagamentos _ e-social _ pessoas
 
TechParty FACCAT 2015 - TI na Administração Pública
TechParty FACCAT 2015 - TI na Administração PúblicaTechParty FACCAT 2015 - TI na Administração Pública
TechParty FACCAT 2015 - TI na Administração Pública
 
Sinfe Apresentacao
Sinfe ApresentacaoSinfe Apresentacao
Sinfe Apresentacao
 
Curso de Análise de Informações p/ Concurso TCU
Curso de Análise de Informações p/ Concurso TCUCurso de Análise de Informações p/ Concurso TCU
Curso de Análise de Informações p/ Concurso TCU
 
Agenda oficial - Fórum de TI e Inovação par Tribunais de Contas
Agenda oficial - Fórum de TI e Inovação par Tribunais de ContasAgenda oficial - Fórum de TI e Inovação par Tribunais de Contas
Agenda oficial - Fórum de TI e Inovação par Tribunais de Contas
 
Pam
PamPam
Pam
 
eSocial: sua empresa está preparada?
eSocial: sua empresa está preparada?eSocial: sua empresa está preparada?
eSocial: sua empresa está preparada?
 
Webinar cidades eficientes e inteligentes
Webinar cidades eficientes e inteligentesWebinar cidades eficientes e inteligentes
Webinar cidades eficientes e inteligentes
 
Agenda Oficial - 1º Fórum de TI e Inovação para Tribunais de Contas
Agenda Oficial - 1º Fórum de TI e Inovação para Tribunais de ContasAgenda Oficial - 1º Fórum de TI e Inovação para Tribunais de Contas
Agenda Oficial - 1º Fórum de TI e Inovação para Tribunais de Contas
 
Plano de-negocio
Plano de-negocioPlano de-negocio
Plano de-negocio
 
eSocial - Palestra de José Adriano no III Congresso de Contabilidade do Sul d...
eSocial - Palestra de José Adriano no III Congresso de Contabilidade do Sul d...eSocial - Palestra de José Adriano no III Congresso de Contabilidade do Sul d...
eSocial - Palestra de José Adriano no III Congresso de Contabilidade do Sul d...
 
Engenharia de Requisitos com BPM
Engenharia de Requisitos com BPMEngenharia de Requisitos com BPM
Engenharia de Requisitos com BPM
 
Compliance Partidário, Barbara Krysttal
Compliance Partidário, Barbara KrysttalCompliance Partidário, Barbara Krysttal
Compliance Partidário, Barbara Krysttal
 
ENCOAD 2016 - eSocial - Sua empresa esta preparada?
ENCOAD 2016 - eSocial - Sua empresa esta preparada?ENCOAD 2016 - eSocial - Sua empresa esta preparada?
ENCOAD 2016 - eSocial - Sua empresa esta preparada?
 
SPED: empreendedorismo e inovação - no mercado de serviços contábeis
SPED: empreendedorismo e inovação - no mercado de serviços contábeisSPED: empreendedorismo e inovação - no mercado de serviços contábeis
SPED: empreendedorismo e inovação - no mercado de serviços contábeis
 
Saneamento de Cadastro de Clientes e Fornecedores (KeyConsultas-web)
Saneamento de Cadastro de Clientes e Fornecedores (KeyConsultas-web)Saneamento de Cadastro de Clientes e Fornecedores (KeyConsultas-web)
Saneamento de Cadastro de Clientes e Fornecedores (KeyConsultas-web)
 
(2) Saneamento de Cadastros de Clientes e Fornecedores: o processo
(2) Saneamento de Cadastros de Clientes e Fornecedores: o processo(2) Saneamento de Cadastros de Clientes e Fornecedores: o processo
(2) Saneamento de Cadastros de Clientes e Fornecedores: o processo
 
SPED: CURSO CRC DE GOIAS
SPED: CURSO CRC DE GOIASSPED: CURSO CRC DE GOIAS
SPED: CURSO CRC DE GOIAS
 

Plus de Rommel Carvalho

Ouvidoria de Balcão vs Ouvidoria Digital: Desafios na Era Big Data
Ouvidoria de Balcão vs Ouvidoria Digital: Desafios na Era Big DataOuvidoria de Balcão vs Ouvidoria Digital: Desafios na Era Big Data
Ouvidoria de Balcão vs Ouvidoria Digital: Desafios na Era Big DataRommel Carvalho
 
Como transformar servidores em cientistas de dados e diminuir a distância ent...
Como transformar servidores em cientistas de dados e diminuir a distância ent...Como transformar servidores em cientistas de dados e diminuir a distância ent...
Como transformar servidores em cientistas de dados e diminuir a distância ent...Rommel Carvalho
 
Categorização de achados em auditorias de TI com modelos supervisionados e nã...
Categorização de achados em auditorias de TI com modelos supervisionados e nã...Categorização de achados em auditorias de TI com modelos supervisionados e nã...
Categorização de achados em auditorias de TI com modelos supervisionados e nã...Rommel Carvalho
 
Aplicação de técnicas de mineração de textos para classificação automática de...
Aplicação de técnicas de mineração de textos para classificação automática de...Aplicação de técnicas de mineração de textos para classificação automática de...
Aplicação de técnicas de mineração de textos para classificação automática de...Rommel Carvalho
 
BMAW 2014 - Using Bayesian Networks to Identify and Prevent Split Purchases i...
BMAW 2014 - Using Bayesian Networks to Identify and Prevent Split Purchases i...BMAW 2014 - Using Bayesian Networks to Identify and Prevent Split Purchases i...
BMAW 2014 - Using Bayesian Networks to Identify and Prevent Split Purchases i...Rommel Carvalho
 
URSW 2013 - UMP-ST plug-in
URSW 2013 - UMP-ST plug-inURSW 2013 - UMP-ST plug-in
URSW 2013 - UMP-ST plug-inRommel Carvalho
 
Integração do Portal da Copa @ Comissão CMA do Senado Federal
Integração do Portal da Copa @ Comissão CMA do Senado FederalIntegração do Portal da Copa @ Comissão CMA do Senado Federal
Integração do Portal da Copa @ Comissão CMA do Senado FederalRommel Carvalho
 
Dados Abertos Governamentais
Dados Abertos GovernamentaisDados Abertos Governamentais
Dados Abertos GovernamentaisRommel Carvalho
 
Modeling a Probabilistic Ontology for Maritime Domain Awareness
Modeling a Probabilistic Ontology for Maritime Domain AwarenessModeling a Probabilistic Ontology for Maritime Domain Awareness
Modeling a Probabilistic Ontology for Maritime Domain AwarenessRommel Carvalho
 
Probabilistic Ontology: Representation and Modeling Methodology
Probabilistic Ontology: Representation and Modeling MethodologyProbabilistic Ontology: Representation and Modeling Methodology
Probabilistic Ontology: Representation and Modeling MethodologyRommel Carvalho
 
SWRL-F - A Fuzzy Logic Extension of the Semantic Web Rule Language
SWRL-F - A Fuzzy Logic Extension of the Semantic Web Rule LanguageSWRL-F - A Fuzzy Logic Extension of the Semantic Web Rule Language
SWRL-F - A Fuzzy Logic Extension of the Semantic Web Rule LanguageRommel Carvalho
 
Default Logics for Plausible Reasoning with Controversial Axioms
Default Logics for Plausible Reasoning with Controversial AxiomsDefault Logics for Plausible Reasoning with Controversial Axioms
Default Logics for Plausible Reasoning with Controversial AxiomsRommel Carvalho
 
Tractability of the Crisp Representations of Tractable Fuzzy Description Logics
Tractability of the Crisp Representations of Tractable Fuzzy Description LogicsTractability of the Crisp Representations of Tractable Fuzzy Description Logics
Tractability of the Crisp Representations of Tractable Fuzzy Description LogicsRommel Carvalho
 
PrOntoLearn: Unsupervised Lexico-Semantic Ontology Generation using Probabili...
PrOntoLearn: Unsupervised Lexico-Semantic Ontology Generation using Probabili...PrOntoLearn: Unsupervised Lexico-Semantic Ontology Generation using Probabili...
PrOntoLearn: Unsupervised Lexico-Semantic Ontology Generation using Probabili...Rommel Carvalho
 
PR-OWL 2.0 - Bridging the gap to OWL semantics
PR-OWL 2.0 - Bridging the gap to OWL semanticsPR-OWL 2.0 - Bridging the gap to OWL semantics
PR-OWL 2.0 - Bridging the gap to OWL semanticsRommel Carvalho
 
UnBBayes-PRM - On Implementing Probabilistic Relational Models
UnBBayes-PRM - On Implementing Probabilistic Relational ModelsUnBBayes-PRM - On Implementing Probabilistic Relational Models
UnBBayes-PRM - On Implementing Probabilistic Relational ModelsRommel Carvalho
 
Fusion 2010 - PROGNOS: Predictive Situational Awareness with Probabilistic On...
Fusion 2010 - PROGNOS: Predictive Situational Awareness with Probabilistic On...Fusion 2010 - PROGNOS: Predictive Situational Awareness with Probabilistic On...
Fusion 2010 - PROGNOS: Predictive Situational Awareness with Probabilistic On...Rommel Carvalho
 
UniDL 2010 - Compatibility Formalization Between PR-OWL and OWL
UniDL 2010 - Compatibility Formalization Between PR-OWL and OWLUniDL 2010 - Compatibility Formalization Between PR-OWL and OWL
UniDL 2010 - Compatibility Formalization Between PR-OWL and OWLRommel Carvalho
 
AFCEA 2010 - High Level Fusion and Predictive Situational Awareness with Prob...
AFCEA 2010 - High Level Fusion and Predictive Situational Awareness with Prob...AFCEA 2010 - High Level Fusion and Predictive Situational Awareness with Prob...
AFCEA 2010 - High Level Fusion and Predictive Situational Awareness with Prob...Rommel Carvalho
 

Plus de Rommel Carvalho (20)

Ouvidoria de Balcão vs Ouvidoria Digital: Desafios na Era Big Data
Ouvidoria de Balcão vs Ouvidoria Digital: Desafios na Era Big DataOuvidoria de Balcão vs Ouvidoria Digital: Desafios na Era Big Data
Ouvidoria de Balcão vs Ouvidoria Digital: Desafios na Era Big Data
 
Como transformar servidores em cientistas de dados e diminuir a distância ent...
Como transformar servidores em cientistas de dados e diminuir a distância ent...Como transformar servidores em cientistas de dados e diminuir a distância ent...
Como transformar servidores em cientistas de dados e diminuir a distância ent...
 
Categorização de achados em auditorias de TI com modelos supervisionados e nã...
Categorização de achados em auditorias de TI com modelos supervisionados e nã...Categorização de achados em auditorias de TI com modelos supervisionados e nã...
Categorização de achados em auditorias de TI com modelos supervisionados e nã...
 
Aplicação de técnicas de mineração de textos para classificação automática de...
Aplicação de técnicas de mineração de textos para classificação automática de...Aplicação de técnicas de mineração de textos para classificação automática de...
Aplicação de técnicas de mineração de textos para classificação automática de...
 
BMAW 2014 - Using Bayesian Networks to Identify and Prevent Split Purchases i...
BMAW 2014 - Using Bayesian Networks to Identify and Prevent Split Purchases i...BMAW 2014 - Using Bayesian Networks to Identify and Prevent Split Purchases i...
BMAW 2014 - Using Bayesian Networks to Identify and Prevent Split Purchases i...
 
A GUI for MLN
A GUI for MLNA GUI for MLN
A GUI for MLN
 
URSW 2013 - UMP-ST plug-in
URSW 2013 - UMP-ST plug-inURSW 2013 - UMP-ST plug-in
URSW 2013 - UMP-ST plug-in
 
Integração do Portal da Copa @ Comissão CMA do Senado Federal
Integração do Portal da Copa @ Comissão CMA do Senado FederalIntegração do Portal da Copa @ Comissão CMA do Senado Federal
Integração do Portal da Copa @ Comissão CMA do Senado Federal
 
Dados Abertos Governamentais
Dados Abertos GovernamentaisDados Abertos Governamentais
Dados Abertos Governamentais
 
Modeling a Probabilistic Ontology for Maritime Domain Awareness
Modeling a Probabilistic Ontology for Maritime Domain AwarenessModeling a Probabilistic Ontology for Maritime Domain Awareness
Modeling a Probabilistic Ontology for Maritime Domain Awareness
 
Probabilistic Ontology: Representation and Modeling Methodology
Probabilistic Ontology: Representation and Modeling MethodologyProbabilistic Ontology: Representation and Modeling Methodology
Probabilistic Ontology: Representation and Modeling Methodology
 
SWRL-F - A Fuzzy Logic Extension of the Semantic Web Rule Language
SWRL-F - A Fuzzy Logic Extension of the Semantic Web Rule LanguageSWRL-F - A Fuzzy Logic Extension of the Semantic Web Rule Language
SWRL-F - A Fuzzy Logic Extension of the Semantic Web Rule Language
 
Default Logics for Plausible Reasoning with Controversial Axioms
Default Logics for Plausible Reasoning with Controversial AxiomsDefault Logics for Plausible Reasoning with Controversial Axioms
Default Logics for Plausible Reasoning with Controversial Axioms
 
Tractability of the Crisp Representations of Tractable Fuzzy Description Logics
Tractability of the Crisp Representations of Tractable Fuzzy Description LogicsTractability of the Crisp Representations of Tractable Fuzzy Description Logics
Tractability of the Crisp Representations of Tractable Fuzzy Description Logics
 
PrOntoLearn: Unsupervised Lexico-Semantic Ontology Generation using Probabili...
PrOntoLearn: Unsupervised Lexico-Semantic Ontology Generation using Probabili...PrOntoLearn: Unsupervised Lexico-Semantic Ontology Generation using Probabili...
PrOntoLearn: Unsupervised Lexico-Semantic Ontology Generation using Probabili...
 
PR-OWL 2.0 - Bridging the gap to OWL semantics
PR-OWL 2.0 - Bridging the gap to OWL semanticsPR-OWL 2.0 - Bridging the gap to OWL semantics
PR-OWL 2.0 - Bridging the gap to OWL semantics
 
UnBBayes-PRM - On Implementing Probabilistic Relational Models
UnBBayes-PRM - On Implementing Probabilistic Relational ModelsUnBBayes-PRM - On Implementing Probabilistic Relational Models
UnBBayes-PRM - On Implementing Probabilistic Relational Models
 
Fusion 2010 - PROGNOS: Predictive Situational Awareness with Probabilistic On...
Fusion 2010 - PROGNOS: Predictive Situational Awareness with Probabilistic On...Fusion 2010 - PROGNOS: Predictive Situational Awareness with Probabilistic On...
Fusion 2010 - PROGNOS: Predictive Situational Awareness with Probabilistic On...
 
UniDL 2010 - Compatibility Formalization Between PR-OWL and OWL
UniDL 2010 - Compatibility Formalization Between PR-OWL and OWLUniDL 2010 - Compatibility Formalization Between PR-OWL and OWL
UniDL 2010 - Compatibility Formalization Between PR-OWL and OWL
 
AFCEA 2010 - High Level Fusion and Predictive Situational Awareness with Prob...
AFCEA 2010 - High Level Fusion and Predictive Situational Awareness with Prob...AFCEA 2010 - High Level Fusion and Predictive Situational Awareness with Prob...
AFCEA 2010 - High Level Fusion and Predictive Situational Awareness with Prob...
 

Ciência de Dados no Combate à Corrupção

  • 1. Ciência de Dados no Combate à Corrupção Dr. Rommel N. Carvalho | Coordenador-Geral do ODP/DIE/SE/MTFC https://about.me/rommelnc | 15/06/2016 @ Ciência de Dados e Sociedade
  • 2. O Observatório da Despesa Pública é uma unidade de produção de informações estratégicas e monitoramento dos gastos públicos da Controladoria-Geral da União Identificar riscos de fraude, irregularidades e/ou mau uso dos recursos públicos Apoiar o processo de tomada de decisão dos gestores públicos
  • 3. Especialistas Auditores, TI, Analistas, Advogados, ... Tecnologia Técnicas e ferramentas avançadas Metodologia Objetivo comum
  • 4. –Gartner “Big data is high-volume, high-velocity and high-variety information assets that demand cost-effective, innovative forms of information processing for enhanced insight and decision making.” – G A R T N E R
  • 5. Banco de Vínculos da APF Mapa de Risco de Fornecedores Análise Preventiva de Contratações Triagem Automática de Denúncias Identificação dos Principais Pedidos da LAI Identificação das Principais Constatações nas Auditorias Banco de Preços da APF Projetos de Big Data
  • 6. Auditoria Contínua Classificação Análise de Redes Sociais Regressão Detecção de Anomalia Clusterização Modelagem de TópicosMineração de Textos Análise Multicritério Inteligência de Negócio Técnicas Utilizadas
  • 7. Suporte Estatístico Inicial   2 1 12 k l ij ij i j ij O E E       Embasamento Teórico Agregação Pivoteamento Padronização Atualização Tratamento Básico de Dados Discretização Normalização Sampling Datasets Pré-Processamento de Dados Seleção de Atributos Relevantes Aprendizagem de Máquina Validação de Modelos Ajuste de Modelos Teste de Modelo Final Implantação de Modelo no Sistema Modelo Final Confiável? SIM Metodologia
  • 8. Mapa de Risco de Irregularidades de Fornecedores do Governo Identificação de fornecedores com perfil semelhante aos que receberam punições nos contratos com governo
  • 10. Frutos de Parceria 83%$$ para avaliar o impacto do ODP
  • 11. Busca e Identificação de Padrões no Banco de Vínculos da APF Possibilitar a busca simples e rápida por vínculos explícitos e implícitos, simples e complexos, entre PFs e PJs que estão associados às atividades da APF
  • 12. • Bases da Administração possuem vínculos expressos (PF-PF; PJ-PF; PJ-PJ): – CPF: nome da mãe – CNPJ e CNE: sócios e responsáveis – RAIS: empregados – ... • É possível combinar todas essas bases em um único grafo • Desafio: mais de um bilhão de vínculos Banco de Vínculo
  • 13. Análise Preventiva de Contratações Recuperação automática de informações sobre compras, com análise imediata de risco
  • 14. Contexto Incorporar modelagem de risco para prevenir situações já reportadas Empresa fantasma Baixa capacidade operacional (comunicado CGU-R-AP) • $$$ Contrato milionário • Poucos funcionários • Recém-criada
  • 17. Risco: 1º lugar Planalto Service Ltda. Evolução dos negócios com o governo desproporcional em relação à sua capacidade operacional. Histórico operacional.Evolução comparada (Faturamento x Empregados) R$ 49 mi R$ 164 mi 4,5 mil 6 mil Volume de Contratos 2011 2014 R$ 112 milhõesR$ 14 milhões Ocorrências nas trilhas de compras Mesmo TelefonePlanalto Service Ltda Fortaleza serviços Empresariais Ltda 6 ocorrências 17 vezes Contou com a desistência de outros participantes pra vencer. Pregão onde a melhor proposta não ganhou Pregão nº. 15/2014. Venceu após 9 desclassificações. Estudo de Caso: Dispensas (Jul/2015)
  • 18. Triagem Automática de Denúncias Identificação e encaminhamento automático de denúncia para as principais áreas envolvidas de acordo com texto informado na denúncia
  • 20. Identificação Automática de Tipos de Pedidos mais Frequentes da LAI Identificação dos principais assuntos abordados nos mais de 300 mil pedidos de informação no e-SIC
  • 21. Tópicos - BACEN 9.220 pedidos (~3,06%)
  • 22. Tópicos - Negado 44.322 pedidos (~14,71%)
  • 23. "gostaria de ser informada sobre a minha classificacao final no concurso ... relativa ao edital ... ou seja quero a classificacao obtida apos a eliminacao de 1715 candidatos nas provas de aptidao fisica psicologica exames medicos e investigacao social atenciosamente e desde ja agradeco ..." "gostaria de obter as seguintes informacoes 01 quantidade de servidores concursados do poder executivo federal e o gasto mensal com os salarios destes servidores 02 quantidade de servidores nomeados em cargo de confiaca do poder executivo federal e o gasto mensal com os salarios destes servidores 03 quantidade de servidores aposentados vinculados ao poder executivo federal e o gasto mensal com a aposentadoria destes servidores" "venho requerer minha classificacao apos provas objetivas e subjetiva teste de aptidao fisica e exames medico considerando as eliminacoes no concurso no concurso publico para provimento de vagas e formacao de cadastro de reserva no cargo de ... da terceira classe prova aplicada pela banca ... a banca examinadora se omite da prestacao da informacao ou a presta equivocadamente ... " "solicito informar a quantidade de empregados do cargo de analista de sistemas que foram promovidos de estagio do cargo conforme a seguir desde a implantacao do ... analista de sistemas 1 do estagio jr para o pleno 2 do estagio jr para o pleno 2 do estagio pl para o..." Tópicos - Negado Concurso Público
  • 24. Análise de Recurso 0% 5% 10% 15% 20% 25% 30% 35% 40% 45% 60%20% 6% 14% Atendido Negado Recurso - Atendido Recurso - Negado declaracao 2014 ano imposto renda numero recibo exercicio irpf restituicao ... "solicito resgate do numero de recibo da declaracao de irpf referente ao ano de 2014 por ter perdido os dados no computador ficando assim impossibilitada de realizar a declaracao de 2015"
  • 25. Desafios Quantos Tópicos?Tempo de Execução? 0 100 200 300 400 500 600 700 10.000 20.000 130.000 300.000 Tempodeprocessamento(min) Número de pedidos 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 10 20 30 40 50 60 70 80 90 100 PontuaçãodoAgrupamento Número de tópicos Big Data?! 10 horas x 100 rodadas = 1.000 horas ou ~ 41 dias se 100 núcleos (paralelo)  10 horas
  • 26. Identificação de Irregularidades Mais Frequentes nas Auditorias Identificação dos principais problemas encontrados em constatações de auditorias feitas e registradas no Novo Ativa, por programa, órgão, tema, etc.
  • 27. Avaliação de Gastos Públicos através de Preços de Referência O Banco de Preços do ODP/CGU permite o auxílio à gestão, a pesquisa de mercado, o controle social e a identificação de anomalias, sobrepreços e melhores práticas
  • 28. Consultar Preço de Referência Calcular Preço de Referência Gerar Ficha do Produto Consultar Empenhos Vinculados DW / Dashboards Transparência e Prêmios
  • 29. Funcionalidades Disponíveis através do Portal ODP Pesquise informações estratégicas e preços de referência, acesse trilhas de auditoria e painéis gerenciais, receba notificações e realize consultas avançadas no DOU
  • 30.
  • 32. Expansão do ODP.estadual, ODP.tce e ODP.Colômbia Expansão do ODP para estados, municípios e tribunais de contas estaduais, incluindo metodologia e treinamento em análise e cruzamento de dados. Piloto também previsto para América Latina.
  • 33. Publicações e Prêmios Eficiência na Administração Pública Conhecimento Governamental Governo para cidadãos Gestão da Informação Informação de Custos e Qualidade do Gasto no Setor Público Artigos Nacionais e Internacionais
  • 34. Ciência de Dados no Combate à Corrupção Dr. Rommel N. Carvalho | Coordenador-Geral do ODP/DIE/SE/MTFC https://about.me/rommelnc | 15/06/2016 @ Ciência de Dados e Sociedade