Brasil 100% Digital - O evento teve como principal objetivo a troca de experiências relacionadas ao uso de técnicas avançadas de análise de dados como instrumento para melhoria da gestão e do controle de entidades e políticas públicas. Espera-se que os debates contribuam para que as instituições participantes possam iniciar ou intensificar a adoção de tais técnicas, de modo a obter maior eficiência e efetividade em suas atividades.
Painel 01 03 - leonardo teles - Projeto CNAE: Algoritmo para classificação ...
Painel 03 03 - lucas freire - Filtros econômicos e combate a cartéis em licitações
1. Filtros econômicos e combate a
cartéis em licitações
Lucas Freire Silva
Superintendência-Geral do CADE
2. Contexto do desafio
Defesa da
concorrência
Estruturas
(fusões e
aquisições)
Cartéis
• Internacionais
• Nacionais
• Licitações
• Disponibilidade de
dados (movimentos de
transparência)
• Acumulo de literatura
econômica sobre
“leilões”.
• Expertise prévia em
investigações
• Grande impacto na
sociedade (10 – 15% PIB)
3. Estratégias
• Cobertura
• Supressão de proposta
• Rodízio
• Divisão de mercado
• divisão de clientes
Consequências
• Aumento de custos
• Piora dos serviços públicos
Como funciona a combinação
entre concorrentes em licitações?
4. Como procurar o cartel?
• Fatos suspeitos / raros
• Sinais de competição simulada
• Similaridades e padrões nos
comportamentos de concorrentes
Mineração
de dados
• Filtros econômicos: problema de
classificação / teste de hipóteses
Testes
estatísticos
5. • Automação da análise
• Grupo focal com especialistas
• Roteiros de análise (internos e de
outras autoridades de defesa da
concorrência)
Mineração
de dados
• Generalização baseada em casos
concretos (literatura econômica)
• Teoria microeconômica
Testes
estatísticos
Como desenvolver os
algoritmos?
Tecnologia da
informação
Estatística e
Econometria
7. O que analisamos no ranking?
Premissas do modelo econométrico:
• Independência condicional das propostas
Se conheço quem apresentou a proposta X, isso não me diz nada sobre
quem apresentou a proposta Y (correlação dos resíduos)
• Permutabilidade das posições
Dado um grupo: maior número de licitações e maior número de
licitantes - > maior variação das posições
9. 1. Selecione uma firma.
2. Busque todos os pregões de que ela participou.
3. Liste todos os seus concorrentes.
4. Teste se a variância observada é equivalente à variância esperada
Logo, "filtramos" as firmas cujo teste de hipótese de igualdade entre
as variâncias é rejeitado
Teste de
Komolgorov-
Smirnov
Passo a passo do algoritmo
11. Medicamentos – Caso
Mexicano
Fonte: Estrada and Vazquez
(2013)
Durante o cartel:
•Divisão do mercado estável
•Variância de lances baixa
Depois de descoberto o cartel:
•Divisão de mercado se desorganiza
•Elevação imediata da variância de
lances
12. •Durante o cartel:
•margem de venda é maior que
a referência regional
•variância de preços ínfima
•Após a descoberta do cartel
•margem de venda é menor que
a referência regional
•variância de preços significativa
Mercado de combustíveis. João Pessoa – PB
Dados de 2004 a 2009.
Experiência brasileira -
combustíveis
14. Como montamos a equipe?
Analyzing the
Analyzers
An Introspective
Survey of Data
Scientists and Their
Work.
By Harlan Harris, Sean
Murphy, Marck
Vaisman
O'Reilly. June 2013
15. - Aprendizado rápido
- Pacotes de análises de dados
- Open source
- Comunidade grande (muitas
perguntas já respondidas)
- Fácil integração com outras
linguagens e ferramentas
- Rápido e simples de usar.
- Open source.
- Comunidade grande (= muitas
perguntas já respondidas).
- Django (principal alternativa) tem
uma curva de aprendizado bem maior e
seria excessivo para nossas
necessidades.
Quais ferramentas usamos?
16. - Previamente adquirida
- Desempenho bom.
- Comunidade grande, bem documentado.
- Banco de dados de grafos – facilita a identificação de redes
societárias.
- Open source.
17. - Base para filtros econômicos
- Responsável pelos filtros desenvolve em R; é mais eficiente “plugar” o
código dele no resto do que reescrever tudo em Python
- RPy2 permite integração entre as duas linguagens.
- Completo: R tem pacotes estatísticos para tudo.
- Open source.
- Comunidade grande, bem documentado.
- SQL Server 2016 vai rodar R nativamente.
18. Linha do tempo
18
Novembro de 2013 a
janeiro de 2014
• Estudo e
benchmarking da
experiência
internacional
Fevereiro de 2014 a
Junho 2014
• Planejamento e
contratação de
consultorias em
estatística e
tecnologia da
informação para o
projeto
Agosto de 2014 a
dezembro de 2014
• Desenvolvimento
das bases
metodológicas para
uso de filtros
econômicos
Janeiro de 2015 a
novembro de 2015
• Coleta e
estruturação de
repositório de
dados
• Desenvolvimento e
teste de algoritmos
Dezembro de 2015
• Treinamento da
equipe e
finalização das
consultorias
Dezembro de
2015
19. Desafios
• Traduzir as análises em produtos de informações úteis aos nossos
públicos (Superintendente-Geral, Tribunal do CADE, Judiciário)
•Dimensionar e priorizar os casos de análise e investigação
posterior
• Competência sobre o mercado como um todo: necessidade de
integrar dados federais com dados de 27 estados e 5565
municípios, além de bases estatísticas e fontes públicas