O documento descreve os processos de tratamento e análise de dados pessoais, incluindo a padronização, validação e enriquecimento de nomes, CPFs/CNPJs, endereços, telefones e e-mails. Também discute a identificação de duplicidades nos dados e o desenvolvimento de programas para captura automatizada de informações em sites públicos.
4. Padronização
• Maiúscula
• Substitui caracteres acentuados
• Substitui caracteres especiais, pontos, traços e barras por branco
• Abreviação de grau de parentesco (JR, FO, NT)
Atribuição de Sexo
Retorna o sexo do indivíduo a partir do nome.
Nome de tratamento
Retorna o nome de tratamento a partir do nome.
I = Indefinido
J = Jurídico
F = Feminino
M = Masculino
TRATAMENTO NOME
4
6. Inconsistências
• em branco ou preenchido somente com uma palavra
• números no campo de nome, desde que o sexo atribuído não seja igual a “J” - Jurídico
• palavras de baixo calão
• quando houver caracteres que se repetem por mais de 3 vezes (exceto jurídico)
• quando existem ocorrências de palavras apenas com 1 byte no Início (exceto jurídico)
ou no Final
Original após Padronização
TRATAMENTO NOME
6
8. Padronização Original após Padronização
• Insere zeros a esquerda quando necessário
• Retira pontos, barras, traços
• Validação do dígito verificador CPF / CNPJ
Inconsistências Original após Padronização
• em branco ou zerado
• caso o CPF seja maior que 11 posições
( desconsiderando zeros a esquerda )
• caso o CNPJ seja maior que 14 posições
(desconsiderando zeros a esquerda )
• caso o dígito verificador seja inválido
TRATAMENTO CPF / CNPJ
8
10. Padronização do Endereço
• Maiúscula
• Abreviações ( PROF, DR, CS, BL, LT, QD, AP, ... )
• Substitui caracteres acentuados, limpa pontos, traços, barras
• Separa endereço em:
CEP , Cidade, Estado e Bairro
• Consiste e atribui CEP através de Endereço, Cidade e Estado
• Consiste e atribui Cidade e Estado através do CEP
• Atribui Bairro através do CEP
Tipo do Logradouro
Logradouro
Número
Complemento
TRATAMENTO DADOS DE
ENDEREÇAMENTO
10
12. CEP s atribuídos :
Original após Padronização
TRATAMENTO DADOS DE
ENDEREÇAMENTO
12
13. Inconsistências de Endereço
• em branco
• possua menos que 5 bytes
• somente números no campo de endereço
• caracteres que se repetem por mais de três vezes (exceto brancos)
• sem número, exceto SN, S/N, etc.
• palavras de baixo calão ou inválidas
Original após Padronização
TRATAMENTO DADOS DE
ENDEREÇAMENTO
13
14. Inconsistências de CEP
• por inconsistência de Cidade/UF.
• logradouro não foi encontrado na base dos Correios
• logradouro possui vários CEP s e não foi possível identificar o CEP correto
• CEP encontrado nos Correios e endereço original não confere (problema de grafia)
Original após Padronização
TRATAMENTO DADOS DE
ENDEREÇAMENTO
14
17. DDD
• Consiste DDD através de Cidade e Estado
• Atribui DDD através da Cidade e Estado
Inconsistências DDD
• caso Cidade e Estado informados não existam.
• DDD em branco.
• DDD não condiz com a Cidade e Estado.
Telefone
• Validação do Telefone
• Separa Ramal e DDD
Inconsistências Telefone
• em branco
• menos de 7 dígitos
• mais de 8 dígitos ( exceto 0800, 0300 )
• primeiro dígito igual a 1 (um)
• com todos os dígitos iguais
TRATAMENTO DDD e
TELEFONE
17
20. Padronização
• Minúscula
• Verificação do @
• Validação da extensão (.com.br, .org, .com) , provedor (uol, terra, hotmail)
• Correção de problemas/grafia de provedor/extensão
TRATAMENTO EMAIL
20
21. Inconsistências
• em branco.
• possui “WWW” (caracterizando ser uma página na internet).
• não possui o caractere “@” ou o mesmo aparece mais de uma vez.
• não possui “.” após o caractere arroba (“@”)
• possui o caractere “.” duas ou mais vezes consecutivas (Ex: “..”)
• termina com o caractere “.”.
• possui algum caractere especial não permitido.
• possui uma extensão não identificada (categoria ou país).
TRATAMENTO EMAIL
21
26. Realizamos o enriquecimento através de CPF ou CNPJ:
CPF
CNPJ
Dados Principais
Nome completo
Endereço completo
Cidade
UF
Bairro
CEP
Atributos Complementares
Profissão
Sexo
Data de nascimento
DDD + Telefone
E-mail
Classe Social
Potencial de consumo
Dados Principais
Razão social
Endereço completo
Cidade
UF
Bairro
CEP
Atributos Complementares
Principal atividade da empresa
Natureza jurídica / CNAE / Divisão
Data de abertura
Número de funcionários
Porte da empresa
Situação cadastral
Ramo de atividade
Site
Nome do executivo
DDD + Telefone
E-mail
ENRIQUECIMENTO
26
31. • Através da solicitação do cliente desenvolvemos aplicações inteligentes que
capturam os dados de 95% das consultas públicas existentes no mercado.
• Qualquer site que possua uma consulta aberta ( sem utilização de usuário e
senha ) pode ser capturado.
• Sites com utilização de CAPTCHA ou sistema de bloqueio baseado em palavras
impressas em imagens também podem ser acessados ( A viabilidade deste recurso
depende de estudo do tipo de imagem utilizada ).
31
32. Exemplos de Sites com informações para captura:
Receita Federal - CNPJ
Agência Nacional do Petróleo – Postos de Gasolina
E demais sites como INEP ( Escolas ), ANVISA( Saúde ), Sites de listas ( Guia Mais, Ilocal,
Telelistas ), Sites de entidades de classes.
32
33. Vantagens:
• O cliente escolhe a fonte dos dados e nós garantimos a captura dos dados
exatamente como apresentado no site.
• A velocidade de captura é infinitamente maior do que a atividade de uma pessoa
utilizando-se do método de copiar e colar os dados.
• A informação capturada é idêntica a publicada no site, sem perigo de digitação
errada ou esquecimento de coleta de alguma informação.
33
34. Observações:
• Todo programa de captura é desenvolvido mediante solicitação do cliente e
análise do site solicitado para verificar a viabilidade técnica da captura dos dados e
orçamento do serviço realizado.
• O Valor deste serviço esta ligado a complexidade de acesso a informação x
volume de dados capturado.
• Os programas são executados diretamente na LC Data e somente os dados
capturados são entregues ao cliente, uma vez que o programa sofre manutenções
para cada alteração apresentada no site. Qualquer mudança de layout da tela ou na
formatação interna dos dados no servidor demanda esta manutenção para correto
funcionamento do programa.
• Uma vez entregue a base da captura o serviço é considerado finalizado e nova
captura para o mesmo site será considerada como renovação de contrato e portanto o
cliente terá um preço menor nesta nova captura.
34
35. • Total de Empresas Ativas com Dados Consistentes
35
36. • Atributos - PJ
36
• Razão Social
• CNPJ
• Nome Fantasia
• Data de Abertura
• Dados de Endereçamento Consistentes
• CNAE
• Descrição do CNAE
• Natureza Jurídica
• Situação Cadastral
• Sócios da Empresa com seus respectivos Cargos
• Informação de Empreendedor Individual
• (*) Porte
• (*) Telefone
• (*) Email
•(*) Não temos essa informação para 100% do nosso banco de dados.
38. Vantagens:
• A campanha de e-mail marketing é uma das melhores formas de comunicação no
mundo virtual;
• Baixo custo de produção e disparo;
• Rastreamento completo da campanha, ao final do processo é possível identificar
quais usuários abriram o e-mail, quais lerão, quais se interessaram pela mensagem e
clicaram nos links;
38
39. Porque escolher a LC Data para a sua campanha
de e-mail marketing?
• Desfrutamos de ferramentas apropriadas de envio de e-mail marketing
garantindo a qualidade de entrega;
• Criamos estratégias adequadas para o envio da campanha, considerando fatores
de horários, perfil da campanha dentre outros;
• Utilizamos o que existe de mais moderno em tecnologia do momento do disparo
até o relatório de resultados;
• Nossa tecnologia permite realizar um rastreamento completo da mensagem
enviada, identificando quem e quando foi impactado.
39