Construire sa base de prospects BtoB, nécessite de trouver les critères de ciblages suffisants pour éliminer le bruit, les cibles qui ne convertirons jamais. Pour cela le big data et le machine learning dépassent largement le ciblage par code naf.
2. Sommaire
Établi par l’INSEE en 1959 le NAE (Nomenclature des activités économiques) l'est à
des fins statistiques et administratives.
Par la suite le NAE devient NAF (Nomenclature d'activités françaises) et comme toute
donnée à usage statistique, fait son possible pour évoluer le moins possible, car tout
changement provoque une perte de sens immédiat de la donnée analysable.
Bien que révisé en 2008, le code NAF reste une donnée à fin d’analyse de l’Etat
Français. Il segmente les activités françaises en 21 sections, lesquelles se divisent en
88 divisions, qui elles même se subdivisent en 272 groupes. À partir de ces sous-
groupes, on aboutit à 615 classes qui donnent lieu à une dernière et ensuite
en plusieurs classes et sous classes en 732. Voilà, il y a 732 codes NAF, mais en quoi
cette classification permet elle de cibler fournisseurs ou prospects d'aujourd'hui ?
2
3. Le code Naf a été conçu par l’INSEE afin de caractériser
l’activité des entreprises
Il s’agit d’un code conçu par l’INSEE pour catégoriser l’activité des entreprises. Il est
défini de manière hiérarchique en 5 niveaux :
3
Niveaux
Nombre de sections,
divisions, groupes,
classes Référence Libellé
1 21 sections C Industrie manufacturière
2 88 divisions 58 - Edition, 33
Réparation et installation de machines et
d’équipements
3 272 groupes 58.2 - Edition de logiciels, 33.2 Installation de machines et d’équipements industriels
4 615 classes
58.29 - Edition d’autres logiciels,
33.20
Installation de machines et d’équipements industriels
5 732 sous-classes
58.29C - Edition de logiciels
applicatifs, 33.20A
Installation de structures métalliques, chaudronnées
et de tuyauterie
4. Construire sa base prospect BtoB sur des codes NAF
génère de plus en plus de bruits
4
La nomenclature NAF présente des limites de fiabilité
Des codes NAF :
● Mal renseignés
● Trop larges
● Obsolètes
● ….
La nomenclature NAF présente des limites intrinsèques, la
nature même des Codes NAF ne correspond pas à
certaines recherches, pour lesquelles des dimensions sont
nécessaires au-delà de l’activité. Par exemple :
● Recherche de sous-traitants
● Sociétés exportatrices (certaines déposent un CA
export de 0)
● Recherche d’écosystèmes (Big Data, Cleantech,…)
Limites de fiabilité
Mal renseignés
Larges
Obsolètes
Limites par nature
Notion
d’écosystème
Notion de sous-
traitance
Notion d’export
5. Seules 12% des entreprises de recouvrement sont
classées dans le code Naf dédié!
5
Limites de
fiabilité
Mal
renseignés
Larges
Obsolètes
Limites par
nature
Notion
d’écosystè
me
Notion de
sous-
traitance
Notion
d’export
12% seulement des
entreprises du
recouvrement sont
classées dans le bon
code NAF.
6. Certains code NAF trop larges et/ou homogènes
6
Même les codes NAF les plus détaillés
(NAF732) regroupent de larges
ensembles d’entreprises (conseil pour
les affaires,…)
Dan certains cas (holding, sièges
sociaux), les entreprises au sein d’un
code NAF fin (NAF 732) ne représentent
pas une activité homogène
Limites de
fiabilité
Mal
renseignés
Larges
Obsolètes
Limites par
nature
Notion
d’écosystè
me
Notion de
sous-
traitance
Notion
d’export
7. Avec les codes NAF, il est difficile d’identifier les activités
récentes, les écosystèmes émergents
7
Limites de
fiabilité
Mal
renseignés
Larges
Obsolètes
Limites par
nature
Notion
d’écosystè
me
Notion de
sous-
traitance
Notion
d’export
Constat : les codes NAF ne sont pas suffisants pour témoigner de l’activité réelle des
entreprises ou pour un ciblage commercial précis.
Idée : pouvoir effectuer des regroupements d’entreprises en se basant sur le vocabulaire
employé sur leur site web.
Exemple concret : les entreprises effectuant des bilans carbones et des
diagnostics d’efficacité énergétique peuvent être des cabinets de conseil (NAF
7022Z), des bureaux d’études techniques (7112B), des cabinets d’architecture
(7111Z), des installateurs de panneaux photovoltaïques (3320D, 3511Z)...
8. Certains code NAF trop larges et/ou homogènes
8
Données administratives et
financières
(INSEE + BODAC + Infogreffe)
Données de marques,
brevets, certifications…
(INPI…)
Données marketing & vente
Site Web,
Réseaux sociaux,
Médias
Trafic web et Réseaux sociaux
+
Ces données sont plus
récentes, plus riches
(l'entreprise promeut ses
produits et services), et
moins structurées...
9. Exemple 1 – identification de « sous traitants »
9
Contexte
• Obtenir des prospects qualifiés dans des domaines qui ne correspondent pas à des codes
NAF
Objectif
• Distinguer parmi une liste de 20.000 entreprises industrielles les sous traitants de
l’aéronautique et de l’automobile
Méthodologie
• Enrichissement des 20.000 entreprises avec des informations issues de leur site web
(adresse, contacts, réseaux sociaux, sémantique….) grâce au moteur de crawl et d’extraction
C-Radar.
• Constitution de corpus positifs et négatifs pour les catégories aéronautique et automobile
(opération manuelle à partir de données des clients)
• Application d’un algorithme de classification sur ces variables après filtrage
Résultats
• Classification des 20.000 entreprises en deux listes
• Niveau de qualité du ciblage 98%
• Taux de conversion téléphonique *3 par rapport aux bases des prestataires traditionnels
Limites de
fiabilité
Mal
renseignés
Larges
Obsolètes
Limites par
nature
Notion
d’écosystè
me
Notion de
sous-
traitance
Notion
d’export
Cas d’étude
10. Exemple 2 – identifier les cibles selon leur niveau de
présence à l’export
10
Contexte
• Obtenir des prospects qualifiés dans des domaines liés à l’export
Objectif
• Distinguer parmi une liste de 10.000 entreprises les sociétés exportatrices
Méthodologie
• Crawl et extraction des pages des entreprises ayant un site Web.
• Reconnaissance des mots liés à l’export (export et ses dérivés), calcul d’un score à partir
du nombre d’occurrences et l’emplacement des pages où ces mots ont été détectés.
Reconnaissance des pays où la société exporte
Résultats
• Classification des 10.000 entreprises avec score d’exportation et les pays concernés
• Augmentation de 40% de la base de données CRM
• Qualité de la cible 96%
Limites de
fiabilité
Mal
renseignés
Larges
Obsolètes
Limites par
nature
Notion
d’écosystè
me
Notion de
sous-
traitance
Notion
d’export
Cas d’étude
11. Exemple 2 – identifier les cibles selon leur niveau de
présence à l’export
11
Contexte
• Quantifier et identifier des prospects ciblés dans des écosystèmes émergents
Objectif
• Identifier des entreprises dans des écosystèmes non codifiés par le NAF: Smartech,
Fintech, Insurtech, Biotech, Self quantified, MedTech, SmartHome…
Méthodologie
• Crawl et extraction des pages des entreprises ayant un site Web.
• Reconnaissance des mots liés à ces écosystèmes, calcul d’un score à partir du nombre
d’occurrences et l’emplacement des pages où ces mots ont été détectés. Quantification
et identification des cibles
Résultats
• Quantification sur la base FR des 4,6millions d’entreprises
• Quantification sur 11 Millions d’entreprises Worlwide
• Gain de temps en terme de création de l’écosystème: fois 10
• Augmentation des volume: fois 2
Limites de
fiabilité
Mal
renseignés
Larges
Obsolètes
Limites par
nature
Notion
d’écosystè
me
Notion de
sous-
traitance
Notion
d’export
Cas d’étude
12. Déjà 60 clients!
F500 / SBF 250
ETI & PME
Start-up
12
Finance – Industrie -
Services
Industrie – Services
– Editeur de logiciels
Industrie – Services
– Editeur de logiciels