SlideShare une entreprise Scribd logo
1  sur  16
Télécharger pour lire hors ligne
EXPERT EN
DATA INTELLIGENCE
© EXPLORE
Qui sommes-nous ?
Création
2 implantations
Nantes & Paris
Collaborateurs
Clients
Utilisateurs
1997
180
+15 M€
Chiffre d’affaires
+1500
+50 000
Producteur de données à haute valeur ajoutée pour les marchés du BtoB
Immobilier
Promoteur, Investisseur, Broker,
Syndic, Aménagement foncier,
Bailleur social, Grande distribution,
enseignes…
Construction &
prescription
Fabricants / Industriels,
Travaux Bâtiments, Travaux publics,
MOE
Services à
l’entreprise
Banque, Assurance, Communication,
IT, Déménagement, FM, RH,
Sécurité…
Territoires &
Environnement
Collectivités & Administrations,
Bureaux d'études & Conseil,
Energies, Déchets, Eau
Nos
marchés
Chiffres
clés
Data for success
© EXPLORE
Concepteur de solutions de data
comportementales BtoB / BtoC à haute
valeur ajoutée, EXPLORE identifie tous les
moments de vie de vos prospects et
clients et les transforme en levier de
performance commerciale.
© EXPLORE
© EXPLORE
Notre savoir-faire
Le meilleur de la technologie, la
valeur ajoutée de l’humain
SOURCING
360°
ÉQUIPES
D’EXPERTS
TECHNOLOGIES
DU BIG DATA
Presse, web, réseaux sociaux,
communiqués d’entreprise, permis
de construire, transactions,
annonces légales…
Documentalistes, Chargés d’enquêtes,
Chargés de veille stratégique, Urbanistes,
Géomaticiens, Data analysts, Data scientists,
Développeurs …
Bases multidimensionnelles
SQLServer, API sémantique,
Géocodage (Siretisation à 100%),
Graphs, machine learning, dataviz…
© EXPLORE
d’entreprises
(Base Sirene)
+ 11 M
Raison sociale
Adresse
Siren, Siret
Date de création
Code NAF
Effectif
Chiffre d’affaires
Forme juridique
Etablissement principal
ou secondaire
Dirigeants…
d’immeubles et
terrains recensés
+ 18 M
Patrimoine immobilier et
foncier des entreprises :
- Section cadastrale
- Adresse
- Surface
- Nombre d’étages
- Type de bien : bureaux,
commerces, logements…
Identité des propriétaires
et des occupants :
- Raison sociale
- Siren, Siret
- Coordonnées complètes
- Contacts…
Marchés
publics /an
+ 850
000
700 000 appels d’offres
Etudes et avant-projet,
immobilier, aménagement urbain,
santé, travaux, maintenance,
assurance, services généraux,
énergie, financement…
150 000 avis d’attribution
projets
immobiliers /an
+ 25 000
15 000 mouvements
d’entreprises
Déménagements, transferts
d’activité, nouvelles
implantations…
10 000 projets de
construction
évènements
stratégiques /an
+ 3 M
2,7 millions d’annonces légales
12 000 développements
(investissement productif, croissance
CA…)
7 000 recrutements
6 000 transactions
5 500 fusions-acquisitions
5 000 nominations dans le top
management
1 000 sinistres…
Notre solution
Quelques chiffres sur nos data
© EXPLORE
Sourcing
360°
Article
s
de
presse
Sites
web
Patrimoin
e
immobilie
r
Annonce
s
légale
s
Open
Data
Sites
web
annonceur
s
Permis
de
construir
e
Réseau
x
sociau
x
Crowd
-
sourcin
g
Nos sources
L'information, notre
matière première
C’est la diversité et le
croisement des sources
d’information qui permettent la
meilleure vision d’un marché,
d’un territoire, d’une
entreprise. C’est pourquoi
EXPLORE collecte ses données
parmi plusieurs milliers de
sources et supports
d’informations : presse
nationale, régionale et locale,
sites web, réseaux sociaux,
communiqués d’entreprise,
données et annonces légales,
appels d’offres…
Qualification
© EXPLORE
L’infrastructure au service de la diversité des données
© EXPLORE
Traitements spécifiques de la donnée textuelle pour la veille
Problématiques adressées par Elasticsearch
Article de
Presse
Avis de Marché
Sociétés mentionnées (Raison Sociale,
sigle…)
Eléments géographiques
Mots clefs actualité
Collectivité / Structure / Administration
Actifs immobiliers mentionnés
Mots clefs, nature des services / travaux
5 minutes / document :
2h / personne / jour
Moins de documents en file
d’attente => visibilité des
équipes sur la charge
© EXPLORE
Traitement automatique de dédoublonnage
Problématiques adressées par Elasticsearch
Stream de dédoublonnage des documents
Documents importés Indexation
MLT
- Analyzers spécifiques
- Clauses structurées
- Filtres gaussiens /dates
- Similarité textes
Constitution de familles de documents doublons
et filtre automatique
5 minutes / document :
2h / personne / jour
Moins de documents en file d’attente :
visibilité des équipes sur la charge
© EXPLORE
Fouiller la donnée non structurée
Problématiques adressées par Elasticsearch
Documentation de consultation des entreprises :
• Documents de formats mixtes (docs, pdf)
• Plusieurs dizaines voire centaines de pages
• Documents multi-sujets
• OCR
Moteur de recherche DCE :
Trouver des documents, des prescriptions selon
de multiples critères et mots clefs
© EXPLORE
Repenser nos moteurs de recherche
Problématiques adressées par Elasticsearch
Nos référentiels sémantiques dénormalisés :
Données mises à plat, fortement nested, texte + attributs
structurés
Indices agrégeant des dizaines de tables dans plusieurs bases
SQL différentes pour des recherches multi-critères
API python de composition de requêtes elasticsearch « lego »
© EXPLORE
Repenser nos moteurs de recherche
Problématiques adressées par Elasticsearch
© EXPLORE
Déploiement d’un catalogue d’APIs spécialisées
Le Choix Elastic Cloud
Sociétés
~ 200 millions de docs / Index
~ 150Go
Essentiellement structurés
2 index de structure distincte
__________________________
APIs de Recherche,
intégration applicative
(siretisation) et distribution
tierces
Documentaire Interne
~ 5 millions de docs / index
~ 100Go
Texte + métadonnées
___________________________
APIs applicatives de production
Traitement de masse de nuit +
haute fréquence de requêtes
en journée
Documentaire Externe
~ 5 à 100 millions de documents
non structurés par index
~ 10 indices par famille de
document
~ 200 Go
___________________________
APIs de recherche + kibana
interne
Foncier et chantiers
> 600 millions de documents
~ 150 Go
Très fortement structuré et nested
___________________________
API de recherche multicritère
Agrégations complexes
DCE
~ 30 millions de documents
~ 1,5 To
Textes longs ocrisés non structurés
___________________________
API de recherche textuelle
Mieux adresser la diversité de nos données et besoins de performances :
- Différences de structures
- Différences de volumes
- Différences d’usages
© EXPLORE
Explorer nos logs et mieux accompagner nos clients
Le Choix Elastic Cloud
Logs de notre espace client et
de consommation de nos APIs
Suivi des fonctionnalités les + ou – utilisées
Préférences clients
Centres d’intérêts
Etablissement aisé de scénarios de démos
© EXPLORE
Un outil additionnel à la R&D datascience
Le Choix Elastic Cloud
En attendant des fonctionnalités de machine learning en NLP intégrées ….
- Référencement RGPD par reconnaissance d’entités nommées
- Constituer et labelliser des datasets selon recherche
- Récupérer tokens plutôt que textes bruts pour vectorisation (word2vec, text2vec, etc.)
- Recherche documents similaires pour constituer échantillons d’apprentissages
MERCI
C’EST FINI !
02 51 89 09 34
info@explore.fr I www.explore.fr

Contenu connexe

Tendances

Qlik Sense Data Analytics
Qlik Sense Data AnalyticsQlik Sense Data Analytics
Qlik Sense Data AnalyticsAS Stitou
 
GraphTour Paris - Cas d'usages populaires Neo4j
GraphTour Paris - Cas d'usages populaires Neo4jGraphTour Paris - Cas d'usages populaires Neo4j
GraphTour Paris - Cas d'usages populaires Neo4jNeo4j
 
Tenedis: Déployer un socle de Monitoring Unifié
Tenedis: Déployer un socle de Monitoring UnifiéTenedis: Déployer un socle de Monitoring Unifié
Tenedis: Déployer un socle de Monitoring UnifiéElasticsearch
 
Tableau software data visualisation
Tableau software data visualisationTableau software data visualisation
Tableau software data visualisationAS Stitou
 
Salesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalkaSalesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalkaIlan Malka
 
Discovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDiscovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDenodo
 
migrating web applications to azure
migrating web applications to azuremigrating web applications to azure
migrating web applications to azureMichel HUBERT
 
Data Fabric (French)
Data Fabric (French) Data Fabric (French)
Data Fabric (French) NetApp
 
JSS2014 – Le grand tour de Power BI
JSS2014 – Le grand tour de Power BIJSS2014 – Le grand tour de Power BI
JSS2014 – Le grand tour de Power BIGUSS
 
GraphTour - Network inventory - Ciena Blue Planet
GraphTour - Network inventory - Ciena Blue PlanetGraphTour - Network inventory - Ciena Blue Planet
GraphTour - Network inventory - Ciena Blue PlanetNeo4j
 
Tenedis : L’observabilité d’Office 365 avec Elastic
Tenedis : L’observabilité d’Office 365 avec ElasticTenedis : L’observabilité d’Office 365 avec Elastic
Tenedis : L’observabilité d’Office 365 avec ElasticElasticsearch
 

Tendances (12)

Qlik Sense Data Analytics
Qlik Sense Data AnalyticsQlik Sense Data Analytics
Qlik Sense Data Analytics
 
GraphTour Paris - Cas d'usages populaires Neo4j
GraphTour Paris - Cas d'usages populaires Neo4jGraphTour Paris - Cas d'usages populaires Neo4j
GraphTour Paris - Cas d'usages populaires Neo4j
 
Tenedis: Déployer un socle de Monitoring Unifié
Tenedis: Déployer un socle de Monitoring UnifiéTenedis: Déployer un socle de Monitoring Unifié
Tenedis: Déployer un socle de Monitoring Unifié
 
Tableau software data visualisation
Tableau software data visualisationTableau software data visualisation
Tableau software data visualisation
 
Salesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalkaSalesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalka
 
Discovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDiscovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data Virtualization
 
migrating web applications to azure
migrating web applications to azuremigrating web applications to azure
migrating web applications to azure
 
Data Fabric (French)
Data Fabric (French) Data Fabric (French)
Data Fabric (French)
 
JSS2014 – Le grand tour de Power BI
JSS2014 – Le grand tour de Power BIJSS2014 – Le grand tour de Power BI
JSS2014 – Le grand tour de Power BI
 
GraphTour - Network inventory - Ciena Blue Planet
GraphTour - Network inventory - Ciena Blue PlanetGraphTour - Network inventory - Ciena Blue Planet
GraphTour - Network inventory - Ciena Blue Planet
 
Tenedis : L’observabilité d’Office 365 avec Elastic
Tenedis : L’observabilité d’Office 365 avec ElasticTenedis : L’observabilité d’Office 365 avec Elastic
Tenedis : L’observabilité d’Office 365 avec Elastic
 
Spark tools by Jonathan Winandy
Spark tools by Jonathan WinandySpark tools by Jonathan Winandy
Spark tools by Jonathan Winandy
 

Similaire à Explore relève les défis Big Data avec Elastic Cloud

Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013ADBS
 
La Banque de demain : Chapitre 4
La Banque de demain : Chapitre 4 La Banque de demain : Chapitre 4
La Banque de demain : Chapitre 4 OCTO Technology
 
Introduction à Neo4j
Introduction à Neo4jIntroduction à Neo4j
Introduction à Neo4jNeo4j
 
EXL Group - Offre Data Science
EXL Group - Offre Data ScienceEXL Group - Offre Data Science
EXL Group - Offre Data ScienceAshraf Grioute
 
Big data en (ré)assurance régis delayet
Big data en (ré)assurance   régis delayetBig data en (ré)assurance   régis delayet
Big data en (ré)assurance régis delayetKezhan SHI
 
Quel est l'avenir des stratégies de données?
Quel est l'avenir des stratégies de données?Quel est l'avenir des stratégies de données?
Quel est l'avenir des stratégies de données?Denodo
 
Le reporting BI dans tous ses états / quel outil pour quel usage
Le reporting BI dans tous ses états / quel outil pour quel usage Le reporting BI dans tous ses états / quel outil pour quel usage
Le reporting BI dans tous ses états / quel outil pour quel usage Microsoft Technet France
 
Introduction à Neo4j
Introduction à Neo4jIntroduction à Neo4j
Introduction à Neo4jNeo4j
 
HUBREPORT - Future of Data & CRM [EXTRAIT]
HUBREPORT - Future of Data & CRM [EXTRAIT]HUBREPORT - Future of Data & CRM [EXTRAIT]
HUBREPORT - Future of Data & CRM [EXTRAIT]HUB INSTITUTE
 
Océane consulting - Intégration de Luxid TEMIS dans Nuxeo Platform - Nuxeo ...
Océane consulting - Intégration de Luxid TEMIS dans Nuxeo Platform - Nuxeo ...Océane consulting - Intégration de Luxid TEMIS dans Nuxeo Platform - Nuxeo ...
Océane consulting - Intégration de Luxid TEMIS dans Nuxeo Platform - Nuxeo ...Nuxeo
 
Le reporting bi dans tous ses états quel outil pour quel usage
Le reporting bi dans tous ses états quel outil pour quel usageLe reporting bi dans tous ses états quel outil pour quel usage
Le reporting bi dans tous ses états quel outil pour quel usageMichael Nokhamzon
 
Présentation observatoire-trendeo-2012
Présentation observatoire-trendeo-2012Présentation observatoire-trendeo-2012
Présentation observatoire-trendeo-2012Trendeo
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel businessMouhsine LAKHDISSI
 
BigDataBx #1 - Journée BigData à la CCI de Bordeaux
BigDataBx #1 - Journée BigData à la CCI de BordeauxBigDataBx #1 - Journée BigData à la CCI de Bordeaux
BigDataBx #1 - Journée BigData à la CCI de BordeauxExcelerate Systems
 
i-expo 2013 : présentation du Linked Enterprise Data par Antidot avec témoign...
i-expo 2013 : présentation du Linked Enterprise Data par Antidot avec témoign...i-expo 2013 : présentation du Linked Enterprise Data par Antidot avec témoign...
i-expo 2013 : présentation du Linked Enterprise Data par Antidot avec témoign...Antidot
 
Big Data by Soft Computing - Lille
Big Data by Soft Computing - LilleBig Data by Soft Computing - Lille
Big Data by Soft Computing - LilleSoft Computing
 

Similaire à Explore relève les défis Big Data avec Elastic Cloud (20)

Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013
 
La Banque de demain : Chapitre 4
La Banque de demain : Chapitre 4 La Banque de demain : Chapitre 4
La Banque de demain : Chapitre 4
 
Introduction à Neo4j
Introduction à Neo4jIntroduction à Neo4j
Introduction à Neo4j
 
Offre Search
Offre SearchOffre Search
Offre Search
 
EXL Group - Offre Data Science
EXL Group - Offre Data ScienceEXL Group - Offre Data Science
EXL Group - Offre Data Science
 
Big data en (ré)assurance régis delayet
Big data en (ré)assurance   régis delayetBig data en (ré)assurance   régis delayet
Big data en (ré)assurance régis delayet
 
Quel est l'avenir des stratégies de données?
Quel est l'avenir des stratégies de données?Quel est l'avenir des stratégies de données?
Quel est l'avenir des stratégies de données?
 
Le reporting BI dans tous ses états / quel outil pour quel usage
Le reporting BI dans tous ses états / quel outil pour quel usage Le reporting BI dans tous ses états / quel outil pour quel usage
Le reporting BI dans tous ses états / quel outil pour quel usage
 
Introduction à Neo4j
Introduction à Neo4jIntroduction à Neo4j
Introduction à Neo4j
 
HUBREPORT - Future of Data & CRM [EXTRAIT]
HUBREPORT - Future of Data & CRM [EXTRAIT]HUBREPORT - Future of Data & CRM [EXTRAIT]
HUBREPORT - Future of Data & CRM [EXTRAIT]
 
Océane consulting - Intégration de Luxid TEMIS dans Nuxeo Platform - Nuxeo ...
Océane consulting - Intégration de Luxid TEMIS dans Nuxeo Platform - Nuxeo ...Océane consulting - Intégration de Luxid TEMIS dans Nuxeo Platform - Nuxeo ...
Océane consulting - Intégration de Luxid TEMIS dans Nuxeo Platform - Nuxeo ...
 
Le reporting bi dans tous ses états quel outil pour quel usage
Le reporting bi dans tous ses états quel outil pour quel usageLe reporting bi dans tous ses états quel outil pour quel usage
Le reporting bi dans tous ses états quel outil pour quel usage
 
Présentation observatoire-trendeo-2012
Présentation observatoire-trendeo-2012Présentation observatoire-trendeo-2012
Présentation observatoire-trendeo-2012
 
Smart Data as a Service
Smart Data as a ServiceSmart Data as a Service
Smart Data as a Service
 
Big data
Big dataBig data
Big data
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel business
 
BigDataBx #1 - Journée BigData à la CCI de Bordeaux
BigDataBx #1 - Journée BigData à la CCI de BordeauxBigDataBx #1 - Journée BigData à la CCI de Bordeaux
BigDataBx #1 - Journée BigData à la CCI de Bordeaux
 
i-expo 2013 : présentation du Linked Enterprise Data par Antidot avec témoign...
i-expo 2013 : présentation du Linked Enterprise Data par Antidot avec témoign...i-expo 2013 : présentation du Linked Enterprise Data par Antidot avec témoign...
i-expo 2013 : présentation du Linked Enterprise Data par Antidot avec témoign...
 
Big Data by Soft Computing - Lille
Big Data by Soft Computing - LilleBig Data by Soft Computing - Lille
Big Data by Soft Computing - Lille
 
Offre onepoint medias
Offre onepoint mediasOffre onepoint medias
Offre onepoint medias
 

Plus de Elasticsearch

An introduction to Elasticsearch's advanced relevance ranking toolbox
An introduction to Elasticsearch's advanced relevance ranking toolboxAn introduction to Elasticsearch's advanced relevance ranking toolbox
An introduction to Elasticsearch's advanced relevance ranking toolboxElasticsearch
 
From MSP to MSSP using Elastic
From MSP to MSSP using ElasticFrom MSP to MSSP using Elastic
From MSP to MSSP using ElasticElasticsearch
 
Cómo crear excelentes experiencias de búsqueda en sitios web
Cómo crear excelentes experiencias de búsqueda en sitios webCómo crear excelentes experiencias de búsqueda en sitios web
Cómo crear excelentes experiencias de búsqueda en sitios webElasticsearch
 
Te damos la bienvenida a una nueva forma de realizar búsquedas
Te damos la bienvenida a una nueva forma de realizar búsquedas Te damos la bienvenida a una nueva forma de realizar búsquedas
Te damos la bienvenida a una nueva forma de realizar búsquedas Elasticsearch
 
Tirez pleinement parti d'Elastic grâce à Elastic Cloud
Tirez pleinement parti d'Elastic grâce à Elastic CloudTirez pleinement parti d'Elastic grâce à Elastic Cloud
Tirez pleinement parti d'Elastic grâce à Elastic CloudElasticsearch
 
Comment transformer vos données en informations exploitables
Comment transformer vos données en informations exploitablesComment transformer vos données en informations exploitables
Comment transformer vos données en informations exploitablesElasticsearch
 
Plongez au cœur de la recherche dans tous ses états.
Plongez au cœur de la recherche dans tous ses états.Plongez au cœur de la recherche dans tous ses états.
Plongez au cœur de la recherche dans tous ses états.Elasticsearch
 
Modernising One Legal Se@rch with Elastic Enterprise Search [Customer Story]
Modernising One Legal Se@rch with Elastic Enterprise Search [Customer Story]Modernising One Legal Se@rch with Elastic Enterprise Search [Customer Story]
Modernising One Legal Se@rch with Elastic Enterprise Search [Customer Story]Elasticsearch
 
An introduction to Elasticsearch's advanced relevance ranking toolbox
An introduction to Elasticsearch's advanced relevance ranking toolboxAn introduction to Elasticsearch's advanced relevance ranking toolbox
An introduction to Elasticsearch's advanced relevance ranking toolboxElasticsearch
 
Welcome to a new state of find
Welcome to a new state of findWelcome to a new state of find
Welcome to a new state of findElasticsearch
 
Building great website search experiences
Building great website search experiencesBuilding great website search experiences
Building great website search experiencesElasticsearch
 
Keynote: Harnessing the power of Elasticsearch for simplified search
Keynote: Harnessing the power of Elasticsearch for simplified searchKeynote: Harnessing the power of Elasticsearch for simplified search
Keynote: Harnessing the power of Elasticsearch for simplified searchElasticsearch
 
Cómo transformar los datos en análisis con los que tomar decisiones
Cómo transformar los datos en análisis con los que tomar decisionesCómo transformar los datos en análisis con los que tomar decisiones
Cómo transformar los datos en análisis con los que tomar decisionesElasticsearch
 
Comment transformer vos données en informations exploitables
Comment transformer vos données en informations exploitablesComment transformer vos données en informations exploitables
Comment transformer vos données en informations exploitablesElasticsearch
 
Transforming data into actionable insights
Transforming data into actionable insightsTransforming data into actionable insights
Transforming data into actionable insightsElasticsearch
 
Opening Keynote: Why Elastic?
Opening Keynote: Why Elastic?Opening Keynote: Why Elastic?
Opening Keynote: Why Elastic?Elasticsearch
 
Empowering agencies using Elastic as a Service inside Government
Empowering agencies using Elastic as a Service inside GovernmentEmpowering agencies using Elastic as a Service inside Government
Empowering agencies using Elastic as a Service inside GovernmentElasticsearch
 
The opportunities and challenges of data for public good
The opportunities and challenges of data for public goodThe opportunities and challenges of data for public good
The opportunities and challenges of data for public goodElasticsearch
 
Enterprise search and unstructured data with CGI and Elastic
Enterprise search and unstructured data with CGI and ElasticEnterprise search and unstructured data with CGI and Elastic
Enterprise search and unstructured data with CGI and ElasticElasticsearch
 
What's new at Elastic: Update on major initiatives and releases
What's new at Elastic: Update on major initiatives and releasesWhat's new at Elastic: Update on major initiatives and releases
What's new at Elastic: Update on major initiatives and releasesElasticsearch
 

Plus de Elasticsearch (20)

An introduction to Elasticsearch's advanced relevance ranking toolbox
An introduction to Elasticsearch's advanced relevance ranking toolboxAn introduction to Elasticsearch's advanced relevance ranking toolbox
An introduction to Elasticsearch's advanced relevance ranking toolbox
 
From MSP to MSSP using Elastic
From MSP to MSSP using ElasticFrom MSP to MSSP using Elastic
From MSP to MSSP using Elastic
 
Cómo crear excelentes experiencias de búsqueda en sitios web
Cómo crear excelentes experiencias de búsqueda en sitios webCómo crear excelentes experiencias de búsqueda en sitios web
Cómo crear excelentes experiencias de búsqueda en sitios web
 
Te damos la bienvenida a una nueva forma de realizar búsquedas
Te damos la bienvenida a una nueva forma de realizar búsquedas Te damos la bienvenida a una nueva forma de realizar búsquedas
Te damos la bienvenida a una nueva forma de realizar búsquedas
 
Tirez pleinement parti d'Elastic grâce à Elastic Cloud
Tirez pleinement parti d'Elastic grâce à Elastic CloudTirez pleinement parti d'Elastic grâce à Elastic Cloud
Tirez pleinement parti d'Elastic grâce à Elastic Cloud
 
Comment transformer vos données en informations exploitables
Comment transformer vos données en informations exploitablesComment transformer vos données en informations exploitables
Comment transformer vos données en informations exploitables
 
Plongez au cœur de la recherche dans tous ses états.
Plongez au cœur de la recherche dans tous ses états.Plongez au cœur de la recherche dans tous ses états.
Plongez au cœur de la recherche dans tous ses états.
 
Modernising One Legal Se@rch with Elastic Enterprise Search [Customer Story]
Modernising One Legal Se@rch with Elastic Enterprise Search [Customer Story]Modernising One Legal Se@rch with Elastic Enterprise Search [Customer Story]
Modernising One Legal Se@rch with Elastic Enterprise Search [Customer Story]
 
An introduction to Elasticsearch's advanced relevance ranking toolbox
An introduction to Elasticsearch's advanced relevance ranking toolboxAn introduction to Elasticsearch's advanced relevance ranking toolbox
An introduction to Elasticsearch's advanced relevance ranking toolbox
 
Welcome to a new state of find
Welcome to a new state of findWelcome to a new state of find
Welcome to a new state of find
 
Building great website search experiences
Building great website search experiencesBuilding great website search experiences
Building great website search experiences
 
Keynote: Harnessing the power of Elasticsearch for simplified search
Keynote: Harnessing the power of Elasticsearch for simplified searchKeynote: Harnessing the power of Elasticsearch for simplified search
Keynote: Harnessing the power of Elasticsearch for simplified search
 
Cómo transformar los datos en análisis con los que tomar decisiones
Cómo transformar los datos en análisis con los que tomar decisionesCómo transformar los datos en análisis con los que tomar decisiones
Cómo transformar los datos en análisis con los que tomar decisiones
 
Comment transformer vos données en informations exploitables
Comment transformer vos données en informations exploitablesComment transformer vos données en informations exploitables
Comment transformer vos données en informations exploitables
 
Transforming data into actionable insights
Transforming data into actionable insightsTransforming data into actionable insights
Transforming data into actionable insights
 
Opening Keynote: Why Elastic?
Opening Keynote: Why Elastic?Opening Keynote: Why Elastic?
Opening Keynote: Why Elastic?
 
Empowering agencies using Elastic as a Service inside Government
Empowering agencies using Elastic as a Service inside GovernmentEmpowering agencies using Elastic as a Service inside Government
Empowering agencies using Elastic as a Service inside Government
 
The opportunities and challenges of data for public good
The opportunities and challenges of data for public goodThe opportunities and challenges of data for public good
The opportunities and challenges of data for public good
 
Enterprise search and unstructured data with CGI and Elastic
Enterprise search and unstructured data with CGI and ElasticEnterprise search and unstructured data with CGI and Elastic
Enterprise search and unstructured data with CGI and Elastic
 
What's new at Elastic: Update on major initiatives and releases
What's new at Elastic: Update on major initiatives and releasesWhat's new at Elastic: Update on major initiatives and releases
What's new at Elastic: Update on major initiatives and releases
 

Explore relève les défis Big Data avec Elastic Cloud

  • 2. © EXPLORE Qui sommes-nous ? Création 2 implantations Nantes & Paris Collaborateurs Clients Utilisateurs 1997 180 +15 M€ Chiffre d’affaires +1500 +50 000 Producteur de données à haute valeur ajoutée pour les marchés du BtoB Immobilier Promoteur, Investisseur, Broker, Syndic, Aménagement foncier, Bailleur social, Grande distribution, enseignes… Construction & prescription Fabricants / Industriels, Travaux Bâtiments, Travaux publics, MOE Services à l’entreprise Banque, Assurance, Communication, IT, Déménagement, FM, RH, Sécurité… Territoires & Environnement Collectivités & Administrations, Bureaux d'études & Conseil, Energies, Déchets, Eau Nos marchés Chiffres clés
  • 3. Data for success © EXPLORE Concepteur de solutions de data comportementales BtoB / BtoC à haute valeur ajoutée, EXPLORE identifie tous les moments de vie de vos prospects et clients et les transforme en levier de performance commerciale.
  • 4. © EXPLORE © EXPLORE Notre savoir-faire Le meilleur de la technologie, la valeur ajoutée de l’humain SOURCING 360° ÉQUIPES D’EXPERTS TECHNOLOGIES DU BIG DATA Presse, web, réseaux sociaux, communiqués d’entreprise, permis de construire, transactions, annonces légales… Documentalistes, Chargés d’enquêtes, Chargés de veille stratégique, Urbanistes, Géomaticiens, Data analysts, Data scientists, Développeurs … Bases multidimensionnelles SQLServer, API sémantique, Géocodage (Siretisation à 100%), Graphs, machine learning, dataviz…
  • 5. © EXPLORE d’entreprises (Base Sirene) + 11 M Raison sociale Adresse Siren, Siret Date de création Code NAF Effectif Chiffre d’affaires Forme juridique Etablissement principal ou secondaire Dirigeants… d’immeubles et terrains recensés + 18 M Patrimoine immobilier et foncier des entreprises : - Section cadastrale - Adresse - Surface - Nombre d’étages - Type de bien : bureaux, commerces, logements… Identité des propriétaires et des occupants : - Raison sociale - Siren, Siret - Coordonnées complètes - Contacts… Marchés publics /an + 850 000 700 000 appels d’offres Etudes et avant-projet, immobilier, aménagement urbain, santé, travaux, maintenance, assurance, services généraux, énergie, financement… 150 000 avis d’attribution projets immobiliers /an + 25 000 15 000 mouvements d’entreprises Déménagements, transferts d’activité, nouvelles implantations… 10 000 projets de construction évènements stratégiques /an + 3 M 2,7 millions d’annonces légales 12 000 développements (investissement productif, croissance CA…) 7 000 recrutements 6 000 transactions 5 500 fusions-acquisitions 5 000 nominations dans le top management 1 000 sinistres… Notre solution Quelques chiffres sur nos data
  • 6. © EXPLORE Sourcing 360° Article s de presse Sites web Patrimoin e immobilie r Annonce s légale s Open Data Sites web annonceur s Permis de construir e Réseau x sociau x Crowd - sourcin g Nos sources L'information, notre matière première C’est la diversité et le croisement des sources d’information qui permettent la meilleure vision d’un marché, d’un territoire, d’une entreprise. C’est pourquoi EXPLORE collecte ses données parmi plusieurs milliers de sources et supports d’informations : presse nationale, régionale et locale, sites web, réseaux sociaux, communiqués d’entreprise, données et annonces légales, appels d’offres… Qualification
  • 7. © EXPLORE L’infrastructure au service de la diversité des données
  • 8. © EXPLORE Traitements spécifiques de la donnée textuelle pour la veille Problématiques adressées par Elasticsearch Article de Presse Avis de Marché Sociétés mentionnées (Raison Sociale, sigle…) Eléments géographiques Mots clefs actualité Collectivité / Structure / Administration Actifs immobiliers mentionnés Mots clefs, nature des services / travaux 5 minutes / document : 2h / personne / jour Moins de documents en file d’attente => visibilité des équipes sur la charge
  • 9. © EXPLORE Traitement automatique de dédoublonnage Problématiques adressées par Elasticsearch Stream de dédoublonnage des documents Documents importés Indexation MLT - Analyzers spécifiques - Clauses structurées - Filtres gaussiens /dates - Similarité textes Constitution de familles de documents doublons et filtre automatique 5 minutes / document : 2h / personne / jour Moins de documents en file d’attente : visibilité des équipes sur la charge
  • 10. © EXPLORE Fouiller la donnée non structurée Problématiques adressées par Elasticsearch Documentation de consultation des entreprises : • Documents de formats mixtes (docs, pdf) • Plusieurs dizaines voire centaines de pages • Documents multi-sujets • OCR Moteur de recherche DCE : Trouver des documents, des prescriptions selon de multiples critères et mots clefs
  • 11. © EXPLORE Repenser nos moteurs de recherche Problématiques adressées par Elasticsearch Nos référentiels sémantiques dénormalisés : Données mises à plat, fortement nested, texte + attributs structurés Indices agrégeant des dizaines de tables dans plusieurs bases SQL différentes pour des recherches multi-critères API python de composition de requêtes elasticsearch « lego »
  • 12. © EXPLORE Repenser nos moteurs de recherche Problématiques adressées par Elasticsearch
  • 13. © EXPLORE Déploiement d’un catalogue d’APIs spécialisées Le Choix Elastic Cloud Sociétés ~ 200 millions de docs / Index ~ 150Go Essentiellement structurés 2 index de structure distincte __________________________ APIs de Recherche, intégration applicative (siretisation) et distribution tierces Documentaire Interne ~ 5 millions de docs / index ~ 100Go Texte + métadonnées ___________________________ APIs applicatives de production Traitement de masse de nuit + haute fréquence de requêtes en journée Documentaire Externe ~ 5 à 100 millions de documents non structurés par index ~ 10 indices par famille de document ~ 200 Go ___________________________ APIs de recherche + kibana interne Foncier et chantiers > 600 millions de documents ~ 150 Go Très fortement structuré et nested ___________________________ API de recherche multicritère Agrégations complexes DCE ~ 30 millions de documents ~ 1,5 To Textes longs ocrisés non structurés ___________________________ API de recherche textuelle Mieux adresser la diversité de nos données et besoins de performances : - Différences de structures - Différences de volumes - Différences d’usages
  • 14. © EXPLORE Explorer nos logs et mieux accompagner nos clients Le Choix Elastic Cloud Logs de notre espace client et de consommation de nos APIs Suivi des fonctionnalités les + ou – utilisées Préférences clients Centres d’intérêts Etablissement aisé de scénarios de démos
  • 15. © EXPLORE Un outil additionnel à la R&D datascience Le Choix Elastic Cloud En attendant des fonctionnalités de machine learning en NLP intégrées …. - Référencement RGPD par reconnaissance d’entités nommées - Constituer et labelliser des datasets selon recherche - Récupérer tokens plutôt que textes bruts pour vectorisation (word2vec, text2vec, etc.) - Recherche documents similaires pour constituer échantillons d’apprentissages
  • 16. MERCI C’EST FINI ! 02 51 89 09 34 info@explore.fr I www.explore.fr