SlideShare une entreprise Scribd logo
1  sur  30
1
NOTRE OFFRE
RECHERCHE
OÙ SE TROUVE LA VALEUR ?
Business
Données
Contenus
« Legacy »
Documents
Pour l’extraire,
vos informations
doivent être
• Référencées
• Intégrées
• Uniformisées (indexées)
• Liées (entre elles)
• Auditées
• Reformatées
• …
3
VOTRE MOTEUR DE RECHERCHE
Le bon moteur pour vos informations se trouve ici !
L’OPEN SOURCE OFFRE UNE LARGE GAMME DE SOLUTIONS
4
ET DE NOMBREUX OUTILS POUR L’AMÉLIORER
Des briques open source pour les fonctions clés :
 Analyse sémantique
 Expansion de recherche
 Clustering automatique
 Gestion de thésaurus
ginco
NOTRE EXPERTISE
RECONNUE PAR NOS CLIENTS
6
Médias e-commerce Secteur Public Portails
DES RÉFÉRENCES…
FOCUS SUR ELACTIC SEARCH
10
ELASTICSEARCH
UN ÉCOSYSTÈME ORIENTÉ DONNÉES
ElasticSearch
Moteur de recherche et
analytics
Logstash
Collecte, enrichissement
de données
Marvel
Monitoring solution
Watcher
Alertes & notifications
basées sur les données
Kibana
Visualisation et
exploration de données
Shield
Sécurité et contrôle
d’accès aux données.
Beats
Collecte de données
réseaux
11
ELASTICSEARCH
Moteur de recherche et d’analyse REST
 Construit sur Apache Lucene
 Chez Smile : remplacement de SolR
Licence Open Source
 Apache 2
Fonctionnalités uniques
 Percolation
 Agrégations
 Intégration Hadoop & Spark
Simple à mettre en œuvre
 Courbe d’apprentissage rapide
 Déploiement et administration simple
QU’EST-CE QUE C’EST ?
Recherche fulltext
Données hétérogènes & schéma évolutif
Indexation temps réel
Analyse temps réel
Distribué & haute disponibilité
12
ELASTIC.CO
L’ENTREPRISE DERRIÈRE ELASTICSEARCH
Partenaire privilégié avec Smile
2 sièges sociaux
 EU : Amsterdam (Pays-Bas)
 US : Los Altos (Californie)
Présence commerciale & opérationnelle en
France
Un produit leader
 Plus de 8 millions de téléchargements depuis 2008
 > 500 000 téléchargements par mois
150 employés
Croissance forte à 3 chiffres
+400% ces 9 derniers mois
BusinessModel
•Ventes de support et
de formation pour ES
•3 niveaux de support
(Silver, Gold,
Premium).
Par nœuds
•Différents SLA y
compris 24/7 SLA
•Produits réservés aux
souscripteurs de
support : Shield,
Marvel & Watcher
Investors
•Benchmark Capital
$10M Series A, 2012
•Index Ventures
$24M Series B, 2013
With participation
from Benchmark
Capital
•New Enterprise
Associates $70M
Series C, 2014
With participation
from Benchmark
Capital and Index
Ventures
ELASTIC CHEZ SMILE
14
USE CASE
Répondre à l’enjeu stratégique d’une vision complète du client
 Chaque client a des interactions multiples avec votre marque
 Chaque canal régénère des traces techniques (Web, mobile, téléphone, magasin)
Pourquoi faire ?
 Conseil : en magasin, par téléphone, avant un rendez-vous
 Recommandation : le bon contenu à la bonne personne
 Ciblage d’opération marketing : segmentation, corrélation offre / profil
 …
Et comment ?
 Collecter et analyser de grandes volumétries d’informations sur les clients et les prospects
 Exploiter les Framework du Big Data et d’Elastic pour apporter une réponse opérationnelle au métier
VUE CLIENT À 360°
15
Index client à 360°
USE CASE
VUE CLIENT À 360° Clients
Prospects
Collecte
Indexation donnée
comportementale
Smile_Modules :
Système Big Data
Un dispositif de collecte des données
comportementales (web, in store, téléphone…)
A
APIs
API Vue
Client à
360°
API
Ciblage
client
API
Recommandations
…
Sources
de données
traditionnelles
CRM
Help
Desk
…
Système de traitement Système de stockage / historisation
USE CASE
• Calcul d’un score
d’appétence par catégorie
de produit / offre
• Permet d’orienter la relation
client lors des contacts 1 to 1
(in-store ou par téléphone)
• Permet d’établir des listes de
prospection
 Ex: Tous les clients intéressés par le
rayon « Jeux PS4 »
 Prospection automatique (mailing,
notifications,…) ou sollicitation
ciblée (téléphone)
VUE CLIENT À 360°
Exemple de notre projet interne
Le marketing créé des contenus à forte valeur
ajoutée dont la consultation est un indicateur sur
d’appétence
Relativement simple sur un système e-commerce : la
fiche produit
UN MODULE SMILE POUR
MAGENTO
UN MOTEUR DE RECHERCHE POUR LE E-COMMERCE
Objectif du projet :
• Disposer d’un moteur de
recherche spécialisé dans
le e-commerce
• Fonctionnalités fulltext et
de merchandising à l’état
de l’art
• Inclure des mécanismes
d’optimisation qui
s’appuient sur le
comportement des
utilisateurs
• Projet diffusé en Open
Source
MODULE ELASTICSEARCH POUR MAGENTO
Architecture technique
Website Users
Search Queries
Catalog Index
Behavioral Data Index
Website Usage
Collect Data
Smile Webtracker
Product
Data
Indexing
User Behavior
Indexing
Smile_ElasticSearch
Smile_VirtualCategories Smile_Tracker
Smile_SearchOptimizer
Smile_Modules :
Le dispositif de collecte des données utilisateurs via web tracking permet
d’agir sur la pertinence en temps réel
Il est construit sur des briques Big Data : Apache Spark & Apache Kafka
Elastic en détail
21
SMILE ELASTICSEARCH
BOOSTER VOTRE INTRANET
Facettes
 Sélection de facettes multiples
 Gestion multi sources et sur les sources
 Filtre sur date, sur les notes, sur les auteurs
 Personnalisation facile par les développeurs
Autocomplétion
 Recherche populaires, produits, catégories,
 Extensible pour ajouter d’autres contenus : bases, CMS…
Amélioration de la recherche plein texte
 Pondération de chaque attribut pour la recherche, depuis le back-office
 Recherche floue : « Frankenshten » donnera « Frankenstein »
22
SMILE ELASTICSEARCH
BOOSTER VOTRE INTRANET
Catégories intelligentes
 Définition de catégories par des règles
(en plus d’une sélection manuelle)
 Interface de gestion conviviale et intégrée
Optimisations de la pertinence
 Ajout de règles métiers pour modifier la pertinence
o « Booster les contenus produits ou notés par des experts »
o « faire le lien entre un même contenu stocké deux fois »
 Extensible par un framework de développements
23
SMILE ELASTICSEARCH
BOOSTER VOTRE INTRANET
Visualisation des résultats
 Affichage des résultats avec et sans l’optimiseur
 Permettre de raffiner les résultats
Tri au sein des catégories virtuelles
 Pour déterminer manuellement les positions des produits au sein
des catégories définies automatiquement par des règles
o Ex : positionner une « réglementation européenne récente » en
fonction d’une requête donnée (mise en avant)
Tri dans les résultats de recherche
 Permet d’ordonner les produits qui sont affichés pour des
recherches définies.
o Ex : mise en avant de la robe « Kali » pour la requête de recherche
« robe » (ou « robes »…)
28
+ 20
A QUOI SERT UN MOTEUR DE RECHERCHE ?
Ce que les utilisateurs attendent
 Trouver
 Fédérer / uniformiser
Ce qu’il faut faire
 Un moteur rapide et adapté
 Une bonne exploitation de l’indexation
 La gestion des droits
 La prise en compte de tous les contenus (Web / document / produit…)
 Gérer le « bruit » et « silence »
 Exploiter les outils à valeur ajoutée
o Classification, thésaurus, ontologie…
29
FONCTIONS ESSENTIELLES
Indexation des contenus
 Crawler – temps différé
 Connecteur – temps réel
Deux types de recherches
 « plein texte » (Full text) vs. documentaire
 Fédérée avec gestion des droits des utilisateurs
Exploitation des contenus
 Classement / navigation / cluster
 Statistique / administration
Intégration
 API, Webservice…
 Gestion des droits (SSO)
30
Morpho-syntaxique
• Correction et phonétique
• Cross-lingue
• Extraction d’entités nommées
Sémantique
• Analyse du sens (meaning)
• Recherche par l’exemple
• Catégorisation
Statistique
• Indexation plein texte
• Analyse de corpus
• Détection des liens
• Extraction de concept
Structurée
• Indexation structurée
• Navigation multidimensionnelle
• Exploitation des métadonnées
COMMENT FAIT ON LA RECHERCHE ?
LES TYPES D’ANALYSE
31
COMMENT AMÉLIORER LA RECHERCHE ?
Registre linguistique
 Lemmatisation (réduction au signifiant)
 Synonomie, mots vides, orthographe
 Sémantique
Registre mathématique
 Pertinence : champs, proximité, usage
 Pondération
 Texte mining
TECHNIQUES AVANCÉES
RECHERCHE FÉDÉRÉE ONE SEARCH FOR ALL
Trouver dans
plusieurs
ensembles de
contenus
Les bases sont hétérogènes et leur plus
petit commun dénominateur (ppcm)
réduit, l’objectif est de ne pas passer à
côté d’une information.
Fonctions de recherche dépendant à la
technologie utilisée (crawling,
connecteur)
33
Export des contenus
indexe
Crawling de base(s) Connecteur
• Contrôle des contenus a
priori
• Temps réel
• Contrôle des contenus à
postériorité (crawler)
• Pas de temps réel
• Gestion des droits
• Temps réel
• Maintenance importante
indexe indexe
INDEXATION DES CONTENUS
SUR QUOI S’EXÉCUTE LA RECHERCHE ?
34
INDEXATION DES CONTENUS
Nombre de bases
Hétérogénéité technologique
Evolutivité du système
Architecture des bases
 Centralisées / réparties
 Bases internes, externes
 Contrôlées ou non (internet)
Puissance de recherche
 Opérateurs disponibles
 Vitesse d’exécution / nombre de recherches
ELÉMENTS D’ARBITRAGE DE CHOIX DES MÉTHODES
ARCHITECTURE DES MOTEURS
LES CAS FRÉQUENTS
Brique intégrée
 embarquée dans une
solution
Brique
« branchée »
 mais indépendante
moteur
moteur
requête
TYPES DE RECHERCHES
Quel est votre
projet ?
 Sachez identifier les
leviers de succès
Recherche (simple)
 trouver quelque chose dans un ensemble
 Souvent « Google like »
o Simple et intelligent
Recherche fédérée
 trouver quelque chose dans plusieurs ensembles
 Souvent plus élaborée
o Simple et puissant
Recherche sur le poste de travail
 Trouver quelque chose sur son ordinateur
 Le plus souvent intégré à l’OS
EXPLOITATION DES RÉSULTATS
FONCTIONS CLÉS
Navigation dans les résultats
 Catégorisation (clustering)
 Affichage par facettes
Trier et classer
 Filtrer et affiner
 Thésaurus, plan de classement
Export
 Liste
 Graphique
Alerte
 Requêtes rejouées périodiquement
 Communication du différentiel
On ne
cherche
jamais que
pour trouver

Contenu connexe

Tendances

Tendances (20)

Séminaire Smile & Akeneo : e-commerce - J'ai mal à mon catalogue
Séminaire Smile & Akeneo : e-commerce - J'ai mal à mon catalogueSéminaire Smile & Akeneo : e-commerce - J'ai mal à mon catalogue
Séminaire Smile & Akeneo : e-commerce - J'ai mal à mon catalogue
 
Seminaire Drupal 8 à Nantes
Seminaire Drupal 8 à NantesSeminaire Drupal 8 à Nantes
Seminaire Drupal 8 à Nantes
 
CMSday 2013 - Usines à sites : Quelles sont les approches possibles ?
CMSday 2013 - Usines à sites : Quelles sont les approches possibles ?CMSday 2013 - Usines à sites : Quelles sont les approches possibles ?
CMSday 2013 - Usines à sites : Quelles sont les approches possibles ?
 
Dam et e-business
Dam et e-businessDam et e-business
Dam et e-business
 
Webinar Smile et Talend : Faites communiquer vos applications en temps réel
Webinar Smile et Talend  : Faites communiquer vos applications en temps réelWebinar Smile et Talend  : Faites communiquer vos applications en temps réel
Webinar Smile et Talend : Faites communiquer vos applications en temps réel
 
CMSday 2013 - Jahia xCM : Mise en œuvre chez Socomec
CMSday 2013 - Jahia xCM : Mise en œuvre chez SocomecCMSday 2013 - Jahia xCM : Mise en œuvre chez Socomec
CMSday 2013 - Jahia xCM : Mise en œuvre chez Socomec
 
Webinar SMILE : "Découvrez Alfresco 5.1, la solution pour une gestion documen...
Webinar SMILE : "Découvrez Alfresco 5.1, la solution pour une gestion documen...Webinar SMILE : "Découvrez Alfresco 5.1, la solution pour une gestion documen...
Webinar SMILE : "Découvrez Alfresco 5.1, la solution pour une gestion documen...
 
Séminaire Smile - Réussir son application Métier
Séminaire Smile - Réussir son application MétierSéminaire Smile - Réussir son application Métier
Séminaire Smile - Réussir son application Métier
 
CMSday 2103 - Ametys : Gestion fine des contenus dans un environnement multisite
CMSday 2103 - Ametys : Gestion fine des contenus dans un environnement multisiteCMSday 2103 - Ametys : Gestion fine des contenus dans un environnement multisite
CMSday 2103 - Ametys : Gestion fine des contenus dans un environnement multisite
 
Séminaire E-commerce "J'ai mal à mon catalogue" by Smile & Akeneo
Séminaire E-commerce "J'ai mal à mon catalogue" by Smile & AkeneoSéminaire E-commerce "J'ai mal à mon catalogue" by Smile & Akeneo
Séminaire E-commerce "J'ai mal à mon catalogue" by Smile & Akeneo
 
CMSday 2103 - Les CMS open source qui ont fait le choix des applications mobi...
CMSday 2103 - Les CMS open source qui ont fait le choix des applications mobi...CMSday 2103 - Les CMS open source qui ont fait le choix des applications mobi...
CMSday 2103 - Les CMS open source qui ont fait le choix des applications mobi...
 
Séminaire drupal8.final
Séminaire drupal8.finalSéminaire drupal8.final
Séminaire drupal8.final
 
CMSday 2013 - eZ Publish - une plateforme unifiée pour gérer votre marketing ...
CMSday 2013 - eZ Publish - une plateforme unifiée pour gérer votre marketing ...CMSday 2013 - eZ Publish - une plateforme unifiée pour gérer votre marketing ...
CMSday 2013 - eZ Publish - une plateforme unifiée pour gérer votre marketing ...
 
CMSday 2013 - Investir dans un CMS : Comment les entreprises capitalisent-ell...
CMSday 2013 - Investir dans un CMS : Comment les entreprises capitalisent-ell...CMSday 2013 - Investir dans un CMS : Comment les entreprises capitalisent-ell...
CMSday 2013 - Investir dans un CMS : Comment les entreprises capitalisent-ell...
 
Introduction a IBM API Management
Introduction a IBM API ManagementIntroduction a IBM API Management
Introduction a IBM API Management
 
2015 12-11 Gouvernance 2.0 pour SharePoint et Office 365
2015 12-11 Gouvernance 2.0 pour SharePoint et Office 3652015 12-11 Gouvernance 2.0 pour SharePoint et Office 365
2015 12-11 Gouvernance 2.0 pour SharePoint et Office 365
 
Séminaire drupal8 Lyon
Séminaire drupal8 LyonSéminaire drupal8 Lyon
Séminaire drupal8 Lyon
 
Les nouveautés autour des Groupes Office 365 et les connecteurs
Les nouveautés autour des Groupes Office 365 et les connecteursLes nouveautés autour des Groupes Office 365 et les connecteurs
Les nouveautés autour des Groupes Office 365 et les connecteurs
 
Webinar Smile et WSO2
Webinar Smile et WSO2Webinar Smile et WSO2
Webinar Smile et WSO2
 
PowerApps avec office 365
PowerApps avec office 365PowerApps avec office 365
PowerApps avec office 365
 

En vedette

En vedette (17)

A high profile project with Symfony and API Platform: beIN SPORTS
A high profile project with Symfony and API Platform: beIN SPORTSA high profile project with Symfony and API Platform: beIN SPORTS
A high profile project with Symfony and API Platform: beIN SPORTS
 
Webinar Smile : Comment industrialiser votre SI avec Ansible ?
Webinar Smile : Comment industrialiser votre SI avec Ansible ?Webinar Smile : Comment industrialiser votre SI avec Ansible ?
Webinar Smile : Comment industrialiser votre SI avec Ansible ?
 
Bargento 2014 : conférence Smile « ElasticSearch booste la recherche Magento »
Bargento 2014 : conférence Smile « ElasticSearch booste la recherche Magento »Bargento 2014 : conférence Smile « ElasticSearch booste la recherche Magento »
Bargento 2014 : conférence Smile « ElasticSearch booste la recherche Magento »
 
Présentation sur l'accessibilité numérique / Evènement université de Lille 3
Présentation sur l'accessibilité numérique / Evènement université de Lille 3 Présentation sur l'accessibilité numérique / Evènement université de Lille 3
Présentation sur l'accessibilité numérique / Evènement université de Lille 3
 
Séminaire IoT EISTI du 14 avril 2016 avec Open Wide / Smile
Séminaire IoT EISTI du 14 avril 2016 avec Open Wide / SmileSéminaire IoT EISTI du 14 avril 2016 avec Open Wide / Smile
Séminaire IoT EISTI du 14 avril 2016 avec Open Wide / Smile
 
Meet Magento 2015 Utrecht - ElasticSearch - Smile
Meet Magento 2015 Utrecht - ElasticSearch - SmileMeet Magento 2015 Utrecht - ElasticSearch - Smile
Meet Magento 2015 Utrecht - ElasticSearch - Smile
 
Demarche de cadrage Big data
Demarche de cadrage Big dataDemarche de cadrage Big data
Demarche de cadrage Big data
 
Digitalisez vos points de ventes avec Smile !
Digitalisez vos points de ventes avec Smile !Digitalisez vos points de ventes avec Smile !
Digitalisez vos points de ventes avec Smile !
 
Meetup ElasticSearch : « Booster votre Magento avec Elasticsearch »
Meetup ElasticSearch : « Booster votre Magento avec Elasticsearch »Meetup ElasticSearch : « Booster votre Magento avec Elasticsearch »
Meetup ElasticSearch : « Booster votre Magento avec Elasticsearch »
 
Comment une marque se développe par son approche user centric ? - Conference ...
Comment une marque se développe par son approche user centric ? - Conference ...Comment une marque se développe par son approche user centric ? - Conference ...
Comment une marque se développe par son approche user centric ? - Conference ...
 
Seminaire Smile sur Drupal 8 - Juin 2015
Seminaire Smile sur Drupal 8 - Juin 2015Seminaire Smile sur Drupal 8 - Juin 2015
Seminaire Smile sur Drupal 8 - Juin 2015
 
Webinar Smile - Comment Drupal 8 peut booster votre stratégie digitale ?
Webinar Smile - Comment Drupal 8 peut booster votre stratégie digitale ?Webinar Smile - Comment Drupal 8 peut booster votre stratégie digitale ?
Webinar Smile - Comment Drupal 8 peut booster votre stratégie digitale ?
 
Deploying an Open Source DAM in SAAS Mode (European Drupal Days 2015)
Deploying an Open Source DAM in SAAS Mode (European Drupal Days 2015)Deploying an Open Source DAM in SAAS Mode (European Drupal Days 2015)
Deploying an Open Source DAM in SAAS Mode (European Drupal Days 2015)
 
Dimensions CM 14.2 Webcast: Running the Gauntlet
Dimensions CM 14.2 Webcast: Running the GauntletDimensions CM 14.2 Webcast: Running the Gauntlet
Dimensions CM 14.2 Webcast: Running the Gauntlet
 
Proposition pim esprit mobile
Proposition pim esprit mobileProposition pim esprit mobile
Proposition pim esprit mobile
 
Liferay Module Framework
Liferay Module FrameworkLiferay Module Framework
Liferay Module Framework
 
Architecture Orientee Ressource
Architecture Orientee RessourceArchitecture Orientee Ressource
Architecture Orientee Ressource
 

Similaire à Offre Search

Linked Enterprise Data : disposer d’une vue consolidée des données de l'entre...
Linked Enterprise Data : disposer d’une vue consolidée des données de l'entre...Linked Enterprise Data : disposer d’une vue consolidée des données de l'entre...
Linked Enterprise Data : disposer d’une vue consolidée des données de l'entre...
Antidot
 
Comment retrouver, nettoyer, organiser et gérer l’information dans votre entr...
Comment retrouver, nettoyer, organiser et gérer l’information dans votre entr...Comment retrouver, nettoyer, organiser et gérer l’information dans votre entr...
Comment retrouver, nettoyer, organiser et gérer l’information dans votre entr...
Everteam
 
Oxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataOxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigData
Ludovic Piot
 

Similaire à Offre Search (20)

2009 Search Vivisimo Social Computing
2009 Search Vivisimo Social Computing2009 Search Vivisimo Social Computing
2009 Search Vivisimo Social Computing
 
Presentation 2009 offre Social Computing
Presentation 2009 offre Social ComputingPresentation 2009 offre Social Computing
Presentation 2009 offre Social Computing
 
2011 05 26 Anticipez les évolutions de votre environnement pour adapter votre...
2011 05 26 Anticipez les évolutions de votre environnement pour adapter votre...2011 05 26 Anticipez les évolutions de votre environnement pour adapter votre...
2011 05 26 Anticipez les évolutions de votre environnement pour adapter votre...
 
Comment réussir sa stratégie de contenu grâce à la data SEO
Comment réussir sa stratégie de contenu grâce à la data SEOComment réussir sa stratégie de contenu grâce à la data SEO
Comment réussir sa stratégie de contenu grâce à la data SEO
 
Linked Enterprise Data : disposer d’une vue consolidée des données de l'entre...
Linked Enterprise Data : disposer d’une vue consolidée des données de l'entre...Linked Enterprise Data : disposer d’une vue consolidée des données de l'entre...
Linked Enterprise Data : disposer d’une vue consolidée des données de l'entre...
 
2011 02 17 Suivez votre marché et vos concurrents sur internet by competitic
2011 02 17 Suivez votre marché et vos concurrents sur internet by competitic  2011 02 17 Suivez votre marché et vos concurrents sur internet by competitic
2011 02 17 Suivez votre marché et vos concurrents sur internet by competitic
 
Comment retrouver, nettoyer, organiser et gérer l’information dans votre entr...
Comment retrouver, nettoyer, organiser et gérer l’information dans votre entr...Comment retrouver, nettoyer, organiser et gérer l’information dans votre entr...
Comment retrouver, nettoyer, organiser et gérer l’information dans votre entr...
 
Navigation et Recherche pour les sites E-Commerce
Navigation et Recherche pour les sites E-CommerceNavigation et Recherche pour les sites E-Commerce
Navigation et Recherche pour les sites E-Commerce
 
Petite boite à outils à destination du chef d'entreprise
Petite boite à outils à destination du chef d'entreprisePetite boite à outils à destination du chef d'entreprise
Petite boite à outils à destination du chef d'entreprise
 
20141216 La veille en TPE / PME by competitic
20141216 La veille en TPE / PME by competitic20141216 La veille en TPE / PME by competitic
20141216 La veille en TPE / PME by competitic
 
Oxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataOxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigData
 
i-expo 2013 : présentation du Linked Enterprise Data par Antidot avec témoign...
i-expo 2013 : présentation du Linked Enterprise Data par Antidot avec témoign...i-expo 2013 : présentation du Linked Enterprise Data par Antidot avec témoign...
i-expo 2013 : présentation du Linked Enterprise Data par Antidot avec témoign...
 
Déjeuner-débat EIM360 | Machine Learning et Transformation Digitale, un duo g...
Déjeuner-débat EIM360 | Machine Learning et Transformation Digitale, un duo g...Déjeuner-débat EIM360 | Machine Learning et Transformation Digitale, un duo g...
Déjeuner-débat EIM360 | Machine Learning et Transformation Digitale, un duo g...
 
L’internet des sciences humaines et sociales. Recherches - Perspectives
L’internet des sciences humaines et sociales. Recherches - Perspectives L’internet des sciences humaines et sociales. Recherches - Perspectives
L’internet des sciences humaines et sociales. Recherches - Perspectives
 
Conférence GFII - Constituer des profils d'experts scientifiques, de centres ...
Conférence GFII - Constituer des profils d'experts scientifiques, de centres ...Conférence GFII - Constituer des profils d'experts scientifiques, de centres ...
Conférence GFII - Constituer des profils d'experts scientifiques, de centres ...
 
Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...
Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...
Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...
 
Présentation Inter Ligere Icc2009
Présentation Inter Ligere Icc2009Présentation Inter Ligere Icc2009
Présentation Inter Ligere Icc2009
 
Structurez, Gérez, Valorisez vos contenus non structurés avec Luxid for Share...
Structurez, Gérez, Valorisez vos contenus non structurés avec Luxid for Share...Structurez, Gérez, Valorisez vos contenus non structurés avec Luxid for Share...
Structurez, Gérez, Valorisez vos contenus non structurés avec Luxid for Share...
 
Webschool du Jura - Le référencement par Absolute Création
Webschool du Jura - Le référencement par Absolute CréationWebschool du Jura - Le référencement par Absolute Création
Webschool du Jura - Le référencement par Absolute Création
 
Cours SEO débutant Polycom Lausanne
Cours SEO débutant Polycom LausanneCours SEO débutant Polycom Lausanne
Cours SEO débutant Polycom Lausanne
 

Plus de Smile I.T is open

Plus de Smile I.T is open (9)

Streamlined CMS - DrupalCon Session
Streamlined CMS - DrupalCon SessionStreamlined CMS - DrupalCon Session
Streamlined CMS - DrupalCon Session
 
Deploy your contents with entity share
Deploy your contents with entity share   Deploy your contents with entity share
Deploy your contents with entity share
 
ROM Android Customs
ROM Android Customs ROM Android Customs
ROM Android Customs
 
[Smile] atelier spark - salon big data 13032018
[Smile]   atelier spark - salon big data 13032018[Smile]   atelier spark - salon big data 13032018
[Smile] atelier spark - salon big data 13032018
 
Blend Web Mix - Hackathon, Quand on ne sait pas où on va, autant y aller le ...
Blend Web Mix - Hackathon, Quand on ne sait pas où on va, autant y aller le ...Blend Web Mix - Hackathon, Quand on ne sait pas où on va, autant y aller le ...
Blend Web Mix - Hackathon, Quand on ne sait pas où on va, autant y aller le ...
 
eZ conference - Symfony Bundle enabling webfactory features
eZ conference - Symfony Bundle enabling webfactory featureseZ conference - Symfony Bundle enabling webfactory features
eZ conference - Symfony Bundle enabling webfactory features
 
Les quick wins de l'UX
Les quick wins de l'UXLes quick wins de l'UX
Les quick wins de l'UX
 
Webinar SMILE : "L'Open Source, un accélérateur d'innovation pour les objets ...
Webinar SMILE : "L'Open Source, un accélérateur d'innovation pour les objets ...Webinar SMILE : "L'Open Source, un accélérateur d'innovation pour les objets ...
Webinar SMILE : "L'Open Source, un accélérateur d'innovation pour les objets ...
 
Meet Magento : Connected store with magento 2
Meet Magento : Connected store with magento 2Meet Magento : Connected store with magento 2
Meet Magento : Connected store with magento 2
 

Offre Search

  • 2. OÙ SE TROUVE LA VALEUR ? Business Données Contenus « Legacy » Documents Pour l’extraire, vos informations doivent être • Référencées • Intégrées • Uniformisées (indexées) • Liées (entre elles) • Auditées • Reformatées • …
  • 3. 3 VOTRE MOTEUR DE RECHERCHE Le bon moteur pour vos informations se trouve ici ! L’OPEN SOURCE OFFRE UNE LARGE GAMME DE SOLUTIONS
  • 4. 4 ET DE NOMBREUX OUTILS POUR L’AMÉLIORER Des briques open source pour les fonctions clés :  Analyse sémantique  Expansion de recherche  Clustering automatique  Gestion de thésaurus ginco
  • 6. 6 Médias e-commerce Secteur Public Portails DES RÉFÉRENCES…
  • 8. 10 ELASTICSEARCH UN ÉCOSYSTÈME ORIENTÉ DONNÉES ElasticSearch Moteur de recherche et analytics Logstash Collecte, enrichissement de données Marvel Monitoring solution Watcher Alertes & notifications basées sur les données Kibana Visualisation et exploration de données Shield Sécurité et contrôle d’accès aux données. Beats Collecte de données réseaux
  • 9. 11 ELASTICSEARCH Moteur de recherche et d’analyse REST  Construit sur Apache Lucene  Chez Smile : remplacement de SolR Licence Open Source  Apache 2 Fonctionnalités uniques  Percolation  Agrégations  Intégration Hadoop & Spark Simple à mettre en œuvre  Courbe d’apprentissage rapide  Déploiement et administration simple QU’EST-CE QUE C’EST ? Recherche fulltext Données hétérogènes & schéma évolutif Indexation temps réel Analyse temps réel Distribué & haute disponibilité
  • 10. 12 ELASTIC.CO L’ENTREPRISE DERRIÈRE ELASTICSEARCH Partenaire privilégié avec Smile 2 sièges sociaux  EU : Amsterdam (Pays-Bas)  US : Los Altos (Californie) Présence commerciale & opérationnelle en France Un produit leader  Plus de 8 millions de téléchargements depuis 2008  > 500 000 téléchargements par mois 150 employés Croissance forte à 3 chiffres +400% ces 9 derniers mois BusinessModel •Ventes de support et de formation pour ES •3 niveaux de support (Silver, Gold, Premium). Par nœuds •Différents SLA y compris 24/7 SLA •Produits réservés aux souscripteurs de support : Shield, Marvel & Watcher Investors •Benchmark Capital $10M Series A, 2012 •Index Ventures $24M Series B, 2013 With participation from Benchmark Capital •New Enterprise Associates $70M Series C, 2014 With participation from Benchmark Capital and Index Ventures
  • 12. 14 USE CASE Répondre à l’enjeu stratégique d’une vision complète du client  Chaque client a des interactions multiples avec votre marque  Chaque canal régénère des traces techniques (Web, mobile, téléphone, magasin) Pourquoi faire ?  Conseil : en magasin, par téléphone, avant un rendez-vous  Recommandation : le bon contenu à la bonne personne  Ciblage d’opération marketing : segmentation, corrélation offre / profil  … Et comment ?  Collecter et analyser de grandes volumétries d’informations sur les clients et les prospects  Exploiter les Framework du Big Data et d’Elastic pour apporter une réponse opérationnelle au métier VUE CLIENT À 360°
  • 13. 15 Index client à 360° USE CASE VUE CLIENT À 360° Clients Prospects Collecte Indexation donnée comportementale Smile_Modules : Système Big Data Un dispositif de collecte des données comportementales (web, in store, téléphone…) A APIs API Vue Client à 360° API Ciblage client API Recommandations … Sources de données traditionnelles CRM Help Desk … Système de traitement Système de stockage / historisation
  • 14. USE CASE • Calcul d’un score d’appétence par catégorie de produit / offre • Permet d’orienter la relation client lors des contacts 1 to 1 (in-store ou par téléphone) • Permet d’établir des listes de prospection  Ex: Tous les clients intéressés par le rayon « Jeux PS4 »  Prospection automatique (mailing, notifications,…) ou sollicitation ciblée (téléphone) VUE CLIENT À 360° Exemple de notre projet interne Le marketing créé des contenus à forte valeur ajoutée dont la consultation est un indicateur sur d’appétence Relativement simple sur un système e-commerce : la fiche produit
  • 15. UN MODULE SMILE POUR MAGENTO
  • 16. UN MOTEUR DE RECHERCHE POUR LE E-COMMERCE Objectif du projet : • Disposer d’un moteur de recherche spécialisé dans le e-commerce • Fonctionnalités fulltext et de merchandising à l’état de l’art • Inclure des mécanismes d’optimisation qui s’appuient sur le comportement des utilisateurs • Projet diffusé en Open Source MODULE ELASTICSEARCH POUR MAGENTO Architecture technique Website Users Search Queries Catalog Index Behavioral Data Index Website Usage Collect Data Smile Webtracker Product Data Indexing User Behavior Indexing Smile_ElasticSearch Smile_VirtualCategories Smile_Tracker Smile_SearchOptimizer Smile_Modules : Le dispositif de collecte des données utilisateurs via web tracking permet d’agir sur la pertinence en temps réel Il est construit sur des briques Big Data : Apache Spark & Apache Kafka
  • 18. 21 SMILE ELASTICSEARCH BOOSTER VOTRE INTRANET Facettes  Sélection de facettes multiples  Gestion multi sources et sur les sources  Filtre sur date, sur les notes, sur les auteurs  Personnalisation facile par les développeurs Autocomplétion  Recherche populaires, produits, catégories,  Extensible pour ajouter d’autres contenus : bases, CMS… Amélioration de la recherche plein texte  Pondération de chaque attribut pour la recherche, depuis le back-office  Recherche floue : « Frankenshten » donnera « Frankenstein »
  • 19. 22 SMILE ELASTICSEARCH BOOSTER VOTRE INTRANET Catégories intelligentes  Définition de catégories par des règles (en plus d’une sélection manuelle)  Interface de gestion conviviale et intégrée Optimisations de la pertinence  Ajout de règles métiers pour modifier la pertinence o « Booster les contenus produits ou notés par des experts » o « faire le lien entre un même contenu stocké deux fois »  Extensible par un framework de développements
  • 20. 23 SMILE ELASTICSEARCH BOOSTER VOTRE INTRANET Visualisation des résultats  Affichage des résultats avec et sans l’optimiseur  Permettre de raffiner les résultats Tri au sein des catégories virtuelles  Pour déterminer manuellement les positions des produits au sein des catégories définies automatiquement par des règles o Ex : positionner une « réglementation européenne récente » en fonction d’une requête donnée (mise en avant) Tri dans les résultats de recherche  Permet d’ordonner les produits qui sont affichés pour des recherches définies. o Ex : mise en avant de la robe « Kali » pour la requête de recherche « robe » (ou « robes »…)
  • 21. 28 + 20 A QUOI SERT UN MOTEUR DE RECHERCHE ? Ce que les utilisateurs attendent  Trouver  Fédérer / uniformiser Ce qu’il faut faire  Un moteur rapide et adapté  Une bonne exploitation de l’indexation  La gestion des droits  La prise en compte de tous les contenus (Web / document / produit…)  Gérer le « bruit » et « silence »  Exploiter les outils à valeur ajoutée o Classification, thésaurus, ontologie…
  • 22. 29 FONCTIONS ESSENTIELLES Indexation des contenus  Crawler – temps différé  Connecteur – temps réel Deux types de recherches  « plein texte » (Full text) vs. documentaire  Fédérée avec gestion des droits des utilisateurs Exploitation des contenus  Classement / navigation / cluster  Statistique / administration Intégration  API, Webservice…  Gestion des droits (SSO)
  • 23. 30 Morpho-syntaxique • Correction et phonétique • Cross-lingue • Extraction d’entités nommées Sémantique • Analyse du sens (meaning) • Recherche par l’exemple • Catégorisation Statistique • Indexation plein texte • Analyse de corpus • Détection des liens • Extraction de concept Structurée • Indexation structurée • Navigation multidimensionnelle • Exploitation des métadonnées COMMENT FAIT ON LA RECHERCHE ? LES TYPES D’ANALYSE
  • 24. 31 COMMENT AMÉLIORER LA RECHERCHE ? Registre linguistique  Lemmatisation (réduction au signifiant)  Synonomie, mots vides, orthographe  Sémantique Registre mathématique  Pertinence : champs, proximité, usage  Pondération  Texte mining TECHNIQUES AVANCÉES
  • 25. RECHERCHE FÉDÉRÉE ONE SEARCH FOR ALL Trouver dans plusieurs ensembles de contenus Les bases sont hétérogènes et leur plus petit commun dénominateur (ppcm) réduit, l’objectif est de ne pas passer à côté d’une information. Fonctions de recherche dépendant à la technologie utilisée (crawling, connecteur)
  • 26. 33 Export des contenus indexe Crawling de base(s) Connecteur • Contrôle des contenus a priori • Temps réel • Contrôle des contenus à postériorité (crawler) • Pas de temps réel • Gestion des droits • Temps réel • Maintenance importante indexe indexe INDEXATION DES CONTENUS SUR QUOI S’EXÉCUTE LA RECHERCHE ?
  • 27. 34 INDEXATION DES CONTENUS Nombre de bases Hétérogénéité technologique Evolutivité du système Architecture des bases  Centralisées / réparties  Bases internes, externes  Contrôlées ou non (internet) Puissance de recherche  Opérateurs disponibles  Vitesse d’exécution / nombre de recherches ELÉMENTS D’ARBITRAGE DE CHOIX DES MÉTHODES
  • 28. ARCHITECTURE DES MOTEURS LES CAS FRÉQUENTS Brique intégrée  embarquée dans une solution Brique « branchée »  mais indépendante moteur moteur requête
  • 29. TYPES DE RECHERCHES Quel est votre projet ?  Sachez identifier les leviers de succès Recherche (simple)  trouver quelque chose dans un ensemble  Souvent « Google like » o Simple et intelligent Recherche fédérée  trouver quelque chose dans plusieurs ensembles  Souvent plus élaborée o Simple et puissant Recherche sur le poste de travail  Trouver quelque chose sur son ordinateur  Le plus souvent intégré à l’OS
  • 30. EXPLOITATION DES RÉSULTATS FONCTIONS CLÉS Navigation dans les résultats  Catégorisation (clustering)  Affichage par facettes Trier et classer  Filtrer et affiner  Thésaurus, plan de classement Export  Liste  Graphique Alerte  Requêtes rejouées périodiquement  Communication du différentiel On ne cherche jamais que pour trouver