Table Ronde du 20/06 animée par Yann Sauvageon (@yahn)
Daphne Garcin - EXPEDIA - Senior SEM Specialist
Emmanuel Alix - L'EQUIPE 24/24 Directeur Marketing et Projets
Nicolas Desgranges - ORANGE Responsable e-business & search activities
Fabien Poulard - DICTANOVA - Fondateur
Les nouveaux usages de recherche :
- Poussés par des objets de plus en plus connectés : Le mobile, Les Google Glass, Les montres connectés (Android Wear)
- Recherche vocale : En quoi est-ce différent de la recherche classique ? Comment Google s’adapte et prépare ce nouvel usage ?
- Recherche conversationnelle : Dialoguer avec Google, c’est déjà possible. Il pourrait aussi nous répondre
Comment Google s’adapte (et façonne) à ces nouveaux usages :
- Google souhaite comprendre l’intention qui se cache derrière votre requête.
- La sémantique : Du mot clé aux entités : Freebase, Knowledge Graph, Hummingbird.
- La réponse directe de Google ? Les nouveaux formats de résultats : les « Cards », le « knowledge graph », les carrousels…
Comment s’adapter à ces changements de fond ?
- Un changement d’approche dans l’écriture des textes
- La thématique de vos sites
- Le balisage sémantique (Schema.org)
3. Daphné Garcin / Expedia Inc.
Spécialiste SEM Senior Expedia
› 10 ans d’expérience professionnelle, dont 5 en marketing digital et 3 en SEM
› Expérience globale sur les marchés européens, américains et asiatiques
› Responsable de stratégie et d’exécution SEM (budgets de l’ordre du M$ /an)
Expedia Inc
› Agence de voyage en ligne (OTA) fondée en 2001, spin off de Microsoft
› L’un des 2 leaders mondiaux en vente d’hôtels
› Expedia vend aussi des vols, séjours, activités, locations de voitures et
croisières en temps que tierce-partie (+ technologie en white label)
Mes intérêts
› Passion pour les produits de search et Google
› Comprendre l’évolution des usages et s’adapter à un marketing digital de plus
en plus informé, automatisé, complexe et sous pression compétitive
5. Nicolas Desgranges / Orange
Directeur marketing Search Orange
› Orange et son moteur de recherche = Un moteur de recherche généraliste WEB
et spécialisé sur l’écosystème Orange
6. Fabien Poulard / Dictanova
Dirigeant Fondateur de Dictanova SAS
› Docteur en TAL (informatique +
linguistique)
Dictanova
› Solutions pour l’acquisition de
connaissance marché (consommateurs
et concurrents)
› Fondée en 2011
› 12 personnes aujourd’hui
Industrialise l'analyse de verbatim
par la rigueur linguistique
7. Sommaire
Les nouveaux usages de recherche
Comment Google façonne ces nouveaux usages
Comment s’adapter à ces changements de fond
21. 1/ Les nouveaux usages de recherche
Constat sur les nouveaux usages
de recherche
Le clavier est inadapté sur des
objets connectés ou des supports
écrans déportés (TV, voiture,..).
Une réponse immédiate est
souhaitée à la place d’une liste
standard de 15 liens.
23. 1/ Les nouveaux usages de recherche
De nouvelles typologies de recherche
› Depuis que la recherche sur mobile est devenue naturelle (+ de 16% de nos
recherches en 2013 !), on constate les évolutions suivantes :
Recherches de plus de 3 mots en langage naturel
Avec des abréviations (fréquent sur mobile)
Sans vigilance sur les fautes d’orthographes / de frappe
Des questions de plus en plus pointues
24. 1/ Les nouveaux usages de recherche
De nouvelles typologies de recherche
Variations autour de
l’orthographe
banque populaire du massif central
25. 1/ Les nouveaux usages de recherche
Mobile > L’optique SEM
› Part des clicks payants
› Le mobile croit rapidement.
› Passage de 7,3% a 12,5% (Janvier a Décembre 2013 dans la zone Euro*)
› Inflation de CPC en Mobile
› 26% d’augmentation en zone Euro de 2012 a 2013*
(le Mobile rejoint presque le Desktop en CPC moyen, alors que l’attribution reste
encore un domaine a éclaircir et améliorer dans l’industrie)
› Evolution des requêtes
› Pas de variation poussée des mots clé sur Mobile versus Desktop
› Différences sur la concision et le caractère immédiat/local des requêtes
*selon une étude de Marin Software : « Mobile Search Advertising Around The Globe » (2014)
32. 2/ Comment Google façonne ces nouveaux usages
Recherche vocale et conversationnelle
33.
34.
35.
36.
37.
38.
39. L‘analyse sémantique devient obligatoire pour les
moteurs de recherche
reconnaissance
vocale
(speech2text)
1) extraction : sémantique :
reconnaissance des termes pertinents
2) exploitation
appel du service avec bons paramètres
réponse
« quel temps
fait il à Lyon »
« temps » + « lyon » =
Météo + lyon
service météo
paramètre ville = lyon
40. C’est quoi l’analyse sémantique par les
moteurs de recherche ?
Une interprétation de la requête de l’internaute
L’exploitation des micro-formats > nouvelles informations sémantiques
dans les pages web
..et le web sémantique ? > des résultats enrichis de nouvelles
informations immédiates grâce au graphe de liens
42. ex sister in law 19 juin 1972
41 ans
loves
jealous
A quoi ça sert ?
43. Les dessous de la recherche sémantique
RI 1990 :
› Retourner le document correspondant à
une requête
› Un doute ? retourner une liste de
documents
› Espérons que quelqu’un ait utilisé ces
mots clés !
RI 1998 :
› Trop de documents pour une même
requête
› Prise en compte d’éléments extérieurs (ex
: Page Rank)
44. Les dessous de la recherche sémantique
Sémantique ?
› Lexical
› Syntaxique
› Sémantique (sens local)
› Discursif
› Pragmatique
QA ?
› Trouver la réponse à une question
› Extraction d’information =
identifier l’information dans le
contenu
› Plus facile si on balise ladite
information -> microdata/rdfa
45. Les dessous de la recherche sémantique
QA = recherche de motifs et réécritures
› Analyse de la requête (quel est <…> ? Quand <…> ?)
› Extraction d’information lors de l’indexation (X est Y, X est né le Z)
46. Les dessous de la recherche sémantique
QA = recherche de motifs et réécritures
› Analyse de la requête (quel est <…> ? Quand <…> ?)
› Extraction d’information lors de l’indexation (X est Y, X est né le Z)
47. Le problème des ambiguïtés
Recherche ~ Index ~ chaînes de caractères
› Homonymies
› Tous les mots ne sont pas égaux (substantifs, verbes…)
› Les entités nommées ont un rôle particulier
48. L’apport des entités nommées
Entités nommées
› Objets textuels qui désignent une
chose unique et précise du « monde
réel »
› Personne, lieu, date, valeurs,
entreprise…
Rôles d’« ancres sémantique » des
requêtes
› Besoin de reconnaître les entités
dans les requêtes
› Base sémantique (RDF) : Freebase /
Dbpedia…
› Knowledge graph !
49. Exemples d’usage du knowledge graph
Identification de l’entité Paris (nom de lieu) : interrogation
d’une base de données structurées externe
50. Exemples d’usage du knowledge graph
Identification de « Leonardo DiCaprio » comme une référence à
l’acteur > Extraction de la filmographie de l’acteur
51. Exemples d’usage du knowledge graph
« Équipe de France » est une référence unique et précise à la sélection nationale de football
(et tout un tas d’autres sports) > Utilisation du contexte de l’actualité pour sortir les résultats
de la coupe du monde
52. Exemples d’usage du knowledge graph
« Nantes » est une (très jolie) ville > Extraction des principaux
établissements situés à Nantes qui sont de type « restaurant »
53. Exemples d’usage du knowledge graph
« x-men » est le nom d’une série de films dont un opus est à l’affiche en ce
moment et « Nantes » est une ville > Affichage des horaires des séances du dernier
film X-Men dans les cinémas de Nantes
54. L’ambiguïté des entités nommées
Du texte à l’entité : même problème
d’ambiguïté
Besoin de contexte pour résoudre
l’ambiguïté
› Contexte dans la requête
› Contexte dans l’historique de
navigation, la géolocalisation…
57. Mais comment est-ce possible ?
Algorithmes connus (machine learning)
… Mais besoin de (beaucoup) de données d’apprentissage
Base d’entités = Freebase
Géoloc. d’établissements = Google places
Données structurées = opendata + microformats
Apprentissage = votre clic sur le bon lien !
Contexte = n-grams extraits des pages et des livres (modèles de langue)
62. Satisfaire l’internaute Orange dans ses besoins de réponses immédiates
pour le fidéliser
Sur Orange : l’enrichissement des résultats
CTR
= 30% !!
CTR
= 2%
63. 2/ Comment Google façonne
ces nouveaux usages
Impact SEM
› Knowledge Graph / Answer Box / PLAs
› Réduction de l’espace des liens sponsorisés
› Inflation de CPC dans un contexte de visibilité réduite en SEM
› L’invitation de Google a s’adapter à de nouveaux produits (PLA).
› Exemple du secteur hôtelier (destinations)
› Le haut de page SEM est réduit à 1-2 annonceurs, la droite à 3 annonceurs.
› Nouveaux produits Google: HPA (PLA); Google maps dans une moindre
mesure.
› Le SEO disparait du haut de l’écran ou « above the fold ».
65. 2/ Comment Google façonne
ces nouveaux usages
HPA – PLA pour Hotels
• Google met l’accent sur la comparaison de prix
• Tentative de bypass de sites comme Tripadvisor
• Le prix comme facteur du quality score donc du
calcul du CPC et de la position sur page
Google change la donne en terme de visibilité
des acteurs.
66. 3/ S’adapter
Evolution de la SERP par secteur: ex. le secteur hotelier (propriétés)
›Google facilite l’acces aux revues/ critiques et compare les prix
›Google propose ainsi une compétition directe avec des sites comme Tripadvisor
›Google met également en avant la fonctionnalité Maps et Google+
67. 3/ S’adapter
SERP sur le secteur aérien
›Google Flights: comparateurs de vols
›Compétition directe avec des sites comme Skyscanner, Kayak ou Expedia
›SEO disparait du haut d’écran
68.
69. « Answer Box »
Quel est votre regard sur les « answer box » ?
Comment pensez-vous que cela va évoluer ?
82. 3/ S’adapter > Schema.org
Que peut-on décrire ?
~ 100
catégories au
départ
+ 1 200
aujourd’hui
83. 3/ S’adapter > Schema.org
Le vocabulaire évolue rapidement
Sept. 2011
News
Nov. 2011
Annonces d’emploi
Novembre 2012
Ecommerce
Juin 2012
Santé et Medical
Publications Techniques
Août 2013
Service civil
Décembre 2013
Extension TV /
Radio
Février 2014
Sports
2011 2012 2013 2014
87. 3/ S’adapter > Schema.org
Demain
Mobile / Voice /
Conversationnel
Thématique
Être reconnu comme
une réponse
Balisage Schema.org
Avant
Desktop Mot Clé
Répétition
« simpliste »
Balises Méta
88. 3/ S’adapter
Réflexion sur une adaptation par device
Aujourd’hui
• Un rédacteur
• Un seul
éditeur
• En 1er lieu
pour le web
Demain
• Un rédacteur
• Plusieurs
éditeurs
• Mieux
« éditer
l’usage »
89. titre de la présentation
Les micro-formats sont ils vraiment utilisés dans les sites
web ? Vue de notre observatoire du web francophone
Type
Nombre de
pages
http://data-vocabulary.org/Breadcrumb 78 470 400
http://schema.org/MusicRecording 28 062 720
http://schema.org/VideoObject 27 659 520
http://schema.org/Person 25 440 000
http://schema.org/WebPage 24 084 480
http://schema.org/Article 21 335 040
http://schema.org/Product 19 703 040
http://schema.org/Blog 12 384 000
http://schema.org/Organization 12 138 240
http://schema.org/BlogPosting 11 089 920
http://schema.org/MusicPlaylist 10 801 920
http://data-vocabulary.org/Product 8 344 320
http://schema.org/LocalBusiness 6 608 640
http://data-vocabulary.org/Review-aggregate 6 182 400
http://schema.org/Book 6 028 800
http://schema.org/ImageObject 5 936 640
http://schema.org/MusicAlbum 4 308 480
3 formats en compétition :
Microdata (Google, Bing, Yahoo, Yandex)
RDFa (W3C)
Microformats
la famille des RDFA
15-16% des domaines,
en augmentation (+2% en 2013-2014)
la famille des microformats
6-7% des hosts, stagnation
(en voie de disparition)
la famille des micro-datas
8-9% des hosts, en augmentation
(+2% en 2013-2014)
principalement du schema.org
90. La position du moteur de recherche
d’Orange : investir dans l’open data &
sémantique
mettre en valeur les sites francophones à forte valeur ajoutée par leur
micro-formats
ouvrir notre observatoire du web avec des APIS pour inciter aux
innovations Search
mieux comprendre les questions complexes sur l’Assistance Orange,
(notre mission première) avec l’analyse sémantique des requêtes
92. Les points à retenir
Changement des
usages de recherches >
Mobile, vocal,
conversationnel
Meilleure
compréhension de la
requête > sens des
mots + entités
nommées + contexte
Recherche de la
réponse > formulations,
champ sémantique,
schema.org