SlideShare une entreprise Scribd logo
1#seocamp
FUTUR DU SEO & TECHNOS DE TAL
2#seocamp
Marguerite Leenhardt
PhD Linguistique & TAL, MSc. IL & MSc. IM
CEO & co-founder @ XIKO
Présidente & co-founder @ AFTAL
Girlz in Web & Les Expertes du Numérique
Concours Mondial de l’Innovation (Big Data), Prix Syntec Etudes “Idées pour le Futur”
3#seocamp
Search : une application de fouille de textes qui
intègre des techniques de Traitement
Automatique des Langues (Natural Language
Processing)
Contenu
Comprendre l’intention de recherche
L’usage et l’attente des utilisateurs finaux a
changé : vers le Natural Language Search
Développer des fonctionnalités intelligentes
pour le moteur de recherche
TAL & search
TAL & SEO : points communs, parcours liés
tous crédits photos: pexels.com
4#seocamp
QUOI de neuf ?
5#seocamp
▪ Apprentissage machine (machine learning)
○ par opposition à l’approche procédurale (règles de
classification prédéfinies manuellement)
Focus Word Embeddings
Apprentissage machine pour le TAL : exemple d’une innovation actuelle
6#seocamp
▪ Apprentissage machine (machine learning)
○ apprendre à une machine à opérer une classification en
identifiant un objet en fonction de ses caractéristiques
(features)
Focus Word Embeddings
Apprentissage machine pour le TAL : exemple d’une innovation actuelle
D’après Bird et al. 2009, Bird, S., Klein, E., & Loper, E. (2009). Natural language processing with Python. O'Reilly.
7#seocamp
▪ Apprentissage machine (machine learning)
○ modèles
■ symboliques (ex: arbres de décision)
■ bayésiens (ex: bayésien naïf)
■ régression (ex: entropie maximale)
■ géométriques (ex: SVM, Support Vector Machines)
■ modèles neuronaux
Focus Word Embeddings
Apprentissage machine pour le TAL : exemple d’une innovation actuelle
8#seocamp
▪ Modèles neuronaux et analyse distributionnelle
○ le but : apprendre à une machine à analyser le sens par les
propriétés distributionnelles des unités textuelles
○ le moyen : le prolongement de la représentation
■ représentation des unités textuelles et de leurs contextes dans
le même espace vectoriel (= couche cachée embarque les
pondérations de chacun des éléments de contexte associé à chaque unité textuelle)
○ le résultat : les unités textuelles qui ont des contextes
similaires sont rapprochées (et c’est différent du tf-idf qui dépend du document!)
Focus Word Embeddings
Apprentissage machine pour le TAL : exemple d’une innovation actuelle
9#seocamp
▪ Modèles neuronaux et analyse distributionnelle
○ les algos et les représentations des unités textuelles
■ word2vec : vecteurs appris sur les mots
■ fastText : vecteurs appris sur les n-gram composant le mot
en plus d’être appris sur les mots
■ gloVe : vecteurs appris avec les co-occurrences statistiques
○ les avantages : représentations, données d’apprentissage
○ les écueils : passage à l’échelle, biais
Focus Word Embeddings
Apprentissage machine pour le TAL : exemple d’une innovation actuelle
10#seocamp
VOCAL vers le multimodal
11#seocamp
La recherche vocale devient le nouveau terrain de jeu des marques qui ont de fortes attentes
envers le search. C’est aussi un levier de croissance majeur pour l’ensemble du marché SEO.
Focus Vocal Apps
Au-delà du texte : les applications conversationnelles
La prospective est positive, les chiffres Comscore
prévoient que la moitié des requêtes seront
dites en 2020 (chiffres 2016).
50% en 2020
12#seocamp
Focus Vocal Apps
Au-delà du texte : les applications conversationnelles
Des progrès conséquents en text-to-speech
(synthèse vocale) et speech-to-text (analyse de
l’oral) rendent accessibles les composants.
Les améliorations
Une adoption croissante côté utilisateurs mène
certains à prédire que, d’ici 10 ans, les interfaces
qui ne seront pas vocales seront une curiosité.
(Embracing the Voice Revolution, Google team keynote,
Smart Voice Summit)
Les attentes
Des essais et expérimentations dans tous les
secteurs, côté transactionnel (e.g. retail,
transports) et contenus (branding).
Les chantiers
La qualité de l’interaction et la gestion du
multilinguisme sont les principaux écueils
immédiats.
Les problèmes
13#seocamp
Opportunité pour le SEO
La démocratisation des interfaces vocales
pour délivrer des expériences de contenus
et de services est un premier pas vers le
SEO multimodal
Focus Vocal Apps
Au-delà du texte : les applications conversationnelles
Défis dans le contenu
Tous les défis actuels en analyse de
contenu (sémantique, multilinguisme,
qualité des résultats à l’échelle) prennent
de nouvelles dimensions
Défis dans le contexte
De nouveaux défis apparaissent (naturel
de la conversation, fusion des modalités
texte/son/image/temps/contexte,
conception de l’expérience multimodale)
14#seocamp
Le texte et la voix ne sont pas les seules modalités
L’image et la vidéo, la situation physique et
numérique (géoloc., historiques) comme la
situation d’interaction homme-machine, posent
des défis spécifiques, par exemple :
- interfaçage et fusion des entrées
multimodales
- contextualisation des requêtes
- intelligence conversationnelle
Vers des standards du web multimodal :
- W3C Multimodal Interaction Working
Group
- Recherches appliquées au sein de
différentes communautés scientifiques
reliées par l’analyse des données
produites par et entourant l’humain
- Avec un focus sur le search multimodal
depuis 10 ans
15#seocamp
MULTImodal
16#seocamp
▪ Interfaçage et fusion des entrées multimodales
○ le but : la formalisation du cadre
■ gérer des entrées hétérogènes
■ combiner des indices
○ le moyen : la fusion des résultats
■ combinaison des résultats
■ plusieurs moteurs (meta-search)
■ plusieurs entrées unimodales
○ le défi : la gestion des interférences
■ contextualiser les modalités
■ pondérer contextuellement
Focus Mutimodal
L’interaction dans toutes ses dimensions
D’après Kennedy et al. 2008, Kennedy, L., Chang, S-F., & Natsev, A. (2008). Query-Adaptive Fusion for Multimodal Search, Proceedings of the IEEE.
17#seocamp
▪ Prédiction de la performance des requêtes
○ le but : la gestion des requêtes incomplètes ou bruitées
■ re-contextualiser
■ à partir des documents
○ le moyen : le prolongement de la représentation
■ segmentation de requête
■ mesure d’overlap des vecteurs
○ le défi : la rationalisation du flux
■ optimiser le pré-traitement des requêtes
■ évaluer la complexité pour adapter le workflow
Focus Mutimodal
L’interaction dans toutes ses dimensions
D’après Kennedy et al. 2008, Kennedy, L., Chang, S-F., & Natsev, A. (2008). Query-Adaptive Fusion for Multimodal Search, Proceedings of the IEEE.
18#seocamp
▪ Redesign des principes d’interface
○ le but : adapter la conception à la multimodalité
■ répondre aux enjeux identifiés aujourd’hui
■ avoir un cadre pour penser ceux de demain
○ le moyen : l’expérimentation
■ associer les commandes uni / multi
■ ajouter la dimension gestuelle
■ préciser les différentes méthodes
○ le défi : la gestion des interactions
■ entre les composants
■ avec l’utilisateur et à l’échelle
Focus Mutimodal
L’interaction dans toutes ses dimensions
D’après Etzold et al. 2012, Etzold, J., Brousseau, A., Grimm, P. & Steiner, T. (2012). Context-aware Querying for Multimodal Search Engines, Google Germany.
19#seocamp
Les défis seront à penser systématiquement en n-dimensions (principe de l’embedding
et du prolongement des représentations, fusion des modalités
texte/son/image/temps/contexte) : autant de compétences à intégrer et organiser
Les prochaines avancées dans la conception des dimensions viendront pour partie de
l’analyse automatique des interactions et des conversations, émergente en TAL
Multimodal = pluridisciplinarité + interaction
20#seocamp
Question Mug
● Un algo de Word Embedding
● autre que word2vec ?
21#seocamp
MERCI AUX SPONSORS
22#seocamp
Merci à vous !Marguerite Leenhardt | @MyLinguistics

Contenu connexe

Tendances

Petit Déj' "Ergonomie et SEO" organisé par Use Age le 26 Septembre 2013
Petit Déj' "Ergonomie et SEO" organisé par Use Age le 26 Septembre 2013Petit Déj' "Ergonomie et SEO" organisé par Use Age le 26 Septembre 2013
Petit Déj' "Ergonomie et SEO" organisé par Use Age le 26 Septembre 2013
Use Age
 
Les outils SEO ne servent à rien - SEOCamp'us 2018
Les outils SEO ne servent à rien - SEOCamp'us 2018Les outils SEO ne servent à rien - SEOCamp'us 2018
Les outils SEO ne servent à rien - SEOCamp'us 2018
Daniel Roch - SeoMix
 
Seo camp'us 2018 - cloaking is not a crime : Patrick Valibus
Seo camp'us 2018 - cloaking is not a crime : Patrick ValibusSeo camp'us 2018 - cloaking is not a crime : Patrick Valibus
Seo camp'us 2018 - cloaking is not a crime : Patrick Valibus
Patrick Valibus
 
Référencement 2.0
Référencement 2.0Référencement 2.0
Référencement 2.0
phalengry
 
Les 10 leviers à optimiser en 2018 pour votre SEO
Les 10 leviers à optimiser en 2018 pour votre SEOLes 10 leviers à optimiser en 2018 pour votre SEO
Les 10 leviers à optimiser en 2018 pour votre SEO
Nicolas Mercatili
 
Actualité SEO / SEA
Actualité SEO / SEAActualité SEO / SEA
Actualité SEO / SEA
Peak Ace
 
Taille du site et stratégies SEO - SEOCamp'us 2018
Taille du site et stratégies SEO - SEOCamp'us 2018Taille du site et stratégies SEO - SEOCamp'us 2018
Taille du site et stratégies SEO - SEOCamp'us 2018
Aurélien Delefosse
 
Séminaire Boostez votre référencement sur Google
Séminaire Boostez votre référencement sur GoogleSéminaire Boostez votre référencement sur Google
Séminaire Boostez votre référencement sur Google
Digital Link Sàrl
 
QueduWeb: Cas pratique SEO: lorsque les pages dupliquées sont les plus efficaces
QueduWeb: Cas pratique SEO: lorsque les pages dupliquées sont les plus efficacesQueduWeb: Cas pratique SEO: lorsque les pages dupliquées sont les plus efficaces
QueduWeb: Cas pratique SEO: lorsque les pages dupliquées sont les plus efficaces
Serge Esteves
 
SEO Camp Day Lorraine 2022 par Dan Bernier sur une étude de cas d’une campagn...
SEO Camp Day Lorraine 2022 par Dan Bernier sur une étude de cas d’une campagn...SEO Camp Day Lorraine 2022 par Dan Bernier sur une étude de cas d’une campagn...
SEO Camp Day Lorraine 2022 par Dan Bernier sur une étude de cas d’une campagn...
Dan Bernier
 
Cannibalisation SEO - Consultant SEO Julien Ringard
Cannibalisation SEO - Consultant SEO Julien RingardCannibalisation SEO - Consultant SEO Julien Ringard
Cannibalisation SEO - Consultant SEO Julien Ringard
Julien Ringard - Consultant SEO
 
Les blogs, toujours intéressants pour le SEO ?
Les blogs, toujours intéressants pour le SEO ?Les blogs, toujours intéressants pour le SEO ?
Les blogs, toujours intéressants pour le SEO ?
Peak Ace
 
Paris Retail Week 10 septembre 2018 - Comment booster les conversions de votr...
Paris Retail Week 10 septembre 2018 - Comment booster les conversions de votr...Paris Retail Week 10 septembre 2018 - Comment booster les conversions de votr...
Paris Retail Week 10 septembre 2018 - Comment booster les conversions de votr...
Peak Ace
 
Comment passer de SEO à SEO + data
Comment passer de SEO à SEO + dataComment passer de SEO à SEO + data
Comment passer de SEO à SEO + data
SEO CAMP
 
La longueur et structure parfaite d une page pour la placer 1ere position seo
La longueur et structure parfaite d une page pour la placer 1ere position  seoLa longueur et structure parfaite d une page pour la placer 1ere position  seo
La longueur et structure parfaite d une page pour la placer 1ere position seo
Julien Dereumaux
 
SEO Campus 2018 : La migration Voyages-sncf.com > OUI.sncf côté SEO
SEO Campus 2018 : La migration Voyages-sncf.com > OUI.sncf côté SEOSEO Campus 2018 : La migration Voyages-sncf.com > OUI.sncf côté SEO
SEO Campus 2018 : La migration Voyages-sncf.com > OUI.sncf côté SEO
Plantelin Nicolas
 
Webconférence du 8 mars 2018 - Comment obtenir et exploiter la positions 0 de...
Webconférence du 8 mars 2018 - Comment obtenir et exploiter la positions 0 de...Webconférence du 8 mars 2018 - Comment obtenir et exploiter la positions 0 de...
Webconférence du 8 mars 2018 - Comment obtenir et exploiter la positions 0 de...
Peak Ace
 
Webconf SF - 12-05-2016 - La recette pour un SEO réussi à l'international
Webconf SF - 12-05-2016 - La recette pour un SEO réussi à l'internationalWebconf SF - 12-05-2016 - La recette pour un SEO réussi à l'international
Webconf SF - 12-05-2016 - La recette pour un SEO réussi à l'international
Peak Ace
 
Formation : Techniques de rédaction web - Hack/Hackers Dakar
Formation : Techniques de rédaction web - Hack/Hackers DakarFormation : Techniques de rédaction web - Hack/Hackers Dakar
Formation : Techniques de rédaction web - Hack/Hackers Dakar
Mountaga CISSE
 
Seo campus 2015 - L'emploi des référenceurs en france
Seo campus 2015 - L'emploi des référenceurs en franceSeo campus 2015 - L'emploi des référenceurs en france
Seo campus 2015 - L'emploi des référenceurs en france
SEO CAMP
 

Tendances (20)

Petit Déj' "Ergonomie et SEO" organisé par Use Age le 26 Septembre 2013
Petit Déj' "Ergonomie et SEO" organisé par Use Age le 26 Septembre 2013Petit Déj' "Ergonomie et SEO" organisé par Use Age le 26 Septembre 2013
Petit Déj' "Ergonomie et SEO" organisé par Use Age le 26 Septembre 2013
 
Les outils SEO ne servent à rien - SEOCamp'us 2018
Les outils SEO ne servent à rien - SEOCamp'us 2018Les outils SEO ne servent à rien - SEOCamp'us 2018
Les outils SEO ne servent à rien - SEOCamp'us 2018
 
Seo camp'us 2018 - cloaking is not a crime : Patrick Valibus
Seo camp'us 2018 - cloaking is not a crime : Patrick ValibusSeo camp'us 2018 - cloaking is not a crime : Patrick Valibus
Seo camp'us 2018 - cloaking is not a crime : Patrick Valibus
 
Référencement 2.0
Référencement 2.0Référencement 2.0
Référencement 2.0
 
Les 10 leviers à optimiser en 2018 pour votre SEO
Les 10 leviers à optimiser en 2018 pour votre SEOLes 10 leviers à optimiser en 2018 pour votre SEO
Les 10 leviers à optimiser en 2018 pour votre SEO
 
Actualité SEO / SEA
Actualité SEO / SEAActualité SEO / SEA
Actualité SEO / SEA
 
Taille du site et stratégies SEO - SEOCamp'us 2018
Taille du site et stratégies SEO - SEOCamp'us 2018Taille du site et stratégies SEO - SEOCamp'us 2018
Taille du site et stratégies SEO - SEOCamp'us 2018
 
Séminaire Boostez votre référencement sur Google
Séminaire Boostez votre référencement sur GoogleSéminaire Boostez votre référencement sur Google
Séminaire Boostez votre référencement sur Google
 
QueduWeb: Cas pratique SEO: lorsque les pages dupliquées sont les plus efficaces
QueduWeb: Cas pratique SEO: lorsque les pages dupliquées sont les plus efficacesQueduWeb: Cas pratique SEO: lorsque les pages dupliquées sont les plus efficaces
QueduWeb: Cas pratique SEO: lorsque les pages dupliquées sont les plus efficaces
 
SEO Camp Day Lorraine 2022 par Dan Bernier sur une étude de cas d’une campagn...
SEO Camp Day Lorraine 2022 par Dan Bernier sur une étude de cas d’une campagn...SEO Camp Day Lorraine 2022 par Dan Bernier sur une étude de cas d’une campagn...
SEO Camp Day Lorraine 2022 par Dan Bernier sur une étude de cas d’une campagn...
 
Cannibalisation SEO - Consultant SEO Julien Ringard
Cannibalisation SEO - Consultant SEO Julien RingardCannibalisation SEO - Consultant SEO Julien Ringard
Cannibalisation SEO - Consultant SEO Julien Ringard
 
Les blogs, toujours intéressants pour le SEO ?
Les blogs, toujours intéressants pour le SEO ?Les blogs, toujours intéressants pour le SEO ?
Les blogs, toujours intéressants pour le SEO ?
 
Paris Retail Week 10 septembre 2018 - Comment booster les conversions de votr...
Paris Retail Week 10 septembre 2018 - Comment booster les conversions de votr...Paris Retail Week 10 septembre 2018 - Comment booster les conversions de votr...
Paris Retail Week 10 septembre 2018 - Comment booster les conversions de votr...
 
Comment passer de SEO à SEO + data
Comment passer de SEO à SEO + dataComment passer de SEO à SEO + data
Comment passer de SEO à SEO + data
 
La longueur et structure parfaite d une page pour la placer 1ere position seo
La longueur et structure parfaite d une page pour la placer 1ere position  seoLa longueur et structure parfaite d une page pour la placer 1ere position  seo
La longueur et structure parfaite d une page pour la placer 1ere position seo
 
SEO Campus 2018 : La migration Voyages-sncf.com > OUI.sncf côté SEO
SEO Campus 2018 : La migration Voyages-sncf.com > OUI.sncf côté SEOSEO Campus 2018 : La migration Voyages-sncf.com > OUI.sncf côté SEO
SEO Campus 2018 : La migration Voyages-sncf.com > OUI.sncf côté SEO
 
Webconférence du 8 mars 2018 - Comment obtenir et exploiter la positions 0 de...
Webconférence du 8 mars 2018 - Comment obtenir et exploiter la positions 0 de...Webconférence du 8 mars 2018 - Comment obtenir et exploiter la positions 0 de...
Webconférence du 8 mars 2018 - Comment obtenir et exploiter la positions 0 de...
 
Webconf SF - 12-05-2016 - La recette pour un SEO réussi à l'international
Webconf SF - 12-05-2016 - La recette pour un SEO réussi à l'internationalWebconf SF - 12-05-2016 - La recette pour un SEO réussi à l'international
Webconf SF - 12-05-2016 - La recette pour un SEO réussi à l'international
 
Formation : Techniques de rédaction web - Hack/Hackers Dakar
Formation : Techniques de rédaction web - Hack/Hackers DakarFormation : Techniques de rédaction web - Hack/Hackers Dakar
Formation : Techniques de rédaction web - Hack/Hackers Dakar
 
Seo campus 2015 - L'emploi des référenceurs en france
Seo campus 2015 - L'emploi des référenceurs en franceSeo campus 2015 - L'emploi des référenceurs en france
Seo campus 2015 - L'emploi des référenceurs en france
 

Similaire à Les technologies TAL et le futur du SEO

Projets d'Humanités numérique et collaboration de différents métiers
Projets d'Humanités numérique et collaboration de différents métiersProjets d'Humanités numérique et collaboration de différents métiers
Projets d'Humanités numérique et collaboration de différents métiers
Emmanuelle Morlock
 
Lmo02.ppt
Lmo02.pptLmo02.ppt
Projet+com02.ppt
Projet+com02.pptProjet+com02.ppt
Projet+com02.ppt
Yann-Gaël Guéhéneuc
 
Déjeuner-débat EIM360 | Machine Learning et Transformation Digitale, un duo g...
Déjeuner-débat EIM360 | Machine Learning et Transformation Digitale, un duo g...Déjeuner-débat EIM360 | Machine Learning et Transformation Digitale, un duo g...
Déjeuner-débat EIM360 | Machine Learning et Transformation Digitale, un duo g...
SOLLAN FRANCE
 
Personnalisation basée sur l'utilisation d'ontologies, utilisation du context...
Personnalisation basée sur l'utilisation d'ontologies, utilisation du context...Personnalisation basée sur l'utilisation d'ontologies, utilisation du context...
Personnalisation basée sur l'utilisation d'ontologies, utilisation du context...
louschwartz
 
Stages 2015
Stages 2015Stages 2015
Stages 2015
Fabian Restiaux
 
Introduction a l_agilite_iut_lyon_1_decembre2011
Introduction a l_agilite_iut_lyon_1_decembre2011Introduction a l_agilite_iut_lyon_1_decembre2011
Introduction a l_agilite_iut_lyon_1_decembre2011
agnes_crepet
 
Kit De Survie Techno et Web à l'usage des Entrepreneurs
Kit De Survie Techno et Web à l'usage des EntrepreneursKit De Survie Techno et Web à l'usage des Entrepreneurs
Kit De Survie Techno et Web à l'usage des Entrepreneurs
Stéphanie Hertrich
 
Sael Planifier et réaliser des sites Web
Sael Planifier et réaliser des sites WebSael Planifier et réaliser des sites Web
Sael Planifier et réaliser des sites Web
SAEL
 
Le web sémantique n'est pas antisocial (version de 2006)
Le web sémantique n'est pas antisocial (version de 2006)Le web sémantique n'est pas antisocial (version de 2006)
Le web sémantique n'est pas antisocial (version de 2006)
Fabien Gandon
 
Priows présentation des résultats
Priows présentation des résultats Priows présentation des résultats
Priows présentation des résultats
Gilbert Paquette
 
Une vue "Web Sémantique" de l'évoluation d'ontologies
Une vue "Web Sémantique" de l'évoluation d'ontologiesUne vue "Web Sémantique" de l'évoluation d'ontologies
Une vue "Web Sémantique" de l'évoluation d'ontologies
Mathieu d'Aquin
 
BigText, compréhension et inférence avancées sur les textes
BigText, compréhension et inférence avancées sur les textesBigText, compréhension et inférence avancées sur les textes
BigText, compréhension et inférence avancées sur les textes
PALO IT
 
Moteurs de recherche et web sémantique
Moteurs de recherche et web sémantiqueMoteurs de recherche et web sémantique
Moteurs de recherche et web sémantique
Antidot
 
Matinale "Data Science et Machine Learning"
Matinale "Data Science et Machine Learning"Matinale "Data Science et Machine Learning"
Matinale "Data Science et Machine Learning"
Aline Deschamps
 
EFAP-1 Introduction technologies web - 1ère séance 9/10/2017
EFAP-1 Introduction technologies web - 1ère séance 9/10/2017EFAP-1 Introduction technologies web - 1ère séance 9/10/2017
EFAP-1 Introduction technologies web - 1ère séance 9/10/2017
Beer Bergman
 
La "Data science" au service des entreprises
La "Data science" au service des entreprisesLa "Data science" au service des entreprises
La "Data science" au service des entreprises
Aymen ZAAFOURI
 
GESTION ELECTRONIQUE DE DOCUMENT
GESTION ELECTRONIQUE DE DOCUMENTGESTION ELECTRONIQUE DE DOCUMENT
GESTION ELECTRONIQUE DE DOCUMENT
Serge Wallas
 
Le prototypage et l'apprentissage organisationnel dans la pratique.
Le prototypage et l'apprentissage organisationnel dans la pratique.Le prototypage et l'apprentissage organisationnel dans la pratique.
Le prototypage et l'apprentissage organisationnel dans la pratique.
Dario Gomez Tafur
 

Similaire à Les technologies TAL et le futur du SEO (20)

Projets d'Humanités numérique et collaboration de différents métiers
Projets d'Humanités numérique et collaboration de différents métiersProjets d'Humanités numérique et collaboration de différents métiers
Projets d'Humanités numérique et collaboration de différents métiers
 
Lmo02.ppt
Lmo02.pptLmo02.ppt
Lmo02.ppt
 
Projet+com02.ppt
Projet+com02.pptProjet+com02.ppt
Projet+com02.ppt
 
Déjeuner-débat EIM360 | Machine Learning et Transformation Digitale, un duo g...
Déjeuner-débat EIM360 | Machine Learning et Transformation Digitale, un duo g...Déjeuner-débat EIM360 | Machine Learning et Transformation Digitale, un duo g...
Déjeuner-débat EIM360 | Machine Learning et Transformation Digitale, un duo g...
 
Personnalisation basée sur l'utilisation d'ontologies, utilisation du context...
Personnalisation basée sur l'utilisation d'ontologies, utilisation du context...Personnalisation basée sur l'utilisation d'ontologies, utilisation du context...
Personnalisation basée sur l'utilisation d'ontologies, utilisation du context...
 
Stages 2015
Stages 2015Stages 2015
Stages 2015
 
Introduction a l_agilite_iut_lyon_1_decembre2011
Introduction a l_agilite_iut_lyon_1_decembre2011Introduction a l_agilite_iut_lyon_1_decembre2011
Introduction a l_agilite_iut_lyon_1_decembre2011
 
Kit De Survie Techno et Web à l'usage des Entrepreneurs
Kit De Survie Techno et Web à l'usage des EntrepreneursKit De Survie Techno et Web à l'usage des Entrepreneurs
Kit De Survie Techno et Web à l'usage des Entrepreneurs
 
Sael Planifier et réaliser des sites Web
Sael Planifier et réaliser des sites WebSael Planifier et réaliser des sites Web
Sael Planifier et réaliser des sites Web
 
Le web sémantique n'est pas antisocial (version de 2006)
Le web sémantique n'est pas antisocial (version de 2006)Le web sémantique n'est pas antisocial (version de 2006)
Le web sémantique n'est pas antisocial (version de 2006)
 
Priows présentation des résultats
Priows présentation des résultats Priows présentation des résultats
Priows présentation des résultats
 
Une vue "Web Sémantique" de l'évoluation d'ontologies
Une vue "Web Sémantique" de l'évoluation d'ontologiesUne vue "Web Sémantique" de l'évoluation d'ontologies
Une vue "Web Sémantique" de l'évoluation d'ontologies
 
Présentation cice telos
Présentation cice   telosPrésentation cice   telos
Présentation cice telos
 
BigText, compréhension et inférence avancées sur les textes
BigText, compréhension et inférence avancées sur les textesBigText, compréhension et inférence avancées sur les textes
BigText, compréhension et inférence avancées sur les textes
 
Moteurs de recherche et web sémantique
Moteurs de recherche et web sémantiqueMoteurs de recherche et web sémantique
Moteurs de recherche et web sémantique
 
Matinale "Data Science et Machine Learning"
Matinale "Data Science et Machine Learning"Matinale "Data Science et Machine Learning"
Matinale "Data Science et Machine Learning"
 
EFAP-1 Introduction technologies web - 1ère séance 9/10/2017
EFAP-1 Introduction technologies web - 1ère séance 9/10/2017EFAP-1 Introduction technologies web - 1ère séance 9/10/2017
EFAP-1 Introduction technologies web - 1ère séance 9/10/2017
 
La "Data science" au service des entreprises
La "Data science" au service des entreprisesLa "Data science" au service des entreprises
La "Data science" au service des entreprises
 
GESTION ELECTRONIQUE DE DOCUMENT
GESTION ELECTRONIQUE DE DOCUMENTGESTION ELECTRONIQUE DE DOCUMENT
GESTION ELECTRONIQUE DE DOCUMENT
 
Le prototypage et l'apprentissage organisationnel dans la pratique.
Le prototypage et l'apprentissage organisationnel dans la pratique.Le prototypage et l'apprentissage organisationnel dans la pratique.
Le prototypage et l'apprentissage organisationnel dans la pratique.
 

Plus de SEO Camp Association

Didier Sampaolo - SEO EN 2019 : GAGNEZ DU TEMPS !
Didier Sampaolo - SEO EN 2019 : GAGNEZ DU TEMPS !Didier Sampaolo - SEO EN 2019 : GAGNEZ DU TEMPS !
Didier Sampaolo - SEO EN 2019 : GAGNEZ DU TEMPS !
SEO Camp Association
 
Sebestien Thibert - 10 tips qui aident à augmenter le chiffre d'affaires
Sebestien Thibert - 10 tips qui aident à augmenter le chiffre d'affairesSebestien Thibert - 10 tips qui aident à augmenter le chiffre d'affaires
Sebestien Thibert - 10 tips qui aident à augmenter le chiffre d'affaires
SEO Camp Association
 
Julien Anouilh - Faire décoller votre business avec Instagram, mode d'emploi !
Julien Anouilh - Faire décoller votre business avec Instagram, mode d'emploi !Julien Anouilh - Faire décoller votre business avec Instagram, mode d'emploi !
Julien Anouilh - Faire décoller votre business avec Instagram, mode d'emploi !
SEO Camp Association
 
Julien Ringard & Benjamin Thiers - Cannibalisation SEO
Julien Ringard & Benjamin Thiers - Cannibalisation SEO Julien Ringard & Benjamin Thiers - Cannibalisation SEO
Julien Ringard & Benjamin Thiers - Cannibalisation SEO
SEO Camp Association
 
Guillaume Eouzan - 10 Clés pour optimiser les conversions de votre site
Guillaume Eouzan - 10 Clés pour optimiser les conversions de votre siteGuillaume Eouzan - 10 Clés pour optimiser les conversions de votre site
Guillaume Eouzan - 10 Clés pour optimiser les conversions de votre site
SEO Camp Association
 
Nicolas J. Chevalier - Nouveaux Schémas de croissance e-commerce
Nicolas J. Chevalier - Nouveaux Schémas de croissance e-commerce Nicolas J. Chevalier - Nouveaux Schémas de croissance e-commerce
Nicolas J. Chevalier - Nouveaux Schémas de croissance e-commerce
SEO Camp Association
 
Comment définir une stratégie pour atteindre ses objectifs SEO ?
Comment définir une stratégie pour atteindre ses objectifs SEO ?Comment définir une stratégie pour atteindre ses objectifs SEO ?
Comment définir une stratégie pour atteindre ses objectifs SEO ?
SEO Camp Association
 
Référencement universel : 10 ans après toujours d actualité ?
Référencement universel : 10 ans après toujours d actualité ?Référencement universel : 10 ans après toujours d actualité ?
Référencement universel : 10 ans après toujours d actualité ?
SEO Camp Association
 
Content marketing seo
Content marketing seoContent marketing seo
Content marketing seo
SEO Camp Association
 
Rédaction web intelligence artificielle et semantique seo
Rédaction web intelligence artificielle et semantique seoRédaction web intelligence artificielle et semantique seo
Rédaction web intelligence artificielle et semantique seo
SEO Camp Association
 
Petites histoires seo vecues par un seo
Petites histoires seo vecues par un seoPetites histoires seo vecues par un seo
Petites histoires seo vecues par un seo
SEO Camp Association
 
Performance Web : vers la speed update, un pas après l'autre
Performance Web : vers la speed update, un pas après l'autrePerformance Web : vers la speed update, un pas après l'autre
Performance Web : vers la speed update, un pas après l'autre
SEO Camp Association
 
Excel au service de votre SEO
Excel au service de votre SEOExcel au service de votre SEO
Excel au service de votre SEO
SEO Camp Association
 
Data, algorithmes et automatisation
Data, algorithmes et automatisationData, algorithmes et automatisation
Data, algorithmes et automatisation
SEO Camp Association
 
La nouvelle Search Console : session exemples et feedback
La nouvelle Search Console : session exemples et feedbackLa nouvelle Search Console : session exemples et feedback
La nouvelle Search Console : session exemples et feedback
SEO Camp Association
 
How a briefing can ruin or win your content results
How a briefing can ruin or win your content resultsHow a briefing can ruin or win your content results
How a briefing can ruin or win your content results
SEO Camp Association
 
SEO & SEA : Réconcilions les frères ennemis !
SEO & SEA : Réconcilions les frères ennemis !SEO & SEA : Réconcilions les frères ennemis !
SEO & SEA : Réconcilions les frères ennemis !
SEO Camp Association
 
Inbound marketing : comment attirer des visiteurs et les transformer en clien...
Inbound marketing : comment attirer des visiteurs et les transformer en clien...Inbound marketing : comment attirer des visiteurs et les transformer en clien...
Inbound marketing : comment attirer des visiteurs et les transformer en clien...
SEO Camp Association
 
L’importance du crawl du JavaScript : pourquoi, comment et pour quels bénéfic...
L’importance du crawl du JavaScript : pourquoi, comment et pour quels bénéfic...L’importance du crawl du JavaScript : pourquoi, comment et pour quels bénéfic...
L’importance du crawl du JavaScript : pourquoi, comment et pour quels bénéfic...
SEO Camp Association
 
Grandes attentes, financement inadéquat: les défis auxquels fait face le SEO ...
Grandes attentes, financement inadéquat: les défis auxquels fait face le SEO ...Grandes attentes, financement inadéquat: les défis auxquels fait face le SEO ...
Grandes attentes, financement inadéquat: les défis auxquels fait face le SEO ...
SEO Camp Association
 

Plus de SEO Camp Association (20)

Didier Sampaolo - SEO EN 2019 : GAGNEZ DU TEMPS !
Didier Sampaolo - SEO EN 2019 : GAGNEZ DU TEMPS !Didier Sampaolo - SEO EN 2019 : GAGNEZ DU TEMPS !
Didier Sampaolo - SEO EN 2019 : GAGNEZ DU TEMPS !
 
Sebestien Thibert - 10 tips qui aident à augmenter le chiffre d'affaires
Sebestien Thibert - 10 tips qui aident à augmenter le chiffre d'affairesSebestien Thibert - 10 tips qui aident à augmenter le chiffre d'affaires
Sebestien Thibert - 10 tips qui aident à augmenter le chiffre d'affaires
 
Julien Anouilh - Faire décoller votre business avec Instagram, mode d'emploi !
Julien Anouilh - Faire décoller votre business avec Instagram, mode d'emploi !Julien Anouilh - Faire décoller votre business avec Instagram, mode d'emploi !
Julien Anouilh - Faire décoller votre business avec Instagram, mode d'emploi !
 
Julien Ringard & Benjamin Thiers - Cannibalisation SEO
Julien Ringard & Benjamin Thiers - Cannibalisation SEO Julien Ringard & Benjamin Thiers - Cannibalisation SEO
Julien Ringard & Benjamin Thiers - Cannibalisation SEO
 
Guillaume Eouzan - 10 Clés pour optimiser les conversions de votre site
Guillaume Eouzan - 10 Clés pour optimiser les conversions de votre siteGuillaume Eouzan - 10 Clés pour optimiser les conversions de votre site
Guillaume Eouzan - 10 Clés pour optimiser les conversions de votre site
 
Nicolas J. Chevalier - Nouveaux Schémas de croissance e-commerce
Nicolas J. Chevalier - Nouveaux Schémas de croissance e-commerce Nicolas J. Chevalier - Nouveaux Schémas de croissance e-commerce
Nicolas J. Chevalier - Nouveaux Schémas de croissance e-commerce
 
Comment définir une stratégie pour atteindre ses objectifs SEO ?
Comment définir une stratégie pour atteindre ses objectifs SEO ?Comment définir une stratégie pour atteindre ses objectifs SEO ?
Comment définir une stratégie pour atteindre ses objectifs SEO ?
 
Référencement universel : 10 ans après toujours d actualité ?
Référencement universel : 10 ans après toujours d actualité ?Référencement universel : 10 ans après toujours d actualité ?
Référencement universel : 10 ans après toujours d actualité ?
 
Content marketing seo
Content marketing seoContent marketing seo
Content marketing seo
 
Rédaction web intelligence artificielle et semantique seo
Rédaction web intelligence artificielle et semantique seoRédaction web intelligence artificielle et semantique seo
Rédaction web intelligence artificielle et semantique seo
 
Petites histoires seo vecues par un seo
Petites histoires seo vecues par un seoPetites histoires seo vecues par un seo
Petites histoires seo vecues par un seo
 
Performance Web : vers la speed update, un pas après l'autre
Performance Web : vers la speed update, un pas après l'autrePerformance Web : vers la speed update, un pas après l'autre
Performance Web : vers la speed update, un pas après l'autre
 
Excel au service de votre SEO
Excel au service de votre SEOExcel au service de votre SEO
Excel au service de votre SEO
 
Data, algorithmes et automatisation
Data, algorithmes et automatisationData, algorithmes et automatisation
Data, algorithmes et automatisation
 
La nouvelle Search Console : session exemples et feedback
La nouvelle Search Console : session exemples et feedbackLa nouvelle Search Console : session exemples et feedback
La nouvelle Search Console : session exemples et feedback
 
How a briefing can ruin or win your content results
How a briefing can ruin or win your content resultsHow a briefing can ruin or win your content results
How a briefing can ruin or win your content results
 
SEO & SEA : Réconcilions les frères ennemis !
SEO & SEA : Réconcilions les frères ennemis !SEO & SEA : Réconcilions les frères ennemis !
SEO & SEA : Réconcilions les frères ennemis !
 
Inbound marketing : comment attirer des visiteurs et les transformer en clien...
Inbound marketing : comment attirer des visiteurs et les transformer en clien...Inbound marketing : comment attirer des visiteurs et les transformer en clien...
Inbound marketing : comment attirer des visiteurs et les transformer en clien...
 
L’importance du crawl du JavaScript : pourquoi, comment et pour quels bénéfic...
L’importance du crawl du JavaScript : pourquoi, comment et pour quels bénéfic...L’importance du crawl du JavaScript : pourquoi, comment et pour quels bénéfic...
L’importance du crawl du JavaScript : pourquoi, comment et pour quels bénéfic...
 
Grandes attentes, financement inadéquat: les défis auxquels fait face le SEO ...
Grandes attentes, financement inadéquat: les défis auxquels fait face le SEO ...Grandes attentes, financement inadéquat: les défis auxquels fait face le SEO ...
Grandes attentes, financement inadéquat: les défis auxquels fait face le SEO ...
 

Les technologies TAL et le futur du SEO

  • 1. 1#seocamp FUTUR DU SEO & TECHNOS DE TAL
  • 2. 2#seocamp Marguerite Leenhardt PhD Linguistique & TAL, MSc. IL & MSc. IM CEO & co-founder @ XIKO Présidente & co-founder @ AFTAL Girlz in Web & Les Expertes du Numérique Concours Mondial de l’Innovation (Big Data), Prix Syntec Etudes “Idées pour le Futur”
  • 3. 3#seocamp Search : une application de fouille de textes qui intègre des techniques de Traitement Automatique des Langues (Natural Language Processing) Contenu Comprendre l’intention de recherche L’usage et l’attente des utilisateurs finaux a changé : vers le Natural Language Search Développer des fonctionnalités intelligentes pour le moteur de recherche TAL & search TAL & SEO : points communs, parcours liés tous crédits photos: pexels.com
  • 5. 5#seocamp ▪ Apprentissage machine (machine learning) ○ par opposition à l’approche procédurale (règles de classification prédéfinies manuellement) Focus Word Embeddings Apprentissage machine pour le TAL : exemple d’une innovation actuelle
  • 6. 6#seocamp ▪ Apprentissage machine (machine learning) ○ apprendre à une machine à opérer une classification en identifiant un objet en fonction de ses caractéristiques (features) Focus Word Embeddings Apprentissage machine pour le TAL : exemple d’une innovation actuelle D’après Bird et al. 2009, Bird, S., Klein, E., & Loper, E. (2009). Natural language processing with Python. O'Reilly.
  • 7. 7#seocamp ▪ Apprentissage machine (machine learning) ○ modèles ■ symboliques (ex: arbres de décision) ■ bayésiens (ex: bayésien naïf) ■ régression (ex: entropie maximale) ■ géométriques (ex: SVM, Support Vector Machines) ■ modèles neuronaux Focus Word Embeddings Apprentissage machine pour le TAL : exemple d’une innovation actuelle
  • 8. 8#seocamp ▪ Modèles neuronaux et analyse distributionnelle ○ le but : apprendre à une machine à analyser le sens par les propriétés distributionnelles des unités textuelles ○ le moyen : le prolongement de la représentation ■ représentation des unités textuelles et de leurs contextes dans le même espace vectoriel (= couche cachée embarque les pondérations de chacun des éléments de contexte associé à chaque unité textuelle) ○ le résultat : les unités textuelles qui ont des contextes similaires sont rapprochées (et c’est différent du tf-idf qui dépend du document!) Focus Word Embeddings Apprentissage machine pour le TAL : exemple d’une innovation actuelle
  • 9. 9#seocamp ▪ Modèles neuronaux et analyse distributionnelle ○ les algos et les représentations des unités textuelles ■ word2vec : vecteurs appris sur les mots ■ fastText : vecteurs appris sur les n-gram composant le mot en plus d’être appris sur les mots ■ gloVe : vecteurs appris avec les co-occurrences statistiques ○ les avantages : représentations, données d’apprentissage ○ les écueils : passage à l’échelle, biais Focus Word Embeddings Apprentissage machine pour le TAL : exemple d’une innovation actuelle
  • 11. 11#seocamp La recherche vocale devient le nouveau terrain de jeu des marques qui ont de fortes attentes envers le search. C’est aussi un levier de croissance majeur pour l’ensemble du marché SEO. Focus Vocal Apps Au-delà du texte : les applications conversationnelles La prospective est positive, les chiffres Comscore prévoient que la moitié des requêtes seront dites en 2020 (chiffres 2016). 50% en 2020
  • 12. 12#seocamp Focus Vocal Apps Au-delà du texte : les applications conversationnelles Des progrès conséquents en text-to-speech (synthèse vocale) et speech-to-text (analyse de l’oral) rendent accessibles les composants. Les améliorations Une adoption croissante côté utilisateurs mène certains à prédire que, d’ici 10 ans, les interfaces qui ne seront pas vocales seront une curiosité. (Embracing the Voice Revolution, Google team keynote, Smart Voice Summit) Les attentes Des essais et expérimentations dans tous les secteurs, côté transactionnel (e.g. retail, transports) et contenus (branding). Les chantiers La qualité de l’interaction et la gestion du multilinguisme sont les principaux écueils immédiats. Les problèmes
  • 13. 13#seocamp Opportunité pour le SEO La démocratisation des interfaces vocales pour délivrer des expériences de contenus et de services est un premier pas vers le SEO multimodal Focus Vocal Apps Au-delà du texte : les applications conversationnelles Défis dans le contenu Tous les défis actuels en analyse de contenu (sémantique, multilinguisme, qualité des résultats à l’échelle) prennent de nouvelles dimensions Défis dans le contexte De nouveaux défis apparaissent (naturel de la conversation, fusion des modalités texte/son/image/temps/contexte, conception de l’expérience multimodale)
  • 14. 14#seocamp Le texte et la voix ne sont pas les seules modalités L’image et la vidéo, la situation physique et numérique (géoloc., historiques) comme la situation d’interaction homme-machine, posent des défis spécifiques, par exemple : - interfaçage et fusion des entrées multimodales - contextualisation des requêtes - intelligence conversationnelle Vers des standards du web multimodal : - W3C Multimodal Interaction Working Group - Recherches appliquées au sein de différentes communautés scientifiques reliées par l’analyse des données produites par et entourant l’humain - Avec un focus sur le search multimodal depuis 10 ans
  • 16. 16#seocamp ▪ Interfaçage et fusion des entrées multimodales ○ le but : la formalisation du cadre ■ gérer des entrées hétérogènes ■ combiner des indices ○ le moyen : la fusion des résultats ■ combinaison des résultats ■ plusieurs moteurs (meta-search) ■ plusieurs entrées unimodales ○ le défi : la gestion des interférences ■ contextualiser les modalités ■ pondérer contextuellement Focus Mutimodal L’interaction dans toutes ses dimensions D’après Kennedy et al. 2008, Kennedy, L., Chang, S-F., & Natsev, A. (2008). Query-Adaptive Fusion for Multimodal Search, Proceedings of the IEEE.
  • 17. 17#seocamp ▪ Prédiction de la performance des requêtes ○ le but : la gestion des requêtes incomplètes ou bruitées ■ re-contextualiser ■ à partir des documents ○ le moyen : le prolongement de la représentation ■ segmentation de requête ■ mesure d’overlap des vecteurs ○ le défi : la rationalisation du flux ■ optimiser le pré-traitement des requêtes ■ évaluer la complexité pour adapter le workflow Focus Mutimodal L’interaction dans toutes ses dimensions D’après Kennedy et al. 2008, Kennedy, L., Chang, S-F., & Natsev, A. (2008). Query-Adaptive Fusion for Multimodal Search, Proceedings of the IEEE.
  • 18. 18#seocamp ▪ Redesign des principes d’interface ○ le but : adapter la conception à la multimodalité ■ répondre aux enjeux identifiés aujourd’hui ■ avoir un cadre pour penser ceux de demain ○ le moyen : l’expérimentation ■ associer les commandes uni / multi ■ ajouter la dimension gestuelle ■ préciser les différentes méthodes ○ le défi : la gestion des interactions ■ entre les composants ■ avec l’utilisateur et à l’échelle Focus Mutimodal L’interaction dans toutes ses dimensions D’après Etzold et al. 2012, Etzold, J., Brousseau, A., Grimm, P. & Steiner, T. (2012). Context-aware Querying for Multimodal Search Engines, Google Germany.
  • 19. 19#seocamp Les défis seront à penser systématiquement en n-dimensions (principe de l’embedding et du prolongement des représentations, fusion des modalités texte/son/image/temps/contexte) : autant de compétences à intégrer et organiser Les prochaines avancées dans la conception des dimensions viendront pour partie de l’analyse automatique des interactions et des conversations, émergente en TAL Multimodal = pluridisciplinarité + interaction
  • 20. 20#seocamp Question Mug ● Un algo de Word Embedding ● autre que word2vec ?
  • 22. 22#seocamp Merci à vous !Marguerite Leenhardt | @MyLinguistics