SlideShare une entreprise Scribd logo
1  sur  21
Télécharger pour lire hors ligne
UNE RÉVOLUTION SILENCIEUSE DANS LES ALGORITHMES DE GOOGLE
LE SEO FACE A UNE INTELLIGENCE
ARTIFICIELLE
- 1 -
PETIT DEJEUNER SEO
SEARCH FORESIGHT
11EME ÉDITION
LILLE le 28 janvier 2016
9h-12h
/ Et l’IA est maintenant au cœur de son algorithme
2
Google se met SERIEUSEMENT à l’IA
/ Les programmes utilisant de l’IA ne sont pas
forcément… intelligents au sens commun
- 3 -
« Intelligence Artificielle » est un faux ami
Définition de l’IA :
Au sens large, le domaine de
l’intelligence artificielle regroupe toutes
les techniques essayant de simuler les
capacités du cerveau humain dans un
programme informatique
 Aujourd’hui, deux de ces capacités
ont engendré des applications
particulièrement prolifiques, au point
que souvent, les informaticiens
confondent « IA » et ces domaines
de l’informatique
• Capacité de perception : réseaux de
neurones, deep learning et toutes les
variantes
• Capacité d’apprentissage automatique
 Un programme basé sur de l’IA n’est
pas un programme qui
« comprend » au sens commun
- 4 -
Utiliser de l’IA dans un outil de recherche
est une vieille idée
 Un exemple spectaculaire et ancien : YANDEX
 Son architecture Matrixnet est basée sur de l’apprentissage
automatique
- 5 -
Matrixnet en action
- 6 -
Créer des filtres grâce à de
l’apprentissage automatique
 Classifieurs : spam, ou non spam !
 De gros progrès ont été obtenus au niveau performance :
SVM : support vector machines
 Trouver la « formule » qui va prendre les mêmes décisions qu’un humain se
résume à un problème de géométrie mis en équations
- 7 -
Et pour la machine, le travail de
classification devient simple
/ la clé du mystère dans une interview de wired
- 8 -
Panda et l’apprentissage automatique
http://www.wired.com/2011/03/the-panda-that-hates-farms/all/
Wired.com: But how do you implement that algorithmically?
Cutts: I think you look for signals that recreate that same intuition, that same
experience that you have as an engineer and that users have. Whenever we look at
the most blocked sites, it did match our intuition and experience, but the key is, you
also have your experience of the sorts of sites that are going to be adding value for
users versus not adding value for users. And we actually came up with a classifier to
say, okay, IRS or Wikipedia or New York Times is over on this side, and the low-quality
sites are over on this side. And you can really see mathematical reasons …
Singhal: You can imagine in a hyperspace a bunch of points, some points are red,
some points are green, and in others there’s some mixture. Your job is to find a plane
which says that most things on this side of the place are red, and most of the things on
that side of the plane are the opposite of red.
Since the search engineers could not compute a signal for “would you trust this site
with your credit card” they had to look for other statistical measurements that would
correspond highly with the answers provided in the Quality Raters Survey.
Cela ne vous rappelle rien ?
- 9 -
Intégrer du machine learning dans l’algo?
Nous ne sommes pas les seuls à l’avoir compris : Le process décrit par Moz
- 10 -
Plus fort :
les réseaux de neurones dans l’algo
 Les approches « classiques » ont atteint leurs limites
 L’approche prometteuse : le « deep learning »
/ 2012 : Google brain
- 11 -
Google maîtrise le deep learning
 Google brain est capable de reconnaître un chat dans l’image en bas à droite !
 2015 : Google Deepmind bat le champion d’Europe de Go
- 12 -
L’analyse des textes permet d’associer
des termes à des vecteurs
/ Grâce aux vecteurs obtenus, on obtient des termes
proches par opérations simples entre vecteurs
- 13 -
Et… tada !
/ en place depuis début 2015
- 14 -
Application chez google : Rankbrain
 En calculant une moyenne pour les vecteurs liés aux mots clés, on peut calculer
le vecteur d’une combinaison de mots clé : un syntagme, une phrase
/ l’ingénieur derrière l’implémentation de Rankbrain
- 15 -
Greg corrado
/ Premier niveau : expansion de requêtes
- 16 -
Word2vec est utilisé 2 fois dans l’algo
Si une requête rare est tapée, le requêteur essaie d’identifier une requête proche qui
elle est connue et offrira des résultats de meilleure qualité:
 Exploitation de l’historique des sessions de requêtes sur la requête connue
 Reconnaissance de l’intention derrière la requête connue
/ Deuxième niveau : calcul de similarité
- 17 -
Word2vec est utilisé 2 fois dans l’algo
La similarité avec la requête peut être calculée aussi bien qu’un cosinus de Salton.
Il semble que l’approche permette d’augmenter le rappel sans dégrader la précision
Les résultats sont améliorés par un score supplémentaire similaire dans son mode de
calcul au pagerank.
- 18 -
Encore une fois, adieu les mots clés
 Indexation des concepts
 Vecteurs Word2vec
Illustration : Brafton.com
- 19 -
Quelles conséquences pour le SEO ?
 Les différentes couches de l’algorithme coexistent, les résultats sont obtenus en
combinant les approches
 Les optimisations « à l’ancienne » n’ont pas complètement perdu leur intérêt à
date : l’algo classique reste dominant
 Mais : les cas où une page remonte en tête du classement sur une requête alors
qu’elle semble ne pas être optimisée pour cette requête augmentent en
fréquence
Il faut donc se préparer à un nouveau paradigme de recherche, où pour bien se
classer, une page doit être avant tout une bonne réponse à la requête de
l’internaute, et même, un résultat en phase avec l’intention cachée derrière la
requête de l’internaute.
- 20 -
Pour en savoir plus
 https://code.google.com/archive/p/word2vec/
 https://scholar.google.com/citations?user=oBu8kMMAAAAJ
 http://www.bloomberg.com/news/articles/2015-10-26/google-turning-its-
lucrative-web-search-over-to-ai-machines
 http://research.google.com/pubs/GregCorrado.html
Merci !
- 21 -

Contenu connexe

En vedette

En vedette (20)

Les outils du Search pour connaître les utilisateurs - Jean-François Loup & R...
Les outils du Search pour connaître les utilisateurs - Jean-François Loup & R...Les outils du Search pour connaître les utilisateurs - Jean-François Loup & R...
Les outils du Search pour connaître les utilisateurs - Jean-François Loup & R...
 
Exploiter les données d'outils avancés pour optimiser ses textes pour le SEO
Exploiter les données d'outils avancés pour optimiser ses textes pour le SEOExploiter les données d'outils avancés pour optimiser ses textes pour le SEO
Exploiter les données d'outils avancés pour optimiser ses textes pour le SEO
 
Cluster Analysis - Keyword Clustering
Cluster Analysis -  Keyword ClusteringCluster Analysis -  Keyword Clustering
Cluster Analysis - Keyword Clustering
 
Le Futur des Moteurs de Recherche
Le Futur des Moteurs de RechercheLe Futur des Moteurs de Recherche
Le Futur des Moteurs de Recherche
 
Google Rankbrain, l’IA du search - Sylvain Peyronnet - YOODx 2017
Google Rankbrain, l’IA du search - Sylvain Peyronnet - YOODx 2017Google Rankbrain, l’IA du search - Sylvain Peyronnet - YOODx 2017
Google Rankbrain, l’IA du search - Sylvain Peyronnet - YOODx 2017
 
Evolutions et nouveaux outils SEO
Evolutions et nouveaux outils SEOEvolutions et nouveaux outils SEO
Evolutions et nouveaux outils SEO
 
Seo camp2017 Marguerite Leenhardt
Seo camp2017 Marguerite LeenhardtSeo camp2017 Marguerite Leenhardt
Seo camp2017 Marguerite Leenhardt
 
Reportings SEO avec Google Data Studio - SEO Campus Paris 2017
Reportings SEO avec Google Data Studio - SEO Campus Paris 2017Reportings SEO avec Google Data Studio - SEO Campus Paris 2017
Reportings SEO avec Google Data Studio - SEO Campus Paris 2017
 
SEO et ecommerce sur Magento: retour d’expérience
SEO et ecommerce sur Magento: retour d’expérienceSEO et ecommerce sur Magento: retour d’expérience
SEO et ecommerce sur Magento: retour d’expérience
 
SEO : comment obtenir des liens puissants grâce à un contenu décalé
SEO : comment obtenir des liens puissants grâce à un contenu décaléSEO : comment obtenir des liens puissants grâce à un contenu décalé
SEO : comment obtenir des liens puissants grâce à un contenu décalé
 
Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017
Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017
Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017
 
Machine Learning & SEO - SEO Camp'Us Paris 2016
Machine Learning & SEO - SEO Camp'Us Paris 2016Machine Learning & SEO - SEO Camp'Us Paris 2016
Machine Learning & SEO - SEO Camp'Us Paris 2016
 
La mise en cache et ses secrets
La mise en cache et ses secretsLa mise en cache et ses secrets
La mise en cache et ses secrets
 
Designing Creative Content: How visualising data helps us see
Designing Creative Content: How visualising data helps us seeDesigning Creative Content: How visualising data helps us see
Designing Creative Content: How visualising data helps us see
 
Cocon, metamots et plus si affinités sémantiques. Seo campus-03-2017
Cocon, metamots et plus si affinités sémantiques. Seo campus-03-2017Cocon, metamots et plus si affinités sémantiques. Seo campus-03-2017
Cocon, metamots et plus si affinités sémantiques. Seo campus-03-2017
 
Analyse de logs - Études de cas et best practices - SEO Campus 2017
Analyse de logs - Études de cas et best practices - SEO Campus 2017Analyse de logs - Études de cas et best practices - SEO Campus 2017
Analyse de logs - Études de cas et best practices - SEO Campus 2017
 
HTTPS The Road To A More Secure Web / SEOCamp Paris
HTTPS The Road To A More Secure Web / SEOCamp ParisHTTPS The Road To A More Secure Web / SEOCamp Paris
HTTPS The Road To A More Secure Web / SEOCamp Paris
 
Seo camp paris - A chaque enjeu, sa stratégie - Tips & REX
Seo camp paris - A chaque enjeu, sa stratégie - Tips & REX Seo camp paris - A chaque enjeu, sa stratégie - Tips & REX
Seo camp paris - A chaque enjeu, sa stratégie - Tips & REX
 
Google AMP 1 an après : quel bilan, quelles perspectives ?
Google AMP 1 an après : quel bilan, quelles perspectives ?Google AMP 1 an après : quel bilan, quelles perspectives ?
Google AMP 1 an après : quel bilan, quelles perspectives ?
 
Position 0 seocampus 2017 (Featured Snippets)
Position 0 seocampus 2017 (Featured Snippets)Position 0 seocampus 2017 (Featured Snippets)
Position 0 seocampus 2017 (Featured Snippets)
 

Similaire à En 2016 : Faire du SEO face à une intelligence artificielle

Synergie entre développeur et consultant SEO - Didier Sampaolo - SEOcamp'us P...
Synergie entre développeur et consultant SEO - Didier Sampaolo - SEOcamp'us P...Synergie entre développeur et consultant SEO - Didier Sampaolo - SEOcamp'us P...
Synergie entre développeur et consultant SEO - Didier Sampaolo - SEOcamp'us P...
SEO CAMP
 

Similaire à En 2016 : Faire du SEO face à une intelligence artificielle (20)

IA DANS L'ALGORITHME DE GOOGLE.pptx
IA DANS L'ALGORITHME DE GOOGLE.pptxIA DANS L'ALGORITHME DE GOOGLE.pptx
IA DANS L'ALGORITHME DE GOOGLE.pptx
 
IMPACT DE L'IA SUR LE SEO.pptx
IMPACT DE L'IA SUR LE SEO.pptxIMPACT DE L'IA SUR LE SEO.pptx
IMPACT DE L'IA SUR LE SEO.pptx
 
L'IA dans l'algorithme de Google - Matin neperien 7 juillet 2021
L'IA dans l'algorithme de Google - Matin neperien 7 juillet 2021L'IA dans l'algorithme de Google - Matin neperien 7 juillet 2021
L'IA dans l'algorithme de Google - Matin neperien 7 juillet 2021
 
ChatGPT et IA : impacts sur le processus d'évaluation des étudiants
ChatGPT et IA : impacts sur le processus d'évaluation des étudiantsChatGPT et IA : impacts sur le processus d'évaluation des étudiants
ChatGPT et IA : impacts sur le processus d'évaluation des étudiants
 
Lbv Dev Meetup #3
Lbv Dev Meetup #3Lbv Dev Meetup #3
Lbv Dev Meetup #3
 
Programmation en technologie (C.Blin)
Programmation en technologie (C.Blin)Programmation en technologie (C.Blin)
Programmation en technologie (C.Blin)
 
Synergie entre développeur et consultant SEO - Didier Sampaolo - SEOcamp'us P...
Synergie entre développeur et consultant SEO - Didier Sampaolo - SEOcamp'us P...Synergie entre développeur et consultant SEO - Didier Sampaolo - SEOcamp'us P...
Synergie entre développeur et consultant SEO - Didier Sampaolo - SEOcamp'us P...
 
Synergies entre DEV et SEO (SeoCampus 2019)
Synergies entre DEV et SEO (SeoCampus 2019)Synergies entre DEV et SEO (SeoCampus 2019)
Synergies entre DEV et SEO (SeoCampus 2019)
 
ALL4CUSTOMER: Comment adapter sa stratégie SEO à l'heure des IA génératives ?
ALL4CUSTOMER: Comment adapter sa stratégie SEO à l'heure des IA génératives ?ALL4CUSTOMER: Comment adapter sa stratégie SEO à l'heure des IA génératives ?
ALL4CUSTOMER: Comment adapter sa stratégie SEO à l'heure des IA génératives ?
 
Core web vitals - Webinar Neper du 3 décembre 2020
Core web vitals - Webinar Neper du 3 décembre 2020Core web vitals - Webinar Neper du 3 décembre 2020
Core web vitals - Webinar Neper du 3 décembre 2020
 
Accompagner le lecteur aux usages du numérique 3/3
Accompagner le lecteur aux usages du numérique 3/3Accompagner le lecteur aux usages du numérique 3/3
Accompagner le lecteur aux usages du numérique 3/3
 
Focus schema.org et sémantique SEOCamp Nice Sophia-Antipolis
Focus schema.org et sémantique SEOCamp Nice Sophia-AntipolisFocus schema.org et sémantique SEOCamp Nice Sophia-Antipolis
Focus schema.org et sémantique SEOCamp Nice Sophia-Antipolis
 
Nos Systèmes by Fing : "Kit d'auto-évaluation des algorithmes"
Nos Systèmes by Fing : "Kit d'auto-évaluation des algorithmes"Nos Systèmes by Fing : "Kit d'auto-évaluation des algorithmes"
Nos Systèmes by Fing : "Kit d'auto-évaluation des algorithmes"
 
Décryptage des LLMs au-delà de la hype - Lyon Data science
Décryptage des LLMs au-delà de la hype - Lyon Data scienceDécryptage des LLMs au-delà de la hype - Lyon Data science
Décryptage des LLMs au-delà de la hype - Lyon Data science
 
3 familles d'intelligence artificielle et leurs applications business
3 familles d'intelligence artificielle et leurs applications business3 familles d'intelligence artificielle et leurs applications business
3 familles d'intelligence artificielle et leurs applications business
 
Optimisez vos sites pour la recherche sur smartphone, tablettes et objets con...
Optimisez vos sites pour la recherche sur smartphone, tablettes et objets con...Optimisez vos sites pour la recherche sur smartphone, tablettes et objets con...
Optimisez vos sites pour la recherche sur smartphone, tablettes et objets con...
 
Utiliser Le MultiméDia Dans Un Projet Danimation
Utiliser Le MultiméDia Dans Un Projet DanimationUtiliser Le MultiméDia Dans Un Projet Danimation
Utiliser Le MultiméDia Dans Un Projet Danimation
 
Julien dollon
Julien dollonJulien dollon
Julien dollon
 
Fact Sheet : IA, Machine Learning, NLP
Fact Sheet : IA, Machine Learning, NLPFact Sheet : IA, Machine Learning, NLP
Fact Sheet : IA, Machine Learning, NLP
 
Guide d'Onboarding du Recruteur
Guide d'Onboarding du RecruteurGuide d'Onboarding du Recruteur
Guide d'Onboarding du Recruteur
 

Plus de Peak Ace

Plus de Peak Ace (20)

SEO CAMP'us Paris 2022 - CADOR EN SEO - Mathieu Chapon (1).pptx
SEO CAMP'us Paris 2022 - CADOR EN SEO - Mathieu Chapon (1).pptxSEO CAMP'us Paris 2022 - CADOR EN SEO - Mathieu Chapon (1).pptx
SEO CAMP'us Paris 2022 - CADOR EN SEO - Mathieu Chapon (1).pptx
 
SEO CAMP'us Paris 2022 - 6 Tips E-Commerce - Mathieu Chapon.pptx
SEO CAMP'us Paris 2022 - 6 Tips E-Commerce - Mathieu Chapon.pptxSEO CAMP'us Paris 2022 - 6 Tips E-Commerce - Mathieu Chapon.pptx
SEO CAMP'us Paris 2022 - 6 Tips E-Commerce - Mathieu Chapon.pptx
 
Guide shopify & seo: fausse bonne idée?
Guide shopify & seo: fausse bonne idée?Guide shopify & seo: fausse bonne idée?
Guide shopify & seo: fausse bonne idée?
 
Petit dejeuner sf 180419 actualite seo sea
Petit dejeuner sf 180419   actualite seo seaPetit dejeuner sf 180419   actualite seo sea
Petit dejeuner sf 180419 actualite seo sea
 
Event sf 180419 changement de marque et de domaine
Event sf 180419 changement de marque et de domaineEvent sf 180419 changement de marque et de domaine
Event sf 180419 changement de marque et de domaine
 
Event sf 180419 gerer les contenus pagines
Event sf 180419 gerer les contenus paginesEvent sf 180419 gerer les contenus pagines
Event sf 180419 gerer les contenus pagines
 
Event sf 180419 les bonnes pratiques en netlinking
Event sf 180419 les bonnes pratiques en netlinkingEvent sf 180419 les bonnes pratiques en netlinking
Event sf 180419 les bonnes pratiques en netlinking
 
Amazon : au cœur de votre stratégie SEO 2019 - Philippe Yonnet - Petit déjeun...
Amazon : au cœur de votre stratégie SEO 2019 - Philippe Yonnet - Petit déjeun...Amazon : au cœur de votre stratégie SEO 2019 - Philippe Yonnet - Petit déjeun...
Amazon : au cœur de votre stratégie SEO 2019 - Philippe Yonnet - Petit déjeun...
 
Contenu et SEO : quelles tendances pour 2019 ? - Julien Callaou - petit déjeu...
Contenu et SEO : quelles tendances pour 2019 ? - Julien Callaou - petit déjeu...Contenu et SEO : quelles tendances pour 2019 ? - Julien Callaou - petit déjeu...
Contenu et SEO : quelles tendances pour 2019 ? - Julien Callaou - petit déjeu...
 
Comment privilégier l’expérience utilisateur (UX) au cœur de votre stratégie ...
Comment privilégier l’expérience utilisateur (UX) au cœur de votre stratégie ...Comment privilégier l’expérience utilisateur (UX) au cœur de votre stratégie ...
Comment privilégier l’expérience utilisateur (UX) au cœur de votre stratégie ...
 
Comment structurer ses campagnes adwords pour tirer le meilleur parti de l’au...
Comment structurer ses campagnes adwords pour tirer le meilleur parti de l’au...Comment structurer ses campagnes adwords pour tirer le meilleur parti de l’au...
Comment structurer ses campagnes adwords pour tirer le meilleur parti de l’au...
 
Actualités SEO SEA - Tiphaine Coupeau - Petit déjeuner 26-02-2019 Paris
Actualités SEO SEA - Tiphaine Coupeau - Petit déjeuner 26-02-2019 ParisActualités SEO SEA - Tiphaine Coupeau - Petit déjeuner 26-02-2019 Paris
Actualités SEO SEA - Tiphaine Coupeau - Petit déjeuner 26-02-2019 Paris
 
Comment optimiser votre site pour être visible sur les requêtes saisonnières ...
Comment optimiser votre site pour être visible sur les requêtes saisonnières ...Comment optimiser votre site pour être visible sur les requêtes saisonnières ...
Comment optimiser votre site pour être visible sur les requêtes saisonnières ...
 
Le futur du SEO : l’optimisation pour les moteurs de réponse (AEO) - petit dé...
Le futur du SEO : l’optimisation pour les moteurs de réponse (AEO) - petit dé...Le futur du SEO : l’optimisation pour les moteurs de réponse (AEO) - petit dé...
Le futur du SEO : l’optimisation pour les moteurs de réponse (AEO) - petit dé...
 
« Le temps de chargement n’existe pas ! » - petit déjeuner 13 décembre paris
« Le temps de chargement n’existe pas ! » - petit déjeuner 13 décembre paris« Le temps de chargement n’existe pas ! » - petit déjeuner 13 décembre paris
« Le temps de chargement n’existe pas ! » - petit déjeuner 13 décembre paris
 
Comment exploiter et atteindre la position 0 ou featured snippets de Google ...
Comment exploiter et atteindre la position 0 ou featured snippets de Google  ...Comment exploiter et atteindre la position 0 ou featured snippets de Google  ...
Comment exploiter et atteindre la position 0 ou featured snippets de Google ...
 
Actualité des moteurs de recherche et du référencement (SEO & SEA) - petit dé...
Actualité des moteurs de recherche et du référencement (SEO & SEA) - petit dé...Actualité des moteurs de recherche et du référencement (SEO & SEA) - petit dé...
Actualité des moteurs de recherche et du référencement (SEO & SEA) - petit dé...
 
La nouvelle Google Search Console - petit déjeuner 15-11-2018 Nantes
La nouvelle Google Search Console - petit déjeuner 15-11-2018 Nantes La nouvelle Google Search Console - petit déjeuner 15-11-2018 Nantes
La nouvelle Google Search Console - petit déjeuner 15-11-2018 Nantes
 
Comment tirer le meilleur parti possible du content marketing - petit déjeune...
Comment tirer le meilleur parti possible du content marketing - petit déjeune...Comment tirer le meilleur parti possible du content marketing - petit déjeune...
Comment tirer le meilleur parti possible du content marketing - petit déjeune...
 
Migration les pièges a éviter - petit déjeuner 15-11-2018 Nantes
Migration les pièges a éviter - petit déjeuner 15-11-2018 Nantes Migration les pièges a éviter - petit déjeuner 15-11-2018 Nantes
Migration les pièges a éviter - petit déjeuner 15-11-2018 Nantes
 

En 2016 : Faire du SEO face à une intelligence artificielle

  • 1. UNE RÉVOLUTION SILENCIEUSE DANS LES ALGORITHMES DE GOOGLE LE SEO FACE A UNE INTELLIGENCE ARTIFICIELLE - 1 - PETIT DEJEUNER SEO SEARCH FORESIGHT 11EME ÉDITION LILLE le 28 janvier 2016 9h-12h
  • 2. / Et l’IA est maintenant au cœur de son algorithme 2 Google se met SERIEUSEMENT à l’IA
  • 3. / Les programmes utilisant de l’IA ne sont pas forcément… intelligents au sens commun - 3 - « Intelligence Artificielle » est un faux ami Définition de l’IA : Au sens large, le domaine de l’intelligence artificielle regroupe toutes les techniques essayant de simuler les capacités du cerveau humain dans un programme informatique  Aujourd’hui, deux de ces capacités ont engendré des applications particulièrement prolifiques, au point que souvent, les informaticiens confondent « IA » et ces domaines de l’informatique • Capacité de perception : réseaux de neurones, deep learning et toutes les variantes • Capacité d’apprentissage automatique  Un programme basé sur de l’IA n’est pas un programme qui « comprend » au sens commun
  • 4. - 4 - Utiliser de l’IA dans un outil de recherche est une vieille idée  Un exemple spectaculaire et ancien : YANDEX  Son architecture Matrixnet est basée sur de l’apprentissage automatique
  • 5. - 5 - Matrixnet en action
  • 6. - 6 - Créer des filtres grâce à de l’apprentissage automatique  Classifieurs : spam, ou non spam !  De gros progrès ont été obtenus au niveau performance : SVM : support vector machines  Trouver la « formule » qui va prendre les mêmes décisions qu’un humain se résume à un problème de géométrie mis en équations
  • 7. - 7 - Et pour la machine, le travail de classification devient simple
  • 8. / la clé du mystère dans une interview de wired - 8 - Panda et l’apprentissage automatique http://www.wired.com/2011/03/the-panda-that-hates-farms/all/ Wired.com: But how do you implement that algorithmically? Cutts: I think you look for signals that recreate that same intuition, that same experience that you have as an engineer and that users have. Whenever we look at the most blocked sites, it did match our intuition and experience, but the key is, you also have your experience of the sorts of sites that are going to be adding value for users versus not adding value for users. And we actually came up with a classifier to say, okay, IRS or Wikipedia or New York Times is over on this side, and the low-quality sites are over on this side. And you can really see mathematical reasons … Singhal: You can imagine in a hyperspace a bunch of points, some points are red, some points are green, and in others there’s some mixture. Your job is to find a plane which says that most things on this side of the place are red, and most of the things on that side of the plane are the opposite of red. Since the search engineers could not compute a signal for “would you trust this site with your credit card” they had to look for other statistical measurements that would correspond highly with the answers provided in the Quality Raters Survey. Cela ne vous rappelle rien ?
  • 9. - 9 - Intégrer du machine learning dans l’algo? Nous ne sommes pas les seuls à l’avoir compris : Le process décrit par Moz
  • 10. - 10 - Plus fort : les réseaux de neurones dans l’algo  Les approches « classiques » ont atteint leurs limites  L’approche prometteuse : le « deep learning »
  • 11. / 2012 : Google brain - 11 - Google maîtrise le deep learning  Google brain est capable de reconnaître un chat dans l’image en bas à droite !  2015 : Google Deepmind bat le champion d’Europe de Go
  • 12. - 12 - L’analyse des textes permet d’associer des termes à des vecteurs
  • 13. / Grâce aux vecteurs obtenus, on obtient des termes proches par opérations simples entre vecteurs - 13 - Et… tada !
  • 14. / en place depuis début 2015 - 14 - Application chez google : Rankbrain  En calculant une moyenne pour les vecteurs liés aux mots clés, on peut calculer le vecteur d’une combinaison de mots clé : un syntagme, une phrase
  • 15. / l’ingénieur derrière l’implémentation de Rankbrain - 15 - Greg corrado
  • 16. / Premier niveau : expansion de requêtes - 16 - Word2vec est utilisé 2 fois dans l’algo Si une requête rare est tapée, le requêteur essaie d’identifier une requête proche qui elle est connue et offrira des résultats de meilleure qualité:  Exploitation de l’historique des sessions de requêtes sur la requête connue  Reconnaissance de l’intention derrière la requête connue
  • 17. / Deuxième niveau : calcul de similarité - 17 - Word2vec est utilisé 2 fois dans l’algo La similarité avec la requête peut être calculée aussi bien qu’un cosinus de Salton. Il semble que l’approche permette d’augmenter le rappel sans dégrader la précision Les résultats sont améliorés par un score supplémentaire similaire dans son mode de calcul au pagerank.
  • 18. - 18 - Encore une fois, adieu les mots clés  Indexation des concepts  Vecteurs Word2vec Illustration : Brafton.com
  • 19. - 19 - Quelles conséquences pour le SEO ?  Les différentes couches de l’algorithme coexistent, les résultats sont obtenus en combinant les approches  Les optimisations « à l’ancienne » n’ont pas complètement perdu leur intérêt à date : l’algo classique reste dominant  Mais : les cas où une page remonte en tête du classement sur une requête alors qu’elle semble ne pas être optimisée pour cette requête augmentent en fréquence Il faut donc se préparer à un nouveau paradigme de recherche, où pour bien se classer, une page doit être avant tout une bonne réponse à la requête de l’internaute, et même, un résultat en phase avec l’intention cachée derrière la requête de l’internaute.
  • 20. - 20 - Pour en savoir plus  https://code.google.com/archive/p/word2vec/  https://scholar.google.com/citations?user=oBu8kMMAAAAJ  http://www.bloomberg.com/news/articles/2015-10-26/google-turning-its- lucrative-web-search-over-to-ai-machines  http://research.google.com/pubs/GregCorrado.html