SlideShare une entreprise Scribd logo
Machine Learning dans les
Moteurs de recherche

8-9 mars 2012

Philippe YONNET
Directeur SEO International
philippe.yonnet@twenga.com
Pourquoi parler de ces algorithmes ?


  Il est fort possible que l’algorithme
  Panda soit un algorithme
  d’apprentissage automatique.

  Son auteur, un dénommé… Panda.

  Il y’a deux Panda connus chez
  Google, tous les deux ont travaillé
  sur des projets de Machine
  Learning…
L’apprentissage automatique


 Machine learning en anglais
 Conception et développement d’algorithmes capables de
  s’autoam
Applications classiques


 Reconnaissance de formes, reconnaissance de caractère
 Robotique
 Classification automatique
Les principaux types d’apprentissage


 Apprentissage supervisé
    Présence d’un « oracle » qui fournit un jeu de réponses désirées
     (exemples ou contre-exemples)
 Apprentissage non supervisé
    Classification automatique / Clustering
    L'algorithme doit découvrir par lui-même la structure plus ou
     moins cachée des données
 Apprentissage par renforcement
    l'algorithme apprend un comportement étant donné une observation.
     L'action de l'algorithme sur l'environnement produit une valeur de retour
     qui guide l'algorithme d'apprentissage.
On identifie d’autres types d’algorithmes : semi-supervisé,
partiellement supervisé…
Quelques grandes catégories d’algorithmes

 Les algorithmes à bases d’arbres de décision
    Data mining, entrepôts de données, aide à la décision, système experts,
      diagnostic
 Le boosting
    Amélioration des systèmes de classification binaire
 Les réseaux de neurones artificiels
 Les algorithmes génétiques
    Sélection naturelle des meilleurs programmes
 L’ILP (inductive logic programming) :
    exemples positifs + exemples négatifs + base de connaissances =
      règles (utile en TAL)
 Les Support Vector Machines
 Les Réseaux Bayésiens
    diagnostic (médical et industriel), l'analyse de risques, la détection
      des spams et le data mining.
L’apprentissage automatique et le spam




                                                                  SPAM




  Classification automatique utilisant l’apprentissage supervisé à partir de
  données étiquetées (classifiées) par un humain (« oracle »). L’objectif est
  de déterminer une fonction opérationnelle séparant correctement les
  points bleus et rouges (courbe verte)
Pourquoi ces algorithmes ont-ils été longtemps
sous-utilisés par les moteurs de recherche?

Longtemps, l’utilisation de ces algorithmes a été bridée par trois
problèmes :

 La difficulté de création des données d’entrainement

 Le temps de calcul et les besoins en ressources

 La faisabilité pure des calculs
Définition d’un classifier

Une première approche possible (et triviale) pour déterminer les lois régissant
un ensemble de données : la régression. L’objectif est de déterminer une courbe
qui donne une approximation correcte des points mesurés. Dans l’exemple de
gauche, la courbe est droite affine y=ax+b. A droite un polynome plus complexe.
Les Support Vector Machines SVM




   Un des principes de la technique des SVM : il existe souvent plusieurs
     frontières permettant de « séparer » des échantillons de points. Les
 meilleures frontières sont celles qui maximisent la distance entre la frontière
   et les points (les « séparateurs à vastes marges »). L’algorithme SVM
       permet d’identifier les frontières donnant le minimum d’erreurs de
                                   classification.
SVM : La recherche d’un hyperplan « frontière »




Recherche d’un hyperplan « frontière » dans la technique des SVM : la frontière ici est
relativement complexe si on la décrit dans l’espace à deux dimensions qui décrit les
données d’entrainement. En transposant le problème dans un espace muldimensionnel (3
dimensions sur le schéma) il peut être possible de trouver un hyperplan (ici un plan), simple
à décrire, qui permet de classifier facilement les données.


                                Tiens tiens… J’ai déjà vu ça quelque part
Panda et les SVM


 Amit Singhal décrit l’algorithme ainsi dans une interview de
  Wired:

 « Vous pouvez imaginer dans un espace muldimensionnel un
  groupe de points, certains points sont rouges, certains points
  sont verts, and pour d’autres c’est un mélange des deux. Votre
  travail est de trouver un hyperplan qui indique que la plupart
  des choses d’un côté de ce plan sont rouges, et que la plupart
  des choses de l’autre côté sont le contraire de « rouge » ».
REFERENCES


 Machine Learning chez Google
    http://research.google.com/pubs/MachineLearning.html
    PLANET: Massively Parallel Learning of Tree Ensembles with MapReduce
     Biswanath Panda, Joshua S. Herbach, Sugato Basu, Roberto J. Bayardo,
     Google, Inc.
     http://www.bayardo.org/ps/vldb2009.pdf
    KDX: An Indexer for Support Vector Machines
     Navneet Panda, Edward Y. Chang, Google Inc
     http://www.computer.org/portal/web/csdl/doi/10.1109/TKDE.2006.101


    OASIS : Large Scale Online Learning of Image Similarity Through Ranking
     Gal Chechik , Varun Sharma, Samy Bengio, Google Inc & Uri Shalit, The Gonda
     brain research center, Bar Ilan University
     www.robots.ox.ac.uk/~vgg/rg/papers/rankingsimilarity.pdf
Références


   Machine Learning chez Bing!
        http://research.microsoft.com/en-us/groups/ml/
        http://research.microsoft.com/en-us/groups/mlp/
        http://research.microsoft.com/en-us/groups/mlpml/
   ...
   Beyond PageRank: Machine Learning for Static Ranking
    Matthew Richardson, Microsoft Research, Amit Prakash MSN, Eric Brill,
    Microsoft Research
         www.inf.unibz.it/~ricci/SDB/slides/fRank-Presentation.pdf
   Machine Learning chez Yahoo!
        http://research.yahoo.com/Machine_Learning
        Developing parallel sequential minimal optimization for fast training support vector machine.
         Yahoo Labs, Cao, L.J.; Keerthi, S.S.; Ong, C.J.; Uvaraj, P.; Fu, X.J.; Lee, H.P.
         http://research.yahoo.com/pub/951

Contenu connexe

Tendances

Data Mining
Data MiningData Mining
Arbre de décision.pdf
Arbre de décision.pdfArbre de décision.pdf
Arbre de décision.pdf
imane26
 
Introduction au datamining, concepts et techniques
Introduction au datamining, concepts et techniquesIntroduction au datamining, concepts et techniques
Introduction au datamining, concepts et techniques
Ismail CHAIB
 
Evaluation metrics: Precision, Recall, F-Measure, ROC
Evaluation metrics: Precision, Recall, F-Measure, ROCEvaluation metrics: Precision, Recall, F-Measure, ROC
Evaluation metrics: Precision, Recall, F-Measure, ROC
Big Data Engineering, Faculty of Engineering, Dhurakij Pundit University
 
Introduction au Machine Learning
Introduction au Machine LearningIntroduction au Machine Learning
Introduction au Machine Learning
Mathieu Goeminne
 
Kaggle presentation
Kaggle presentationKaggle presentation
Kaggle presentation
HJ van Veen
 
Clustering: Méthode hiérarchique
Clustering: Méthode hiérarchiqueClustering: Méthode hiérarchique
Clustering: Méthode hiérarchique
Yassine Mhadhbi
 
Les arbres de décisions
Les arbres de décisionsLes arbres de décisions
Les arbres de décisions
Mariem Chaaben
 
Présentation pfe
Présentation pfePrésentation pfe
Présentation pfe
Abdelghafour Zguindou
 
Apprentissage supervisé.pdf
Apprentissage supervisé.pdfApprentissage supervisé.pdf
Apprentissage supervisé.pdf
hanamettali
 
5.5 Clustering
5.5 Clustering5.5 Clustering
5.5 Clustering
Boris Guarisma
 
Machine Learning
Machine LearningMachine Learning
Machine Learning
Soft Computing
 
Cours datamining
Cours dataminingCours datamining
Cours datamining
sarah Benmerzouk
 
Lecture1 introduction to machine learning
Lecture1 introduction to machine learningLecture1 introduction to machine learning
Lecture1 introduction to machine learning
UmmeSalmaM1
 
Exposé réseaux des neurones (NN) - (RN)
Exposé réseaux des neurones (NN) - (RN)Exposé réseaux des neurones (NN) - (RN)
Exposé réseaux des neurones (NN) - (RN)
Soumia Elyakote HERMA
 
Algorithme génétique
Algorithme génétiqueAlgorithme génétique
Algorithme génétiqueIlhem Daoudi
 
Ia project Apprentissage Automatique
Ia project Apprentissage AutomatiqueIa project Apprentissage Automatique
Ia project Apprentissage Automatique
Nizar Bechir
 
Seminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie AppliquéeSeminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie Appliquée
Jean Roger Mably
 
Intelligence artificielle etroite introduction
Intelligence artificielle etroite introductionIntelligence artificielle etroite introduction
Intelligence artificielle etroite introduction
Smals
 
Le Reseau De Neurones
Le Reseau De NeuronesLe Reseau De Neurones
Le Reseau De Neuronesguestf80d95
 

Tendances (20)

Data Mining
Data MiningData Mining
Data Mining
 
Arbre de décision.pdf
Arbre de décision.pdfArbre de décision.pdf
Arbre de décision.pdf
 
Introduction au datamining, concepts et techniques
Introduction au datamining, concepts et techniquesIntroduction au datamining, concepts et techniques
Introduction au datamining, concepts et techniques
 
Evaluation metrics: Precision, Recall, F-Measure, ROC
Evaluation metrics: Precision, Recall, F-Measure, ROCEvaluation metrics: Precision, Recall, F-Measure, ROC
Evaluation metrics: Precision, Recall, F-Measure, ROC
 
Introduction au Machine Learning
Introduction au Machine LearningIntroduction au Machine Learning
Introduction au Machine Learning
 
Kaggle presentation
Kaggle presentationKaggle presentation
Kaggle presentation
 
Clustering: Méthode hiérarchique
Clustering: Méthode hiérarchiqueClustering: Méthode hiérarchique
Clustering: Méthode hiérarchique
 
Les arbres de décisions
Les arbres de décisionsLes arbres de décisions
Les arbres de décisions
 
Présentation pfe
Présentation pfePrésentation pfe
Présentation pfe
 
Apprentissage supervisé.pdf
Apprentissage supervisé.pdfApprentissage supervisé.pdf
Apprentissage supervisé.pdf
 
5.5 Clustering
5.5 Clustering5.5 Clustering
5.5 Clustering
 
Machine Learning
Machine LearningMachine Learning
Machine Learning
 
Cours datamining
Cours dataminingCours datamining
Cours datamining
 
Lecture1 introduction to machine learning
Lecture1 introduction to machine learningLecture1 introduction to machine learning
Lecture1 introduction to machine learning
 
Exposé réseaux des neurones (NN) - (RN)
Exposé réseaux des neurones (NN) - (RN)Exposé réseaux des neurones (NN) - (RN)
Exposé réseaux des neurones (NN) - (RN)
 
Algorithme génétique
Algorithme génétiqueAlgorithme génétique
Algorithme génétique
 
Ia project Apprentissage Automatique
Ia project Apprentissage AutomatiqueIa project Apprentissage Automatique
Ia project Apprentissage Automatique
 
Seminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie AppliquéeSeminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie Appliquée
 
Intelligence artificielle etroite introduction
Intelligence artificielle etroite introductionIntelligence artificielle etroite introduction
Intelligence artificielle etroite introduction
 
Le Reseau De Neurones
Le Reseau De NeuronesLe Reseau De Neurones
Le Reseau De Neurones
 

En vedette

Analyse financière
Analyse financièreAnalyse financière
Analyse financière
Abdo attar
 
Machine learning, deep learning et search : à quand ces innovations dans nos ...
Machine learning, deep learning et search : à quand ces innovations dans nos ...Machine learning, deep learning et search : à quand ces innovations dans nos ...
Machine learning, deep learning et search : à quand ces innovations dans nos ...
Antidot
 
Machine learning pour tous
Machine learning pour tousMachine learning pour tous
Machine learning pour tous
Damien Seguy
 
Mix it2014 - Machine Learning et Régulation Numérique
Mix it2014 - Machine Learning et Régulation NumériqueMix it2014 - Machine Learning et Régulation Numérique
Mix it2014 - Machine Learning et Régulation Numérique
Didier Girard
 
Machine intelligente d’analyse financiere
Machine intelligente d’analyse financiereMachine intelligente d’analyse financiere
Machine intelligente d’analyse financiere
Sabrine MASTOURA
 
Mahout classification presentation
Mahout classification presentationMahout classification presentation
Mahout classification presentation
Naoki Nakatani
 
Machine learning
Machine learningMachine learning
Machine learning
ebiznext
 
Cours Big Data Chap4 - Spark
Cours Big Data Chap4 - SparkCours Big Data Chap4 - Spark
Cours Big Data Chap4 - Spark
Amal Abid
 
TP2 Big Data HBase
TP2 Big Data HBaseTP2 Big Data HBase
TP2 Big Data HBase
Amal Abid
 
Machine Learning and Apache Mahout : An Introduction
Machine Learning and Apache Mahout : An IntroductionMachine Learning and Apache Mahout : An Introduction
Machine Learning and Apache Mahout : An Introduction
Varad Meru
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1
Amal Abid
 

En vedette (11)

Analyse financière
Analyse financièreAnalyse financière
Analyse financière
 
Machine learning, deep learning et search : à quand ces innovations dans nos ...
Machine learning, deep learning et search : à quand ces innovations dans nos ...Machine learning, deep learning et search : à quand ces innovations dans nos ...
Machine learning, deep learning et search : à quand ces innovations dans nos ...
 
Machine learning pour tous
Machine learning pour tousMachine learning pour tous
Machine learning pour tous
 
Mix it2014 - Machine Learning et Régulation Numérique
Mix it2014 - Machine Learning et Régulation NumériqueMix it2014 - Machine Learning et Régulation Numérique
Mix it2014 - Machine Learning et Régulation Numérique
 
Machine intelligente d’analyse financiere
Machine intelligente d’analyse financiereMachine intelligente d’analyse financiere
Machine intelligente d’analyse financiere
 
Mahout classification presentation
Mahout classification presentationMahout classification presentation
Mahout classification presentation
 
Machine learning
Machine learningMachine learning
Machine learning
 
Cours Big Data Chap4 - Spark
Cours Big Data Chap4 - SparkCours Big Data Chap4 - Spark
Cours Big Data Chap4 - Spark
 
TP2 Big Data HBase
TP2 Big Data HBaseTP2 Big Data HBase
TP2 Big Data HBase
 
Machine Learning and Apache Mahout : An Introduction
Machine Learning and Apache Mahout : An IntroductionMachine Learning and Apache Mahout : An Introduction
Machine Learning and Apache Mahout : An Introduction
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1
 

Similaire à Apprentissage Automatique et moteurs de recherche

test
testtest
test
dehbimoad
 
Séminaire IA & VA- Dominique Gruyer, Univ Gustave Eiffel
Séminaire IA & VA- Dominique Gruyer, Univ Gustave EiffelSéminaire IA & VA- Dominique Gruyer, Univ Gustave Eiffel
Séminaire IA & VA- Dominique Gruyer, Univ Gustave Eiffel
Mahdi Zarg Ayouna
 
Visite guidée au pays de la donnée - Traitement automatique des données
Visite guidée au pays de la donnée - Traitement automatique des donnéesVisite guidée au pays de la donnée - Traitement automatique des données
Visite guidée au pays de la donnée - Traitement automatique des données
Gautier Poupeau
 
Euratech'trends : Machine Learning
Euratech'trends : Machine LearningEuratech'trends : Machine Learning
Euratech'trends : Machine Learning
EuraTechnologies
 
Debuteraveclesmls
DebuteraveclesmlsDebuteraveclesmls
Le Machine Learning... tous aux fourneaux !
Le Machine Learning... tous aux fourneaux !Le Machine Learning... tous aux fourneaux !
Le Machine Learning... tous aux fourneaux !
BeeBryte | Energy Intelligence & Automation
 
Comprenez-vous l’intelligence artificielle ?
Comprenez-vous l’intelligence artificielle ?Comprenez-vous l’intelligence artificielle ?
Comprenez-vous l’intelligence artificielle ?
BigBrain Evolution
 
First step about IA and business
First step about IA and businessFirst step about IA and business
First step about IA and business
David Argellies
 
Parlez-vous le langage IA ? 30 notions pour comprendre l'IA
Parlez-vous le langage IA ? 30 notions pour comprendre l'IAParlez-vous le langage IA ? 30 notions pour comprendre l'IA
Parlez-vous le langage IA ? 30 notions pour comprendre l'IA
BigBrain Evolution
 
Comment le Data et Deep Learning révolutionnent la science
Comment le Data et Deep Learning révolutionnent la scienceComment le Data et Deep Learning révolutionnent la science
Comment le Data et Deep Learning révolutionnent la science
habib200
 
Les algorithmes de tri
Les algorithmes de triLes algorithmes de tri
Les algorithmes de tri
Thierry Leriche-Dessirier
 
Forum Labo Version DEF par Yvon Gervaise.pdf
Forum Labo Version DEF par Yvon Gervaise.pdfForum Labo Version DEF par Yvon Gervaise.pdf
Forum Labo Version DEF par Yvon Gervaise.pdf
Yvon Gervaise
 
Démystifions le machine learning avec spark par David Martin pour le Salon B...
Démystifions le machine learning avec spark par David Martin pour le Salon B...Démystifions le machine learning avec spark par David Martin pour le Salon B...
Démystifions le machine learning avec spark par David Martin pour le Salon B...
Ippon
 
Rapport-du-projet CNN.docx
Rapport-du-projet CNN.docxRapport-du-projet CNN.docx
Rapport-du-projet CNN.docx
khalil Ismail
 
BIPEA 2023 Yvon Gervaise : L'IA Matrice du Laboratoire du Futur ..
BIPEA 2023 Yvon Gervaise : L'IA Matrice du Laboratoire du Futur ..BIPEA 2023 Yvon Gervaise : L'IA Matrice du Laboratoire du Futur ..
BIPEA 2023 Yvon Gervaise : L'IA Matrice du Laboratoire du Futur ..
YvonGervaise
 
Introduction Azure machine learning
Introduction Azure machine learningIntroduction Azure machine learning
Introduction Azure machine learning
sana khiari
 
L'IA au service des Laboratoire - Conference donnée a Paris le 6 Février 2024
L'IA au service des Laboratoire - Conference donnée a Paris le 6 Février 2024L'IA au service des Laboratoire - Conference donnée a Paris le 6 Février 2024
L'IA au service des Laboratoire - Conference donnée a Paris le 6 Février 2024
YvonGervaise
 
L'Intelligence Artificielle I.A. au service des Laboratoires
L'Intelligence Artificielle I.A. au service des LaboratoiresL'Intelligence Artificielle I.A. au service des Laboratoires
L'Intelligence Artificielle I.A. au service des Laboratoires
Yvon Gervaise
 
IA, vous avez dit IA ?
IA, vous avez dit IA ?IA, vous avez dit IA ?
IA, vous avez dit IA ?
Ipsos France
 
DataMining.pdf
DataMining.pdfDataMining.pdf
DataMining.pdf
CoulibalyYoussoufngo
 

Similaire à Apprentissage Automatique et moteurs de recherche (20)

test
testtest
test
 
Séminaire IA & VA- Dominique Gruyer, Univ Gustave Eiffel
Séminaire IA & VA- Dominique Gruyer, Univ Gustave EiffelSéminaire IA & VA- Dominique Gruyer, Univ Gustave Eiffel
Séminaire IA & VA- Dominique Gruyer, Univ Gustave Eiffel
 
Visite guidée au pays de la donnée - Traitement automatique des données
Visite guidée au pays de la donnée - Traitement automatique des donnéesVisite guidée au pays de la donnée - Traitement automatique des données
Visite guidée au pays de la donnée - Traitement automatique des données
 
Euratech'trends : Machine Learning
Euratech'trends : Machine LearningEuratech'trends : Machine Learning
Euratech'trends : Machine Learning
 
Debuteraveclesmls
DebuteraveclesmlsDebuteraveclesmls
Debuteraveclesmls
 
Le Machine Learning... tous aux fourneaux !
Le Machine Learning... tous aux fourneaux !Le Machine Learning... tous aux fourneaux !
Le Machine Learning... tous aux fourneaux !
 
Comprenez-vous l’intelligence artificielle ?
Comprenez-vous l’intelligence artificielle ?Comprenez-vous l’intelligence artificielle ?
Comprenez-vous l’intelligence artificielle ?
 
First step about IA and business
First step about IA and businessFirst step about IA and business
First step about IA and business
 
Parlez-vous le langage IA ? 30 notions pour comprendre l'IA
Parlez-vous le langage IA ? 30 notions pour comprendre l'IAParlez-vous le langage IA ? 30 notions pour comprendre l'IA
Parlez-vous le langage IA ? 30 notions pour comprendre l'IA
 
Comment le Data et Deep Learning révolutionnent la science
Comment le Data et Deep Learning révolutionnent la scienceComment le Data et Deep Learning révolutionnent la science
Comment le Data et Deep Learning révolutionnent la science
 
Les algorithmes de tri
Les algorithmes de triLes algorithmes de tri
Les algorithmes de tri
 
Forum Labo Version DEF par Yvon Gervaise.pdf
Forum Labo Version DEF par Yvon Gervaise.pdfForum Labo Version DEF par Yvon Gervaise.pdf
Forum Labo Version DEF par Yvon Gervaise.pdf
 
Démystifions le machine learning avec spark par David Martin pour le Salon B...
Démystifions le machine learning avec spark par David Martin pour le Salon B...Démystifions le machine learning avec spark par David Martin pour le Salon B...
Démystifions le machine learning avec spark par David Martin pour le Salon B...
 
Rapport-du-projet CNN.docx
Rapport-du-projet CNN.docxRapport-du-projet CNN.docx
Rapport-du-projet CNN.docx
 
BIPEA 2023 Yvon Gervaise : L'IA Matrice du Laboratoire du Futur ..
BIPEA 2023 Yvon Gervaise : L'IA Matrice du Laboratoire du Futur ..BIPEA 2023 Yvon Gervaise : L'IA Matrice du Laboratoire du Futur ..
BIPEA 2023 Yvon Gervaise : L'IA Matrice du Laboratoire du Futur ..
 
Introduction Azure machine learning
Introduction Azure machine learningIntroduction Azure machine learning
Introduction Azure machine learning
 
L'IA au service des Laboratoire - Conference donnée a Paris le 6 Février 2024
L'IA au service des Laboratoire - Conference donnée a Paris le 6 Février 2024L'IA au service des Laboratoire - Conference donnée a Paris le 6 Février 2024
L'IA au service des Laboratoire - Conference donnée a Paris le 6 Février 2024
 
L'Intelligence Artificielle I.A. au service des Laboratoires
L'Intelligence Artificielle I.A. au service des LaboratoiresL'Intelligence Artificielle I.A. au service des Laboratoires
L'Intelligence Artificielle I.A. au service des Laboratoires
 
IA, vous avez dit IA ?
IA, vous avez dit IA ?IA, vous avez dit IA ?
IA, vous avez dit IA ?
 
DataMining.pdf
DataMining.pdfDataMining.pdf
DataMining.pdf
 

Plus de Philippe YONNET

Requetes ecommerce - les différences US vs Europe.pptx
Requetes ecommerce - les différences US vs Europe.pptxRequetes ecommerce - les différences US vs Europe.pptx
Requetes ecommerce - les différences US vs Europe.pptx
Philippe YONNET
 
Google - les nouvelles regles du jeu.pptx
Google - les nouvelles regles du jeu.pptxGoogle - les nouvelles regles du jeu.pptx
Google - les nouvelles regles du jeu.pptx
Philippe YONNET
 
Actu du SEO - Matin Népérien Lille - Agence Neper
Actu du SEO - Matin Népérien Lille - Agence NeperActu du SEO - Matin Népérien Lille - Agence Neper
Actu du SEO - Matin Népérien Lille - Agence Neper
Philippe YONNET
 
WEBINAR TOPICAL CLUSTERS 9 JUIN 2022.pptx
WEBINAR TOPICAL CLUSTERS 9 JUIN 2022.pptxWEBINAR TOPICAL CLUSTERS 9 JUIN 2022.pptx
WEBINAR TOPICAL CLUSTERS 9 JUIN 2022.pptx
Philippe YONNET
 
WEBINAR SEO INTERNATIONAL 5 mai 2022.pptx
WEBINAR SEO INTERNATIONAL 5 mai 2022.pptxWEBINAR SEO INTERNATIONAL 5 mai 2022.pptx
WEBINAR SEO INTERNATIONAL 5 mai 2022.pptx
Philippe YONNET
 
IMPACT DE L'IA SUR LE SEO.pptx
IMPACT DE L'IA SUR LE SEO.pptxIMPACT DE L'IA SUR LE SEO.pptx
IMPACT DE L'IA SUR LE SEO.pptx
Philippe YONNET
 
IA DANS L'ALGORITHME DE GOOGLE.pptx
IA DANS L'ALGORITHME DE GOOGLE.pptxIA DANS L'ALGORITHME DE GOOGLE.pptx
IA DANS L'ALGORITHME DE GOOGLE.pptx
Philippe YONNET
 
No Code et SEO sont ils compatibles ? Philippe Yonnet Neper
No Code et SEO sont ils compatibles ? Philippe Yonnet NeperNo Code et SEO sont ils compatibles ? Philippe Yonnet Neper
No Code et SEO sont ils compatibles ? Philippe Yonnet Neper
Philippe YONNET
 
Webinar marketplace 9 mars 2022
Webinar marketplace 9 mars 2022Webinar marketplace 9 mars 2022
Webinar marketplace 9 mars 2022
Philippe YONNET
 
Apprenons à faire des SEO Split Tests
Apprenons à faire des SEO Split TestsApprenons à faire des SEO Split Tests
Apprenons à faire des SEO Split Tests
Philippe YONNET
 
L'IA dans l'algorithme de Google - Matin neperien 7 juillet 2021
L'IA dans l'algorithme de Google - Matin neperien 7 juillet 2021L'IA dans l'algorithme de Google - Matin neperien 7 juillet 2021
L'IA dans l'algorithme de Google - Matin neperien 7 juillet 2021
Philippe YONNET
 
Nouvelles architectures de sites web et SEO
Nouvelles architectures de sites web et SEONouvelles architectures de sites web et SEO
Nouvelles architectures de sites web et SEO
Philippe YONNET
 
Matin neperien : quelles actions lancer en digital en 2021
Matin neperien : quelles actions lancer en digital en 2021Matin neperien : quelles actions lancer en digital en 2021
Matin neperien : quelles actions lancer en digital en 2021
Philippe YONNET
 
Ab testing seo 22 dec 2020
Ab testing seo   22 dec 2020Ab testing seo   22 dec 2020
Ab testing seo 22 dec 2020
Philippe YONNET
 
Core web vitals - Webinar Neper du 3 décembre 2020
Core web vitals - Webinar Neper du 3 décembre 2020Core web vitals - Webinar Neper du 3 décembre 2020
Core web vitals - Webinar Neper du 3 décembre 2020
Philippe YONNET
 
Webinar Semrush Neper - quel ROI pour les pages amp
Webinar Semrush Neper - quel ROI pour les pages  ampWebinar Semrush Neper - quel ROI pour les pages  amp
Webinar Semrush Neper - quel ROI pour les pages amp
Philippe YONNET
 
L'impact sur le SEO de Googlebot Evergreen
L'impact sur le SEO de Googlebot EvergreenL'impact sur le SEO de Googlebot Evergreen
L'impact sur le SEO de Googlebot Evergreen
Philippe YONNET
 
Le Edge SEO : comment faire du SEO dans le Cloud quand tout le reste a échoué
Le Edge SEO : comment faire du SEO dans le Cloud quand tout le reste a échouéLe Edge SEO : comment faire du SEO dans le Cloud quand tout le reste a échoué
Le Edge SEO : comment faire du SEO dans le Cloud quand tout le reste a échoué
Philippe YONNET
 
2018 le seo à l heure du mobile first index
2018 le seo à l heure du mobile first index2018 le seo à l heure du mobile first index
2018 le seo à l heure du mobile first index
Philippe YONNET
 
Tuniseo 2017 année charnière pour le SEO ?
Tuniseo  2017 année charnière pour le SEO ?Tuniseo  2017 année charnière pour le SEO ?
Tuniseo 2017 année charnière pour le SEO ?
Philippe YONNET
 

Plus de Philippe YONNET (20)

Requetes ecommerce - les différences US vs Europe.pptx
Requetes ecommerce - les différences US vs Europe.pptxRequetes ecommerce - les différences US vs Europe.pptx
Requetes ecommerce - les différences US vs Europe.pptx
 
Google - les nouvelles regles du jeu.pptx
Google - les nouvelles regles du jeu.pptxGoogle - les nouvelles regles du jeu.pptx
Google - les nouvelles regles du jeu.pptx
 
Actu du SEO - Matin Népérien Lille - Agence Neper
Actu du SEO - Matin Népérien Lille - Agence NeperActu du SEO - Matin Népérien Lille - Agence Neper
Actu du SEO - Matin Népérien Lille - Agence Neper
 
WEBINAR TOPICAL CLUSTERS 9 JUIN 2022.pptx
WEBINAR TOPICAL CLUSTERS 9 JUIN 2022.pptxWEBINAR TOPICAL CLUSTERS 9 JUIN 2022.pptx
WEBINAR TOPICAL CLUSTERS 9 JUIN 2022.pptx
 
WEBINAR SEO INTERNATIONAL 5 mai 2022.pptx
WEBINAR SEO INTERNATIONAL 5 mai 2022.pptxWEBINAR SEO INTERNATIONAL 5 mai 2022.pptx
WEBINAR SEO INTERNATIONAL 5 mai 2022.pptx
 
IMPACT DE L'IA SUR LE SEO.pptx
IMPACT DE L'IA SUR LE SEO.pptxIMPACT DE L'IA SUR LE SEO.pptx
IMPACT DE L'IA SUR LE SEO.pptx
 
IA DANS L'ALGORITHME DE GOOGLE.pptx
IA DANS L'ALGORITHME DE GOOGLE.pptxIA DANS L'ALGORITHME DE GOOGLE.pptx
IA DANS L'ALGORITHME DE GOOGLE.pptx
 
No Code et SEO sont ils compatibles ? Philippe Yonnet Neper
No Code et SEO sont ils compatibles ? Philippe Yonnet NeperNo Code et SEO sont ils compatibles ? Philippe Yonnet Neper
No Code et SEO sont ils compatibles ? Philippe Yonnet Neper
 
Webinar marketplace 9 mars 2022
Webinar marketplace 9 mars 2022Webinar marketplace 9 mars 2022
Webinar marketplace 9 mars 2022
 
Apprenons à faire des SEO Split Tests
Apprenons à faire des SEO Split TestsApprenons à faire des SEO Split Tests
Apprenons à faire des SEO Split Tests
 
L'IA dans l'algorithme de Google - Matin neperien 7 juillet 2021
L'IA dans l'algorithme de Google - Matin neperien 7 juillet 2021L'IA dans l'algorithme de Google - Matin neperien 7 juillet 2021
L'IA dans l'algorithme de Google - Matin neperien 7 juillet 2021
 
Nouvelles architectures de sites web et SEO
Nouvelles architectures de sites web et SEONouvelles architectures de sites web et SEO
Nouvelles architectures de sites web et SEO
 
Matin neperien : quelles actions lancer en digital en 2021
Matin neperien : quelles actions lancer en digital en 2021Matin neperien : quelles actions lancer en digital en 2021
Matin neperien : quelles actions lancer en digital en 2021
 
Ab testing seo 22 dec 2020
Ab testing seo   22 dec 2020Ab testing seo   22 dec 2020
Ab testing seo 22 dec 2020
 
Core web vitals - Webinar Neper du 3 décembre 2020
Core web vitals - Webinar Neper du 3 décembre 2020Core web vitals - Webinar Neper du 3 décembre 2020
Core web vitals - Webinar Neper du 3 décembre 2020
 
Webinar Semrush Neper - quel ROI pour les pages amp
Webinar Semrush Neper - quel ROI pour les pages  ampWebinar Semrush Neper - quel ROI pour les pages  amp
Webinar Semrush Neper - quel ROI pour les pages amp
 
L'impact sur le SEO de Googlebot Evergreen
L'impact sur le SEO de Googlebot EvergreenL'impact sur le SEO de Googlebot Evergreen
L'impact sur le SEO de Googlebot Evergreen
 
Le Edge SEO : comment faire du SEO dans le Cloud quand tout le reste a échoué
Le Edge SEO : comment faire du SEO dans le Cloud quand tout le reste a échouéLe Edge SEO : comment faire du SEO dans le Cloud quand tout le reste a échoué
Le Edge SEO : comment faire du SEO dans le Cloud quand tout le reste a échoué
 
2018 le seo à l heure du mobile first index
2018 le seo à l heure du mobile first index2018 le seo à l heure du mobile first index
2018 le seo à l heure du mobile first index
 
Tuniseo 2017 année charnière pour le SEO ?
Tuniseo  2017 année charnière pour le SEO ?Tuniseo  2017 année charnière pour le SEO ?
Tuniseo 2017 année charnière pour le SEO ?
 

Apprentissage Automatique et moteurs de recherche

  • 1. Machine Learning dans les Moteurs de recherche 8-9 mars 2012 Philippe YONNET Directeur SEO International philippe.yonnet@twenga.com
  • 2. Pourquoi parler de ces algorithmes ? Il est fort possible que l’algorithme Panda soit un algorithme d’apprentissage automatique. Son auteur, un dénommé… Panda. Il y’a deux Panda connus chez Google, tous les deux ont travaillé sur des projets de Machine Learning…
  • 3. L’apprentissage automatique  Machine learning en anglais  Conception et développement d’algorithmes capables de s’autoam
  • 4. Applications classiques  Reconnaissance de formes, reconnaissance de caractère  Robotique  Classification automatique
  • 5. Les principaux types d’apprentissage  Apprentissage supervisé  Présence d’un « oracle » qui fournit un jeu de réponses désirées (exemples ou contre-exemples)  Apprentissage non supervisé  Classification automatique / Clustering  L'algorithme doit découvrir par lui-même la structure plus ou moins cachée des données  Apprentissage par renforcement  l'algorithme apprend un comportement étant donné une observation. L'action de l'algorithme sur l'environnement produit une valeur de retour qui guide l'algorithme d'apprentissage. On identifie d’autres types d’algorithmes : semi-supervisé, partiellement supervisé…
  • 6. Quelques grandes catégories d’algorithmes  Les algorithmes à bases d’arbres de décision  Data mining, entrepôts de données, aide à la décision, système experts, diagnostic  Le boosting  Amélioration des systèmes de classification binaire  Les réseaux de neurones artificiels  Les algorithmes génétiques  Sélection naturelle des meilleurs programmes  L’ILP (inductive logic programming) :  exemples positifs + exemples négatifs + base de connaissances = règles (utile en TAL)  Les Support Vector Machines  Les Réseaux Bayésiens  diagnostic (médical et industriel), l'analyse de risques, la détection des spams et le data mining.
  • 7. L’apprentissage automatique et le spam SPAM Classification automatique utilisant l’apprentissage supervisé à partir de données étiquetées (classifiées) par un humain (« oracle »). L’objectif est de déterminer une fonction opérationnelle séparant correctement les points bleus et rouges (courbe verte)
  • 8. Pourquoi ces algorithmes ont-ils été longtemps sous-utilisés par les moteurs de recherche? Longtemps, l’utilisation de ces algorithmes a été bridée par trois problèmes :  La difficulté de création des données d’entrainement  Le temps de calcul et les besoins en ressources  La faisabilité pure des calculs
  • 9. Définition d’un classifier Une première approche possible (et triviale) pour déterminer les lois régissant un ensemble de données : la régression. L’objectif est de déterminer une courbe qui donne une approximation correcte des points mesurés. Dans l’exemple de gauche, la courbe est droite affine y=ax+b. A droite un polynome plus complexe.
  • 10. Les Support Vector Machines SVM Un des principes de la technique des SVM : il existe souvent plusieurs frontières permettant de « séparer » des échantillons de points. Les meilleures frontières sont celles qui maximisent la distance entre la frontière et les points (les « séparateurs à vastes marges »). L’algorithme SVM permet d’identifier les frontières donnant le minimum d’erreurs de classification.
  • 11. SVM : La recherche d’un hyperplan « frontière » Recherche d’un hyperplan « frontière » dans la technique des SVM : la frontière ici est relativement complexe si on la décrit dans l’espace à deux dimensions qui décrit les données d’entrainement. En transposant le problème dans un espace muldimensionnel (3 dimensions sur le schéma) il peut être possible de trouver un hyperplan (ici un plan), simple à décrire, qui permet de classifier facilement les données. Tiens tiens… J’ai déjà vu ça quelque part
  • 12. Panda et les SVM  Amit Singhal décrit l’algorithme ainsi dans une interview de Wired:  « Vous pouvez imaginer dans un espace muldimensionnel un groupe de points, certains points sont rouges, certains points sont verts, and pour d’autres c’est un mélange des deux. Votre travail est de trouver un hyperplan qui indique que la plupart des choses d’un côté de ce plan sont rouges, et que la plupart des choses de l’autre côté sont le contraire de « rouge » ».
  • 13. REFERENCES  Machine Learning chez Google  http://research.google.com/pubs/MachineLearning.html  PLANET: Massively Parallel Learning of Tree Ensembles with MapReduce Biswanath Panda, Joshua S. Herbach, Sugato Basu, Roberto J. Bayardo, Google, Inc. http://www.bayardo.org/ps/vldb2009.pdf  KDX: An Indexer for Support Vector Machines Navneet Panda, Edward Y. Chang, Google Inc http://www.computer.org/portal/web/csdl/doi/10.1109/TKDE.2006.101  OASIS : Large Scale Online Learning of Image Similarity Through Ranking Gal Chechik , Varun Sharma, Samy Bengio, Google Inc & Uri Shalit, The Gonda brain research center, Bar Ilan University www.robots.ox.ac.uk/~vgg/rg/papers/rankingsimilarity.pdf
  • 14. Références  Machine Learning chez Bing!  http://research.microsoft.com/en-us/groups/ml/  http://research.microsoft.com/en-us/groups/mlp/  http://research.microsoft.com/en-us/groups/mlpml/  ...  Beyond PageRank: Machine Learning for Static Ranking Matthew Richardson, Microsoft Research, Amit Prakash MSN, Eric Brill, Microsoft Research www.inf.unibz.it/~ricci/SDB/slides/fRank-Presentation.pdf  Machine Learning chez Yahoo!  http://research.yahoo.com/Machine_Learning  Developing parallel sequential minimal optimization for fast training support vector machine. Yahoo Labs, Cao, L.J.; Keerthi, S.S.; Ong, C.J.; Uvaraj, P.; Fu, X.J.; Lee, H.P. http://research.yahoo.com/pub/951