Machine Learning
Quelles applications concrètes pour le SEO ?
Julien Deneuville
• 27 ans
• Monte des sites depuis 2004
• SEO pro depuis 2011
• Twitter : @diije
• Blog : http://blog.1-clic.info/
• Musique
• Vélo
Qui suis-je ?
Hello, World!
De quoi parle-t-on ?
Exemple 1 : analyse sémantique
Exemple 2 : segmentation d’utilisateurs
Exemple 3 : catégorisation d’URLs
Aller plus loin
3
Machine Learning
Sommaire
Machine Learning
De quoi ça s’agit ?
Machine Learning
5
Buzz Word ou réelle tendance ?
Machine Learning
Machine Learning : Field of study that gives computers the
ability to learn without being explicitly programmed.
Arthur Samuel, pionnier de l’intelligence artificielle
6
Dessine-moi un mouton
Machine Learning
Mettre au point des algorithmes permettant de déterminer
des caractéristiques pour de nouvelles données en se basant
sur la connaissance de données d’apprentissage.
7
Pour de vrai
Comment ça fonctionne ?
8
Dans les grandes lignes
Les régressions
• Prédire une valeur « continue »
• Exemple type : calculer le prix de vente
d’une maison
Les classifications
• Déterminer une valeur « discrète »
• Exemple type : catégoriser des données
9
Deux grands types de méthodes
Machine Learning 101
Découper de manière algorithmique
un ensemble de données en classes ou
clusters :
• Classes : connues à l’avance
• Clusters : déterminés par la machine
En théorie :
• Des objets d’un même ensemble sont
similaires
• Des objets d’ensembles différents sont
dissimilaires
10
Classification
Kézako ?
Pourquoi ?
1. Un bon nombre de traitements automatisables
• « Il y a un algorithme pour ça. » © Sylvain Peyronnet
2. Un changement d’échelle
• Une machine traitera beaucoup plus de données qu’un humain, et plus vite.
3. Une littérature abondante
• Merci à la communauté scientifique !
11
Quel intérêt au Machine Learning ?
Analyse de données
sémantiques
Plus grand, plus vite, plus loin
Regrouper des mots clés
Objectif : regrouper des mots clés par proximité sémantique
Sur quels critères ?
• Analyse syntaxique
• Cooccurrence
• TF*IDF
• …
Avec quelle méthode ?
• K-means : le classique
Clustering
K-means
14
Quelques explications
Les avantages
• Un classique du clustering
• Simple à implémenter
• Résultats rapides
Les inconvénients
• Résultats aléatoires
• Nécessite d’indiquer à l’avance le nombre
de classes
15
http://Scikit-Learn.org/
K-means
Quelques explications
16
Clustering sémantique
Exemple live
Quelles applications ?
Explorer un univers sémantique
Analyser la visibilité de votre site sur cet univers
Détecter des opportunités
Identifier les mots clés à utiliser
…
17
Idées d’utilisation
Segmentation d’une
base d’utilisateurs
CRM & recommandation
Segmenter une base d’utilisateurs
Mise en situation : vous éditez un site qui propose des contenus sur différentes
thématiques (sport, jeux vidéos, cinéma …).
Vos données :
• Une liste d’utilisateurs
• Leurs affinités avec vos thématiques
Votre objectif :
• Regrouper vos utilisateurs par affinités
19
Trouver mes influenceurs
20
Segmenter des utilisateurs
Catégorisation
Réutiliser ces données
Objectif : mettre en place un système de recommandation
1. Identifier les « influenceurs » : les utilisateurs typiques d’une affinité
2. Identifier les « suiveurs » : les utilisateurs proches de ces influenceurs
3. Si un contenu plaît aux influenceurs, il plaira probablement aux suiveurs
21
Think different
22
Segmenter des utilisateurs
Catégorisation
Influenceurs Suiveurs
Catégorisation
d’URLs
Au-delà des RegEx
Catégoriser des URLs
Objectif : catégoriser les pages d’un site, sans se baser sur les URLs
Schema classique :
• http://www.example.com/category/page.htm
• Catégorie : /category/
Données d’entrée :
• Liste des pages
• Liens entre ces pages
24
Brasse coulée
Logiciel open source, gratuit, français.
Visualisation de graphes
Algorithmes intégrés
Documentation
25
https://gephi.org/
Gephi
Couteau Suisse
Step 1 : intégrer les données dans Gephi
26
Nœuds et liens
Step 2 : catégorisation instantanée
27
Modularity Class
Aller plus loin
Un peu de lecture
Les Frères Peyronnet
• https://freres.peyronnet.eu/
• @speyronnet et @gpeyronnet
Aurélien Berrut
• http://www.htitipi.com/blog/
• @htitipidotcom
Vincent Terrasi
• http://data-seo.com/
• @vincentterrasi
29
De bonnes infos
Blogs et personnes à suivre
www.1-clic.info
Merci de votre attention !
Bon appétit J
Mail
julien@1-clic.info
Blog
http://blog.1-clic.info/
Twitter
@diije

Machine Learning & SEO - SEO Camp'Us Paris 2016

  • 1.
    Machine Learning Quelles applicationsconcrètes pour le SEO ?
  • 2.
    Julien Deneuville • 27ans • Monte des sites depuis 2004 • SEO pro depuis 2011 • Twitter : @diije • Blog : http://blog.1-clic.info/ • Musique • Vélo Qui suis-je ? Hello, World!
  • 3.
    De quoi parle-t-on? Exemple 1 : analyse sémantique Exemple 2 : segmentation d’utilisateurs Exemple 3 : catégorisation d’URLs Aller plus loin 3 Machine Learning Sommaire
  • 4.
  • 5.
    Machine Learning 5 Buzz Wordou réelle tendance ?
  • 6.
    Machine Learning Machine Learning: Field of study that gives computers the ability to learn without being explicitly programmed. Arthur Samuel, pionnier de l’intelligence artificielle 6 Dessine-moi un mouton
  • 7.
    Machine Learning Mettre aupoint des algorithmes permettant de déterminer des caractéristiques pour de nouvelles données en se basant sur la connaissance de données d’apprentissage. 7 Pour de vrai
  • 8.
    Comment ça fonctionne? 8 Dans les grandes lignes
  • 9.
    Les régressions • Prédireune valeur « continue » • Exemple type : calculer le prix de vente d’une maison Les classifications • Déterminer une valeur « discrète » • Exemple type : catégoriser des données 9 Deux grands types de méthodes Machine Learning 101
  • 10.
    Découper de manièrealgorithmique un ensemble de données en classes ou clusters : • Classes : connues à l’avance • Clusters : déterminés par la machine En théorie : • Des objets d’un même ensemble sont similaires • Des objets d’ensembles différents sont dissimilaires 10 Classification Kézako ?
  • 11.
    Pourquoi ? 1. Unbon nombre de traitements automatisables • « Il y a un algorithme pour ça. » © Sylvain Peyronnet 2. Un changement d’échelle • Une machine traitera beaucoup plus de données qu’un humain, et plus vite. 3. Une littérature abondante • Merci à la communauté scientifique ! 11 Quel intérêt au Machine Learning ?
  • 12.
    Analyse de données sémantiques Plusgrand, plus vite, plus loin
  • 13.
    Regrouper des motsclés Objectif : regrouper des mots clés par proximité sémantique Sur quels critères ? • Analyse syntaxique • Cooccurrence • TF*IDF • … Avec quelle méthode ? • K-means : le classique Clustering
  • 14.
  • 15.
    Les avantages • Unclassique du clustering • Simple à implémenter • Résultats rapides Les inconvénients • Résultats aléatoires • Nécessite d’indiquer à l’avance le nombre de classes 15 http://Scikit-Learn.org/ K-means Quelques explications
  • 16.
  • 17.
    Quelles applications ? Explorerun univers sémantique Analyser la visibilité de votre site sur cet univers Détecter des opportunités Identifier les mots clés à utiliser … 17 Idées d’utilisation
  • 18.
  • 19.
    Segmenter une based’utilisateurs Mise en situation : vous éditez un site qui propose des contenus sur différentes thématiques (sport, jeux vidéos, cinéma …). Vos données : • Une liste d’utilisateurs • Leurs affinités avec vos thématiques Votre objectif : • Regrouper vos utilisateurs par affinités 19 Trouver mes influenceurs
  • 20.
  • 21.
    Réutiliser ces données Objectif: mettre en place un système de recommandation 1. Identifier les « influenceurs » : les utilisateurs typiques d’une affinité 2. Identifier les « suiveurs » : les utilisateurs proches de ces influenceurs 3. Si un contenu plaît aux influenceurs, il plaira probablement aux suiveurs 21 Think different
  • 22.
  • 23.
  • 24.
    Catégoriser des URLs Objectif: catégoriser les pages d’un site, sans se baser sur les URLs Schema classique : • http://www.example.com/category/page.htm • Catégorie : /category/ Données d’entrée : • Liste des pages • Liens entre ces pages 24 Brasse coulée
  • 25.
    Logiciel open source,gratuit, français. Visualisation de graphes Algorithmes intégrés Documentation 25 https://gephi.org/ Gephi Couteau Suisse
  • 26.
    Step 1 :intégrer les données dans Gephi 26 Nœuds et liens
  • 27.
    Step 2 :catégorisation instantanée 27 Modularity Class
  • 28.
    Aller plus loin Unpeu de lecture
  • 29.
    Les Frères Peyronnet •https://freres.peyronnet.eu/ • @speyronnet et @gpeyronnet Aurélien Berrut • http://www.htitipi.com/blog/ • @htitipidotcom Vincent Terrasi • http://data-seo.com/ • @vincentterrasi 29 De bonnes infos Blogs et personnes à suivre
  • 30.
    www.1-clic.info Merci de votreattention ! Bon appétit J Mail julien@1-clic.info Blog http://blog.1-clic.info/ Twitter @diije