Machine Learning & SEO - SEO Camp'Us Paris 2016

737 vues

Publié le

Slides de ma présentation sur le thème du Machine Learning lors du SEO Camp'US Paris 2016, le 8 avril dernier.
Au programme : quelques explications sur le Machine Learning et ses principes, des exemples concrets d'utilisation, et quelques pistes pour aller plus loin.

Plus d'infos : http://blog.1-clic.info/referencement/machine-learning-seocampus-paris-2016/

Publié dans : Données & analyses
0 commentaire
2 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
737
Sur SlideShare
0
Issues des intégrations
0
Intégrations
354
Actions
Partages
0
Téléchargements
15
Commentaires
0
J’aime
2
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Machine Learning & SEO - SEO Camp'Us Paris 2016

  1. 1. Machine Learning Quelles applications concrètes pour le SEO ?
  2. 2. Julien Deneuville • 27 ans • Monte des sites depuis 2004 • SEO pro depuis 2011 • Twitter : @diije • Blog : http://blog.1-clic.info/ • Musique • Vélo Qui suis-je ? Hello, World!
  3. 3. De quoi parle-t-on ? Exemple 1 : analyse sémantique Exemple 2 : segmentation d’utilisateurs Exemple 3 : catégorisation d’URLs Aller plus loin 3 Machine Learning Sommaire
  4. 4. Machine Learning De quoi ça s’agit ?
  5. 5. Machine Learning 5 Buzz Word ou réelle tendance ?
  6. 6. Machine Learning Machine Learning : Field of study that gives computers the ability to learn without being explicitly programmed. Arthur Samuel, pionnier de l’intelligence artificielle 6 Dessine-moi un mouton
  7. 7. Machine Learning Mettre au point des algorithmes permettant de déterminer des caractéristiques pour de nouvelles données en se basant sur la connaissance de données d’apprentissage. 7 Pour de vrai
  8. 8. Comment ça fonctionne ? 8 Dans les grandes lignes
  9. 9. Les régressions • Prédire une valeur « continue » • Exemple type : calculer le prix de vente d’une maison Les classifications • Déterminer une valeur « discrète » • Exemple type : catégoriser des données 9 Deux grands types de méthodes Machine Learning 101
  10. 10. Découper de manière algorithmique un ensemble de données en classes ou clusters : • Classes : connues à l’avance • Clusters : déterminés par la machine En théorie : • Des objets d’un même ensemble sont similaires • Des objets d’ensembles différents sont dissimilaires 10 Classification Kézako ?
  11. 11. Pourquoi ? 1. Un bon nombre de traitements automatisables • « Il y a un algorithme pour ça. » © Sylvain Peyronnet 2. Un changement d’échelle • Une machine traitera beaucoup plus de données qu’un humain, et plus vite. 3. Une littérature abondante • Merci à la communauté scientifique ! 11 Quel intérêt au Machine Learning ?
  12. 12. Analyse de données sémantiques Plus grand, plus vite, plus loin
  13. 13. Regrouper des mots clés Objectif : regrouper des mots clés par proximité sémantique Sur quels critères ? • Analyse syntaxique • Cooccurrence • TF*IDF • … Avec quelle méthode ? • K-means : le classique Clustering
  14. 14. K-means 14 Quelques explications
  15. 15. Les avantages • Un classique du clustering • Simple à implémenter • Résultats rapides Les inconvénients • Résultats aléatoires • Nécessite d’indiquer à l’avance le nombre de classes 15 http://Scikit-Learn.org/ K-means Quelques explications
  16. 16. 16 Clustering sémantique Exemple live
  17. 17. Quelles applications ? Explorer un univers sémantique Analyser la visibilité de votre site sur cet univers Détecter des opportunités Identifier les mots clés à utiliser … 17 Idées d’utilisation
  18. 18. Segmentation d’une base d’utilisateurs CRM & recommandation
  19. 19. Segmenter une base d’utilisateurs Mise en situation : vous éditez un site qui propose des contenus sur différentes thématiques (sport, jeux vidéos, cinéma …). Vos données : • Une liste d’utilisateurs • Leurs affinités avec vos thématiques Votre objectif : • Regrouper vos utilisateurs par affinités 19 Trouver mes influenceurs
  20. 20. 20 Segmenter des utilisateurs Catégorisation
  21. 21. Réutiliser ces données Objectif : mettre en place un système de recommandation 1. Identifier les « influenceurs » : les utilisateurs typiques d’une affinité 2. Identifier les « suiveurs » : les utilisateurs proches de ces influenceurs 3. Si un contenu plaît aux influenceurs, il plaira probablement aux suiveurs 21 Think different
  22. 22. 22 Segmenter des utilisateurs Catégorisation Influenceurs Suiveurs
  23. 23. Catégorisation d’URLs Au-delà des RegEx
  24. 24. Catégoriser des URLs Objectif : catégoriser les pages d’un site, sans se baser sur les URLs Schema classique : • http://www.example.com/category/page.htm • Catégorie : /category/ Données d’entrée : • Liste des pages • Liens entre ces pages 24 Brasse coulée
  25. 25. Logiciel open source, gratuit, français. Visualisation de graphes Algorithmes intégrés Documentation 25 https://gephi.org/ Gephi Couteau Suisse
  26. 26. Step 1 : intégrer les données dans Gephi 26 Nœuds et liens
  27. 27. Step 2 : catégorisation instantanée 27 Modularity Class
  28. 28. Aller plus loin Un peu de lecture
  29. 29. Les Frères Peyronnet • https://freres.peyronnet.eu/ • @speyronnet et @gpeyronnet Aurélien Berrut • http://www.htitipi.com/blog/ • @htitipidotcom Vincent Terrasi • http://data-seo.com/ • @vincentterrasi 29 De bonnes infos Blogs et personnes à suivre
  30. 30. www.1-clic.info Merci de votre attention ! Bon appétit J Mail julien@1-clic.info Blog http://blog.1-clic.info/ Twitter @diije

×