Architecture de
l’information
Enjeux et opportunités
Mathieu Gheerbrant – SEO Hackers
Paul Colombo – Seloger.com
Présentations
Co-fondateur de l’agence SEO Hackers
http://www.seo-france.net/ | http://seohackers.fr/
@BlackMelvyn
Mathieu
Gheerbrant
Promoteur Senior pour Se Loger
http://www.seloger.com/
@Polo_Seo
Paul
Colombo
MOTEURS DE RECHERCHE :
NOTIONS DE BASE
Back to basics
De la page web d’un site aux SERP des moteurs
CrawlCrawl IndexIndex RankRank
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Exploration / Extraction
• Code HTML complet
• Ressources liées
• Extraction :
• Titres, intertitres
• Texte / expressions /
entités
• Liens internes / externes
• Media (images, videos, etc.)
CrawlCrawl
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Circuit d’un crawler
• URL récupérées des liens
• URL récupérées des sitemaps
• URL récupérées des liens externes entrants
CrawlCrawl
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Indexation
• Répartition par cluster
thématique
• URL explorées
• URL connexes / associées
• Pages web et media
IndexIndex
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Classement
• En fonction des requêtes
• Résultat de différentes couches
d’algorithmes
RankRank
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
LA QUÊTE DU CRAWL PARFAIT
Crawl = popularité
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Définir des priorités
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
↑Volume de pages
indexées
Promotion des pages
prioritaires
Gestion des pages dans le
temps
Architecture
La colonne vertébrale du site
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Double utilité
• Présenter une conception stable et durable
• Contenus organisés, structurés
• Charge de popularité répartie
• Indispensable à la circulation des
informations et le maillage sémantique
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Double enjeu
• Permettre un crawl optimal du site
• Augmenter la pertinence par le maillage
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Objectif : pertinence
• Développer un circuit de crawl récursif
• Créer des circuits par ensembles thématiques
• Définir des nœuds sémantiques
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Gros site / petit site
• Structure nécessaire différente
• Crawl budget différent
• Enjeux critiques différents
L’architecture de l’information doit être adaptée
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Gestion de crawl arborescente
Gestion de crawl
• Certaines sections de site doivent être interdites
aux crawlers
• Fichier robots.txt
• Autorisation sur IP
• Authentification serveur
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Rendre son site
« crawlable »
•
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Différents leviers
• Arborescence
• Fil d’Ariane
• Pied de page
• Navigations secondaires
• Blocs contextuels
• Plan de site
• Menu
• Liens in-text
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Façonner l’arborescence
• Utilisation des restrictions de crawl
• Utilisation des leviers en fonction :
• des niveaux d’arborescence
• des typologies de pages
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Arborescence
• Arborescence :
Structure générale
du site
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Arborescence simple
• Doit être réfléchie
et optimisée pour
aussi bien pour les
petits sites …
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Arborescence
complexe
• Que pour les
gros !
• Chaque pages
doivent être
maillées.
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Fil d’Ariane
Correspond au cheminement pour atteindre
la page sur laquelle vous êtes
•Utilisé par :
• Internautes
• Robots
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Pied de page
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Blocs contextuels
• Permettent la navigation entre les pages et
accélèrent la découverte de nouvelles
pages.
• Créent du linking contextualisé entre les
pages de mêmes catégories / familles.
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Plan de site
• Une solution pour avoir plus de pages à
positionner et donc plus de visibilité
• Des pages créées pour faire du lien interne
• Ne pas créer un plan de site inutilement
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Plan de site
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Navigations secondaires
Considérée comme
un menu secondaire,
non accessible depuis
l’ensemble des pages
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Navigations secondaires
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Menu
La navigation est l’un des points les plus
important de votre arborescence car elle se
retrouve sur toutes vos pages
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Menu
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Menu
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Menu
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Lien in-text
Ils permettent de
contextualiser la
page cible par
rapport au contenu
d’une autre page
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Osez inter-linker
Via @
https://twitter.com/Doeurf/status/7372224543393
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Créer des opportunités
de trafic
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Développer les points
d’entrée
• Définir les chemins d’entrée de chaque
ensemble
• Qualifier le trafic potentiel
• Répondre aux besoins des internautes
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Viser l’intention !
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Transactionnel
Informationnel Navigationnel
Décision prise
Marque connue
Décision prise
Marque connue
Recherche de
conseil
Recherche de
conseil
Réassurance /
support
Réassurance /
support
Exemple de structure multiple
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
ImmobilierImmobilier
VenteVente LocationLocation GéographieGéographie MaisonMaisonAppartementAppartement
MaisonMaison
DépartementDépartement
VilleVille
RégionRégion
DépartementDépartement
VilleVille
MaisonMaison
VenteVente
Fiche produitFiche produit
DépartementDépartement
VilleVille
CONTRAINTES
Navigation à facettesAllier arborescence optimisée, crawl et UX
Maîtriser la qualité des pages et la duplication
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Navigation à facettesAllier arborescence optimisée, crawl et UX
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Navigation à facettesLa solution :AJAX et technologies assimilées
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Liens pertinents explorables par les
moteurs
Comportement au clic purement
utilisateur
PaginationA définir en fonction du niveau d’arborescence
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Autres contraintes
• Gestion des taxonomies / tags / étiquettes
• Archives par date
• Silos stricts
• Contraintes utilisateurs (connexion nécessaire,
recherches par formulaire, etc.)
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Définition des
entités de recherche
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Entités de recherche
• Définir avec précision le besoin utilisateur
en utilisant :
• Propriétés
• Relations
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Déterminer le type d’entité
Entités de recherche
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Entité 2
Lien /
Prédicat
Résultat de
recherche
désambigüisé
Propriétés
Relations
Propriétés
Relations
Entité 1
Résultat final
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
Cercle vertueux du SEO
Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016

Smxparis 2016 : architecture de site SEO

  • 1.
    Architecture de l’information Enjeux etopportunités Mathieu Gheerbrant – SEO Hackers Paul Colombo – Seloger.com
  • 2.
    Présentations Co-fondateur de l’agenceSEO Hackers http://www.seo-france.net/ | http://seohackers.fr/ @BlackMelvyn Mathieu Gheerbrant Promoteur Senior pour Se Loger http://www.seloger.com/ @Polo_Seo Paul Colombo
  • 3.
    MOTEURS DE RECHERCHE: NOTIONS DE BASE
  • 4.
    Back to basics Dela page web d’un site aux SERP des moteurs CrawlCrawl IndexIndex RankRank Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
  • 5.
    Exploration / Extraction •Code HTML complet • Ressources liées • Extraction : • Titres, intertitres • Texte / expressions / entités • Liens internes / externes • Media (images, videos, etc.) CrawlCrawl Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
  • 6.
    Circuit d’un crawler •URL récupérées des liens • URL récupérées des sitemaps • URL récupérées des liens externes entrants CrawlCrawl Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
  • 7.
    Indexation • Répartition parcluster thématique • URL explorées • URL connexes / associées • Pages web et media IndexIndex Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
  • 8.
    Classement • En fonctiondes requêtes • Résultat de différentes couches d’algorithmes RankRank Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
  • 9.
    LA QUÊTE DUCRAWL PARFAIT
  • 10.
    Crawl = popularité MathieuGheerbrant & Paul Colombo – SMX Paris 2016
  • 11.
    Définir des priorités MathieuGheerbrant & Paul Colombo – SMX Paris 2016 ↑Volume de pages indexées Promotion des pages prioritaires Gestion des pages dans le temps
  • 12.
    Architecture La colonne vertébraledu site Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
  • 13.
    Double utilité • Présenterune conception stable et durable • Contenus organisés, structurés • Charge de popularité répartie • Indispensable à la circulation des informations et le maillage sémantique Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
  • 14.
    Double enjeu • Permettreun crawl optimal du site • Augmenter la pertinence par le maillage Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
  • 15.
    Objectif : pertinence •Développer un circuit de crawl récursif • Créer des circuits par ensembles thématiques • Définir des nœuds sémantiques Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
  • 16.
    Gros site /petit site • Structure nécessaire différente • Crawl budget différent • Enjeux critiques différents L’architecture de l’information doit être adaptée Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
  • 17.
    Gestion de crawlarborescente
  • 18.
    Gestion de crawl •Certaines sections de site doivent être interdites aux crawlers • Fichier robots.txt • Autorisation sur IP • Authentification serveur Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
  • 19.
    Rendre son site « crawlable » • MathieuGheerbrant & Paul Colombo – SMX Paris 2016
  • 20.
    Différents leviers • Arborescence •Fil d’Ariane • Pied de page • Navigations secondaires • Blocs contextuels • Plan de site • Menu • Liens in-text Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
  • 21.
    Façonner l’arborescence • Utilisationdes restrictions de crawl • Utilisation des leviers en fonction : • des niveaux d’arborescence • des typologies de pages Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
  • 22.
    Arborescence • Arborescence : Structuregénérale du site Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
  • 23.
    Arborescence simple • Doitêtre réfléchie et optimisée pour aussi bien pour les petits sites … Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
  • 24.
    Arborescence complexe • Que pourles gros ! • Chaque pages doivent être maillées. Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
  • 25.
    Fil d’Ariane Correspond aucheminement pour atteindre la page sur laquelle vous êtes •Utilisé par : • Internautes • Robots Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
  • 26.
    Mathieu Gheerbrant &Paul Colombo – SMX Paris 2016
  • 27.
    Pied de page MathieuGheerbrant & Paul Colombo – SMX Paris 2016
  • 28.
    Blocs contextuels • Permettentla navigation entre les pages et accélèrent la découverte de nouvelles pages. • Créent du linking contextualisé entre les pages de mêmes catégories / familles. Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
  • 29.
    Mathieu Gheerbrant &Paul Colombo – SMX Paris 2016
  • 30.
    Plan de site •Une solution pour avoir plus de pages à positionner et donc plus de visibilité • Des pages créées pour faire du lien interne • Ne pas créer un plan de site inutilement Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
  • 31.
    Plan de site MathieuGheerbrant & Paul Colombo – SMX Paris 2016
  • 32.
    Mathieu Gheerbrant &Paul Colombo – SMX Paris 2016
  • 33.
    Navigations secondaires Considérée comme unmenu secondaire, non accessible depuis l’ensemble des pages Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
  • 34.
    Navigations secondaires Mathieu Gheerbrant& Paul Colombo – SMX Paris 2016
  • 35.
    Menu La navigation estl’un des points les plus important de votre arborescence car elle se retrouve sur toutes vos pages Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
  • 36.
    Menu Mathieu Gheerbrant &Paul Colombo – SMX Paris 2016
  • 37.
    Menu Mathieu Gheerbrant &Paul Colombo – SMX Paris 2016
  • 38.
    Menu Mathieu Gheerbrant &Paul Colombo – SMX Paris 2016
  • 39.
    Lien in-text Ils permettentde contextualiser la page cible par rapport au contenu d’une autre page Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
  • 40.
  • 41.
    Créer des opportunités detrafic Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
  • 42.
    Développer les points d’entrée •Définir les chemins d’entrée de chaque ensemble • Qualifier le trafic potentiel • Répondre aux besoins des internautes Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
  • 43.
    Viser l’intention ! MathieuGheerbrant & Paul Colombo – SMX Paris 2016 Transactionnel Informationnel Navigationnel Décision prise Marque connue Décision prise Marque connue Recherche de conseil Recherche de conseil Réassurance / support Réassurance / support
  • 44.
    Exemple de structuremultiple Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016 ImmobilierImmobilier VenteVente LocationLocation GéographieGéographie MaisonMaisonAppartementAppartement MaisonMaison DépartementDépartement VilleVille RégionRégion DépartementDépartement VilleVille MaisonMaison VenteVente Fiche produitFiche produit DépartementDépartement VilleVille
  • 45.
  • 46.
    Navigation à facettesAllierarborescence optimisée, crawl et UX Maîtriser la qualité des pages et la duplication Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
  • 47.
    Navigation à facettesAllierarborescence optimisée, crawl et UX Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
  • 48.
    Navigation à facettesLasolution :AJAX et technologies assimilées Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016 Liens pertinents explorables par les moteurs Comportement au clic purement utilisateur
  • 49.
    PaginationA définir enfonction du niveau d’arborescence Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
  • 50.
    Autres contraintes • Gestiondes taxonomies / tags / étiquettes • Archives par date • Silos stricts • Contraintes utilisateurs (connexion nécessaire, recherches par formulaire, etc.) Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
  • 51.
    Définition des entités derecherche Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016
  • 52.
    Entités de recherche •Définir avec précision le besoin utilisateur en utilisant : • Propriétés • Relations Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016 Déterminer le type d’entité
  • 53.
    Entités de recherche MathieuGheerbrant & Paul Colombo – SMX Paris 2016 Entité 2 Lien / Prédicat Résultat de recherche désambigüisé Propriétés Relations Propriétés Relations Entité 1
  • 54.
    Résultat final Mathieu Gheerbrant& Paul Colombo – SMX Paris 2016
  • 55.
    Cercle vertueux duSEO Mathieu Gheerbrant & Paul Colombo – SMX Paris 2016