Les outils de recherche internet

868 vues

Publié le

Publié dans : Formation
0 commentaire
1 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
868
Sur SlideShare
0
Issues des intégrations
0
Intégrations
180
Actions
Partages
0
Téléchargements
17
Commentaires
0
J’aime
1
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Les outils de recherche internet

  1. 1. LES OUTILS DE RECHERCHE
  2. 2. TYPOLOGIE DES OUTILS DE RECHERCHE : MOTEURS ET ANNUAIRES Moteurs Annuaires - Gestion automatisée - Gestion humaine - Entrée par indexation - Entrée par soumission - Tout le web a vocation à être indexé - Des choix éditoriaux sont faits - Tout le contenu des pages est indexé - Seules les références aux sites sont indexées - Navigation par requêtes - Navigation arborescente (recherche possible)
  3. 3. FONCTIONNEMENT DUN MOTEUR DE RECHERCHE (VERSION SIMPLE) Web Indexeur Index Moteur de recherche
  4. 4. FONCTIONNEMENT DUN MOTEUR (VERSION MOINS SIMPLE) (Schema basé sur larticle « The Anatomy Web of a Large-Scale Hypertextual Web Search Engine », par Sergey Brin et Lawrence Page) Serveur dURLs Crawlers Serveur tampon Dicte les URLs à crawler Indexent, envoient le Compresse, numérote et envoie contenu des pages Ancres Résolveur dURLs Stocke les liens et ancres associées Dépôt Convertit les URLs en URLs absolues, Indexeur et lie les documents entre eux Décompresse, parse Contient une copie de chaque page HTML indexée (cache) Silos Silos Silos Trieur Lexique Liens Index des documents Maintient une Trie le contenu des silos et correspondance produit un index inverséStocke une Répertories lensemble des mots / documentscartographie du web documents indexés (index inversé) (index direct) Moteur de recherche Pagerank Répond aux requêtes des utilisateurs
  5. 5. COMMENT PENSE UN MOTEUR ?Juger de la pertinence dune page web, cest un peu comme juger du contenu dun livredans une bibliothèque : Contenu Titre Balise <title> 4ème de couverture Balise <meta> description Table des matière Titraille (balises <h1> à <h6>) Contenu général Ensemble des textes Structure Lisibilité Accessibilité technique et structuration Popularité Recommandations Quantité, qualité et teneur des liens entrants
  6. 6. ANATOMIE GENERALE DUNE PAGE DE RESULTATS Résultats « Onebox » Liens sponsorisés Résultats naturels
  7. 7. ELEMENTS DINTERFACE GOOGLESitelinks Résultats indentés- Déterminés algorithmiquement- Jusque 8 élémentsClassic sitelinks - Contextuels- Déterminés algorithmiquement- Jusque 4 éléments Hiérarchie de site Jumplinks - Basées sur les fils dariane des sites- Contextuels- Basés sur les ancres
  8. 8. RECHERCHE UNIVERSELLE Objectif : « faire tomber les silos de Actualités linformation qui existent sur le web » (Marissa Mayer, 16/05/07) Pages web Billets de blogs Images Vidéos
  9. 9. PERSONNALISATION DES RESULTATS DE RECHERCHEPlusieurs critères concourent la personnalisation des résultats : Localisation de lutilisateur Interface utilisée (IP, langue du navigateur) (.com, .fr...) Comportement de Personnalisations lutilisateur par lutilisateur (loggé ou non) (Searchwiki)
  10. 10. PERSONNALISATION POUR TOUT LE MONDE !
  11. 11. LES OPERATEURS UTILES AU REFERENCEUR : GOOGLEGuillemets "Pour rechercher une chaine de motsTiret -Pour exclure des mots ou sitesSite:Pour rechercher sur un domaine, un sous-domaine, un répertoireFiletype:Pour rechercher un type de fichier donnéInurl: et allinurl:Pour rechercher les pages dont lURL contient une expressionIntitle: et allintitle:Pour rechercher les pages dont le <title> contient une expressionLink:Pour recherche des pages pointant vers une URL donnée
  12. 12. LES OPERATEURS UTILES AU REFERENCEUR : BINGLinkfromdomain:Pour rechercher les liens sortants dun domaineIp:Pour rechercher les sites hébergés sur une IPInanchor:Pour rechercher les sites liés avec une ancre donnée

×