INDEXATION   ET RECHERCHE SUR LE WEB
1)Composants d’un moteur de recherche
Robot d’indexation   :  nombre important de logiciels qui parcourent les documents du Web, à partir d’une adresse donnée (saut de page en page grâce aux liens trouvés) et récupèrent les informations Index   :  base de données des informations récupérées lors de la phase de collecte; prépare ces informations pour optimiser le temps de réponse des requêtes Interface d’interrogation
2)Principe de fonctionnement
Préparation de la requête Interrogation de la base :  en mode simple, avancé(expert) ou spécialisé Restitution des résultats :  la visualisation des résultats repose sur un classement (les réponses sont ordonnées)
3)Modes d’indexation de documents
Métadescription de documents On observe le document et on le décrit à côté : récupération des propriétés et caractéristiques du document Mode qui fait une sélection pour qualifier le document Mode plein texte Le contenu de la page est indexé intégralement Problème pour les images, sons et vidéos Mise à jour automatisée (robot logiciel : repérage et visite) ou manuelle (auteur du site, personne chargée du référencement ou professionnel)

recherche sur le web

  • 1.
    INDEXATION ET RECHERCHE SUR LE WEB
  • 2.
  • 3.
    Robot d’indexation : nombre important de logiciels qui parcourent les documents du Web, à partir d’une adresse donnée (saut de page en page grâce aux liens trouvés) et récupèrent les informations Index : base de données des informations récupérées lors de la phase de collecte; prépare ces informations pour optimiser le temps de réponse des requêtes Interface d’interrogation
  • 4.
  • 5.
    Préparation de larequête Interrogation de la base : en mode simple, avancé(expert) ou spécialisé Restitution des résultats : la visualisation des résultats repose sur un classement (les réponses sont ordonnées)
  • 6.
  • 7.
    Métadescription de documentsOn observe le document et on le décrit à côté : récupération des propriétés et caractéristiques du document Mode qui fait une sélection pour qualifier le document Mode plein texte Le contenu de la page est indexé intégralement Problème pour les images, sons et vidéos Mise à jour automatisée (robot logiciel : repérage et visite) ou manuelle (auteur du site, personne chargée du référencement ou professionnel)