2. Un mot sur moi
● En thèse (2eme année)
● Université de Grenoble-Alpes (équipe AMA)
● CIFRE - Coffreo (Clermont Ferrand)
● Intelligence Artificielle, Apprentissage
Statistique
● Applications du texte
4. RI dans notre vie quotidienne
● les moteurs de recherche
● la requête de recherche
● texte, images, vidéos, ...
5. RI : L'histoire
● Au début des années 1950
● Project Cranfield (1957-1967)
● Projet MEDLARS – MEDical Literature Analysis
and Retrieval System (1968)
● Projet Smart (1691-1965)
● ...
6. Indexation
● Le but: determiner avec quels mots on peut retrouver un document.
– Indexation manuelle ou automatique ?
– Vocabulaire libre ou contrôlé ?
– Quels mots à ajouter dans la stopliste ?
Je suis
étudiant
en thèse.
Doc 1
L’étudiant
est parti.
Doc 2
Stopliste : je, suis, en, l', est...
Doc1 Doc2 ...
étudiant ☺ ☺
thèse ☺ X
parti X ☺
...
Indexation : L'index inversé
7. Les étapes des systèmes RI
Requête Représentation Recherche
d'information
retourner les documents/images/.. qui sont
les plus pertinents
Indexation L'index inversé
L'index inversé
Pre-traitement
Aspiration
des sites web
8. Évaluation : Pertinence des
documents
● La question fondamentale : la relation entre les
documents recherchés et le besoin d'information
● Comparer les résultats renvoyés avec les
réponses souhaitées.
Le besoin d'information
Les résultats retournés
Réponses
Souhaitées