Mise en place d’un moteur de recherche et de recommandation de documents textuels de la production scientifique nationale.

Réalisé par :
 AYAD Abla
 RAHAL Chahrazed
Proposé par Mr:
Amrane Abdesalam
Mise en place d’un moteur de recherche et de
recommandation de documents textuels de la production
scientifique nationale.
Année Universitaire 2016/2017
Centre de recherche dans l’information
scientifique et technique

2
Plan de travail
Introduction,
Etat de l’art
Conception &
Réalisation
Conclusion

3
Problématique
1/ La production scientifique (le contenu textuel des
thèses n’est pas encore indexer)
2/ La documentation étrangère (non stocker)

4
La demande croissante en matière d’accès à
l’information?
Objectifs
Problématique
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Big Data
Moteur de
recherche
Recommandation
4
Objectifs
Problématique
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
La demande croissante en matière d’accès
à l’information?
L’augmentation du volume des données ?
Recommandation
Moteur de
recherche
Indexation

5
Moteur de recherche
L'accès simple et rapide à une multitude d’informations
Mettre en œuvre un environnement pour stocker, indexer et
rechercher les documents scientifiques
Problématique
Indexation
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Objectifs
5
Problématique
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Objectifs
Moteur de recherche
L'accès simple et rapide à
une multitude
d’informations
Indexation
Mettre en œuvre un
environnement pour
stocker, indexer et
rechercher les
documents scientifiques

6
Etat de l’art
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Introduction
& Problématique
Etat de l’art

7
Dimensions de Big Data « Les Trois Vs
Les systèmes de
recommandation
Les plateformes
Big Data
Les moteurs
de recherche
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Etat de l’art

8
Les plateformes
Big Data
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Les systèmes de
recommandation
Les moteurs
de recherche
Introduction
& Problématique
Etat de l’art
Quelque plateformes Big Data

9
Les plateformes
Big Data
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Les systèmes de
recommandation
Les moteurs
de recherche
Introduction
& Problématique
Etat de l’art
Classification des plateformes Big Data
Les plateformes
open source
Cloudera
Hortonworks
HP
Hadoop
talend
Cassandra
Les plateformes
propriétaire
IBM
Amazon
SAP
MICROSOFT
ORACLE
TERADATA

10
Recherche d’information Documents
Indexation
des documents
Indexation
de la requête
processus en U de la recherche d’information
Appariement
requête
Résultats
Les systèmes de
recommandation
Les plateformes
Big Data
Les moteurs
de recherche
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Etat de l’art

11
La recherche d’information (RI) a besoin d’un
outils efficaces pour retrouver les documents
recherchés par l’utilisateur. Parmi ces outils,
les moteurs de recherche
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Les systèmes de
recommandation
Les plateformes
Big Data
Les moteurs
de recherche
Introduction
& Problématique
Etat de l’art
permettre aux utilisateurs de retrouver les
documents dont le contenu répond à leur besoin
en information, le plus rapidement possible

12
ssification des moteurs de recherche
Moteurs de recherche
Moteurs de
recherche open
source
Moteurs de recherche
propriétaire
Non-distribués
Distribués
Sphinx Xapian
Apache
Lucence Apache Soler
Elasticsearch
Bing
Google
Yahoo
Conception &
Réalisation
Conclusion
Les systèmes de
recommandation
Les plateformes
Big Data
Les moteurs
de recherche
Etat de l’art
Introduction
& Problématique

13
13
Les moteurs
de recherche
Les systèmes de
recommandation
Les systèmes de recommandation sont définis comme étant “des
outils logiciels
et des techniques qui suggèrent aux usagers des éléments utile
Conception &
Réalisation
Conclusion
Les plateformes
Big Data
Les approches de recommandation
 Filtrage à base de contenu.
 Filtrage collaboratif
 Filtrage hybride.
Introduction
& Problématique
Etat de l’art

14
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Introduction
& Problématique
Conception
& Réalisation

15
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Architecture de la solution proposée:
Interface utilisateur
Médiateur
Indexer, Rechercher, Recommander, Stocker
Elasticsearch Hadoop
Introduction
& Problématique
Conception
& Réalisation

16
Conception & Réalisation
Etat de l’art Conclusion
Introduction
& Problématique
Conception
& Réalisation

17
Réalisation
Conception
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Système
Utilisateur
Administrateur
Introduction
& Problématique
Conception
& Réalisation

18
Diagramme de cas d’utilisation
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Introduction
& Problématique
Conception
& Réalisation

Conception
Réalisation
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Introduction
& Problématique
Conception
& Réalisation

Conception
Réalisation
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Environnement de travail
Système d’exploitation
Outils
Framework
de stockage
API d’indexation Serveur web
Les outils de développements
Introduction
& Problématique
Conception
& Réalisation

21
Schéma d’un cluster elasticsearch
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Conception
Réalisation
Introduction
& Problématique
Conception
& Réalisation

22
Schéma de création de l’index « pnst_cerist »
curl -X POST http://localhost:9200/pnst_cerist/ -d '{
"mappings": {
"document": {
"properties": {
"titre": { "type": "string" },
"auteur": { "type": "string" },
"date_edition": { "type": "date" },
"mot cle": {
"properties": {
"mot_cle1": { "type": "string" },
"mot_cle2": { "type": "string" },
"mot_cle3": { "type": "string" }
} },
"file": { "type": "attachment" }
} } }}'
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Conception
Réalisation
Introduction
& Problématique
Conception
& Réalisation

23
Schéma d’un cluster Hadoop(HDFS)
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Conception
Réalisation
Introduction
& Problématique
Conception
& Réalisation

Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Introduction
& Problématique
Conception
& Réalisation

25
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Introduction
& Problématique
Conception
& Réalisation

27
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Introduction
& Problématique
Conception
& Réalisation

Etat de l’art
Conception &
Réalisation
Introduction
& Problématique
Introduction
& Problématique Conclusion
Mise en place d’un moteur de recherche et indexation
elasticsearch
Une solution d’indexation de documents textuel,
Un interface qui donne à l’utilisateur la possibilité
d’ajouter, indexer, supprimer et faire une simple
recherche pour extraire des documents textuels,

Mise en place d’un moteur de recherche et de recommandation de documents textuels de la production scientifique nationale.

Recommandé

Recommandé

Contenu connexe

Similaire à Mise en place d’un moteur de recherche et de recommandation de documents textuels de la production scientifique nationale.

Similaire à Mise en place d’un moteur de recherche et de recommandation de documents textuels de la production scientifique nationale. (20)

Dernier

Dernier (15)

Mise en place d’un moteur de recherche et de recommandation de documents textuels de la production scientifique nationale.

Notes de l'éditeur