SlideShare une entreprise Scribd logo
1  sur  31
Réalisé par :
 AYAD Abla
 RAHAL Chahrazed
Proposé par Mr:
Amrane Abdesalam
Mise en place d’un moteur de recherche et de
recommandation de documents textuels de la production
scientifique nationale.
Année Universitaire 2016/2017
Centre de recherche dans l’information
scientifique et technique
2
Plan de travail
Introduction,
Etat de l’art
Conception &
Réalisation
Conclusion
3
Problématique
1/ La production scientifique (le contenu textuel des
thèses n’est pas encore indexer)
2/ La documentation étrangère (non stocker)
4
La demande croissante en matière d’accès à
l’information?
Objectifs
Problématique
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Big Data
Moteur de
recherche
Recommandation
4
Objectifs
Problématique
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
La demande croissante en matière d’accès
à l’information?
L’augmentation du volume des données ?
Recommandation
Moteur de
recherche
Indexation
5
Moteur de recherche
L'accès simple et rapide à une multitude d’informations
Mettre en œuvre un environnement pour stocker, indexer et
rechercher les documents scientifiques
Problématique
Indexation
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Objectifs
5
Problématique
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Objectifs
Moteur de recherche
L'accès simple et rapide à
une multitude
d’informations
Indexation
Mettre en œuvre un
environnement pour
stocker, indexer et
rechercher les
documents scientifiques
6
Etat de l’art
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Introduction
& Problématique
Etat de l’art
7
Dimensions de Big Data « Les Trois Vs
Les systèmes de
recommandation
Les plateformes
Big Data
Les moteurs
de recherche
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Etat de l’art
8
Les plateformes
Big Data
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Les systèmes de
recommandation
Les moteurs
de recherche
Introduction
& Problématique
Etat de l’art
Quelque plateformes Big Data
9
Les plateformes
Big Data
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Les systèmes de
recommandation
Les moteurs
de recherche
Introduction
& Problématique
Etat de l’art
Classification des plateformes Big Data
Les plateformes
open source
Cloudera
Hortonworks
HP
Hadoop
talend
Cassandra
Les plateformes
propriétaire
IBM
Amazon
SAP
MICROSOFT
ORACLE
TERADATA
10
Recherche d’information Documents
Indexation
des documents
Indexation
de la requête
processus en U de la recherche d’information
Appariement
requête
Résultats
Les systèmes de
recommandation
Les plateformes
Big Data
Les moteurs
de recherche
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Etat de l’art
11
La recherche d’information (RI) a besoin d’un
outils efficaces pour retrouver les documents
recherchés par l’utilisateur. Parmi ces outils,
les moteurs de recherche
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Les systèmes de
recommandation
Les plateformes
Big Data
Les moteurs
de recherche
Introduction
& Problématique
Etat de l’art
permettre aux utilisateurs de retrouver les
documents dont le contenu répond à leur besoin
en information, le plus rapidement possible
12
ssification des moteurs de recherche
Moteurs de recherche
Moteurs de
recherche open
source
Moteurs de recherche
propriétaire
Non-distribués
Distribués
Sphinx Xapian
Apache
Lucence Apache Soler
Elasticsearch
Bing
Google
Yahoo
Conception &
Réalisation
Conclusion
Les systèmes de
recommandation
Les plateformes
Big Data
Les moteurs
de recherche
Etat de l’art
Introduction
& Problématique
13
13
Les moteurs
de recherche
Les systèmes de
recommandation
Les systèmes de recommandation sont définis comme étant “des
outils logiciels
et des techniques qui suggèrent aux usagers des éléments utile
Conception &
Réalisation
Conclusion
Les plateformes
Big Data
Les approches de recommandation
 Filtrage à base de contenu.
 Filtrage collaboratif
 Filtrage hybride.
Introduction
& Problématique
Etat de l’art
14
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Introduction
& Problématique
Conception
& Réalisation
15
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Architecture de la solution proposée:
Interface utilisateur
Médiateur
Indexer, Rechercher, Recommander, Stocker
Elasticsearch Hadoop
Introduction
& Problématique
Conception
& Réalisation
16
Conception & Réalisation
Etat de l’art Conclusion
Introduction
& Problématique
Conception
& Réalisation
17
Réalisation
Conception
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Système
Utilisateur
Administrateur
Introduction
& Problématique
Conception
& Réalisation
18
Diagramme de cas d’utilisation
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Introduction
& Problématique
Conception
& Réalisation
Conception
Réalisation
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Introduction
& Problématique
Conception
& Réalisation
Conception
Réalisation
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Environnement de travail
Système d’exploitation
Outils
Framework
de stockage
API d’indexation Serveur web
Les outils de développements
Introduction
& Problématique
Conception
& Réalisation
21
Schéma d’un cluster elasticsearch
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Conception
Réalisation
Introduction
& Problématique
Conception
& Réalisation
22
Schéma de création de l’index « pnst_cerist »
curl -X POST http://localhost:9200/pnst_cerist/ -d '{
"mappings": {
"document": {
"properties": {
"titre": { "type": "string" },
"auteur": { "type": "string" },
"date_edition": { "type": "date" },
"mot cle": {
"properties": {
"mot_cle1": { "type": "string" },
"mot_cle2": { "type": "string" },
"mot_cle3": { "type": "string" }
} },
"file": { "type": "attachment" }
} } }}'
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Conception
Réalisation
Introduction
& Problématique
Conception
& Réalisation
23
Schéma d’un cluster Hadoop(HDFS)
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Conception
Réalisation
Introduction
& Problématique
Conception
& Réalisation
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Introduction
& Problématique
Conception
& Réalisation
25
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Introduction
& Problématique
Conception
& Réalisation
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Introduction
& Problématique
Conception
& Réalisation
27
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Introduction
& Problématique
Conception
& Réalisation
Etat de l’art
Conception &
Réalisation
Conclusion
Introduction
& Problématique
Introduction
& Problématique
Conception
& Réalisation
Etat de l’art
Conception &
Réalisation
Introduction
& Problématique
Introduction
& Problématique Conclusion
Mise en place d’un moteur de recherche et indexation
elasticsearch
Une solution d’indexation de documents textuel,
Un interface qui donne à l’utilisateur la possibilité
d’ajouter, indexer, supprimer et faire une simple
recherche pour extraire des documents textuels,
30
Démonstration
31
Questions

Contenu connexe

Similaire à Mise en place d’un moteur de recherche et de recommandation de documents textuels de la production scientifique nationale.

Discovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDiscovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDenodo
 
Présentation_PFE_FINAL A
Présentation_PFE_FINAL                   APrésentation_PFE_FINAL                   A
Présentation_PFE_FINAL AIMRANEYOUSSEF
 
Oxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataOxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataLudovic Piot
 
Les technologies big data avec speech commentaries
Les technologies big data avec speech commentariesLes technologies big data avec speech commentaries
Les technologies big data avec speech commentariesRima Jamli Faidi
 
Migration de Sage ligne 100 vers OpenERP v6
Migration de Sage ligne 100 vers OpenERP v6Migration de Sage ligne 100 vers OpenERP v6
Migration de Sage ligne 100 vers OpenERP v6riyadadva
 
templates.iafactory, guide de prise en main
templates.iafactory, guide de prise en maintemplates.iafactory, guide de prise en main
templates.iafactory, guide de prise en mainiafactory
 
Les cas d’usages populaires de Neo4j
Les cas d’usages populaires de Neo4jLes cas d’usages populaires de Neo4j
Les cas d’usages populaires de Neo4jNeo4j
 
Phan-TienNam-CV-20161103
Phan-TienNam-CV-20161103Phan-TienNam-CV-20161103
Phan-TienNam-CV-20161103Tien Nam Phan
 
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationSession découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationDenodo
 
Acquia et Arte : Drupal Camp Paris 2013
Acquia et Arte : Drupal Camp Paris 2013Acquia et Arte : Drupal Camp Paris 2013
Acquia et Arte : Drupal Camp Paris 2013Cyril Reinhard
 
GraphTour Paris - Cas d'usages populaires Neo4j
GraphTour Paris - Cas d'usages populaires Neo4jGraphTour Paris - Cas d'usages populaires Neo4j
GraphTour Paris - Cas d'usages populaires Neo4jNeo4j
 
Analytics & Machine Learning avec la Data Virtualization
Analytics & Machine Learning avec la Data VirtualizationAnalytics & Machine Learning avec la Data Virtualization
Analytics & Machine Learning avec la Data VirtualizationDenodo
 
Morning tech #2 - Démarche performance slides
Morning tech #2 - Démarche performance slidesMorning tech #2 - Démarche performance slides
Morning tech #2 - Démarche performance slidesOxalide
 
Oxalide Morning tech #2 - démarche performance
Oxalide Morning tech #2 - démarche performanceOxalide Morning tech #2 - démarche performance
Oxalide Morning tech #2 - démarche performanceLudovic Piot
 
Text mining pour industrie
Text mining pour industrieText mining pour industrie
Text mining pour industrieAli Kabbadj
 
Découvrez les nouvelles fonctionnalités de Talend 6
Découvrez les nouvelles fonctionnalités de Talend 6Découvrez les nouvelles fonctionnalités de Talend 6
Découvrez les nouvelles fonctionnalités de Talend 6Jean-Michel Franco
 
La voie du succès avec les bases de données de graphes, la Graph Data Scie...
 La voie du succès avec les bases de données de graphes, la Graph Data Scie... La voie du succès avec les bases de données de graphes, la Graph Data Scie...
La voie du succès avec les bases de données de graphes, la Graph Data Scie...Neo4j
 

Similaire à Mise en place d’un moteur de recherche et de recommandation de documents textuels de la production scientifique nationale. (20)

Discovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDiscovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data Virtualization
 
Présentation_PFE_FINAL A
Présentation_PFE_FINAL                   APrésentation_PFE_FINAL                   A
Présentation_PFE_FINAL A
 
Oxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataOxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigData
 
Diapo PFE
Diapo PFEDiapo PFE
Diapo PFE
 
Les technologies big data avec speech commentaries
Les technologies big data avec speech commentariesLes technologies big data avec speech commentaries
Les technologies big data avec speech commentaries
 
Migration de Sage ligne 100 vers OpenERP v6
Migration de Sage ligne 100 vers OpenERP v6Migration de Sage ligne 100 vers OpenERP v6
Migration de Sage ligne 100 vers OpenERP v6
 
Commencer avec Hadoop
Commencer avec HadoopCommencer avec Hadoop
Commencer avec Hadoop
 
Architecture de la bibliothèque numérique : Modélisation et migrations de don...
Architecture de la bibliothèque numérique : Modélisation et migrations de don...Architecture de la bibliothèque numérique : Modélisation et migrations de don...
Architecture de la bibliothèque numérique : Modélisation et migrations de don...
 
templates.iafactory, guide de prise en main
templates.iafactory, guide de prise en maintemplates.iafactory, guide de prise en main
templates.iafactory, guide de prise en main
 
Les cas d’usages populaires de Neo4j
Les cas d’usages populaires de Neo4jLes cas d’usages populaires de Neo4j
Les cas d’usages populaires de Neo4j
 
Phan-TienNam-CV-20161103
Phan-TienNam-CV-20161103Phan-TienNam-CV-20161103
Phan-TienNam-CV-20161103
 
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationSession découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
 
Acquia et Arte : Drupal Camp Paris 2013
Acquia et Arte : Drupal Camp Paris 2013Acquia et Arte : Drupal Camp Paris 2013
Acquia et Arte : Drupal Camp Paris 2013
 
GraphTour Paris - Cas d'usages populaires Neo4j
GraphTour Paris - Cas d'usages populaires Neo4jGraphTour Paris - Cas d'usages populaires Neo4j
GraphTour Paris - Cas d'usages populaires Neo4j
 
Analytics & Machine Learning avec la Data Virtualization
Analytics & Machine Learning avec la Data VirtualizationAnalytics & Machine Learning avec la Data Virtualization
Analytics & Machine Learning avec la Data Virtualization
 
Morning tech #2 - Démarche performance slides
Morning tech #2 - Démarche performance slidesMorning tech #2 - Démarche performance slides
Morning tech #2 - Démarche performance slides
 
Oxalide Morning tech #2 - démarche performance
Oxalide Morning tech #2 - démarche performanceOxalide Morning tech #2 - démarche performance
Oxalide Morning tech #2 - démarche performance
 
Text mining pour industrie
Text mining pour industrieText mining pour industrie
Text mining pour industrie
 
Découvrez les nouvelles fonctionnalités de Talend 6
Découvrez les nouvelles fonctionnalités de Talend 6Découvrez les nouvelles fonctionnalités de Talend 6
Découvrez les nouvelles fonctionnalités de Talend 6
 
La voie du succès avec les bases de données de graphes, la Graph Data Scie...
 La voie du succès avec les bases de données de graphes, la Graph Data Scie... La voie du succès avec les bases de données de graphes, la Graph Data Scie...
La voie du succès avec les bases de données de graphes, la Graph Data Scie...
 

Dernier

JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...
JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...
JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...Institut de l'Elevage - Idele
 
GAL2024 - Décarbonation du secteur laitier : la filière s'engage
GAL2024 - Décarbonation du secteur laitier : la filière s'engageGAL2024 - Décarbonation du secteur laitier : la filière s'engage
GAL2024 - Décarbonation du secteur laitier : la filière s'engageInstitut de l'Elevage - Idele
 
GAL2024 - L'élevage laitier cultive la biodiversité
GAL2024 - L'élevage laitier cultive la biodiversitéGAL2024 - L'élevage laitier cultive la biodiversité
GAL2024 - L'élevage laitier cultive la biodiversitéInstitut de l'Elevage - Idele
 
GAL2024 - Traite des vaches laitières : au coeur des stratégies d'évolution d...
GAL2024 - Traite des vaches laitières : au coeur des stratégies d'évolution d...GAL2024 - Traite des vaches laitières : au coeur des stratégies d'évolution d...
GAL2024 - Traite des vaches laitières : au coeur des stratégies d'évolution d...Institut de l'Elevage - Idele
 
GAL2024 - Changements climatiques et maladies émergentes
GAL2024 - Changements climatiques et maladies émergentesGAL2024 - Changements climatiques et maladies émergentes
GAL2024 - Changements climatiques et maladies émergentesInstitut de l'Elevage - Idele
 
Algo II : les piles ( cours + exercices)
Algo II :  les piles ( cours + exercices)Algo II :  les piles ( cours + exercices)
Algo II : les piles ( cours + exercices)Sana REFAI
 
GAL2024 - Renouvellement des actifs : un enjeu pour la filière laitière franç...
GAL2024 - Renouvellement des actifs : un enjeu pour la filière laitière franç...GAL2024 - Renouvellement des actifs : un enjeu pour la filière laitière franç...
GAL2024 - Renouvellement des actifs : un enjeu pour la filière laitière franç...Institut de l'Elevage - Idele
 
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdf
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdfJTC 2024 - SMARTER Retour sur les indicateurs de santé .pdf
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdfInstitut de l'Elevage - Idele
 
GAL2024 - Situation laitière 2023-2024 : consommation, marchés, prix et revenus
GAL2024 - Situation laitière 2023-2024 : consommation, marchés, prix et revenusGAL2024 - Situation laitière 2023-2024 : consommation, marchés, prix et revenus
GAL2024 - Situation laitière 2023-2024 : consommation, marchés, prix et revenusInstitut de l'Elevage - Idele
 
JTC 2024 - Réglementation européenne BEA et Transport.pdf
JTC 2024 - Réglementation européenne BEA et Transport.pdfJTC 2024 - Réglementation européenne BEA et Transport.pdf
JTC 2024 - Réglementation européenne BEA et Transport.pdfInstitut de l'Elevage - Idele
 
comprehension de DDMRP dans le domaine de gestion
comprehension de DDMRP dans le domaine de gestioncomprehension de DDMRP dans le domaine de gestion
comprehension de DDMRP dans le domaine de gestionyakinekaidouchi1
 
JTC 2024 La relance de la filière de la viande de chevreau.pdf
JTC 2024 La relance de la filière de la viande de chevreau.pdfJTC 2024 La relance de la filière de la viande de chevreau.pdf
JTC 2024 La relance de la filière de la viande de chevreau.pdfInstitut de l'Elevage - Idele
 
Câblage, installation et paramétrage d’un réseau informatique.pdf
Câblage, installation et paramétrage d’un réseau informatique.pdfCâblage, installation et paramétrage d’un réseau informatique.pdf
Câblage, installation et paramétrage d’un réseau informatique.pdfmia884611
 

Dernier (15)

JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...
JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...
JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...
 
CAP2ER_GC_Presentation_Outil_20240422.pptx
CAP2ER_GC_Presentation_Outil_20240422.pptxCAP2ER_GC_Presentation_Outil_20240422.pptx
CAP2ER_GC_Presentation_Outil_20240422.pptx
 
GAL2024 - Décarbonation du secteur laitier : la filière s'engage
GAL2024 - Décarbonation du secteur laitier : la filière s'engageGAL2024 - Décarbonation du secteur laitier : la filière s'engage
GAL2024 - Décarbonation du secteur laitier : la filière s'engage
 
GAL2024 - L'élevage laitier cultive la biodiversité
GAL2024 - L'élevage laitier cultive la biodiversitéGAL2024 - L'élevage laitier cultive la biodiversité
GAL2024 - L'élevage laitier cultive la biodiversité
 
GAL2024 - Traite des vaches laitières : au coeur des stratégies d'évolution d...
GAL2024 - Traite des vaches laitières : au coeur des stratégies d'évolution d...GAL2024 - Traite des vaches laitières : au coeur des stratégies d'évolution d...
GAL2024 - Traite des vaches laitières : au coeur des stratégies d'évolution d...
 
GAL2024 - Changements climatiques et maladies émergentes
GAL2024 - Changements climatiques et maladies émergentesGAL2024 - Changements climatiques et maladies émergentes
GAL2024 - Changements climatiques et maladies émergentes
 
Algo II : les piles ( cours + exercices)
Algo II :  les piles ( cours + exercices)Algo II :  les piles ( cours + exercices)
Algo II : les piles ( cours + exercices)
 
GAL2024 - Renouvellement des actifs : un enjeu pour la filière laitière franç...
GAL2024 - Renouvellement des actifs : un enjeu pour la filière laitière franç...GAL2024 - Renouvellement des actifs : un enjeu pour la filière laitière franç...
GAL2024 - Renouvellement des actifs : un enjeu pour la filière laitière franç...
 
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdf
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdfJTC 2024 - SMARTER Retour sur les indicateurs de santé .pdf
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdf
 
GAL2024 - Situation laitière 2023-2024 : consommation, marchés, prix et revenus
GAL2024 - Situation laitière 2023-2024 : consommation, marchés, prix et revenusGAL2024 - Situation laitière 2023-2024 : consommation, marchés, prix et revenus
GAL2024 - Situation laitière 2023-2024 : consommation, marchés, prix et revenus
 
JTC 2024 - Réglementation européenne BEA et Transport.pdf
JTC 2024 - Réglementation européenne BEA et Transport.pdfJTC 2024 - Réglementation européenne BEA et Transport.pdf
JTC 2024 - Réglementation européenne BEA et Transport.pdf
 
comprehension de DDMRP dans le domaine de gestion
comprehension de DDMRP dans le domaine de gestioncomprehension de DDMRP dans le domaine de gestion
comprehension de DDMRP dans le domaine de gestion
 
JTC 2024 La relance de la filière de la viande de chevreau.pdf
JTC 2024 La relance de la filière de la viande de chevreau.pdfJTC 2024 La relance de la filière de la viande de chevreau.pdf
JTC 2024 La relance de la filière de la viande de chevreau.pdf
 
Câblage, installation et paramétrage d’un réseau informatique.pdf
Câblage, installation et paramétrage d’un réseau informatique.pdfCâblage, installation et paramétrage d’un réseau informatique.pdf
Câblage, installation et paramétrage d’un réseau informatique.pdf
 
JTC 2024 - DeCremoux_Anomalies_génétiques.pdf
JTC 2024 - DeCremoux_Anomalies_génétiques.pdfJTC 2024 - DeCremoux_Anomalies_génétiques.pdf
JTC 2024 - DeCremoux_Anomalies_génétiques.pdf
 

Mise en place d’un moteur de recherche et de recommandation de documents textuels de la production scientifique nationale.

  • 1. Réalisé par :  AYAD Abla  RAHAL Chahrazed Proposé par Mr: Amrane Abdesalam Mise en place d’un moteur de recherche et de recommandation de documents textuels de la production scientifique nationale. Année Universitaire 2016/2017 Centre de recherche dans l’information scientifique et technique
  • 2. 2 Plan de travail Introduction, Etat de l’art Conception & Réalisation Conclusion
  • 3. 3 Problématique 1/ La production scientifique (le contenu textuel des thèses n’est pas encore indexer) 2/ La documentation étrangère (non stocker)
  • 4. 4 La demande croissante en matière d’accès à l’information? Objectifs Problématique Etat de l’art Conception & Réalisation Conclusion Introduction & Problématique Big Data Moteur de recherche Recommandation 4 Objectifs Problématique Etat de l’art Conception & Réalisation Conclusion Introduction & Problématique La demande croissante en matière d’accès à l’information? L’augmentation du volume des données ? Recommandation Moteur de recherche Indexation
  • 5. 5 Moteur de recherche L'accès simple et rapide à une multitude d’informations Mettre en œuvre un environnement pour stocker, indexer et rechercher les documents scientifiques Problématique Indexation Etat de l’art Conception & Réalisation Conclusion Introduction & Problématique Objectifs 5 Problématique Etat de l’art Conception & Réalisation Conclusion Introduction & Problématique Objectifs Moteur de recherche L'accès simple et rapide à une multitude d’informations Indexation Mettre en œuvre un environnement pour stocker, indexer et rechercher les documents scientifiques
  • 6. 6 Etat de l’art Etat de l’art Conception & Réalisation Conclusion Introduction & Problématique Introduction & Problématique Etat de l’art
  • 7. 7 Dimensions de Big Data « Les Trois Vs Les systèmes de recommandation Les plateformes Big Data Les moteurs de recherche Conception & Réalisation Conclusion Introduction & Problématique Etat de l’art
  • 8. 8 Les plateformes Big Data Etat de l’art Conception & Réalisation Conclusion Introduction & Problématique Les systèmes de recommandation Les moteurs de recherche Introduction & Problématique Etat de l’art Quelque plateformes Big Data
  • 9. 9 Les plateformes Big Data Etat de l’art Conception & Réalisation Conclusion Introduction & Problématique Les systèmes de recommandation Les moteurs de recherche Introduction & Problématique Etat de l’art Classification des plateformes Big Data Les plateformes open source Cloudera Hortonworks HP Hadoop talend Cassandra Les plateformes propriétaire IBM Amazon SAP MICROSOFT ORACLE TERADATA
  • 10. 10 Recherche d’information Documents Indexation des documents Indexation de la requête processus en U de la recherche d’information Appariement requête Résultats Les systèmes de recommandation Les plateformes Big Data Les moteurs de recherche Conception & Réalisation Conclusion Introduction & Problématique Etat de l’art
  • 11. 11 La recherche d’information (RI) a besoin d’un outils efficaces pour retrouver les documents recherchés par l’utilisateur. Parmi ces outils, les moteurs de recherche Etat de l’art Conception & Réalisation Conclusion Introduction & Problématique Les systèmes de recommandation Les plateformes Big Data Les moteurs de recherche Introduction & Problématique Etat de l’art permettre aux utilisateurs de retrouver les documents dont le contenu répond à leur besoin en information, le plus rapidement possible
  • 12. 12 ssification des moteurs de recherche Moteurs de recherche Moteurs de recherche open source Moteurs de recherche propriétaire Non-distribués Distribués Sphinx Xapian Apache Lucence Apache Soler Elasticsearch Bing Google Yahoo Conception & Réalisation Conclusion Les systèmes de recommandation Les plateformes Big Data Les moteurs de recherche Etat de l’art Introduction & Problématique
  • 13. 13 13 Les moteurs de recherche Les systèmes de recommandation Les systèmes de recommandation sont définis comme étant “des outils logiciels et des techniques qui suggèrent aux usagers des éléments utile Conception & Réalisation Conclusion Les plateformes Big Data Les approches de recommandation  Filtrage à base de contenu.  Filtrage collaboratif  Filtrage hybride. Introduction & Problématique Etat de l’art
  • 14. 14 Etat de l’art Conception & Réalisation Conclusion Introduction & Problématique Introduction & Problématique Conception & Réalisation
  • 15. 15 Etat de l’art Conception & Réalisation Conclusion Introduction & Problématique Architecture de la solution proposée: Interface utilisateur Médiateur Indexer, Rechercher, Recommander, Stocker Elasticsearch Hadoop Introduction & Problématique Conception & Réalisation
  • 16. 16 Conception & Réalisation Etat de l’art Conclusion Introduction & Problématique Conception & Réalisation
  • 17. 17 Réalisation Conception Etat de l’art Conception & Réalisation Conclusion Introduction & Problématique Système Utilisateur Administrateur Introduction & Problématique Conception & Réalisation
  • 18. 18 Diagramme de cas d’utilisation Etat de l’art Conception & Réalisation Conclusion Introduction & Problématique Introduction & Problématique Conception & Réalisation
  • 19. Conception Réalisation Etat de l’art Conception & Réalisation Conclusion Introduction & Problématique Introduction & Problématique Conception & Réalisation
  • 20. Conception Réalisation Etat de l’art Conception & Réalisation Conclusion Introduction & Problématique Environnement de travail Système d’exploitation Outils Framework de stockage API d’indexation Serveur web Les outils de développements Introduction & Problématique Conception & Réalisation
  • 21. 21 Schéma d’un cluster elasticsearch Etat de l’art Conception & Réalisation Conclusion Introduction & Problématique Conception Réalisation Introduction & Problématique Conception & Réalisation
  • 22. 22 Schéma de création de l’index « pnst_cerist » curl -X POST http://localhost:9200/pnst_cerist/ -d '{ "mappings": { "document": { "properties": { "titre": { "type": "string" }, "auteur": { "type": "string" }, "date_edition": { "type": "date" }, "mot cle": { "properties": { "mot_cle1": { "type": "string" }, "mot_cle2": { "type": "string" }, "mot_cle3": { "type": "string" } } }, "file": { "type": "attachment" } } } }}' Etat de l’art Conception & Réalisation Conclusion Introduction & Problématique Conception Réalisation Introduction & Problématique Conception & Réalisation
  • 23. 23 Schéma d’un cluster Hadoop(HDFS) Etat de l’art Conception & Réalisation Conclusion Introduction & Problématique Conception Réalisation Introduction & Problématique Conception & Réalisation
  • 24. Etat de l’art Conception & Réalisation Conclusion Introduction & Problématique Introduction & Problématique Conception & Réalisation
  • 25. 25 Etat de l’art Conception & Réalisation Conclusion Introduction & Problématique Introduction & Problématique Conception & Réalisation
  • 26. Etat de l’art Conception & Réalisation Conclusion Introduction & Problématique Introduction & Problématique Conception & Réalisation
  • 27. 27 Etat de l’art Conception & Réalisation Conclusion Introduction & Problématique Introduction & Problématique Conception & Réalisation
  • 28. Etat de l’art Conception & Réalisation Conclusion Introduction & Problématique Introduction & Problématique Conception & Réalisation
  • 29. Etat de l’art Conception & Réalisation Introduction & Problématique Introduction & Problématique Conclusion Mise en place d’un moteur de recherche et indexation elasticsearch Une solution d’indexation de documents textuel, Un interface qui donne à l’utilisateur la possibilité d’ajouter, indexer, supprimer et faire une simple recherche pour extraire des documents textuels,

Notes de l'éditeur

  1. 1
  2. 2
  3. 3
  4. 4
  5. 5
  6. 6
  7. 7
  8. 8
  9. 9
  10. 10
  11. 11
  12. 12
  13. 13
  14. 15
  15. 16
  16. 17
  17. 18
  18. 19
  19. 20
  20. 21
  21. 22
  22. 23
  23. 24
  24. 25
  25. 26
  26. 27
  27. 28
  28. 29
  29. 30
  30. 31