SlideShare une entreprise Scribd logo
WEB INVISIBLE 
ET DEEP WEB 
Cours de recherche d’information avancée 
Antoine PY et Baptiste Buisson
• Introduction sur le Web Invisible 
• Les 4 niveaux d’invisibilité 
• Les serveurs classiques 
• L’évolution 
• L’utilité 
• Les outils pour explorer ce monde caché 
• Comment naviguer sur le web de façon anonyme 
Antoine PY et Baptiste Buisson 
2 
Sommaire
Qu’est ce que le Web Invisible? 
C’est l’ensemble des pages internet non-indexées par les 
moteurs de recherche traditionnels 
DEEP WEB WEB PROFOND WEB CACHE WEB INVISIBLE 
Antoine PY et Baptiste Buisson 
3 
Introduction
Antoine PY et Baptiste Buisson 
4 
Introduction 
Un Web caché…
• The Opaque Web 
Pages susceptibles d’être indexées mais qui ne le sont pas. 
The opaque Web : nearly visible web 
Pourquoi? 
- Création de nouvelles pages (pas de détection du robot 
« spider ») 
- Limitation du moteur sur le nombre de page d’un site 
- La page possède peu de backlinks 
Antoine PY et Baptiste Buisson 
5 
Le Web Invisible 
Les 4 niveaux d’invisibilités
• The Opaque Web 
• The Private Web 
Pages exclues volontairement par les Webmasters 
Web invisible: la partie immergé de l’Iceberg 
Antoine PY et Baptiste Buisson 
6 
Le Web Invisible 
Les 4 niveaux d’invisibilités
• The OpaqueWeb 
• The Private Web 
• The Proprietary Web 
- Identification nécessaire (l’indexage par le robot est bloqué) 
Web invisible: la partie immergé de l’Iceberg 
Antoine PY et Baptiste Buisson 
7 
Le Web Invisible 
Les 4 niveaux d’invisibilités
• The Opaque Web 
• The Private Web 
• The Proprietary Web 
• The Truly Invisible web 
Toute indexation est impossible en raison des formats 
inconnus, de la structure ou de la taille hors norme des informations. 
Les pages générées dynamiquement ne peuvent également pas 
être gérées par les moteurs de recherche. 
Les banques de données: une partie intégrante du Web 
Antoine PY et Baptiste Buisson 
8 
Le Web Invisible 
Les 4 niveaux d’invisibilités
Une requête consomme autant qu’une ampoule pendant 1h 
Antoine PY et Baptiste Buisson 
9 
Les serveurs classiques 
Historique: 
• Les banques de données sont apparues en 1960. 
Objectif: Une volonté d’améliorer l’efficacité du web. 
• Depuis 1970 des serveurs sont crées par plusieurs 
sociétés privées.
Contenu plus qualifié, plus précis, plus vérifié et plus vaste 
Antoine PY et Baptiste Buisson 
10 
Des informations structurées et validées 
• Les bases de données hébergent une information structurée et 
variée. 
- Références avec résumé et indexation d’articles… 
- Brevets américains, européens… 
- Références avec indexation de brevets 
- Textes intégrals de milliers de titres de presse 
- Informations marketing
Contenu plus qualifié, plus précis, plus vérifié et plus vaste 
Antoine PY et Baptiste Buisson 
11 
Des ressources difficiles d’accès 
• Les bases de données sont plus difficiles d’accès que 
celle du web visible 
- Accès réservé aux abonnées 
- Accès Payant 
- Connaissance des langages
En 2000: la taille du web invisible croissait plus vite que le 
web visible. Ceci n’est plus d’actualité. Pourquoi? 
• L’indexation de nouveaux formats de fichier 
Fichier .pdf (document de qualité): publications scientifiques et 
universitaires, rapports de chercheurs… 
Fichier .doc, .xls, .ppt, .rtf, .ps 
• Les partenariats avec des éditeurs de banques de données 
Pages dynamiques 
Accord signé entre l’Inst-Cnrs (17 millions de bibliographie) 
avec Google 
La croissance de la taille du Web invisible s’atténue de plus en plus 
Antoine PY et Baptiste Buisson 
12 
L’évolution
• Trouver des documents supplémentaires 
• Informations plus pertinentes 
• Elargir son champ de recherche 
Taille web visible: 167 téraoctets 
Tailles web invisible: 91 000 téraoctet 
Antoine PY et Baptiste Buisson 
13 
Utilité des recherches dans le deep web
Les informations à trouver: 
- Revues éléctroniques 
- Livres électroniques 
- Catalogues en ligne 
- Des articles 
Le web invisible est 544 fois plus grand que le web visible 
Antoine PY et Baptiste Buisson 
14 
Les outils 
Le fonctionnement: 
- Recherche par catégorie 
- Possibilité de modifier sa recherche: options de recherche
Les informations à trouver: 
- Ressources pertinentes sur 
beaucoups de sujets 
Antoine PY et Baptiste Buisson 
15 
Les outils 
Le fonctionnement: 
- Recherche par catégorie et par mots-clés
Les informations à trouver: 
- Ressources pertinentes sur 
beaucoups de sujets 
Antoine PY et Baptiste Buisson 
16 
Le fonctionnement: 
- Recherche par catégorie 
Les outils
Les informations à trouver: 
- Sujets académiques 
- Dictatitiels sur des techniques 
efficaces de recherche 
d’internet 
Antoine PY et Baptiste Buisson 
17 
Les outils 
Le fonctionnement: 
- Recherche par mots-clés ou par sujet
Les informations à trouver: 
- Encyclopédies 
- Atlas 
- Bibliographie 
Antoine PY et Baptiste Buisson 
18 
Le fonctionnement: 
- Recherche par mots-clés 
Les outils
Moteurs de recherche pour étudiants 
Trouver du contenu sur l’ingénierie, 
les mathématiques et l’informatique 
Types d’information: 
- Nouvelles sur l’industrie 
- Offres d’emploi 
- Rapports techniques 
- Sites web pertinents 
Antoine PY et Baptiste Buisson 
19 
Le fonctionnement: 
- Recherche par mots-clés 
Les outils
Antoine PY et Baptiste Buisson 
20 
Les outils 
Méta-moteur 
- Nombreuses possibilités de personnalisation et de 
paramétrage 
- Trouver les informations les plus récentes
• DeepWeb ≠ DarkWeb ≠ Darknet 
DarkWeb: le côté « malsain » du DeepWeb 
Darknets: réseaux privés virtuels, souvent de petites tailles 
et dans le but d’échanger des fichiers, 
The internet behind the internet 
Antoine PY et Baptiste Buisson 
21 
Le DarkWeb
Plusieurs Outils existent: 
• TOR (The Onion Router) 
• Base-search.net 
• D’autres moteurs de recherche spécialisés 
The internet behind the internet 
Antoine PY et Baptiste Buisson 
22 
Comment y accéder? 
Avec Google Chrome Avec TOR
The internet behind the internet 
Antoine PY et Baptiste Buisson 
23 
Les Outils
The internet behind the internet 
Antoine PY et Baptiste Buisson 
24 
Les Outils
• Béatrice Foenix-Riou : « Recherche éveillé sur Internet: mode d’emploi » 
• « Web profond ». Encyclopédie en ligne. Wikipédia, s. d. http://fr.wikipedia.org/wiki/Web_profond 
• « Cinq moteurs de recherche pour explorer le darknet ». Site d’information sur les nouvelles technologies. Parlons Geek, s. d. 
http://www.parlonsgeek.com/cinq-moteurs-de-recherche-pour-explorer/. 
• « Clearing Up Confusion – Deep Web vs. Dark Web », 27 mars 2014. 
http://www.brightplanet.com/2014/03/clearing-confusion-deep-web-vs-dark-web/ 
• « Deep Web, Dark Web, les parties immergées d’Internet | Panoptinet », s. d. 
http://www.panoptinet.com/cybersecurite-decryptee/deep-web-dark-web-les-parties-immergees-dinternet/ 
• Dejonckheere, Eric. « AYA.io - Recherche dans le Web profond ». Blog. AYA.io, 22 juin 2013. http://aya.io/blog/deep-web-search/. 
• « La recherche d’Informations sur le Web », s. d. http://c.asselin.free.fr/french/invisible_web.htm. 
• « MemoAV_WebInvisible - Memo_WebInvisible.pdf ». 
http://bibliotheque.unice.fr/services-et-formations/aide-et-formation/documents/Memo_WebInvisible.pdf. 
• « Rechercher l’information - Les informations du web invisible ». http://www.c2imes.org/MODULES/B2/co/I_E_partieB.html. 
• Digimind, Découvrir et exploiter le web invisible pour la veille stratégique: http://www.esi.ac.ma/Dossiers/20140126070100.pdf 
Antoine PY et Baptiste Buisson 
25 
Bibliographie
Merci pour votre attention 
Antoine PY et Baptiste Buisson 
26

Contenu connexe

Tendances

Introduction au Phishing
Introduction au PhishingIntroduction au Phishing
Introduction au Phishing
Club Scientifique de l'ESI - CSE
 
La sécurité informatique
La sécurité informatiqueLa sécurité informatique
La sécurité informatiqueSaber Ferjani
 
Présentation sécurité informatique naceur chafroud de cynapsys
Présentation sécurité informatique naceur chafroud de cynapsysPrésentation sécurité informatique naceur chafroud de cynapsys
Présentation sécurité informatique naceur chafroud de cynapsys
Jihen KOCHBATI
 
Alphorm.com Formation Hacking et Sécurité 2020 (3of4) : Attaques Réseaux, Sys...
Alphorm.com Formation Hacking et Sécurité 2020 (3of4) : Attaques Réseaux, Sys...Alphorm.com Formation Hacking et Sécurité 2020 (3of4) : Attaques Réseaux, Sys...
Alphorm.com Formation Hacking et Sécurité 2020 (3of4) : Attaques Réseaux, Sys...
Alphorm
 
Sécurité de l'IoT | Internet des objets - Formation d'une journée
Sécurité de l'IoT | Internet des objets - Formation d'une journéeSécurité de l'IoT | Internet des objets - Formation d'une journée
Sécurité de l'IoT | Internet des objets - Formation d'une journée
Tactika inc.
 
Présentation des TIC dans la communication
Présentation des TIC dans la communication Présentation des TIC dans la communication
Présentation des TIC dans la communication
dihiaselma
 
La veille technologique
La veille technologiqueLa veille technologique
La veille technologique
Vicky Gagnon-Mountzouris
 
Enjeux et évolutions de la sécurite informatique
Enjeux et évolutions de la sécurite informatiqueEnjeux et évolutions de la sécurite informatique
Enjeux et évolutions de la sécurite informatique
Maxime ALAY-EDDINE
 
Culture numérique - Révision.pdf
Culture numérique - Révision.pdfCulture numérique - Révision.pdf
Culture numérique - Révision.pdf
MedBechir
 
La sécurité informatique
La sécurité informatiqueLa sécurité informatique
La sécurité informatique
Cheick Ahmed Camara
 
BigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-ReduceBigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-Reduce
Lilia Sfaxi
 
La Sécurité informatiques
La Sécurité informatiquesLa Sécurité informatiques
La Sécurité informatiques
Nouriddin BEN ZEKRI
 
Introduction à Python
Introduction à PythonIntroduction à Python
Introduction à Python
Abdoulaye Dieng
 
Sensibilisation sur la cybersécurité
Sensibilisation sur la cybersécuritéSensibilisation sur la cybersécurité
Sensibilisation sur la cybersécurité
OUSMANESoumailaYaye
 
Alphorm.com Formation Hacking et Sécurité , avancé
Alphorm.com Formation Hacking et Sécurité , avancéAlphorm.com Formation Hacking et Sécurité , avancé
Alphorm.com Formation Hacking et Sécurité , avancé
Alphorm
 
La datavisualisation
La datavisualisationLa datavisualisation
La datavisualisation
Soft Computing
 
Présentation blockchain v2
Présentation blockchain v2Présentation blockchain v2
Présentation blockchain v2
Amine HAMOUDA
 
Attaques Informatiques
Attaques InformatiquesAttaques Informatiques
Attaques Informatiques
Sylvain Maret
 
Introduction à la sécurité informatique
Introduction à la sécurité informatiqueIntroduction à la sécurité informatique
Introduction à la sécurité informatique
Yves Van Gheem
 
La recherche d\'information sur internet
La recherche d\'information sur internetLa recherche d\'information sur internet
La recherche d\'information sur internet
alexartiste
 

Tendances (20)

Introduction au Phishing
Introduction au PhishingIntroduction au Phishing
Introduction au Phishing
 
La sécurité informatique
La sécurité informatiqueLa sécurité informatique
La sécurité informatique
 
Présentation sécurité informatique naceur chafroud de cynapsys
Présentation sécurité informatique naceur chafroud de cynapsysPrésentation sécurité informatique naceur chafroud de cynapsys
Présentation sécurité informatique naceur chafroud de cynapsys
 
Alphorm.com Formation Hacking et Sécurité 2020 (3of4) : Attaques Réseaux, Sys...
Alphorm.com Formation Hacking et Sécurité 2020 (3of4) : Attaques Réseaux, Sys...Alphorm.com Formation Hacking et Sécurité 2020 (3of4) : Attaques Réseaux, Sys...
Alphorm.com Formation Hacking et Sécurité 2020 (3of4) : Attaques Réseaux, Sys...
 
Sécurité de l'IoT | Internet des objets - Formation d'une journée
Sécurité de l'IoT | Internet des objets - Formation d'une journéeSécurité de l'IoT | Internet des objets - Formation d'une journée
Sécurité de l'IoT | Internet des objets - Formation d'une journée
 
Présentation des TIC dans la communication
Présentation des TIC dans la communication Présentation des TIC dans la communication
Présentation des TIC dans la communication
 
La veille technologique
La veille technologiqueLa veille technologique
La veille technologique
 
Enjeux et évolutions de la sécurite informatique
Enjeux et évolutions de la sécurite informatiqueEnjeux et évolutions de la sécurite informatique
Enjeux et évolutions de la sécurite informatique
 
Culture numérique - Révision.pdf
Culture numérique - Révision.pdfCulture numérique - Révision.pdf
Culture numérique - Révision.pdf
 
La sécurité informatique
La sécurité informatiqueLa sécurité informatique
La sécurité informatique
 
BigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-ReduceBigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-Reduce
 
La Sécurité informatiques
La Sécurité informatiquesLa Sécurité informatiques
La Sécurité informatiques
 
Introduction à Python
Introduction à PythonIntroduction à Python
Introduction à Python
 
Sensibilisation sur la cybersécurité
Sensibilisation sur la cybersécuritéSensibilisation sur la cybersécurité
Sensibilisation sur la cybersécurité
 
Alphorm.com Formation Hacking et Sécurité , avancé
Alphorm.com Formation Hacking et Sécurité , avancéAlphorm.com Formation Hacking et Sécurité , avancé
Alphorm.com Formation Hacking et Sécurité , avancé
 
La datavisualisation
La datavisualisationLa datavisualisation
La datavisualisation
 
Présentation blockchain v2
Présentation blockchain v2Présentation blockchain v2
Présentation blockchain v2
 
Attaques Informatiques
Attaques InformatiquesAttaques Informatiques
Attaques Informatiques
 
Introduction à la sécurité informatique
Introduction à la sécurité informatiqueIntroduction à la sécurité informatique
Introduction à la sécurité informatique
 
La recherche d\'information sur internet
La recherche d\'information sur internetLa recherche d\'information sur internet
La recherche d\'information sur internet
 

En vedette

Les outils de recherche et veille sur le web
Les outils de recherche et veille sur le webLes outils de recherche et veille sur le web
Les outils de recherche et veille sur le web
echangeurba
 
Présentation du Web Invisible
Présentation du Web InvisiblePrésentation du Web Invisible
Présentation du Web Invisible
IANTE Réunion
 
AG CITC - Présentation "Internet des objets: Quels défis pour l'avenir?" ¨Par...
AG CITC - Présentation "Internet des objets: Quels défis pour l'avenir?" ¨Par...AG CITC - Présentation "Internet des objets: Quels défis pour l'avenir?" ¨Par...
AG CITC - Présentation "Internet des objets: Quels défis pour l'avenir?" ¨Par...
CITC-EuraRFID
 
Presentation FrenchWeb Day IoT
Presentation FrenchWeb Day IoTPresentation FrenchWeb Day IoT
Presentation FrenchWeb Day IoT
FrenchWeb.fr
 
Oliviere iot grenoble May2015
Oliviere iot grenoble May2015Oliviere iot grenoble May2015
Oliviere iot grenoble May2015
Olivier Ezratty
 
Valtech - Internet of Things & Big Data : un mariage de raison
Valtech - Internet of Things & Big Data : un mariage de raisonValtech - Internet of Things & Big Data : un mariage de raison
Valtech - Internet of Things & Big Data : un mariage de raison
Valtech
 
Conférence Internet des objets IoT M2M - CCI Bordeaux - 02 04 2015 - Introduc...
Conférence Internet des objets IoT M2M - CCI Bordeaux - 02 04 2015 - Introduc...Conférence Internet des objets IoT M2M - CCI Bordeaux - 02 04 2015 - Introduc...
Conférence Internet des objets IoT M2M - CCI Bordeaux - 02 04 2015 - Introduc...
polenumerique33
 
Internet des objets (IoT)
Internet des objets (IoT)Internet des objets (IoT)
Internet des objets (IoT)
bruno-dambrun
 
Présentation des IoT
Présentation des IoTPrésentation des IoT
Présentation des IoT
Lakhdar Meftah
 

En vedette (9)

Les outils de recherche et veille sur le web
Les outils de recherche et veille sur le webLes outils de recherche et veille sur le web
Les outils de recherche et veille sur le web
 
Présentation du Web Invisible
Présentation du Web InvisiblePrésentation du Web Invisible
Présentation du Web Invisible
 
AG CITC - Présentation "Internet des objets: Quels défis pour l'avenir?" ¨Par...
AG CITC - Présentation "Internet des objets: Quels défis pour l'avenir?" ¨Par...AG CITC - Présentation "Internet des objets: Quels défis pour l'avenir?" ¨Par...
AG CITC - Présentation "Internet des objets: Quels défis pour l'avenir?" ¨Par...
 
Presentation FrenchWeb Day IoT
Presentation FrenchWeb Day IoTPresentation FrenchWeb Day IoT
Presentation FrenchWeb Day IoT
 
Oliviere iot grenoble May2015
Oliviere iot grenoble May2015Oliviere iot grenoble May2015
Oliviere iot grenoble May2015
 
Valtech - Internet of Things & Big Data : un mariage de raison
Valtech - Internet of Things & Big Data : un mariage de raisonValtech - Internet of Things & Big Data : un mariage de raison
Valtech - Internet of Things & Big Data : un mariage de raison
 
Conférence Internet des objets IoT M2M - CCI Bordeaux - 02 04 2015 - Introduc...
Conférence Internet des objets IoT M2M - CCI Bordeaux - 02 04 2015 - Introduc...Conférence Internet des objets IoT M2M - CCI Bordeaux - 02 04 2015 - Introduc...
Conférence Internet des objets IoT M2M - CCI Bordeaux - 02 04 2015 - Introduc...
 
Internet des objets (IoT)
Internet des objets (IoT)Internet des objets (IoT)
Internet des objets (IoT)
 
Présentation des IoT
Présentation des IoTPrésentation des IoT
Présentation des IoT
 

Similaire à Web Invisible et Deep Web

De la veille au partage
De la veille au partageDe la veille au partage
De la veille au partage
Terheck
 
Tendances et innovation des outils de recherche
Tendances et innovation des outils de recherche Tendances et innovation des outils de recherche
Tendances et innovation des outils de recherche
ei4idi
 
Sites internet de services d'archives : comment faire connaître son site ?
Sites internet de services d'archives : comment faire connaître son site ?Sites internet de services d'archives : comment faire connaître son site ?
Sites internet de services d'archives : comment faire connaître son site ?
Julie Scheffer
 
Web invisible
Web invisibleWeb invisible
Web invisible
Françoise Grave
 
Veille2012 avec-copies-ecran-120416110404-phpapp01
Veille2012 avec-copies-ecran-120416110404-phpapp01Veille2012 avec-copies-ecran-120416110404-phpapp01
Veille2012 avec-copies-ecran-120416110404-phpapp01Claude Martin
 
Rechercher de l'information sur le web
Rechercher de l'information sur le webRechercher de l'information sur le web
Rechercher de l'information sur le web
Isabelle Motte
 
2015 01 08_presentation-culture-web
2015 01 08_presentation-culture-web2015 01 08_presentation-culture-web
2015 01 08_presentation-culture-web
kattass mourad
 
Portail Bibliothèque du Finistère BDF29
Portail Bibliothèque du Finistère BDF29Portail Bibliothèque du Finistère BDF29
Portail Bibliothèque du Finistère BDF29
Association Bibop
 
JEBibop
JEBibopJEBibop
P6 Digimind Christophe Asselin
P6   Digimind   Christophe AsselinP6   Digimind   Christophe Asselin
P6 Digimind Christophe AsselinEtesTIC2007
 
Formation ESFF 2013 Internet Jacques Loigerot
Formation ESFF 2013 Internet Jacques LoigerotFormation ESFF 2013 Internet Jacques Loigerot
Formation ESFF 2013 Internet Jacques Loigerot
Jacques Loigerot
 
La Place Des Services En Ligne En Bibliotheque
La Place Des Services En Ligne En BibliothequeLa Place Des Services En Ligne En Bibliotheque
La Place Des Services En Ligne En Bibliotheque
Dujol Lionel
 
Intelligence du _web_semantique_1_2014
Intelligence du _web_semantique_1_2014Intelligence du _web_semantique_1_2014
Intelligence du _web_semantique_1_2014Serge Garlatti
 
Enquête sur les usagers distants du site de la Bpi
Enquête sur les usagers distants du site de la BpiEnquête sur les usagers distants du site de la Bpi
Enquête sur les usagers distants du site de la Bpi
Bpi Centre Pompidou - Service Etudes & Recherches
 
Jabes 2007 - OCLC : projets de développement et de recherche
Jabes 2007 - OCLC : projets de développement et de rechercheJabes 2007 - OCLC : projets de développement et de recherche
Jabes 2007 - OCLC : projets de développement et de recherche
ABES
 
Reseaux sociaux professionnels- Curation de contenu - Scoop.it, Storify, Pape...
Reseaux sociaux professionnels- Curation de contenu - Scoop.it, Storify, Pape...Reseaux sociaux professionnels- Curation de contenu - Scoop.it, Storify, Pape...
Reseaux sociaux professionnels- Curation de contenu - Scoop.it, Storify, Pape...
Alban Jarry
 
Le Web 2.0 pour les pharmaciens
Le Web 2.0 pour les pharmaciensLe Web 2.0 pour les pharmaciens
Le Web 2.0 pour les pharmaciens
ADIPh
 
WebCSTI Rencontres OCIM 2009
WebCSTI Rencontres OCIM 2009WebCSTI Rencontres OCIM 2009
WebCSTI Rencontres OCIM 2009
Sébastien
 
Referencement moteur de-recherche
Referencement moteur de-rechercheReferencement moteur de-recherche
Referencement moteur de-recherche
lucasroche-etu-univ-st-etienne
 
Accompagner avec le numerique - Intervention JNE ACOP-F Albi 2016
Accompagner avec le numerique - Intervention JNE ACOP-F Albi 2016Accompagner avec le numerique - Intervention JNE ACOP-F Albi 2016
Accompagner avec le numerique - Intervention JNE ACOP-F Albi 2016
jfcastell
 

Similaire à Web Invisible et Deep Web (20)

De la veille au partage
De la veille au partageDe la veille au partage
De la veille au partage
 
Tendances et innovation des outils de recherche
Tendances et innovation des outils de recherche Tendances et innovation des outils de recherche
Tendances et innovation des outils de recherche
 
Sites internet de services d'archives : comment faire connaître son site ?
Sites internet de services d'archives : comment faire connaître son site ?Sites internet de services d'archives : comment faire connaître son site ?
Sites internet de services d'archives : comment faire connaître son site ?
 
Web invisible
Web invisibleWeb invisible
Web invisible
 
Veille2012 avec-copies-ecran-120416110404-phpapp01
Veille2012 avec-copies-ecran-120416110404-phpapp01Veille2012 avec-copies-ecran-120416110404-phpapp01
Veille2012 avec-copies-ecran-120416110404-phpapp01
 
Rechercher de l'information sur le web
Rechercher de l'information sur le webRechercher de l'information sur le web
Rechercher de l'information sur le web
 
2015 01 08_presentation-culture-web
2015 01 08_presentation-culture-web2015 01 08_presentation-culture-web
2015 01 08_presentation-culture-web
 
Portail Bibliothèque du Finistère BDF29
Portail Bibliothèque du Finistère BDF29Portail Bibliothèque du Finistère BDF29
Portail Bibliothèque du Finistère BDF29
 
JEBibop
JEBibopJEBibop
JEBibop
 
P6 Digimind Christophe Asselin
P6   Digimind   Christophe AsselinP6   Digimind   Christophe Asselin
P6 Digimind Christophe Asselin
 
Formation ESFF 2013 Internet Jacques Loigerot
Formation ESFF 2013 Internet Jacques LoigerotFormation ESFF 2013 Internet Jacques Loigerot
Formation ESFF 2013 Internet Jacques Loigerot
 
La Place Des Services En Ligne En Bibliotheque
La Place Des Services En Ligne En BibliothequeLa Place Des Services En Ligne En Bibliotheque
La Place Des Services En Ligne En Bibliotheque
 
Intelligence du _web_semantique_1_2014
Intelligence du _web_semantique_1_2014Intelligence du _web_semantique_1_2014
Intelligence du _web_semantique_1_2014
 
Enquête sur les usagers distants du site de la Bpi
Enquête sur les usagers distants du site de la BpiEnquête sur les usagers distants du site de la Bpi
Enquête sur les usagers distants du site de la Bpi
 
Jabes 2007 - OCLC : projets de développement et de recherche
Jabes 2007 - OCLC : projets de développement et de rechercheJabes 2007 - OCLC : projets de développement et de recherche
Jabes 2007 - OCLC : projets de développement et de recherche
 
Reseaux sociaux professionnels- Curation de contenu - Scoop.it, Storify, Pape...
Reseaux sociaux professionnels- Curation de contenu - Scoop.it, Storify, Pape...Reseaux sociaux professionnels- Curation de contenu - Scoop.it, Storify, Pape...
Reseaux sociaux professionnels- Curation de contenu - Scoop.it, Storify, Pape...
 
Le Web 2.0 pour les pharmaciens
Le Web 2.0 pour les pharmaciensLe Web 2.0 pour les pharmaciens
Le Web 2.0 pour les pharmaciens
 
WebCSTI Rencontres OCIM 2009
WebCSTI Rencontres OCIM 2009WebCSTI Rencontres OCIM 2009
WebCSTI Rencontres OCIM 2009
 
Referencement moteur de-recherche
Referencement moteur de-rechercheReferencement moteur de-recherche
Referencement moteur de-recherche
 
Accompagner avec le numerique - Intervention JNE ACOP-F Albi 2016
Accompagner avec le numerique - Intervention JNE ACOP-F Albi 2016Accompagner avec le numerique - Intervention JNE ACOP-F Albi 2016
Accompagner avec le numerique - Intervention JNE ACOP-F Albi 2016
 

Plus de ei4idi

Taxonomie et folksonomie
Taxonomie et folksonomieTaxonomie et folksonomie
Taxonomie et folksonomie
ei4idi
 
Les outils de curation
Les outils de curationLes outils de curation
Les outils de curation
ei4idi
 
Cm3
Cm3Cm3
Cm3
ei4idi
 
Vérifier l’information
Vérifier l’informationVérifier l’information
Vérifier l’information
ei4idi
 
Bookmarking social
Bookmarking socialBookmarking social
Bookmarking social
ei4idi
 
TROUVER & EXPLOITER L’INFORMATION SCIENTIFIQUE ET TECHNIQUE
TROUVER & EXPLOITER L’INFORMATION SCIENTIFIQUE ET TECHNIQUETROUVER & EXPLOITER L’INFORMATION SCIENTIFIQUE ET TECHNIQUE
TROUVER & EXPLOITER L’INFORMATION SCIENTIFIQUE ET TECHNIQUE
ei4idi
 

Plus de ei4idi (6)

Taxonomie et folksonomie
Taxonomie et folksonomieTaxonomie et folksonomie
Taxonomie et folksonomie
 
Les outils de curation
Les outils de curationLes outils de curation
Les outils de curation
 
Cm3
Cm3Cm3
Cm3
 
Vérifier l’information
Vérifier l’informationVérifier l’information
Vérifier l’information
 
Bookmarking social
Bookmarking socialBookmarking social
Bookmarking social
 
TROUVER & EXPLOITER L’INFORMATION SCIENTIFIQUE ET TECHNIQUE
TROUVER & EXPLOITER L’INFORMATION SCIENTIFIQUE ET TECHNIQUETROUVER & EXPLOITER L’INFORMATION SCIENTIFIQUE ET TECHNIQUE
TROUVER & EXPLOITER L’INFORMATION SCIENTIFIQUE ET TECHNIQUE
 

Web Invisible et Deep Web

  • 1. WEB INVISIBLE ET DEEP WEB Cours de recherche d’information avancée Antoine PY et Baptiste Buisson
  • 2. • Introduction sur le Web Invisible • Les 4 niveaux d’invisibilité • Les serveurs classiques • L’évolution • L’utilité • Les outils pour explorer ce monde caché • Comment naviguer sur le web de façon anonyme Antoine PY et Baptiste Buisson 2 Sommaire
  • 3. Qu’est ce que le Web Invisible? C’est l’ensemble des pages internet non-indexées par les moteurs de recherche traditionnels DEEP WEB WEB PROFOND WEB CACHE WEB INVISIBLE Antoine PY et Baptiste Buisson 3 Introduction
  • 4. Antoine PY et Baptiste Buisson 4 Introduction Un Web caché…
  • 5. • The Opaque Web Pages susceptibles d’être indexées mais qui ne le sont pas. The opaque Web : nearly visible web Pourquoi? - Création de nouvelles pages (pas de détection du robot « spider ») - Limitation du moteur sur le nombre de page d’un site - La page possède peu de backlinks Antoine PY et Baptiste Buisson 5 Le Web Invisible Les 4 niveaux d’invisibilités
  • 6. • The Opaque Web • The Private Web Pages exclues volontairement par les Webmasters Web invisible: la partie immergé de l’Iceberg Antoine PY et Baptiste Buisson 6 Le Web Invisible Les 4 niveaux d’invisibilités
  • 7. • The OpaqueWeb • The Private Web • The Proprietary Web - Identification nécessaire (l’indexage par le robot est bloqué) Web invisible: la partie immergé de l’Iceberg Antoine PY et Baptiste Buisson 7 Le Web Invisible Les 4 niveaux d’invisibilités
  • 8. • The Opaque Web • The Private Web • The Proprietary Web • The Truly Invisible web Toute indexation est impossible en raison des formats inconnus, de la structure ou de la taille hors norme des informations. Les pages générées dynamiquement ne peuvent également pas être gérées par les moteurs de recherche. Les banques de données: une partie intégrante du Web Antoine PY et Baptiste Buisson 8 Le Web Invisible Les 4 niveaux d’invisibilités
  • 9. Une requête consomme autant qu’une ampoule pendant 1h Antoine PY et Baptiste Buisson 9 Les serveurs classiques Historique: • Les banques de données sont apparues en 1960. Objectif: Une volonté d’améliorer l’efficacité du web. • Depuis 1970 des serveurs sont crées par plusieurs sociétés privées.
  • 10. Contenu plus qualifié, plus précis, plus vérifié et plus vaste Antoine PY et Baptiste Buisson 10 Des informations structurées et validées • Les bases de données hébergent une information structurée et variée. - Références avec résumé et indexation d’articles… - Brevets américains, européens… - Références avec indexation de brevets - Textes intégrals de milliers de titres de presse - Informations marketing
  • 11. Contenu plus qualifié, plus précis, plus vérifié et plus vaste Antoine PY et Baptiste Buisson 11 Des ressources difficiles d’accès • Les bases de données sont plus difficiles d’accès que celle du web visible - Accès réservé aux abonnées - Accès Payant - Connaissance des langages
  • 12. En 2000: la taille du web invisible croissait plus vite que le web visible. Ceci n’est plus d’actualité. Pourquoi? • L’indexation de nouveaux formats de fichier Fichier .pdf (document de qualité): publications scientifiques et universitaires, rapports de chercheurs… Fichier .doc, .xls, .ppt, .rtf, .ps • Les partenariats avec des éditeurs de banques de données Pages dynamiques Accord signé entre l’Inst-Cnrs (17 millions de bibliographie) avec Google La croissance de la taille du Web invisible s’atténue de plus en plus Antoine PY et Baptiste Buisson 12 L’évolution
  • 13. • Trouver des documents supplémentaires • Informations plus pertinentes • Elargir son champ de recherche Taille web visible: 167 téraoctets Tailles web invisible: 91 000 téraoctet Antoine PY et Baptiste Buisson 13 Utilité des recherches dans le deep web
  • 14. Les informations à trouver: - Revues éléctroniques - Livres électroniques - Catalogues en ligne - Des articles Le web invisible est 544 fois plus grand que le web visible Antoine PY et Baptiste Buisson 14 Les outils Le fonctionnement: - Recherche par catégorie - Possibilité de modifier sa recherche: options de recherche
  • 15. Les informations à trouver: - Ressources pertinentes sur beaucoups de sujets Antoine PY et Baptiste Buisson 15 Les outils Le fonctionnement: - Recherche par catégorie et par mots-clés
  • 16. Les informations à trouver: - Ressources pertinentes sur beaucoups de sujets Antoine PY et Baptiste Buisson 16 Le fonctionnement: - Recherche par catégorie Les outils
  • 17. Les informations à trouver: - Sujets académiques - Dictatitiels sur des techniques efficaces de recherche d’internet Antoine PY et Baptiste Buisson 17 Les outils Le fonctionnement: - Recherche par mots-clés ou par sujet
  • 18. Les informations à trouver: - Encyclopédies - Atlas - Bibliographie Antoine PY et Baptiste Buisson 18 Le fonctionnement: - Recherche par mots-clés Les outils
  • 19. Moteurs de recherche pour étudiants Trouver du contenu sur l’ingénierie, les mathématiques et l’informatique Types d’information: - Nouvelles sur l’industrie - Offres d’emploi - Rapports techniques - Sites web pertinents Antoine PY et Baptiste Buisson 19 Le fonctionnement: - Recherche par mots-clés Les outils
  • 20. Antoine PY et Baptiste Buisson 20 Les outils Méta-moteur - Nombreuses possibilités de personnalisation et de paramétrage - Trouver les informations les plus récentes
  • 21. • DeepWeb ≠ DarkWeb ≠ Darknet DarkWeb: le côté « malsain » du DeepWeb Darknets: réseaux privés virtuels, souvent de petites tailles et dans le but d’échanger des fichiers, The internet behind the internet Antoine PY et Baptiste Buisson 21 Le DarkWeb
  • 22. Plusieurs Outils existent: • TOR (The Onion Router) • Base-search.net • D’autres moteurs de recherche spécialisés The internet behind the internet Antoine PY et Baptiste Buisson 22 Comment y accéder? Avec Google Chrome Avec TOR
  • 23. The internet behind the internet Antoine PY et Baptiste Buisson 23 Les Outils
  • 24. The internet behind the internet Antoine PY et Baptiste Buisson 24 Les Outils
  • 25. • Béatrice Foenix-Riou : « Recherche éveillé sur Internet: mode d’emploi » • « Web profond ». Encyclopédie en ligne. Wikipédia, s. d. http://fr.wikipedia.org/wiki/Web_profond • « Cinq moteurs de recherche pour explorer le darknet ». Site d’information sur les nouvelles technologies. Parlons Geek, s. d. http://www.parlonsgeek.com/cinq-moteurs-de-recherche-pour-explorer/. • « Clearing Up Confusion – Deep Web vs. Dark Web », 27 mars 2014. http://www.brightplanet.com/2014/03/clearing-confusion-deep-web-vs-dark-web/ • « Deep Web, Dark Web, les parties immergées d’Internet | Panoptinet », s. d. http://www.panoptinet.com/cybersecurite-decryptee/deep-web-dark-web-les-parties-immergees-dinternet/ • Dejonckheere, Eric. « AYA.io - Recherche dans le Web profond ». Blog. AYA.io, 22 juin 2013. http://aya.io/blog/deep-web-search/. • « La recherche d’Informations sur le Web », s. d. http://c.asselin.free.fr/french/invisible_web.htm. • « MemoAV_WebInvisible - Memo_WebInvisible.pdf ». http://bibliotheque.unice.fr/services-et-formations/aide-et-formation/documents/Memo_WebInvisible.pdf. • « Rechercher l’information - Les informations du web invisible ». http://www.c2imes.org/MODULES/B2/co/I_E_partieB.html. • Digimind, Découvrir et exploiter le web invisible pour la veille stratégique: http://www.esi.ac.ma/Dossiers/20140126070100.pdf Antoine PY et Baptiste Buisson 25 Bibliographie
  • 26. Merci pour votre attention Antoine PY et Baptiste Buisson 26