SlideShare une entreprise Scribd logo
1  sur  12
Le tuto des p'tits trucs de la Doc !
Le Web invisible
Françoise Grave
Un p'tit dessin, peut-être ?
Jean-Louis Zimmermann, source : Flickr, sous licence Creative
Commons
http://www.flickr.com/photos/jeanlouis_zimmermann/3870653226/
Une définition en langue française ?
La définition des Signets de la Bnf :
« Le web invisible cache la partie du Web correspondant à l'ensemble
des documents qui ne sont pas indexés par les moteurs de recherche
traditionnels ».
Grand dictionnaire terminologique ( office québecois de la langue
française) :
« Les ressources du Web invisible comprennent, entre autres, les sites
Web construits autour d'une base de données (interrogeables
uniquement avec un moteur de recherche interne), les pages
accessibles par un formulaire de recherche, les pages protégées par un
mot de passe, les pages interdites aux robots d'indexation, les pages
écrites dans des formats propriétaires, les Intranet et les Extranet ».
Web profond, Web caché, web invisible, deep Web
Comment accéder à ce Web des profondeurs ?
On peut télécharger des logiciels pour explorer ce Web abyssal.
C'est très pratique pour éviter d' être repéré par la police politique
lorsque l'on vit dans un état totalitaire.
Hélas, ce Web caché est très prisé des pervers en tout genre notamment
des pédophiles.
On évoque aussi le « Dark Web » refuge des opposants, libertaires et
criminels de tout poil.
On peut aussi utiliser des outils de recherche ou des moteurs
spécialisés.
Mias quel intérêt de fouiller le Web invisible ?
Web invisible ou Web profond : quelques chiffres
● D'après le site Savoirs CDI , le web caché, ou Web profond, ou
Web invisible, serait 300 à 550 fois plus important que le Web
visible.
● Pour le site Intelligence-center.com, le chiffre est de 260 fois le web
de surface.
● D'après Wikipédia, une étude de 2008 estimerait à 70 ou 75% les
pages non référencées par les moteurs classiques.
● D'après Benoit Dupont, directeur du centre international de
criminologie de l' université de Montréal, le web que l'on connaît
totaliserait 10%, 90% du Web appartiennent au « Deep web ».
Et ce serait possible d' être plus précis ?
Non, pas vraiment : le Web, représente des milliards de pages.
Web invisible ou Web profond : quelques chiffres
● D'après le site Savoirs CDI , le web caché, ou Web profond, ou
Web invisible, serait 300 à 550 fois plus important que le Web
visible.
● Pour le site Intelligence-center.com, le chiffre est de 260 fois le web
de surface.
● D'après Wikipédia, une étude de 2008 estimerait à 70 ou 75% les
pages non référencées par les moteurs classiques.
● D'après Benoit Dupont, directeur du centre international de
criminologie de l' université de Montréal, le web que l'on connaît
totaliserait 10%, 90% du Web appartiennent au « Deep web ».
Et ce serait possible d' être plus précis ?
Non, pas vraiment : le Web, représente des milliards de pages.
Le web invisible : des ressources de qualité
Tous les documents ne peuvent être indexés par des moteurs classiques : Yahoo, Bing,
Google ( encore que le dernier cité est aussi cité pour ses capacités à chercher dans le
deep Web).
● Certains documents sont trop volumineux : bases de données.
● Certaines pages sont protégées par leur créateur ( fichier inséré dans le code source
ou mot de passe), ou des accès sont payants.
Le Web surfacique (pour frimer dans la cour de récré uniquement, mais l'expression
existe ) vous propose des ressources de piètre qualité, mais le web profond cache des
pépites dont un grand nombre en accès libre, gratuit :
Base de données, articles scientifiques, rapports , publications gouvernementales,
thèses, portails divers, ressources de bibliothèques, livres numériques...
Il semblerait qu'on puisse accéder à des répertoires FTP, des contenus générés par des
web apps, des dépôts de binaires NNTP, des fichiers financiers d'entreprises cotées en
bourse...
Les outils ou moteurs spécialisés
quelques outils conseillés par : comment ça marche ?
http://www.commentcamarche.net/faq/31357-chercher-de-l-information-sur-le-web-invisible
Base :
http://www.base-search.net/
Un outil de recherche pour les sciences :
http://www.scienceresearch.com/scienceresearch/
Un méta-moteur pour 60 bases de données :
http://worldwidescience.org/
Médecine : Mednar
http://mednar.com/
Commerce : Biznar.com :
http://mednar.com/
Quelques outils en vrac pour fouiller le Web
InfoMine, créé par la bibliothèque de l' Université de Californie :
http://infomine.ucr.edu/
TechXtra : publications universitaires et étudiantes du domaine public
http://www.techxtra.ac.uk/index.html
Le projet Virtual Library :
http://vlib.org/
Xrefer :
http://www.xrefer.com/
Profusion :
http://www.profusion.com/
Quelques catalogues de bibliothèques
OCLC :
http://www.oclc.org/home.en.html
Libdex :
http://www.libdex.com/
Le portail revues.org :
http://www.revues.org/
Et nous terminons par la BnF :
http://www.bnf.fr/fr/acc/x.accueil.html
La suite...
Thunderstone :
http://search.thunderstone.com/texis/websearch19/
Et les coups de cœur de la Doc :
Le catalogue de la BnF, déjà mentionné.
Internet Archive, le must. 5000 films du domaine public, des classiques,
à visionner et bien d'autres documents : photographies, publications...
https://archive.org/index.php
Tout est légal ! Une mine de ressources .
Dadi : un portail de bases de données, avec un classement par la Dewey
si on le souhaite. Non, ce n'est pas Marcel !( toute ma jeunesse...)
http://dadi.univ-lyon1.fr/
Pour terminer
Bon, Google scholar, est intéressant, soyons honnête :
http://scholar.google.fr/
La version définitive de ce tutoriel sera mise en ligne avec les travaux de
mon groupe du MOOC Doc Tice, sur CDI virtuel ( Barbara Alhomme,
Françoise Grave, Noëlle Michaud).
En attendant, bonne pêche dans les profondeurs du Web !
http://commons.wikimedia.org/wiki/File:Saint-Cassien_pecheur.jpg

Contenu connexe

Tendances

E-réputation,Nécéssité de gérer son image sur le web #wasexotweetup Numéro 5
E-réputation,Nécéssité de gérer son image sur le web #wasexotweetup Numéro 5E-réputation,Nécéssité de gérer son image sur le web #wasexotweetup Numéro 5
E-réputation,Nécéssité de gérer son image sur le web #wasexotweetup Numéro 5Stévy-Ferry WALLACE
 
Technique de recherche , méthodes et outils de veille sur internet - #Benindi...
Technique de recherche , méthodes et outils de veille sur internet - #Benindi...Technique de recherche , méthodes et outils de veille sur internet - #Benindi...
Technique de recherche , méthodes et outils de veille sur internet - #Benindi...Stévy-Ferry WALLACE
 
Recherche eveillée sur Internet : mode d'emploi - BFR Consultants
Recherche eveillée sur Internet : mode d'emploi - BFR ConsultantsRecherche eveillée sur Internet : mode d'emploi - BFR Consultants
Recherche eveillée sur Internet : mode d'emploi - BFR ConsultantsBéatrice Foenix-Riou
 
Amélioration de la productivité par les outils TIC/Internet - Recherche d'inf...
Amélioration de la productivité par les outils TIC/Internet - Recherche d'inf...Amélioration de la productivité par les outils TIC/Internet - Recherche d'inf...
Amélioration de la productivité par les outils TIC/Internet - Recherche d'inf...Karim ATTOUMANI MOHAMED
 
Formation Internet Isop 7 juin 2010
Formation Internet Isop 7 juin 2010Formation Internet Isop 7 juin 2010
Formation Internet Isop 7 juin 2010Letaillieur
 
Expospierre 1229514527066080-2
Expospierre 1229514527066080-2Expospierre 1229514527066080-2
Expospierre 1229514527066080-2tomasone
 
Information numérique : défintions et enjeux
Information numérique : défintions et enjeuxInformation numérique : défintions et enjeux
Information numérique : défintions et enjeuxGautier Poupeau
 
Veille 4 - I Choquet - organiser la veille
Veille 4 - I Choquet - organiser la veilleVeille 4 - I Choquet - organiser la veille
Veille 4 - I Choquet - organiser la veilleUniversité de Metz
 
Internet c'est pas magique
Internet c'est pas magiqueInternet c'est pas magique
Internet c'est pas magiquerichard peirano
 
Introduction au web sémantique : quand le lient fait sens
Introduction au web sémantique : quand le lient fait sensIntroduction au web sémantique : quand le lient fait sens
Introduction au web sémantique : quand le lient fait sensFICEL Hemza
 
Atlantico recherche 11 février 2011
Atlantico recherche 11 février 2011Atlantico recherche 11 février 2011
Atlantico recherche 11 février 2011Alain Joannes
 
Outils Web 2.0 pour les militants et ONG
Outils Web 2.0 pour les militants et ONGOutils Web 2.0 pour les militants et ONG
Outils Web 2.0 pour les militants et ONGdiatribekarma
 
Formation Facebook - Protection
Formation Facebook - ProtectionFormation Facebook - Protection
Formation Facebook - ProtectionAhuntsic
 
Les clés du référencement
Les clés du référencementLes clés du référencement
Les clés du référencementOpenEdition
 
Recherche d'information par hamoji
Recherche d'information par hamojiRecherche d'information par hamoji
Recherche d'information par hamojiBarcampCameroon
 
Moteurs de recherche, finir avec les idées reçues
Moteurs de recherche, finir avec les idées reçuesMoteurs de recherche, finir avec les idées reçues
Moteurs de recherche, finir avec les idées reçuesAref Jdey
 
Atelier sur les logiciels et services Web gratuits pouvant être utiles en thè...
Atelier sur les logiciels et services Web gratuits pouvant être utiles en thè...Atelier sur les logiciels et services Web gratuits pouvant être utiles en thè...
Atelier sur les logiciels et services Web gratuits pouvant être utiles en thè...URFIST de Paris
 
Être visible sur internet : l'identité numérique du chercheur
Être visible sur internet : l'identité numérique du chercheurÊtre visible sur internet : l'identité numérique du chercheur
Être visible sur internet : l'identité numérique du chercheurURFIST de Paris
 
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...Gautier Poupeau
 

Tendances (20)

E-réputation,Nécéssité de gérer son image sur le web #wasexotweetup Numéro 5
E-réputation,Nécéssité de gérer son image sur le web #wasexotweetup Numéro 5E-réputation,Nécéssité de gérer son image sur le web #wasexotweetup Numéro 5
E-réputation,Nécéssité de gérer son image sur le web #wasexotweetup Numéro 5
 
Technique de recherche , méthodes et outils de veille sur internet - #Benindi...
Technique de recherche , méthodes et outils de veille sur internet - #Benindi...Technique de recherche , méthodes et outils de veille sur internet - #Benindi...
Technique de recherche , méthodes et outils de veille sur internet - #Benindi...
 
Recherche eveillée sur Internet : mode d'emploi - BFR Consultants
Recherche eveillée sur Internet : mode d'emploi - BFR ConsultantsRecherche eveillée sur Internet : mode d'emploi - BFR Consultants
Recherche eveillée sur Internet : mode d'emploi - BFR Consultants
 
Amélioration de la productivité par les outils TIC/Internet - Recherche d'inf...
Amélioration de la productivité par les outils TIC/Internet - Recherche d'inf...Amélioration de la productivité par les outils TIC/Internet - Recherche d'inf...
Amélioration de la productivité par les outils TIC/Internet - Recherche d'inf...
 
Formation Internet Isop 7 juin 2010
Formation Internet Isop 7 juin 2010Formation Internet Isop 7 juin 2010
Formation Internet Isop 7 juin 2010
 
Expospierre 1229514527066080-2
Expospierre 1229514527066080-2Expospierre 1229514527066080-2
Expospierre 1229514527066080-2
 
Information numérique : défintions et enjeux
Information numérique : défintions et enjeuxInformation numérique : défintions et enjeux
Information numérique : défintions et enjeux
 
Veille 4 - I Choquet - organiser la veille
Veille 4 - I Choquet - organiser la veilleVeille 4 - I Choquet - organiser la veille
Veille 4 - I Choquet - organiser la veille
 
Internet c'est pas magique
Internet c'est pas magiqueInternet c'est pas magique
Internet c'est pas magique
 
Introduction au web sémantique : quand le lient fait sens
Introduction au web sémantique : quand le lient fait sensIntroduction au web sémantique : quand le lient fait sens
Introduction au web sémantique : quand le lient fait sens
 
Atlantico recherche 11 février 2011
Atlantico recherche 11 février 2011Atlantico recherche 11 février 2011
Atlantico recherche 11 février 2011
 
Outils Web 2.0 pour les militants et ONG
Outils Web 2.0 pour les militants et ONGOutils Web 2.0 pour les militants et ONG
Outils Web 2.0 pour les militants et ONG
 
Boostez vos recherches sur Internet
Boostez vos recherches sur InternetBoostez vos recherches sur Internet
Boostez vos recherches sur Internet
 
Formation Facebook - Protection
Formation Facebook - ProtectionFormation Facebook - Protection
Formation Facebook - Protection
 
Les clés du référencement
Les clés du référencementLes clés du référencement
Les clés du référencement
 
Recherche d'information par hamoji
Recherche d'information par hamojiRecherche d'information par hamoji
Recherche d'information par hamoji
 
Moteurs de recherche, finir avec les idées reçues
Moteurs de recherche, finir avec les idées reçuesMoteurs de recherche, finir avec les idées reçues
Moteurs de recherche, finir avec les idées reçues
 
Atelier sur les logiciels et services Web gratuits pouvant être utiles en thè...
Atelier sur les logiciels et services Web gratuits pouvant être utiles en thè...Atelier sur les logiciels et services Web gratuits pouvant être utiles en thè...
Atelier sur les logiciels et services Web gratuits pouvant être utiles en thè...
 
Être visible sur internet : l'identité numérique du chercheur
Être visible sur internet : l'identité numérique du chercheurÊtre visible sur internet : l'identité numérique du chercheur
Être visible sur internet : l'identité numérique du chercheur
 
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
 

En vedette

Cloaking making visible things into invisible
Cloaking  making visible things into invisibleCloaking  making visible things into invisible
Cloaking making visible things into invisiblePraDeep Reddy
 
Mind Mapping en 10 Slides
Mind Mapping en 10 SlidesMind Mapping en 10 Slides
Mind Mapping en 10 SlidesSignos
 
Sketching for Design
Sketching for DesignSketching for Design
Sketching for DesignJackson Fox
 
Deep Web
Deep WebDeep Web
Deep WebSt John
 
Sketching Matters
Sketching MattersSketching Matters
Sketching MattersPaul Goode
 
Sketching & Prototyping
Sketching & PrototypingSketching & Prototyping
Sketching & PrototypingMarius Ursache
 
143 Visuals, Doodles & Sketchnotes to inspire
143 Visuals, Doodles & Sketchnotes to inspire143 Visuals, Doodles & Sketchnotes to inspire
143 Visuals, Doodles & Sketchnotes to inspireScott Torrance
 
Sketching To Communicate, Share Stories And Solve Problems
Sketching To Communicate, Share Stories And Solve ProblemsSketching To Communicate, Share Stories And Solve Problems
Sketching To Communicate, Share Stories And Solve ProblemsKelsey Ruger
 
Bewerbung für das stipendium
Bewerbung für das stipendiumBewerbung für das stipendium
Bewerbung für das stipendiumannasz92
 
INFORMATICA GRUPO 2
INFORMATICA GRUPO 2INFORMATICA GRUPO 2
INFORMATICA GRUPO 2Dayana Mora
 
INFORMATICA GRUPO 7
INFORMATICA GRUPO 7INFORMATICA GRUPO 7
INFORMATICA GRUPO 7Dayana Mora
 
Maltrato a la mujer
Maltrato a la mujerMaltrato a la mujer
Maltrato a la mujerpilllihuaman
 
RELACIÓN ENTRE EL ENTORNO FAMILIAR Y EL RENDIMIENTO ESCOLAR DE LOS NIÑOS DE Q...
RELACIÓN ENTRE EL ENTORNO FAMILIAR Y EL RENDIMIENTO ESCOLAR DE LOS NIÑOS DE Q...RELACIÓN ENTRE EL ENTORNO FAMILIAR Y EL RENDIMIENTO ESCOLAR DE LOS NIÑOS DE Q...
RELACIÓN ENTRE EL ENTORNO FAMILIAR Y EL RENDIMIENTO ESCOLAR DE LOS NIÑOS DE Q...Mariaga66
 

En vedette (20)

Deep-Hidden-Invisible Web
Deep-Hidden-Invisible WebDeep-Hidden-Invisible Web
Deep-Hidden-Invisible Web
 
Cloaking making visible things into invisible
Cloaking  making visible things into invisibleCloaking  making visible things into invisible
Cloaking making visible things into invisible
 
Mind Mapping en 10 Slides
Mind Mapping en 10 SlidesMind Mapping en 10 Slides
Mind Mapping en 10 Slides
 
Deep web
Deep webDeep web
Deep web
 
Sketching for Design
Sketching for DesignSketching for Design
Sketching for Design
 
Deep Web
Deep WebDeep Web
Deep Web
 
Sketching Matters
Sketching MattersSketching Matters
Sketching Matters
 
Sketching & Prototyping
Sketching & PrototypingSketching & Prototyping
Sketching & Prototyping
 
143 Visuals, Doodles & Sketchnotes to inspire
143 Visuals, Doodles & Sketchnotes to inspire143 Visuals, Doodles & Sketchnotes to inspire
143 Visuals, Doodles & Sketchnotes to inspire
 
Sketching To Communicate, Share Stories And Solve Problems
Sketching To Communicate, Share Stories And Solve ProblemsSketching To Communicate, Share Stories And Solve Problems
Sketching To Communicate, Share Stories And Solve Problems
 
Basic sketching
Basic sketchingBasic sketching
Basic sketching
 
Reinosa
ReinosaReinosa
Reinosa
 
Limitación Auditiva
Limitación AuditivaLimitación Auditiva
Limitación Auditiva
 
Ntic
NticNtic
Ntic
 
Bewerbung für das stipendium
Bewerbung für das stipendiumBewerbung für das stipendium
Bewerbung für das stipendium
 
INFORMATICA GRUPO 2
INFORMATICA GRUPO 2INFORMATICA GRUPO 2
INFORMATICA GRUPO 2
 
Clase5 garciarosari omayra
Clase5 garciarosari omayraClase5 garciarosari omayra
Clase5 garciarosari omayra
 
INFORMATICA GRUPO 7
INFORMATICA GRUPO 7INFORMATICA GRUPO 7
INFORMATICA GRUPO 7
 
Maltrato a la mujer
Maltrato a la mujerMaltrato a la mujer
Maltrato a la mujer
 
RELACIÓN ENTRE EL ENTORNO FAMILIAR Y EL RENDIMIENTO ESCOLAR DE LOS NIÑOS DE Q...
RELACIÓN ENTRE EL ENTORNO FAMILIAR Y EL RENDIMIENTO ESCOLAR DE LOS NIÑOS DE Q...RELACIÓN ENTRE EL ENTORNO FAMILIAR Y EL RENDIMIENTO ESCOLAR DE LOS NIÑOS DE Q...
RELACIÓN ENTRE EL ENTORNO FAMILIAR Y EL RENDIMIENTO ESCOLAR DE LOS NIÑOS DE Q...
 

Similaire à Web invisible

Formation Internet isop 7 juin 2010
Formation Internet isop 7 juin 2010Formation Internet isop 7 juin 2010
Formation Internet isop 7 juin 2010Letaillieur
 
Veille2012 avec-copies-ecran-120416110404-phpapp01
Veille2012 avec-copies-ecran-120416110404-phpapp01Veille2012 avec-copies-ecran-120416110404-phpapp01
Veille2012 avec-copies-ecran-120416110404-phpapp01Claude Martin
 
Les outils de recherche et veille sur le web
Les outils de recherche et veille sur le webLes outils de recherche et veille sur le web
Les outils de recherche et veille sur le webechangeurba
 
Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"Philippe METAYER
 
L’internet des sciences humaines et sociales. Recherches - Perspectives
L’internet des sciences humaines et sociales. Recherches - Perspectives L’internet des sciences humaines et sociales. Recherches - Perspectives
L’internet des sciences humaines et sociales. Recherches - Perspectives Phonothèque MMSH
 
Sites internet de services d'archives : comment faire connaître son site ?
Sites internet de services d'archives : comment faire connaître son site ?Sites internet de services d'archives : comment faire connaître son site ?
Sites internet de services d'archives : comment faire connaître son site ?Julie Scheffer
 
Methodologie Recherche Je 15 Dec
Methodologie Recherche Je 15 DecMethodologie Recherche Je 15 Dec
Methodologie Recherche Je 15 DecBibliolab
 
Comprendre et utiliser le web 2.0 en bibliothèque
Comprendre et utiliser le web 2.0 en bibliothèqueComprendre et utiliser le web 2.0 en bibliothèque
Comprendre et utiliser le web 2.0 en bibliothèqueDujol Lionel
 
(exploration du web)
(exploration du web)(exploration du web)
(exploration du web)Anouar Abtoy
 
Bnf 15 Dec Véronique Mesguich
Bnf 15 Dec Véronique MesguichBnf 15 Dec Véronique Mesguich
Bnf 15 Dec Véronique MesguichBibliolab
 
La recherche d\'information sur internet
La recherche d\'information sur internetLa recherche d\'information sur internet
La recherche d\'information sur internetalexartiste
 
Web 2.0 - CGA Guadeloupe
Web 2.0 - CGA GuadeloupeWeb 2.0 - CGA Guadeloupe
Web 2.0 - CGA GuadeloupeXavier LAIR
 
HISTOIRE ET PANORAMA DU WEB À DESTINATION DES PROFESSIONNELS DE L'IMAGE ET DE...
HISTOIRE ET PANORAMA DU WEB À DESTINATION DES PROFESSIONNELS DE L'IMAGE ET DE...HISTOIRE ET PANORAMA DU WEB À DESTINATION DES PROFESSIONNELS DE L'IMAGE ET DE...
HISTOIRE ET PANORAMA DU WEB À DESTINATION DES PROFESSIONNELS DE L'IMAGE ET DE...Nadia Berg
 
Cyber-Langues 2011 veille
Cyber-Langues 2011 veilleCyber-Langues 2011 veille
Cyber-Langues 2011 veilleRémi Thibert
 
Bibliothèque en ligne et médiation numérique des collections
Bibliothèque en ligne et médiation numérique des collectionsBibliothèque en ligne et médiation numérique des collections
Bibliothèque en ligne et médiation numérique des collectionsDujol Lionel
 

Similaire à Web invisible (20)

Formation Internet isop 7 juin 2010
Formation Internet isop 7 juin 2010Formation Internet isop 7 juin 2010
Formation Internet isop 7 juin 2010
 
Veille2012 avec-copies-ecran-120416110404-phpapp01
Veille2012 avec-copies-ecran-120416110404-phpapp01Veille2012 avec-copies-ecran-120416110404-phpapp01
Veille2012 avec-copies-ecran-120416110404-phpapp01
 
Les outils de recherche et veille sur le web
Les outils de recherche et veille sur le webLes outils de recherche et veille sur le web
Les outils de recherche et veille sur le web
 
Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"
 
L’internet des sciences humaines et sociales. Recherches - Perspectives
L’internet des sciences humaines et sociales. Recherches - Perspectives L’internet des sciences humaines et sociales. Recherches - Perspectives
L’internet des sciences humaines et sociales. Recherches - Perspectives
 
Présentation1.pptx
Présentation1.pptxPrésentation1.pptx
Présentation1.pptx
 
Sites internet de services d'archives : comment faire connaître son site ?
Sites internet de services d'archives : comment faire connaître son site ?Sites internet de services d'archives : comment faire connaître son site ?
Sites internet de services d'archives : comment faire connaître son site ?
 
Methodologie Recherche Je 15 Dec
Methodologie Recherche Je 15 DecMethodologie Recherche Je 15 Dec
Methodologie Recherche Je 15 Dec
 
Comprendre et utiliser le web 2.0 en bibliothèque
Comprendre et utiliser le web 2.0 en bibliothèqueComprendre et utiliser le web 2.0 en bibliothèque
Comprendre et utiliser le web 2.0 en bibliothèque
 
(exploration du web)
(exploration du web)(exploration du web)
(exploration du web)
 
Oeinria
OeinriaOeinria
Oeinria
 
Bnf 15 Dec Véronique Mesguich
Bnf 15 Dec Véronique MesguichBnf 15 Dec Véronique Mesguich
Bnf 15 Dec Véronique Mesguich
 
La recherche d\'information sur internet
La recherche d\'information sur internetLa recherche d\'information sur internet
La recherche d\'information sur internet
 
Web 2.0 - CGA Guadeloupe
Web 2.0 - CGA GuadeloupeWeb 2.0 - CGA Guadeloupe
Web 2.0 - CGA Guadeloupe
 
Urfist Web2 0
Urfist Web2 0Urfist Web2 0
Urfist Web2 0
 
Tout trouver sur le web : les bonnes techniques de recherche !
Tout trouver sur le web : les bonnes techniques de recherche !Tout trouver sur le web : les bonnes techniques de recherche !
Tout trouver sur le web : les bonnes techniques de recherche !
 
HISTOIRE ET PANORAMA DU WEB À DESTINATION DES PROFESSIONNELS DE L'IMAGE ET DE...
HISTOIRE ET PANORAMA DU WEB À DESTINATION DES PROFESSIONNELS DE L'IMAGE ET DE...HISTOIRE ET PANORAMA DU WEB À DESTINATION DES PROFESSIONNELS DE L'IMAGE ET DE...
HISTOIRE ET PANORAMA DU WEB À DESTINATION DES PROFESSIONNELS DE L'IMAGE ET DE...
 
Web 2.0 : Blogs, RSS & Wikis
Web 2.0 : Blogs, RSS & WikisWeb 2.0 : Blogs, RSS & Wikis
Web 2.0 : Blogs, RSS & Wikis
 
Cyber-Langues 2011 veille
Cyber-Langues 2011 veilleCyber-Langues 2011 veille
Cyber-Langues 2011 veille
 
Bibliothèque en ligne et médiation numérique des collections
Bibliothèque en ligne et médiation numérique des collectionsBibliothèque en ligne et médiation numérique des collections
Bibliothèque en ligne et médiation numérique des collections
 

Plus de Françoise Grave (20)

Paniers_6EA_6EB_6EC.pdf
Paniers_6EA_6EB_6EC.pdfPaniers_6EA_6EB_6EC.pdf
Paniers_6EA_6EB_6EC.pdf
 
Recherche images libres_droits_sixiemes
Recherche images libres_droits_sixiemesRecherche images libres_droits_sixiemes
Recherche images libres_droits_sixiemes
 
Comptage mots document_numerique
Comptage mots document_numeriqueComptage mots document_numerique
Comptage mots document_numerique
 
Pix raccourcis clavier
Pix raccourcis clavierPix raccourcis clavier
Pix raccourcis clavier
 
Pix twitter
Pix twitterPix twitter
Pix twitter
 
Twitter advanced search_tuto
Twitter advanced search_tutoTwitter advanced search_tuto
Twitter advanced search_tuto
 
Dewey cdi _
Dewey cdi _Dewey cdi _
Dewey cdi _
 
Fact checking
Fact checkingFact checking
Fact checking
 
Recherche images libres_droits_sixiemes
Recherche images libres_droits_sixiemesRecherche images libres_droits_sixiemes
Recherche images libres_droits_sixiemes
 
Cult num 7_deuxieme_partie
Cult num 7_deuxieme_partieCult num 7_deuxieme_partie
Cult num 7_deuxieme_partie
 
Cult num 7_premiere_partie
Cult num 7_premiere_partieCult num 7_premiere_partie
Cult num 7_premiere_partie
 
Cult num 6
Cult num 6Cult num 6
Cult num 6
 
Droit image 6_fevrier
Droit image 6_fevrierDroit image 6_fevrier
Droit image 6_fevrier
 
Esidoc panier
Esidoc panierEsidoc panier
Esidoc panier
 
Cult num 5
Cult num 5Cult num 5
Cult num 5
 
Cult num 4
Cult num 4Cult num 4
Cult num 4
 
Cult num 4
Cult num 4Cult num 4
Cult num 4
 
Cult num 3
Cult num 3Cult num 3
Cult num 3
 
Cult num 1
Cult num 1Cult num 1
Cult num 1
 
Cult num 2
Cult num 2Cult num 2
Cult num 2
 

Web invisible

  • 1. Le tuto des p'tits trucs de la Doc ! Le Web invisible Françoise Grave
  • 2. Un p'tit dessin, peut-être ? Jean-Louis Zimmermann, source : Flickr, sous licence Creative Commons http://www.flickr.com/photos/jeanlouis_zimmermann/3870653226/
  • 3. Une définition en langue française ? La définition des Signets de la Bnf : « Le web invisible cache la partie du Web correspondant à l'ensemble des documents qui ne sont pas indexés par les moteurs de recherche traditionnels ». Grand dictionnaire terminologique ( office québecois de la langue française) : « Les ressources du Web invisible comprennent, entre autres, les sites Web construits autour d'une base de données (interrogeables uniquement avec un moteur de recherche interne), les pages accessibles par un formulaire de recherche, les pages protégées par un mot de passe, les pages interdites aux robots d'indexation, les pages écrites dans des formats propriétaires, les Intranet et les Extranet ».
  • 4. Web profond, Web caché, web invisible, deep Web Comment accéder à ce Web des profondeurs ? On peut télécharger des logiciels pour explorer ce Web abyssal. C'est très pratique pour éviter d' être repéré par la police politique lorsque l'on vit dans un état totalitaire. Hélas, ce Web caché est très prisé des pervers en tout genre notamment des pédophiles. On évoque aussi le « Dark Web » refuge des opposants, libertaires et criminels de tout poil. On peut aussi utiliser des outils de recherche ou des moteurs spécialisés. Mias quel intérêt de fouiller le Web invisible ?
  • 5. Web invisible ou Web profond : quelques chiffres ● D'après le site Savoirs CDI , le web caché, ou Web profond, ou Web invisible, serait 300 à 550 fois plus important que le Web visible. ● Pour le site Intelligence-center.com, le chiffre est de 260 fois le web de surface. ● D'après Wikipédia, une étude de 2008 estimerait à 70 ou 75% les pages non référencées par les moteurs classiques. ● D'après Benoit Dupont, directeur du centre international de criminologie de l' université de Montréal, le web que l'on connaît totaliserait 10%, 90% du Web appartiennent au « Deep web ». Et ce serait possible d' être plus précis ? Non, pas vraiment : le Web, représente des milliards de pages.
  • 6. Web invisible ou Web profond : quelques chiffres ● D'après le site Savoirs CDI , le web caché, ou Web profond, ou Web invisible, serait 300 à 550 fois plus important que le Web visible. ● Pour le site Intelligence-center.com, le chiffre est de 260 fois le web de surface. ● D'après Wikipédia, une étude de 2008 estimerait à 70 ou 75% les pages non référencées par les moteurs classiques. ● D'après Benoit Dupont, directeur du centre international de criminologie de l' université de Montréal, le web que l'on connaît totaliserait 10%, 90% du Web appartiennent au « Deep web ». Et ce serait possible d' être plus précis ? Non, pas vraiment : le Web, représente des milliards de pages.
  • 7. Le web invisible : des ressources de qualité Tous les documents ne peuvent être indexés par des moteurs classiques : Yahoo, Bing, Google ( encore que le dernier cité est aussi cité pour ses capacités à chercher dans le deep Web). ● Certains documents sont trop volumineux : bases de données. ● Certaines pages sont protégées par leur créateur ( fichier inséré dans le code source ou mot de passe), ou des accès sont payants. Le Web surfacique (pour frimer dans la cour de récré uniquement, mais l'expression existe ) vous propose des ressources de piètre qualité, mais le web profond cache des pépites dont un grand nombre en accès libre, gratuit : Base de données, articles scientifiques, rapports , publications gouvernementales, thèses, portails divers, ressources de bibliothèques, livres numériques... Il semblerait qu'on puisse accéder à des répertoires FTP, des contenus générés par des web apps, des dépôts de binaires NNTP, des fichiers financiers d'entreprises cotées en bourse...
  • 8. Les outils ou moteurs spécialisés quelques outils conseillés par : comment ça marche ? http://www.commentcamarche.net/faq/31357-chercher-de-l-information-sur-le-web-invisible Base : http://www.base-search.net/ Un outil de recherche pour les sciences : http://www.scienceresearch.com/scienceresearch/ Un méta-moteur pour 60 bases de données : http://worldwidescience.org/ Médecine : Mednar http://mednar.com/ Commerce : Biznar.com : http://mednar.com/
  • 9. Quelques outils en vrac pour fouiller le Web InfoMine, créé par la bibliothèque de l' Université de Californie : http://infomine.ucr.edu/ TechXtra : publications universitaires et étudiantes du domaine public http://www.techxtra.ac.uk/index.html Le projet Virtual Library : http://vlib.org/ Xrefer : http://www.xrefer.com/ Profusion : http://www.profusion.com/
  • 10. Quelques catalogues de bibliothèques OCLC : http://www.oclc.org/home.en.html Libdex : http://www.libdex.com/ Le portail revues.org : http://www.revues.org/ Et nous terminons par la BnF : http://www.bnf.fr/fr/acc/x.accueil.html
  • 11. La suite... Thunderstone : http://search.thunderstone.com/texis/websearch19/ Et les coups de cœur de la Doc : Le catalogue de la BnF, déjà mentionné. Internet Archive, le must. 5000 films du domaine public, des classiques, à visionner et bien d'autres documents : photographies, publications... https://archive.org/index.php Tout est légal ! Une mine de ressources . Dadi : un portail de bases de données, avec un classement par la Dewey si on le souhaite. Non, ce n'est pas Marcel !( toute ma jeunesse...) http://dadi.univ-lyon1.fr/
  • 12. Pour terminer Bon, Google scholar, est intéressant, soyons honnête : http://scholar.google.fr/ La version définitive de ce tutoriel sera mise en ligne avec les travaux de mon groupe du MOOC Doc Tice, sur CDI virtuel ( Barbara Alhomme, Françoise Grave, Noëlle Michaud). En attendant, bonne pêche dans les profondeurs du Web ! http://commons.wikimedia.org/wiki/File:Saint-Cassien_pecheur.jpg