1. LA RECHERCHE
D’INFORMATION
SUR INTERNET
1
Formation 2011
Sandrine Michel – sandrine.michel@gmail.com
2. Objectifs :
• Savoir utiliser internet pour faire
des recherches d’information
• Savoir construire une méthode de
recherche adaptée
• Savoir suivre les évolutions de la
recherche d’information sur internet
2
3. L’ÉVALUATION DE L’ENSEIGNEMENT
Une fiche de synthèse
IUT 2A2M – Sandrine Michel
En binôme
Sur un sujet à choisir parmi la liste
3
4. INTERNET ET LA
RECHERCHE
D’INFORMATIONS
4 Définitions
Contexte
Méthodologie
5. QU’EST-CE QU’INTERNET ?
Internet = Interconnexion de réseaux en français
IUT 2A2M – Sandrine Michel
Système mondial d’interconnexion de réseau
informatique
Applications composants le web :
Web
Courrier électronique
Messagerie instantanée
5
Source : Wikipédia
6. 1. Qu’est-ce que le web ?
World Wide Web = toile (d’araignée) mondiale
Système hypertexte fonctionnant sur Internet
IUT 2A2M – Sandrine Michel
Estimation de la taille du web visible en 2005 :
11,5 milliards de pages
6
7. WEB INVISIBLE
= web profond ou web caché
250 fois plus vaste que le web visible
IUT 2A2M – Sandrine Michel
7
8. Pages qui ne sont pas indexées par un moteur de
recherche
4 raisons :
Pages non indexées par les moteurs de recherche :
créées après la passage du robot
IUT 2A2M – Sandrine Michel
Le moteur limite le nombre de pages indexées pour un
même site
Page proposant peu de backlinks
Pages non indexées pour des raisons techniques
(majeure partie du web invisible) : format des pages et
surtout pages dynamiques générées à partir d’un
formulaire
8
10. • Internet est en même temps :
• une infrastructure mondiale de
communication (notion de "réseau") http://paylicia.com/
IUT 2A2M – Sandrine Michel
• un ensemble de ressources
• un ensemble de services
• un ensemble de pratiques sociales
• une communauté d'usagers
10
11. DES INFORMATIONS À L’INFINI ET DISPERSÉES
• Hétérogènes
• Le positionnement et le référencement payant
s’imposent
Non contrôlées (multiplicité des législations)
IUT 2A2M – Sandrine Michel
•
• En renouvellement permanent avec une pérennité non
garantie et non recherchée
• Mises en valeur par la popularité
• Difficilement accessibles : instables, fragmentées, non
structurées
11
12. http://www.cykia.com/moteur-
de-recherche-nutch.htm
Pour faire une recherche sur
Internet, il est nécessaire d'avoir
une idée de l'information que l'on
peut y trouver :
IUT 2A2M – Sandrine Michel
• Quels producteurs ou sources
d'information ?
• Quels types d'information
diffusées ?
12
14. Sites d’entreprises – associations
http://www.ardesi.fr
IUT 2A2M – Sandrine Michel
Sites de référence
Ce sont des points de passage qui tendent
à l’exhaustivité et proposent liens, FAQ,
forums, moteurs internes
http://www.service-public.fr
Pages personnelles : listes de ressources qui
ont exploré un domaine
14
15. Sites de laboratoires de recherche d’universités
http://www.irit.fr
Sites de bibliothèques
IUT 2A2M – Sandrine Michel
http://www.bnf.fr
Sites gouvernementaux et institutionnels
http://www.internet.gouv.fr
Sites de presse : dépêches de presse, presse
traditionnelle, presse en ligne
http://www.lemonde.fr 15
16. LES OUTILS : LES MOTEURS DE
RECHERCHE
16 Google, bing, yahoo, exalead
17. http://www.cykia.com/moteur-
LES MOTEURS DE RECHERCHE
de-recherche-nutch.htm
Nécessité d’interroger plusieurs
moteurs
Les moteurs n’ont pas la même
IUT 2A2M – Sandrine Michel
couverture web
Les moteurs utilisent des algorithmes
de classement différents
Le Page Rank de Google
Des réponses différentes d’un moteur
à l’autre
17
18. C’EST QUOI UN MOTEUR DE RECHERCHE ?
Outils assistés par des robots qui scrutent le
contenu du web à la recherche de pages
nouvelles.
IUT 2A2M – Sandrine Michel
Le contenu des pages web et des documents est
stocké dans des index.
Les principaux moteurs :
Google, altavista, bing, yahoo, exalead
Utiles quand vous savez exactement ce que vous
cherchez
18
19. COMMENT CHERCHER EFFICACEMENT SUR
LES MOTEURS ?
Utiliser les fonctionnalités avancées
IUT 2A2M – Sandrine Michel
Choisir des mots clés appropriés
Méthode :
Saisir des mots clés génériques pour repérer
les sites à explorer = sites de référence
Affiner avec des mots clés précis
Des moteurs proposent des mots clés associés
Exemple : exalead
19
21. DES
FONCTIONNALITÉS
POUR AFFINER SA
RECHERCHE SUR
GOOGLE
IUT 2A2M – Sandrine Michel
IUT 2A2M
Saisir une recherche
puis cliquer sur plus
d’outils (bandeau de
gauche)
21
22. Les guillemets : pour rechercher une expression
de mots dans le bon ordre et avec des mots côte
à côte
Rechercher une personne : « prénom nom » et
« nom prénom »
IUT 2A2M – Sandrine Michel
Les accents : OUI !
Limiter la recherche à un type de fichier
Le format pdf pour les publications, thèses, …
Le format doc pour les rapports, documents de
travail
Le format ppt pour les
diaporamas, conférences 22
24. La recherche par date de google :
en cliquant sur plus d’outils
IUT 2A2M – Sandrine Michel
24
25. DES MOTEURS SPÉCIALISÉS
Scirus : la recherche d’information scientifique
Recherche pluridisciplinaire en texte intégral
de millions de documents
Majorité des contenus en anglais
IUT 2A2M – Sandrine Michel
Google Scholar : la recherche dans la littérature
universitaire
Contenu de la base : publications des
universités, des laboratoires et des éditeurs 25
scolaires américains
27. TWINGINE.NO
Lance simultanément une recherche sur google
et yahoo!
IUT 2A2M – Sandrine Michel
IUT 2A2M
27
28. HARVESTER42
Interroge environ 50 bases de données et
moteurs spécialisés
Par défaut la recherche s’effectue sur google et
IUT 2A2M – Sandrine Michel
bing (2 fenêtres l’une au dessous de l’autre)
Des onglets en haut de page pour choisir un
cluster thématique qui lancera la requête sur
quelques outils présélectionnés
Literature : google scholar, google book, …
News : google news, addictomatic
Interroge notamment des banques de données 28
du web invisible
29. LE MÉTAMOTEUR VISUEL
Métamoteur suédois
IUT 2A2M – Sandrine Michel
Collecte des données auprès de moteurs
généralistes, des sites communautaires (twitter,
amazon, flickr)
Rassemble des pages web, des photos, vidéos,
tweets, images, etc
Présentation pêle-mêle
29
32. FONCTIONNEMENT
o Catalogues de sites qui classent les ressources et
hiérarchisent l’information en la classant par catégories
et sous-catégories
o À chaque adresse référencée par son URL est associée
une description de quelques lignes du site selon une
IUT 2A2M – Sandrine Michel
organisation hiérarchique par sujet
o Conseils d’utilisation :
• Outil servant à “dégrossir” une recherche sur un
sujet général
• Outil permettant de connaître l’actualité d’un sujet
• Outil permettant de trouver les sites “fédérateurs”
ou portails
32
33. IUT 2A2M – Sandrine Michel
IUT 2A2M
33
OPEN DIRECTORY (ODP – DMOZ)
34. LES RÉPERTOIRES SÉLECTIFS
Construits sur le même principe que les
annuaires
IUT 2A2M – Sandrine Michel
Répertoires des ressources les plus utiles
Signets de la BNF
http://signets.bnf.fr
34
35. LES ANNUAIRES THÉMATIQUES
Décrivent des sites et les classent dans des
catégories, avec une approche thématique
IUT 2A2M – Sandrine Michel
Exemple :
Manager go! : 5 000 ressources liées au
management
Les annuaires d’annuaires
LesAnnuaires.com
35
37. DES OUTILS PERTINENTS
Google Images : le plus connu
Flickr : la référence en matière de site de partage et
d’hébergement de photos
IUT 2A2M – Sandrine Michel
Picsearch : index de 3 milliards d’images
Pics Like That : fonctionne par similarité
Au survol d’une image « find similar »
37
38. IUT 2A2M – Sandrine Michel
IUT 2A2M
38
www.picslikethat.com
40. SÉLECTION DES OUTILS LES PLUS CONNUS
Google vidéos : analyse le texte de la page
adjacent au fichier, les sous-titres & d’autres
facteurs
IUT 2A2M – Sandrine Michel
YouTube
Dailymotion
40
42. PENSEZ-VOUS QUE LES MÉDIAS SOCIAUX SONT UNIQUEMENT
UNE MODE ?
IUT 2A2M – Sandrine Michel
42
HTTP://WWW.WAT.TV/VIDEO/SOCIAL-MEDIA-REVOLUTION--36ZOH_36ZOF_.HTML
43. QU’ENTEND-ON PAR WEB 2.0 ?
une plate-forme, avec l’idée du « tout en ligne »
Des interfaces ergonomiques
IUT 2A2M – Sandrine Michel
Des possibilités illimitées de publication, de partage
et de participation autour de l’information et des
contenus
L’incontournable « effet communautaire »
43
44. LES BLOGS
Journaux personnels en forme de site web,
publiés régulièrement.
IUT 2A2M – Sandrine Michel
32% des internautes lisent des blogs (source
Pew Internet janvier 2011)
44
45. Blog sélection de sites pour les jeunes
http://sitesjeunes.free.fr/
IUT 2A2M – Sandrine Michel
45
46. Blog social et assistanat
http://social.societal.free.fr/
IUT 2A2M – Sandrine Michel
46
47. BLOG DU SALON DES SERVICES À LA PERSONNE
http://www.salon-services-personne.com/blog/?tag=maintien-a-domicile
IUT 2A2M – Sandrine Michel
47
48. POUR TROUVER DES BLOGS
Google blogs : bonne couverture de la
blogosphère francophone
IUT 2A2M – Sandrine Michel
BlogPulse.com : outil de recherche de blog et
suivi des tendances sur les blogs
48
49. SYNDICATION DE CONTENU ET FLUX RSS
o Technologie d’édition automatique d’un résumé du
contenu ajouté sur un site grâce à ses balises
sources. L’ensemble des informations constitue le
« flux » d’information et peut être republié sur
IUT 2A2M – Sandrine Michel
d’autres sites.
o Permet de diffuser les actualités renouvelées d’un site
de manière très simple (abonnement possible via
navigateur ou lecteur de messagerie)
o La disponibilité de flux d’informations est
généralement matérialisée par :
49
50. EXEMPLE : LES FILS RSS DU MONDE.FR
IUT 2A2M – Sandrine Michel
50
51. RECHERCHER DES FLUX RSS
Rss Micro : l’un des plus important dans le
domaine
Recherche parmi 10 millions de flux rss
Recherche sur les occurrences exactes des
mots
IUT 2A2M – Sandrine Michel
Feedage.com
Annuaire de fils
Recherche par mots ou par arborescence dans
10 millions de flux
Fluxrss.fr
Recherche par mots dans un annuaire de 8
51
666 flux francophones
52. DES AGRÉGATEURS
Google Reader
Clic sur Ajouter un abonnement »
Inscrire l’url du flux souhaitée
Possibilité de saisir un mot clé
IUT 2A2M – Sandrine Michel
IUT 2A2M
52
55. Système de communication original, tout à la fois
système de composition Web, outil de travail
collaboratif et espace de discussion.
C'est un site web auquel tout le monde peut
contribuer.
IUT 2A2M – Sandrine Michel
Wikipedia, l’encyclopédie libre collaborative :
http://fr.wikipedia.org/wiki/Accueil
http://www.citizendium.com
55
57. LE WEB 2.0 : ÉCHANGES ET RÉSEAUX
SOCIAUX
o Un recentrage sur le rôle de l’internaute et son
implication dans les communautés virtuelles /
partage de l’information
IUT 2A2M – Sandrine Michel
o Techniquement, les sites ou services web 2.0
permettent aux internautes de jouer un rôle actif :
échanger de l’information formelle (contacts,
réponses) et informelle (statistiques), collecter,
indexer…(web social)
57
58. DES CHIFFRES SUR LE WEB 2.0
o 78% des internautes français utilisent les
réseaux sociaux
o 94% des internautes français connaissent
Facebook
IUT 2A2M – Sandrine Michel
o Source : observatoire IFOP des réseaux sociaux
(octobre 2010)
58
59. LinkedIn : réseau social
professionnel le plus important
40 millions de membres en mai
2009
1 nouvel inscrit par seconde
MySpace : plateforme de contacts
IUT 2A2M – Sandrine Michel
A été dépassé par Facebook
90 millions de membres
Facebook :
Disponible en 76 langues
500 millions de membres en
2010
20 millions de membres en
France (source : social Bakers
– janvier 2011)