Avez-vous une idée du fonctionnement de Google ou de Wikipédia ?
Pouvez-vous évaluer la fiabilité d'un contenu sur le web ?
Savez-vous comment citer les ressources web dans un travail ?
Autant de questions qui trouveront réponse au cours de ce séminaire animé par Isabelle Motte ...
Formation M2i - Comprendre les neurosciences pour développer son leadership
Rechercher de l'information sur le web
1. La recherche d'information sur
le web
Isabelle Motte
Licence Creative Commons (by-nc-sa)
Dernière mise à jour : 29/10/10
2. Quand je dois faire une recherche documentaire,
la première chose que je fais, c'est ...
aller à la bibliothèqueJ
faire une recherche sur internetB
discuter du sujet avec un spécialisteV
me procurer des travaux de l'an passéR
(Interaction avec les participants à l'aide de cartons de couleur)
3. Pour obtenir des résultats fiables, il vaut mieux
utiliser ...
WikipédiaJ
GoogleB
le moteur de recherche de la
bibliothèque
V
YahooR
4. Je n'ai jamais utilisé les outils suivants :
WikipédiaJ
GoogleB
le moteur de recherche de la BUMPV
YahooR
5. Une grande partie du web est dite « invisible » ...
• Les meilleurs moteurs
de recherche indexent
moins de 20% du web;
• Tous les types de fichiers
ne sont pas indexés et
les pages dynamiques et
les bases de données
sont difficilement
indexées.
6. Les outils de recherche
• Les moteurs : pour une recherche précise
• Les annuaires : pour une recherche large
• Les métamoteurs : pour dégrossir rapidement
• Les encyclopédies : pour des informations
permanentes et sûres
• Les bases de données spécialisées : pour des
informations validées dans un domaine précis
8. Les moteurs : pour une recherche précise
• Les moteurs de recherche indexent
régulièrement des millions de pages
web dans une base de données
à l’aide de robots qui inventorient
et ajoutent les nouvelles pages;
• Chaque robot fonctionne à sa manière et ils peuvent donc
produire des résultats très différents selon l’indexation
utilisée :
- par mots clés;
- par titre;
- par le texte (tout ou seulement le début)
• Chaque moteur propose un formulaire de recherche
avancée plus puissant;
9. • Le moteur recherche l’occurrence du ou des mots
dans sa base de données;
• Les résultats sont classés selon un algorithme de
pertinence propre (présence du mot dans le titre,
dans le texte, dans les balises métas, indice de
popularité, …)
• Les résultats sont souvent présentés après
clustering, c’est-à-dire qu’ils ne proposent qu’un seul
lien pour plusieurs pages sur le même site;
• Tous les moteurs de recherche présentent des
options de tri personnalisables (via Options ou
Préférences)
• Les plus connus : Google, Yahoo! Search,Bing, Ask,
Cuil, ...
10. + beaucoup de types de fichiers référencés;
+ le plus vaste;
+ le plus complet au niveau des critères de recherche;
+ le tri par pertinence avec pondération et clustering
donne d'excellents résultats;
- de plus en plus de liens sponsorisés.
12. Le page rank de Google, le secret de son succès ...
13. + nombreux types
de fichiers
référencés;
+ très vaste;
+ très complet au
niveau des
critères de
recherche;
+ recherche
notamment dans
Yahoo!
- de plus en plus de
liens sponsorisés.
=> le concurrent le
plus sérieux de
Google !
14. Ancien MSN Search et Live Search
+ fichiers Microsoft référencés;
+ vaste;
+ nouveau moteur de recherche dynamique
+ jointure avec la BD de Facebook (bientôt « Vos amis ont
visité ce site »)
+ de plus en plus populaire.
15. + base de données originale;
- critères de recherche limités;
+ présentation des résultats originale.
- de plus en plus de liens sponsorisés.
16. Créé par des anciens collaborateurs Google
+ ne fait pas de suivi des activités des utilisateurs
- critères de recherche limités;
Inquiétant :
un moteur qui n'espionne pas
ses utilisateurs n'est pas viable ...
17. Les moteurs de recherche morts
• Alltheweb (BD reprise par Yahoo)
• Alta Vista (BD reprise par Yahoo)
• Cuil
• Openfind
• Lycos (BD reprise par Yahoo)
• Hotbot (BD reprise par Google)
• Deja.com (BD reprise par Google)
• Direct Hit (BD reprise par Teoma)
• Excite
• Go (BD reprise par Google)
• Infoseek
• NothernLight
• Teoma (BD reprise par Ask)
18. Les annuaires : pour une recherche large
• Les annuaires recensent des sites
classés par catégories; le classement
est effectué par la main de l’homme
et la pertinence et la qualité des sites
sont donc bien meilleures;
• Les responsables construisent une base de données
de fiches descriptives des différents sites et la
recherche des mots s’effectue sur base de la fiche
descriptive et non du site;
• Outre la recherche par catégorie, il est possible de
réaliser une recherche par mots clés qui fournira les
sites et les différentes catégories pertinentes;
• Les plus connus : Yahoo! et Open Directory;
19. - peu de types de fichiers référencés;
+ le plus vaste (car le plus ancien);
- intégré au moteur de recherche Yahoo!
+ très populaire car beaucoup de services et d'aide en
ligne;
- de plus en plus de liens sponsorisés.
20. - peu de types de fichiers référencés;
+ vaste;
+ très récent;
+ pas de liens sponsorisés.
21. Les métamoteurs : pour dégrossir rapidement
• Ils permettent d’interroger simultanément plusieurs
moteurs de recherche mais la requête doit donc être
simple;
• Exemples :Yippy, ...
23. - base de données limitée;
+ originalité : résultats présentés sous forme de carte.
24. Les encyclopédies : pour des infos permanentes
et sûres
• Elles présentent une source sûre, les informations sont
de qualité et permanentes; elles sont parfois payantes;
• Les plus connues : Britannica et Wikipedia
25. + très ancienne et très vaste;
+ référencement de diverses ressources évaluées (articles, ...);
- il faut payer pour accéder au contenu complet;
- beaucoup de pubs et de liens sponsorisés.
26.
27. Les informations de Wikipedia sont fiables parce que
les contenus sont écrits par des
spécialistes.
J
B
V
R
les contenus sont révisés par des
spécialistes.
les contenus sont révisés par tous les
visiteurs
les contenus sont protégés après une
procédure de relecture.
28. Wikipédia
• « Wikipédia est est un vaste projet
d'encyclopédie collective établie sur
Internet, universelle, multilingue et
fonctionnant sur le principe du wiki.
Wikipédia a pour objectif d'offrir un
contenu libre, neutre et vérifiable que
chacun peut éditer et améliorer. »
Source : Page d'accueil de Wikipédia
(http://fr.wikipedia.org/wiki/Wikipédia:A_propos )
consultée en septembre 2010
29. C'est quoi un wiki ?
• Un wiki permet à un groupe de personnes d'éditer
communément un contenu.
• Sur un wiki public, vous pouvez lire ce que la
communauté du wiki a écrit. En cliquant sur un bouton
"edit" ou "modifier" d'un article, vous pouvez éditer le texte
de l'article. Vous pouvez ajouter ou modifier tout ce que
vous voulez dans l'article que vous êtes en train de lire.
30. Si n'importe qui peut modifier le contenu, est ce fiable ?
Comment gère t'on les conflits d'édition ?
Que se passe t'il en cas de vandalisme ?
31. C'est fiable un wiki ?
Le wiki est un outil communautaire qui permet de livrer des
informations fiables grâce aux éléments suivants :
• Les modifications récentes sont accessibles à tout
moment par tout utilisateur;
• Chaque page présente un long historique des versions
qui permet de récupérer des informations vandalisées;
• La rédaction de texte wiki suppose d'utiliser une syntaxe
spécifique très légère;
• Dans les gros wiki (Wikipedia), chaque auteur peut
spécifier une liste de pages à suivre et veiller à leur bonne
évolution;
• Les articles ébauches sont signalés et le domaine
scientifique est un des plus populaire et donc assez
fiable.
32. Wikipédia, les caractéristiques
• Wikipédia est un projet collaboratif international
Internet a contribué à rendre le nombre de
contributeurs, valideurs très vaste et donc à
renforcer la qualité des productions collectives.
• Wikipédia est un pari sur l'honnêteté des
utilisateurs N'importe qui peut écrire du contenu
mais n'importe qui peut aussi corriger ! Les pages
de discussion sont un espace pour discuter des
améliorations à apporter à l'article.
• Wikipédia impose la neutralité de point de vue pour
éviter les guerres d'éditions
Certains thèmes très controversés peuvent être
protégés tant qu'un accord n'aboutit pas au travers
de la page de discussion
33. • Wikipédia demande une attitude critique du
lecteur... comme toute autre ressource
Les articles de Wikipédia sont d'une qualité variable
mais les articles sont documentés par références
bibliographiques pour garantir la qualité.
• Wikipédia est une encyclopédie en perpétuelle
construction
Les contenus ne sont pas figés et peuvent être mis à
jour plus rapidement que dans toute autre
encyclopédie.
• Wikipédia ne dispose pas (encore) de processus de
relecture
Wikipédia est trop jeune (née en 2002) et ne propose
pas encore une couverture suffisamment large et
suffisamment homogène des connaissances.
34. Les bases de données spécialisées : pour des
informations validées dans un domaine précis
• Elles présentent une source sûre, les informations sont
de qualité et spécifiques à un domaine;
• Testez les bases de données de la BUMP !
• Pour les sciences expérimentales, la base de données
PubMed est une référence.
37. Veillez à avoir quelques favoris avec chacun
de ces outils de recherche, vous pourrez ainsi
choisir le meilleur outil pour faire une
recherche d’information sur le web.
=> remplissez bien votre boîte à outils
38. La tendance actuelle : tout faire !
- Yahoo!, qui était un annuaire à la base, a développé son moteur
de recherche en utilisant essentiellement des bases de
données existantes (AllTheWeb, AltaVista, Lycos, ...)
- Google, qui était un moteur à la base propose aujourd'hui un
onglet « annuaire » qui retourne des recherches provenant de
Open Directory;
- Britannica, la grande encyclopédie payante, s'est transformée
en un grand annuaire permettant des recherches notamment
dans l'encyclopédie mais aussi dans une série de ressources
évaluées et cotées très finement;
MAIS quand on veut tout faire, souvent on finit par négliger
certaines tâches ! Alors, informez-vous et testez régulièrement !
39. Pour une recherche efficace ...
• Préparer sa recherche
• Evaluer les ressources
• Citer les références web
• Zotero : Un outil pour indexer les
références web
40. Préparer sa recherche
• Délimiter le sujet et choisir les mots clés;
• Choisir le type de document attendu;
• Choisir les limites de ma recherche (langue, date de
publication, zone géographique des pages, …);
• Fixer le temps de recherche et la quantité d’information
attendue;
• Définir au mieux la question que l’on se pose;
• Choisir l’outil le mieux approprié pour la recherche
selon les limites choisies;
• Utiliser les formulaire de recherche avancée;
41. Evaluer les ressources
• Vous savez maintenant comment trouver de
l’information sur le web, mais il faut savoir que tous
les sites ne proposent pas une information fiable;
• Quelques indices de crédibilité :
– l’URL : elle donne le domaine d’activité;
– la source du document : il doit être possible
d’obtenir le nom de l’auteur, le nom de l’institution,
…
– l’actualité : la date de création et la date de la
dernière mise à jour; à relativiser en fonction du
sujet;
– les références bibliographiques : si le contenu
de la page n’est pas original, les sources
originales doivent être indiquées;
42. Citer les références web
• Une page ou un site web utilisé pour rédiger un
document doit être cité;
• Pour un site web, il faut donner l’auteur, le titre de
la page d’accueil, l’adresse URL et la date de la
consultation;
• Pour une page web, il faut donner l’auteur, le titre de
la page, la ressource plus large à laquelle le
document est rattaché, l’adresse URL et la date de
consultation;
• Pour un document sur un site ftp, il faut donner
l’auteur, le type de support, la date, l’adresse ftp, le
répertoire et le fichier;
43. Zotero, un outil pour indexer les références web
• Zotero est une extension du navigateur Firefox qui
permet d'indexer automatiquement les informations
importantes pour citer les références web;
• Cliquez sur le logo « Zotero » dans la barre inférieure
pour indexer les informations sur la page en cours ;
• Une fois vos références indexées, vous avez la
possibilité de les exporter au format texte;
• Un bel exemple d'utilisation : la liste des références
web de ce document ...
44. Références
1. “Accueil - Wikipédia,” http://fr.wikipedia.org/wiki/Accueil
(accessed October 29, 2010).
2. “AERIS - Aide aux étudiants pour la recherche
d'information scientifique,” http://aeris.11vm-serv.net/
(accessed October 29, 2010).
3. “Ask.com France - L'autre moteur de recherche,”
http://fr.ask.com/ (accessed Octobre 29, 2010).
4. “Bing “ http://www.bing.com/
(accessed October 29, 2010).
5.“Encyclopedia - Britannica Online Encyclopedia,”
http://www.britannica.com/
(accessed October 29, 2010).
45. Références
6. “Google Recherche avancée,”
http://www.google.be/advanced_search?hl=fr
(accessed October 29, 2010).
7. “Infospère “ Aide à la recherche documentaire à l'UCL
http://sites.uclouvain.be/infosphere/sciences/index.html
(accessed October 29, 2010).
8. “Open Directory - World: Français,”
http://www.dmoz.org/World/Français/
(accessed October 29, 2010).
46. Références
9. “Search Engine Showdown: Search Engine Statistics,”
http://www.searchengineshowdown.com/statistics/
(accessed October 29, 2010).
10. “SearchEngineWatch: Metacrawlers and Metasearch
Engines,”
http://searchenginewatch.com/showPage.html?
page=2156241 (accessed October 29, 2010).
11. “Yahoo! Search - Moteur de recherche de sites Web,
images, vidéos, shopping et actualités,”
http://fr.dir.yahoo.com/ (accessed October 29, 2010)
12. “Yahoo! Search - Recherche avancée,”
http://fr.search.yahoo.com/web/advanced;_ylt=A0geu
mW3IUZHy_4A6uFiAQx. (accessed October 29, 2010)
47. Droits sur les images
Iceberg :
http://www.flickr.com/photos/stargazr/2512500651/sizes/o/
Google Pagerank :
http://www.inqbation.com/blog/inqbation%E2%84%A2-achieves-
google-page-rank-pr4-again/
48. Avec un moteur de recherche, ...
les pages sont indexées de manière
automatisée
J
B les pages sont indexées par un humain
49. Un méta-moteur, c'est ...
un moteur de recherche qui a peu de
critères de recherche.
J
B
V
R
un outil de recherche qui interroge
plusieurs moteurs.
un outil de recherche qui présente les
résultats sous forme de carte.
un moteur de recherche qui indexe
uniquement les données métas.
50. Wikipedia est une encyclopédie qui a la(les)
caractéristique(s) suivante(s) :
Tout le monde peut modifier son
contenu.
J
B
V
R
Après relecture par des spécialistes, les
les contenus sont protégés.
C'est une ressource fiable.
On garde une trace des différentes
versions d'un article.
51. Pour citer une référence web, il est nécessaire de
spécifier :
la date de la dernière mise à jour de la
page;
J
B
V
R
la date de consultation de la page;
les mots-clés qui m'ont permis de
trouver le site par une recherche web.
le nom de l'auteur;