SlideShare une entreprise Scribd logo
REP2400
Internet et relations publiques
La recherche web
A2013
1
Enjeux de la recherche
Moteurs de recherche:le cas Google
Stratégies d’interrogation
Écueils de la personnalisation de la
recherche
Médias sociaux et recherche
Évaluation de l’information
Le Web dit invisible ou Web profond
(Bases de données spécialisées)
2
Cinq de ces dix propriétés sont des moteurs de recherche (ou variantes)...
Source: http://stephenslighthouse.com/2012/03/14/how-people-spend-their-time-online/
Les chiffres diffèrent beaucoup entre le graphique ci-dessus et cette autre compilation de
http://www.ebizmba.com/articles/search-engines
Difficile aussi de croire que FB recevait 137 millions de visiteurs unique par mois au début de 2012 !
Leçon # 1: ne jamais se fier sur une seule ressource
http://news.cnet.com/8301-1023_3-57566550-93/facebook-by-the-numbers-1.06-billion-monthly-active-users/
3
Source: Top-10 US sites & Social Networks 2011 (Hitwise)
http://www.hitwise.com/us/datacenter/main/dashboard-10133.html
Top 15 search engines (September 2012)
http://www.ebizmba.com/articles/search-engines
4
Source: Top-20 US sites & engines en 2010 (Hitwise)
http://www.hitwise.com/us/datacenter/main/dashboard-10133.html
Voir aussi:Search Engine Trends (Bing dépasse Yahoo en 2012)
http://www.experian.com/hitwise/online-trends-search-engine.html
5
20	
  +	
  stats	
  on	
  user	
  behaviour	
  (e-­‐Consultancy
h7p://econsultancy.com/us/blog/7027-­‐20-­‐stats-­‐you-­‐might-­‐not-­‐know-­‐about-­‐user-­‐search-­‐behaviour
6
Source: Longer search queries of eight or more words increase 3% in september 2011
http://www.hitwise.com/us/about-us/press-center/press-releases/google-share-of-searches-66-percent-in-sept-2011/
7
Source: Top-15 moteurs de recherche (US) en 2013
http://www.ebizmba.com/articles/search-engines
8
La recherche dans Internet (WWW)
Comment les données sont-elles cataloguées et indexées ?
Quelques outils de recherche disponibles.
Les techniques à utiliser.
Les comportements des chercheurs
Vers la recherche collaborative ?
Bots, Blogs and news Agregators (mis à jour en 2011) par Marcus P. Zillman
http://www.botsblogs.com/
100 useful tips to search the deep web (Alisa Miller)
http://www.online-college-blog.com/features/100-useful-tips-and-tools-to-research-the-deep-web/
9
Quelques mythes
On trouve tout dans Internet
C'est facile de chercher et de trouver
Les sources sont fiables et à jour...
LES RECHERCHES DANS INTERNET PEUVENT SE FAIRE À PARTIR
DES RESSOURCES SUIVANTES, ENTRE AUTRES :
Moteurs de recherche et Annuaires (catologues/répertoires)
+
Les Newgroups (groupes de discussion) dont les contenus
peuvent être accessibles avec un lecteur de nouvelles...
http://alt.binaries.movies.french.usenetor.com/
http://groups.google.com/group/tourisme-recherches-institutions-pratiques?lnk=
Par le biais du web, les «news» étaient accessibles avec
Google Groupes (désactivé en 2011 mais 20 ans d’archives
toujours disponibles...)
Les blogues
Certains réseaux sociaux ouverts (ou par compte Google)
Sites de signets sociaux
Twitter (temps réel)
Le Web profond dit invisible
10
Moteurs de recherche :
Il s'agit de programmes informatiques permettant de
faire des recherches dans les bases de données, conçues par
les robots collecteurs.
Dans Internet, les moteurs nous proposent leur information
grâce à 3 fonctions ou étapes principales :
1) Un robot collecteur : ( crawler, spider, bot)
Il indexe le web automatiquement 24 heures par jour
en "glanant" (en scannant) les informations dans le texte
visible d'un site (les premiers mots ou phrases) et dans le
texte invisible (i.e. dans le code HTML, où on retrouve les
méta-étiquettes, entre autres).
N.B. : Les meilleurs glaneurs/robots peuvent indexer plusieurs millions de pages par jour
( ils prennent quelques heures, jours et semaines pour faire le tour du Web en entier).
11
Le robot visite chaque page (ou pages représentatives)
d'un site (qui veut bien être trouvé ou découvert !) et lit
les pages ainsi que les hyperliens offerts dans le but de
découvrir les autres pages (ou fichiers).
2) Un programme crée un index ou catalogue immense
(base de données/statique) à partir des sites (fichiers)
visités.
3) Un autre programme (le service de requêtes) reçoit
votre requête, la compare à ses entrées de données
(catalogue) et renvoie ses résultats.
C'est dans la fenêtre de requête des moteurs qu'on tape les
informations et qu'on interroge leurs bases de données.
La recherche d'information se fait donc par interrogation.
Il existe des milliers de moteurs de recherche...
Search Engine Colossus (par pays, par thèmes, etc.)
http://www.searchenginecolossus.com/
12
Principales techniques de recherche
Identification du sujet :
Contexte et objet de la recherche; délimitation de la recherche
(langues, pays, etc.); genre de réponses désirées.
Quelle est votre connaissance sémantique du sujet ou de la discipline
recherchée ?
Formulation du sujet :
Quels mots ou expressions précisent ou traduisent le mieux les
concepts de la recherche; choix de mots-clés et de termes à
retenir; trouver des équivalences (synonymes, acronymes et mots
en anglais ou dans une autre langue).
13
Recherche sur les termes exactes
Exemple concernant l'exactitude des termes anglais sur Google...
 
 
Source: http://www.googleguide.com/interpreting_queries.html
14
La stratégie de recherche inclut la traduction de mots clés et
leur regroupement en fonctions de règles syntaxiques
propres aux moteurs de recherche.
On peut combiner des mots ou des termes dans le but de
traduire la requête en une expression de recherche.
Attention aux majuscules et minuscules sur certains moteurs
Requête saisie en minuscules
Toutes les occurrences seront recherchées : ibm trouve ibm, IBM ou Ibm
Requête saisie en majuscules
Idem: IBM trouve IBM, ibm, Ibm ou IbM
Lettres accentuées
L'occurrence exacte est recherchée :
électricité trouve électricité mais pas electricite ou electricité
(HotBot)
Requête saisie sans accents
Toutes les occurrences sont recherchées :
electricite trouve electricite, électricité ou electricité (pas toujours vrai sur certains
moteurs)
15
Requête saisie sans accents
Toutes les occurrences sont recherchées :
electricite trouve electricite, électricité ou electricité (pas toujours vrai sur certains
moteurs).
Ordre des mots
Sur certains moteurs, la recherche (Paris Montréal) ne donne pas les mêmes résultats que la
recherche (Montréal Paris) surtout pour le classement des résultats.
Majuscules, minuscules et accents sur Google
Les recherches Google ne tiennent pas compte de la « casse » des lettres (MAJUSCULES/
minuscules).
Quelle que soit la typographie utilisée, Google interprète toujours les lettres composant vos
termes de recherche comme des minuscules.
Par défaut, les recherches Google ne tiennent pas compte des accents ou autres signes
diacritiques (cédille, tilde espagnol, umlaut allemand, etc.).
Ainsi les termes [FRANÇAIS] et [FRANCAIS] retrouvent les mêmes pages.
Pour indiquer que ces deux termes ont une signification différente, utilisez-les l’un après l’autre.
Google ne prend plus en compte le signe plus ( + ) devant un mot.
Pour certains mots français dont la graphie est semblable à l'anglais (éléphant/elephant), il vaut mieux insérer les accents,
SI on veut obtenir uniquement des documents en français.
 
Par contre, pour les mots français dont la graphie n'a pas de correspondance en anglais, on favorisera un meilleur taux de
rappel (résultat) si le mot en question n'est pas accentué, i.e. zebre ou lieu de zèbre.
16
Les 3 opérateurs "booléens"
Nommés ainsi en l'honneur de Georges Boole (1815-1864) mathématicien et
logicien anglais, inventeur de la logique symbolique moderne et de l'algèbre
booléienne.
1-(AND) (Principe d'association)
Représenté par le symbole + ou la saisie en majuscules AND.
Sur Google, le + est implicite et on ne peut plus l’utiliser pour «forcer» la présence d’un
mot. Il faut utiliser l’expression (champ) intext: ou la fonction Mot à mot (voir menu
dans la colonne de gauche de Google)
Correspond à la conjonction ET en français.
Exemple : la requête moteur de recherche en français force Google à trouver les pages
qui contiennent à la fois les mots moteur ET recherche ET français.
+moteur +recherche +français
Dans certains cas, Google peut omettre certains mots de votre expression de recherche...
Les articles, adjectifs indéfinis, préposition et/ou déterminants de toutes sortes (le, la, les, en, des, du,
pour, et, ou etc..) sont ignorés. Les Américains appellent ces mots des "Stop Words" ou mots-vides.
17
2-(OR/OU)(Principe de regroupement)
Parfois représenté par le symbole ( | )
Correspond à la conjonction OU en français.
Exemple : moteur OU recherche OU français force le moteur à trouver les pages qui
contiennent l'un ou l'autre des mots, soit moteur, soit recherche, soit français ou les trois.
Avec Google, l'opérateur OU doit être saisi en MAJUSCULE obligatoirement.
Source:http://support.google.com/websearch/bin/answer.py?hl=fr&answer=136861&topic=1221265&ctx=topic
Le sigle | est rarement utilisé pour le OU mais fonctionne dans Google.
18
La recherche «adaptée»...
Les résultats obtenus par ma propre recherche risquent d’être assez différents des vôtres !
Quand Google omet des mots que vous avez inscrits...
Source: Dear Google, stop messing with my search (Karen Blakeman)
http://www.rba.co.uk/wordpress/2011/11/08/dear-google-stop-messing-with-my-search/
19
Dans les deux exemples suivants, le moteur tentera de trouver des
pages contenant au moins le premier de ces mots, les deux
premiers ou les trois à la fois: blouse, shirt, chemise.
Cliquez sur les expressions de recherche suivantes (si ça ne
fonctionne pas, réécrivez-les telles quelles dans Google…)
[ blouse OU shirt OU chemise ]
[ blouse|shirt|chemise ]
Remarque: avec l'opérateur OR un espace doit précéder le mot
alors que le signe | ne nécessite aucun espace précédant le mot.
Source: http://www.googleguide.com/or_operator.html
20
3-(NOT/ANDNOT)(Principe d'exclusion)
Représenté par le symbole (-)
Correspond à SAUF/Excepté en français.
Exemple : moteur -voiture forcerait le moteur à trouver les pages qui
contiennent le mot moteur mais SANS le mot voiture.
Avec Google, l'opérateur (-) doit être utilisé devant le mot à exclure (sans espace) et
non le NOT ou ANDNOT
Si on veut trouver plus facilement une recette de "salsa", on risque d'avoir de meilleurs résultats avec:
En anglais: [ salsa -danse] j’obtiens des résultats reliés à la danse ?
En anglais: [ salsa salsa -dance ] La répétition du mot salsa ne semble pas avoir porté fruit...
En français [ salsa -musique -danse -cours ]
Avec la combinaison suivante, je devrais trouver en théorie des informations avec les mots moteur
et hybride mais sans les mots voiture et automobile. Les résultats ne sont pas très concluants...
[-voiture -automobile moteur hybride]
Différence avec l'ordre suivant ?
[moteur hybride -voiture -automobile]
[moteur moteur hybride -voiture -automobile] et avec la répétition du mot moteur ?
Combien de mots-clés peut-on utiliser dans une requête ?
Jusqu'à 32 mots incluant les opérateurs mais pas les "stop-words", i.e. les articles, pronoms ou conjonctions, etc.: Exemple: le,
du, des, quand, ou, où (mots-vides)
21
Source: Advanced Web Searching (Karen Blakeman)
http://fr.slideshare.net/KarenBlakeman/advanced-web-searching-ifeg-3rd-april-2012
22
L'utilisation de parenthèses (Hotbot)
Lorsqu'on utilise simultanément plusieurs opérateurs booléens pour raffiner une recherche,
on peut utiliser les parenthèses.
Exemples :
salade (thon AND Crabe) -Cesar
=
Je veux avoir des informations sur des salades de thon, de crabe ou les deux,
mais pas d'informations sur la salade césar
Les parenthèses permettent aussi de coupler des requêtes :
Exemple :
(+moteur +voiture) -(+moteur +recherche)
Seul Hotbot acceptait encore bien les parenthèses...
23
Les opérateurs de proximité
L'adjacence (ADJ) ( base de données)
Pour introduire une proximité nette entre les mots
Exemple :
Relations ADJ Publiques. Dans Google «Relations Publiques» (ou fonction Mot à mot)
Public ADJ Relations
N.B.: Très peu de moteurs acceptent l'adjacence (ADJ) et les résultats sont peu
concluants dans Google avec cet opérateur...mais cela pourrait être utile ailleurs...
La proximité (~) (base de données)
Pour introduire une notion de proximité entre des mots mais pas aussi nette que l’ADJ.
Les mots doivent être proches l'un de l'autre. Représenté par le sigle NEAR ou ONEAR
et aussi par le symbole ~
Exemple :
conception AND fabrication NEAR ordinateur
ou
computer NEAR translation
=
computer ~translation
Il s'agit donc d'une recherche sur la conception et la fabrication assistées par
ordinateur (CAO-FAO) et sur la traduction assistée par ordinateur (TAO).
24
Dans Google, on utilise le symbole ~ pour trouver un synonyme du
mot qu'on fait précédé par ~.
Exemple: [~portable]
Exemple: [~portable téléphonie -ordinateur]
Google trouve des informations similaires à quelques mots ou à
tous les mots d'une requête précédée du ~
Le masque (?)
Le masque sert à spécifier le nombre exact de caractères à rechercher (ou quand on
cherche des mots différenciés que par un seul caractère)
On représente le masque par le symbole ? (interrogation)
wom?n
(woman, women)
français?? (française et françaises)
25
Les guillemets
Pour trouver un groupe de mots ou une phrase exacte.
Pour trouver une expression particulière...
On utilisera les guillemets.
Représenté par "_"
Exemple:
"moteur de recherche" recherche les trois mots les uns à
côté des autres et dans cet ordre.
"Histoire de la renaissance italienne"
ou
"Post-secondary education in the USA"
N.B.: Les guillemets fonctionnent assez bien avec certains «autres»
moteurs mais parfois Google demande de les retirer...
26
27
La troncature (base de données)
Pour faire une recherche sur une partie d'un mot.
Utilisez la troncature pour obtenir de l'information à partir
d'un même radical (troncature à gauche) ou d'un suffixe
(troncature à droite).
Représentée par le symbole * (astérisque) appelé aussi
en anglais Wildcard
Exemples:
bio* peut chercher..
(biologie, biographie, biochimie, biotechnologie,
biochemistry, biography, biology, etc.)
*sexuel peut chercher…
(transexuel, homosexuel, bisexuel)
Notez bien que - dans Google - la troncature placée avant ou après un
mot peut chercher aussi des termes généralement associés au mot en question
(dans une requête plus complexe). Voir diapo #57 par exemple.
28
Avec Google on peut utiliser le * pour tenter de trouver un ou des
mots manquants dans une phrase ou pour trouver des ressources
dans lesquelles apparaissent des mots qu'on fait précéder du
signe *
Exemple: [*google *ma *vie]
Si vous n'êtes pas certain du titre d'un livre (ou d’une chanson)
mais que vous en connaissez quelques mots, Google peut vous
aider à retrouver le titre précis.
Comment s'intitulait déjà un des livres de J.K. Rowling?
? ? ? [Harry Potter et les * de la mort] ? ? ?
Source: http://www.googleguide.com/wildcard_operator.html
29
Les méta-données ou la recherche par zone
spécifique
Il est aussi très utile de connaître la spécificité des documents
Internet en utilisant les métadonnées ou les champs à inscrire dans
la fenêtre de requête. On nomme aussi ces champs ou
métadonnées recherche linguistique ou par zone.
Exemples de métadonnées (champs par zones) les plus connues :
Avec Google:
title: ou intitle:
Récupère les sites dont le titre spécifié apparaît dans une page.
title:soleil trouve toutes les pages contenant le mot soleil dans le titre.
N.B.: Parfois ce champ s'écrit intitle: au lieu de title:
url: ou inurl:
Récupère selon combinaison (nom du serveur, répertoire, fichier)
url:jardin récupère ou trouve toutes les pages de tous les serveurs ayant le mot jardin à
n'importe quel endroit : nom de domaine (URL), répertoire d'accès, nom de fichiers.
30
intext:
Récupère des documents contenant un mot particulier.
intext:impluvium trouve des documents contenant le mot impluvium.
inlink:
curation inlink:lapresse.ca
Recherche des documents qui contiennent le mot curation soit dans le site de www.lapresse.ca ou qui
nomme la presse ou y pointe un lien.
site: et -site:
Recherche à l’intérieur d’un site spécifique
gaz de schiste site:gouv.qc.ca trouve des documents contenant les mots gaz de schiste, mais
seulement sur le site du gouvernement du Québec
L’expression -site: est particulièrement utile pour exclure spécifiquement un nom de domaine.
gaz de schiste -site:gouv.qc.ca
gaz de schiste -url:gouv.qc.ca (-url fonctionne aussi bien)
31
Est-il possible de combiner une zone avec un opérateur ? OUI !
Exemples :
allinurl: www.honda.com +hybrid (mais on n’a plus besoin du + chez Google)
On recherche des documents qui contiennent le mot hybride
sur le site http://www.honda.com/
intitle:education superieure fr
On recherche des ressources dont le titre porte précisément sur l'éducation supérieure
et on tient à ce que ces informations soient en français.
filetype:pdf curation francais (cherche un document Pdf sur la curation en français)
Peut on combiner deux zones ? NON ! OUI ! (voir prochaine diapo)
inurl:garden intext:roses
Les opérateurs (anciens moteurs)
http://searchengineshowdown.com/features/
Boolean Logic
http://internettutorials.net/boolean.asp
32
Source:	
  How to use Google Search More effectively (Josh Catone) [Infog.]
http://mashable.com/2011/11/24/google-search-infographic/
33
OU
?
Google decides that coots are really lions (Karen Blakeman)
http://www.rba.co.uk/wordpress/2011/02/12/google-decides-that-coots-are-really-lions/
Update: http://www.rba.co.uk/wordpress/2011/02/21/update-on-coots-vs-lions/
Source : Image du macroule
Auteur: Luc Viatour http://commons.wikimedia.org/wiki/User:Lviatour
http://fr.wikipedia.org/wiki/Fichier:Fulica_atra_Luc_Viatour.jpg
Source: Image du lion
Auteur: James Temple http://www.flickr.com/photos/82932964@N00/312326732
https://commons.wikimedia.org/wiki/File:Panthera_leo_Sabi_Sands.jpg#filehistory
34
Source: Advanced Web Searching (Karen Blakeman)
http://fr.slideshare.net/KarenBlakeman/advanced-web-searching-ifeg-3rd-april-2012
35
Tendances en recherche web
Socialisation
Personnalisation
Localisation (mobilité)
Voir mon billet au sujet de La recherche web en 2012 (et la présentation de Karen Blakeman)
http://patriceleroux.blogspot.ca/2012/04/la-recherche-web-en-2012.html
36
(RAPPEL) Personnalisation de la recherche...
Source: Eli Pariser, Beware online «filter bubbles» (2011)
http://www.ted.com/talks/eli_pariser_beware_online_filter_bubbles.html
Voir aussi : Google Personalisation: Web History isn’t the only problem (Karen Blakeman)
http://www.rba.co.uk/wordpress/2012/02/22/google-personalisation-web-history-isnt-the-only-problem/
37
Source: Advanced Web Searching (Karen Blakeman)
http://fr.slideshare.net/KarenBlakeman/advanced-web-searching-ifeg-3rd-april-2012
Google Dashboard
https://www.google.com/dashboard/
38
Visualiser et gérer toutes ses données avec le tableau de bord Google (Dashboard)
https://www.google.com/settings/dashboard?hl=fr
39
Télécharger (et archiver toutes ses données de Google) avec le service Takeout
https://www.google.com/settings/exportdata?hl=fr
Voir aussi The Data Liberation Front
http://www.dataliberation.org/
40
41
Règles de confidentialité Google
http://www.google.com/policies/privacy/
Voir aussi:
Google personalisation: web history isn’t the only problem (Karen Blakeman)
http://www.rba.co.uk/wordpress/2012/02/22/google-personalisation-web-history-isnt-the-only-problem/
42
Supprimer les cookies permet de dépersonnaliser la recherche selon vos activités passées et votre historique de navigation...
43
Chrome et Firefox
44
Sécurité numérique, les bases
https://www.wefightcensorship.org/fr/article/securite-numerique-baseshtml.html
45
Google: un cas particulier (ancienne interface ci-dessus)
http://www.google.ca/
46
Google: Pas seulement qu’un algorithme...
Source: http://www.davidcarlehq.com/2012/09/le-guide-de-levaluateur-google-coule-en-ligne-voici-les-criteres-de-qualite-de-
lalgorithme-naturel/
Lien vers le document «coulé»... : http://pdfcast.org/pdf/google-guidelines
Voir aussi: Google Search Ranking factors 2012 (Martin Missfeldt)
http://www.tagseoblog.com/google-search-ranking-factors-2012-infographic
47
Source: http://www.davidcarlehq.com/2012/09/le-guide-de-levaluateur-google-coule-en-ligne-voici-les-criteres-de-qualite-de-
lalgorithme-naturel/
48
[...] «So what’s our straightforward definition of the ideal search engine?
Your best friend with instant access to all the world’s facts and a photographic
memory of everything you’ve seen and know. That search engine could tailor
answers to you based on your preferences, your existing knowledge and the best
available information; it could ask for clarification and present the answers in
whatever setting or media worked best.» [...]
Marissa Mayer, V-P, Recherche-Produits et expérience utilisateur (chez Google jusqu’en 2012)
Source: http://googleblog.blogspot.com/2008/09/future-of-search.html
Une pub de Google durant le SuperBowl de 2010 (une vidéo disponible depuis plusieurs mois...)
http://www.youtube.com/watch?v=nnsSUqgkDwU
Is Google Making Us Stupid ? (Nicholas Carr)
http://www.theatlantic.com/doc/200807/google
Traduction française :(Framablog)
http://www.framablog.org/index.php/post/2008/12/07/est-ce-que-google-nous-rend-idiot
Are we renting our collective intelligence to Google ? (Matteo Pasquinelli)
http://mastersofmedia.hum.uva.nl/2009/11/16/matteo-pasquinelli-are-we-renting-our-collective-intelligence-to-
google/
49
La fonction Recherche avancée de Google n’est plus aussi apparente qu’auparavant...
Elle apparaît dans le menu outil lors de l’affichage d’un résultat de recherche et
non plus sur sa page d’accueil
Il faut développer le réflexe d’utiliser les fonctions de recherche avancée...
http://www.google.ca/advanced_search?hl=fr
50
51
PageRank de Google
PageRank est un champion de la démocratie : il profite des innombrables liens du Web pour évaluer le contenu des pages Web
-- et leur pertinence vis-à-vis des requêtes exprimées. Le principe de PageRank est simple : tout lien pointant de la page A à la
page B est considéré comme un vote de la page A en faveur de la page B. Toutefois, Google ne limite pas son évaluation au
nombre de « votes » (liens) reçus par la page ; il procède également à une analyse de la page qui contient le lien. Les liens
présents dans des pages jugées importantes par Google ont plus de « poids », et contribuent ainsi à « élire » d'autres pages.
Source:http://www.google.ca/intl/fr/why_use.html
Plusieurs centaines de millions de requêtes par jour !
Des fonctions et services moins connus ou utilisés...
Le choix parmi 45 langues (2012):
http://www.google.ca/preferences?hl=fr#languages
 
Google News/Actualités (+4500 sources médias dont 500 en français)
http://news.google.com/news?cf=all&ned=fr_ca&ict=ln
 
Alerte Google (monitoring de l'actualité)
http://www.google.ca/alerts
http://www.googlealert.com
 
Google Images
http://images.google.ca/
Google Scholar (en français aussi maintenant)
http://scholar.google.com/
52
Google...suite
Google Blog Search
http://blogsearch.google.com/
La numérisation de tous les livres...
http://books.google.com/
Localisation de magasins pour les achats:(ancien Froogle/Google Shopping)
http://www.google.com/products
Recherches dans un lieu géographique précis. (Google Maps)
http://local.google.com/
Google Earth (Images satellites...)
http://earth.google.com/
Rechercher dans les données publiques
http://www.google.com/publicdata/directory#
Moteur de recherches personnalisées Google
http://www.google.com/cse/
Google (vue d'ensemble des services et options)
http://www.google.com/help/features.html
Le blogue Inside Search
http://insidesearch.blogspot.ca/
Quelques bonnes références:
Guide Google de Nancy Blachman
http://www.googleguide.com/
Centre d’aide de Google:http://www.google.com/support/
53
http://translate.google.com/
Voir aussi: A fresh look for Google translate on iOS...
http://insidesearch.blogspot.ca/2013/09/a-fresh-look-for-google-translate-on.html
54
Le niveau de lecture (Reading level) ne semble pas exister dans l’interface française...
Advanced=associé à des recherches universitaires ou des terminologies spécialisées
Cette fonction semble fonctionner qu’en anglais....
55
Tendances des recherches sur Google
http://www.google.com/insights/search/?hl=fr
56
http://www.google.com/trends
57
Source:Groupes sur Google
https://groups.google.com/forum/#!forum/tourisme-recherches-institutions-pratiques
58
Google Goggles
Recherche visuelle/photographique
Il n’y a plus d’entrée de texte...
Application pour mobile
http://www.google.com/mobile/goggles/#text
Voir entrevue avec Marissa Mayer, V-P Google, produits de recherche et expérience-utilisateur (LeWeb/Paris/2009)
http://www.ustream.tv/recorded/2759667
Pour la musique, voir http://www.shazam.com/
59
Recherche par image
http://images.google.fr/
60
Recherche par image (tout de même assez précis comme résultat)
http://images.google.fr/
61
Recherche par image par le biais de Google Images
http://images.google.fr/
Aucune différence entre une image de moi, une image prise par moi (de quelqu’un d’autre) ou d’une image
de moi prise par quelqu’un d’autre...ou encore d’images d’autres Patrice Leroux de ce monde...
62
Google Art Project ( entente avec plus de 150 musées et galeries)
http://www.google.com/culturalinstitute/project/art-project?hl=fr
63
Pourquoi la vidéo domine la recherche ? (enfin presque...)
«Pourquoi préfère-t-on passer plus de temps à regarder la TV qu’à lire la presse ? Nous sommes tout simplement
fainéants. C’est plus facile et surtout plus accessible de s’informer avec des images animées, qu’avec du texte
statique.» (Laurent Maisonnave)
http://www.youtube.com/
YouTube 1er moteur de recherche devant Google (Laurent Maisonnave)
http://zelaurent.com/video-news/youtube-1er-moteur-de-recherche-devant-google/
64
Recherche sociale de Google:
http://www.youtube.com/watch?v=aYf5iSA6t6g
Accéder aux recherches sociales de Google:
http://www.google.com/support/websearch/bin/answer.py?answer=165228
Explication vidéo de Matt Cutts: http://www.youtube.com/watch?v=BlpTjP6h6Ms
Voir aussi Social Search: http://www.socialsearch.com/
65
Recherche avec les mots Internet et relations publiques dans Google+ parmi Tout (la priorité des
résultats proviendraient tout de même de mes cercles).
66
Recherche avec les mots Internet relations publiques dans Google avec la fonction Mot à mot
Voir colonne de gauche sous Tous les résultats
67
Recherche avec les mots New York dans Google+ parmi mes cercles
68
Recherche avec les mots New York dans Google+ parmi la rubrique De vous (donc de moi seulement)
69
Catalogues, annuaires et répertoires:
Les informations sont constituées, organisées en catégories
et même filtrées par des personnes. (pensez curation web)
L'intervention humaine faisait en sorte que l'information
était souvent moins à jour qu'avec les moteurs.
Par contre, plusieurs répertoires sont devenus hybrides en intégrant à la fois un
répertoire et un moteur. Exemple: Yahoo
La recherche d'information se fait donc plutôt par
navigation dans le classement (hiérarchies et répertoires
structurés par des humains).
On gagne en qualité ce qu’on perd en quantité ?
Avec le phénomène «l’infobésité», les annuaires et
catalogues pourraient renaître...(curation)
Exemple : http://www.mahalo.com/
70
Répertoires et annuaires généralistes (quelques exemples)
Purdue (OWL) Search & Directory list
https://owl.english.purdue.edu/owl/resource/558/06/
Family Friendly Sites: http://familyfriendlysites.com/
World Site Index: http://www.worldsiteindex.com/
Greenstalk:http://www.greenstalk.com/
Open Directory Project (AOL): http://www.dmoz.org/
Links To Go: http://www.links2go.com/
Splash Directory: http://www.splashdirectory.com/
Global Web Links: http://www.global-weblinks.com/
Annuaires et répertoires spécialisés
Jobboom:http://www.jobboom.com/
Passeport santé:http://www.passeportsante.net/
France Culture: http://www.culture.fr/fr/sections/
Voir aussi:
Les 25 répertoires les plus puissants sur la toile
http://www.searchenginepeople.com/francais/liste-des-25-repertoires-les-plus-puissants-sur-la-toile
71
Internet Archive : un vrai trésor.
http://archive.org/
À la recherche de sites disparus... avec son Way Back Machine (+150 milliards de documents)
http://www.archive.org/
72
Autres moteurs
HotBot:http://www.hotbot.com/
AOL Search:http://search.aol.com/
Lycos: http://www.lycos.com/
Search Cube: http://www.search-cube.com/
Exalead:http://www.exalead.com/search/
Quixey: http://www.quixey.com/
Référence
Search Engine Watch
http://searchenginewatch.com/reports
73
Source: Advanced Web Searching (Karen Blakeman)
http://fr.slideshare.net/KarenBlakeman/advanced-web-searching-ifeg-3rd-april-2012
Voir aussi:
Sanity Checking Google (The Disruptive Searcher)
http://disruptivesearcher.wordpress.com/2012/02/27/sanity-checking-google/
74
http://www.bing.com/
Introducing the New Bing: Spend Less Time Searching, More Time Doing
http://www.bing.com/community/site_blogs/b/search/archive/2012/05/10/spend-less-time-searching-more-time-doing-
introducing-the-new-bing.aspx
Bing’s Advanced Search Operators: 8 Tips for Better Searches
http://www.howtogeek.com/106751/how-to-use-bings-advanced-search-operators-8-tips-for-better-searches/
75
«I also don’t know which papers written by Scott Wilson were written by the Scott I know and
which one’s were written by the Scott Wilson who is based at the University of British Columbia.
Will the real Scott Wilson please stand up ! »
Analyse du service Academic Search de Microsoft (Brian kelly)
http://ukwebfocus.wordpress.com/2011/09/20/will-the-real-scott-wilson-please-stand-up-please-stand-up/
Academic Search de Microsoft
http://academic.research.microsoft.com/
76
http://www.ask.com/
77
http://search.yahoo.com/
http://ca.yahoo.com/
78
http://www.yandex.com/
79
Pas de personnalisation ni de suivi (tracking)
http://duckduckgo.com/
Voir aussi: http://duckduckgo.com/goodies.html
Ce moteur a affiché une ressource que je ne retrouvais plus sur Google (avec mon nom comme requête...)
Translating Tweetdeck: http://tweetdeck.posterous.com/translating-tweetdeck-the-next-five-languages
80
Search Team ( vers de la recherche web collaborative ?)
http://searchteam.com/
81
Recherche avancée de Flickr
http://www.flickr.com/search/advanced/
Voir aussi
http://www.morguefile.com/
82
Méta-moteurs
MetaCrawler: http://www.metacrawler.com
Beaucoup: http://www.beaucoup.com
Surfwax:http://www.surfwax.com
Dogpile: http://www.dogpile.com
IceRocket: http://www.icerocket.com
Applications à télécharger ? Pas nécessaire !
WebFerret:http://www.webferret.com(Win)
Copernic:http://www.copernic.com (Win)
Références: UC Berleley
http://www.lib.berkeley.edu/TeachingLib/Guides/Internet/MetaSearch.html
RBS Search strategies (Karen Blakeman)
http://www.rba.co.uk/search/index.shtml
83
http://ca.millionshort.com/
Moteur/répertoire qui retire jusqu’à un million de sites parmi les plus populaires
du web dans ses pages de résultats...
84
Différence entre Google et Million Short pour la même requête
(moins le top 10k sites pour Million Short)
85
Mais SURTOUT...
Il faut lire les "modes d'emploi", les guides et les FAQ de
chacun des moteurs et savoir comment utiliser les
fonctions de recherche raffinée telles le "Advanced Search",
le "Power Search" et le "Related Search".
Apprenez à lire (à interpréter) rapidement les informations (sites)
que vous retournent les moteurs, notamment grâce aux titres, aux
résumés, à l'adresse web (nom de domaine)...
86
Autres ressources pour la recherche
Groupes de discussion
http://groups.google.com/
BlogPulse
http://www.blogpulse.com/
Technorati
http://technorati.com/
La recherche de périodiques électroniques par le biais du réseau des bibliothèques de l'Université de
Montréal
Périodiques électroniques (UdeM)
http://opurl.bib.umontreal.ca:9003/sfx_local/a-z/default
Le portail de la Bibliothèque et Archives nationales du Québec
http://www.banq.qc.ca/
Voir aussi Questia (Plus grande bibliothèque en ligne ?)
http://www.questia.com/
87
Ne pas oublier Twitter pour la recherche en temps réel !
http://search.twitter.com
Mais voir aussi OneRiot:
http://www.oneriot.com
Real-Time Search and your business
http://www.clickz.com/3636242
88
Utilisation des opérateurs pour plus de précision sur Twitter
89
Problèmes ??? Difficultés ???
Pas assez de résultats ? (silence)
Trouver de nouveaux synonymes, acronymes ou termes
plus conceptuels se rapprochant de votre recherche.
Trop de résultats ? (bruit)
Utiliser les opérateurs booléens et combiner certains
mots;
Utiliser des métadonnés (champs);
Utiliser les fonctions de recherche raffinée des moteurs.
90
Évaluation et validation de l'information trouvée
Quelques concepts importants:
Fiabilité (auteur, expertise)
Objectifs/Buts (éditorial, pour ou contre une cause?)
Équilibre ( faits bruts, point de vue différent ?)
Mise à jour (actualité, date de parution ?)
Type de couverture (rapport complet, études, petit paragraphe ?)
Les sources semblent bien documentées ?
(liens fonctionnels, sites reconnus, etc.)
Autres sources Web offrant lien vers le site en question ?
Quel rang dans un moteur de recherche ?
Équilibre ? (opinions, biais, pamphlet, autres points de vue ?)
Types de référence offerts (Livre blanc, rapport, petit paragraphe ?)
Pertinence (rapport statistique ou article)
Réputation et crédibilité de la source (commanditaire ?)
Reconnaissance professionnelle ou institutionnelle ?
91
Si c'est écrit, c'est vrai ? (Réseau UQuébec)
http://youtu.be/lXwgv8kq6rA
Lire aussi «60 000 times faster than text»...Really ? (Darren Kuropatwa)
http://adifference.blogspot.ca/2012/07/60-000-times-faster-than-text-really.html
92
Quelques références utiles....
UQAM/Bibliothèques
http://www.bibliotheques.uqam.ca/InfoSphere/sciences/module7/evaluer.html
Déterminer la fiabilité de l’information (Bibliothèques UdeM)
http://guides.bib.umontreal.ca/disciplines/74-Determiner-la-fiabilite-de-l-information
Robert Harris/Virtual Salt
http://www.virtualsalt.com/evalu8it.htm
Évaluation de l’information présente sur Internet (Université de Lyon)
http://sapristi-docinsa.insa-lyon.fr/conseils-pour-chercher/evaluer-linformation
93
Le Web invisible ou profond...
Quelques définitions
Web Invisible: informations que les moteurs de recherche conventionnels ne peuvent
trouver et répertorier.
Web caché: synonyme de Web invisible.
Web profond: terme utilisé d’abord par BrightPlanet qui le préfère à Web invisible. Selon
BrightPlanet, les informations ne sont pas nécessairement invisibles mais plutôt cachées.
Il s'agit d'apprendre comment les trouver !
Web de surface: informations disponibles par le biais des moteurs et répertoires.
La majorité des gens ne savent pas que plusieurs documents parmi les plus crédibles du
Web, c.-à-d. ceux qui font autorité, demeurent "invisibles" auprès des moteurs de
recherche comme Google, Yahoo! ou Bing.
La plupart de ces documents dits invisibles proviennent des bases de données des
universités, bibliothèques, agences gouvernementales, associations, entreprises... partout
dans le monde !
Références A+
DeepWeb (Wikipedia):
http://en.wikipedia.org/wiki/Deep_web
Inventeur du terme «DeepWeb» (Mike. K. Bergman)
http://www.mkbergman.com/about-mike/
The DeepWeb Internet Tutorials
http://www.internettutorials.net/deepweb.asp
94
«99% des contenus du web profond demeurent accessibles dans le Web; cependant la plupart se
trouve dans des bases de données que les moteurs n’indexent pas». (Steve Gruchawka)
Références A+:
Deep Web expliqué par osti.gov: http://www.youtube.com/watch?v=YskdGh8XU5I
Invisible or Deep Web: What it is, How to find it, and Its inherent ambiguity (UC-Berkeley)
http://www.lib.berkeley.edu/TeachingLib/Guides/Internet/InvisibleWeb.html
Voir autre vidéo Deep Web: http://www.osti.gov/media/DeepWebVideo
Source de l’image Iceberg: http://elibrary.icrisat.org/Google Search/Surface Web.htm
Source du graphique: http://21cif.com/resources/materials/webinar/
95
Web profond: exemples de sites contenant des bases de donnés qu’il faut
interroger pour accéder aux informations.
Références A+:
Steve Gruchawka: http://techdeepweb.com
Source de l’image: http://pipl.com/help/deep-web/
96
Le Web profond, c'est aussi...
Pages discrètes: existantes mais non liées par des hyperliens
Bases de données accessibles à travers une requête ou formulaire
Pages générées de façon dynamique (ASP, Cold Fusion);
Il est plus facile (et aussi moins onéreux) de générer une réponse de façon dynamique
par requête plutôt que d'entreposer (archiver) toutes les pages possibles contenant
toutes les réponses possibles de toutes les questions possibles...
Pages contenant des scripts (code avec un "?" par exemple)
Par exemple, Google Scholar ne peut que pointer vers des citations de références de
périodiques très spécialisés (revues savantes, etc.). Il ne peut aller directement vers un
contenu complet et protégé (mot de passe, abonnement payant, etc.) des bases de
données des grandes universités.
Véritable Intranet (entre les murs d'un immeuble, sans plus)
Ex: Compagnies d'assurance
Intranet/Extranet/ou wiki interne:
Le wiki interne de la Faculté de l'éducation permanente
https://intrawiki.umontreal.ca/
Une recherche dans une bibliothèque virtuelle.
(La requête disparaît lorsque la session se termine).
97
Pourquoi les moteurs n'indexent pas tout le Web ?
Les robots des moteurs sont surtout conçus pour chercher des pages en HTML
(statiques) qui reposent dans un serveur.
Depuis 2005-2006,plusieurs moteurs comme Google peuvent trouver des pages
dynamiques (avec un lien stable)...
Un moteur ne peut pas "penser" ni taper du texte...(code utilisateur, mot de passe,
autre texte, opérateurs propres au moteur de recherche interne).
On entend souvent dire que les méthodes de recherche de base et leur technologies
n'ont pas évolué de manière vraiment significative depuis les débuts d'Internet...
On commence à entendre parler de "smart robots" qui pourraient indexés le Web
profond. C’est déjà commencé...
Seuls des fichiers HTML, les fichiers musicaux ( MP3, midi, etc.) et certaines images (gif,
jpg) accompagnés de texte sont indexés convenablement.
Tout ce qui est en «flash» n’est pas indexé....
98
Comment trouver des informations du Web profond ?
Pensez toujours en fonctions des bases de données
Bases de données:
“Ensemble structuré d'éléments d'information, généralement agencés sous forme de tables, dans lesquels les
données sont organisées selon certains critères en vue de permettre leur exploitation”.
Source: Grand dictionnaire http://gdt.oqlf.gouv.qc.ca/ficheOqlf.aspx?Id_Fiche=8355656
Mot clé à ajouter à votre requête: database
Certains répertoires du Web permettent la recherche par mot clé ou par navigation à
l'intérieur de liens pointant vers des bases de données...
Exemples (par où commencer):
Infomine: http://infomine.ucr.edu
Internet Public Library (IPL2): http://www.ipl.org
 
Répertoire des bases de données gratuites disponibles dans Internet
http://dadi.univ-lyon1.fr/
Libdex (Index des grandes bibliothèques du monde entier)
http://www.libdex.com/
99
1e niveau de recherche:
Accès à une base de données par le biais d’un moteur conventionnel.
2e niveau:interrogation profonde d’une base de données.
Avec Google, par exemple, on peut trouver des bases de données en ajoutant comme mots clés le
mot database:
Exemples simples de requêtes de recherche:
Accident Avion OR Plane +database (Avec Google) www.google.ca
	

 Languages database (Avec Google)
database Toxic Products (Google)
Autres mots clés à utiliser pour faire des recherches dans le Web profond, en plus des mots reliés à une
industrie particulière:
Portal
Compliance
Index
Références A+
Research Beyond Google:
http://oedb.org/library/college-basics/research-beyond-google
100
Web Profond/Recherche sémantique
Quelques ressources
List of Academic databases and search engines
http://en.wikipedia.org/wiki/List_of_academic_databases_and_search_engines
Hakia:http://www.hakia.com
Quintura:http://www.quintura.com
Biznar:http://biznar.com/biznar/
Complete planet: http://www.completeplanet.com
Pipl:http://www.pipl.com
DeepPeep:http://www.deeppeep.org
Internet Archive: http://www.archive.org
Beaucoup: http://www.beaucoup.com
IncyWincy: http://www.incywincy.com/
Deep Web Research 2010 (Marcus P. Zellman)
http://www.llrx.com/features/deepweb2010.htm
Exploring a DeepWeb that Google can’t grasp
http://www.nytimes.com/2009/02/23/technology/internet/23search.html?_r=1&th&emc=th
Voir aussi:Ressources d’images (web profond) http://www.readwriteweb.com/archives/
digital_image_resources_on_the_deep_web.php
101
Exemples de base de donnés du Web profond
(art, littérature, gouvernements, affaires, etc.)
Musée du Louvre: http://www.louvre.fr/llv/oeuvres/bdd_oeuvre.jsp?bmLocale=fr_FR
Musée Guggenheim: http://www.guggenheim.org/new-york/collections/collection-online
Smithsonian Institution:http://www.siris.si.edu
Library of Congress:http://www.loc.gov/search/new/
Projet Gutenberg:http://www.gutenberg.org/wiki/Main_Page
US Consumer Product Safety Commission:http://www.cpsc.gov/cpscpub/prerel/
prerel.html
American Association of Advertising Agencies: http://www.aaaa.org/eweb/
dynamicpage.aspx?webcode=findagency
Hoovers: http://www.hoovers.com
Documents de la CIA (Accès information/FOI): http://www.foia.cia.gov
FreeLunch:http://www.economy.com/freelunch/default.asp
FlightWise:http://flightwise.com/default.aspx
Voir aussi:
99 Resources to Research and Mine the Invisible Web
http://www.collegedegree.com/library/college-life/99-resources-to/
102
Un wiki offrant une base de données (entre autres)
http://www.alacrawiki.com/
103
L'ambiguïté du Web invisible...
 
Selon les spécialistes en sciences de l'information de Berkeley, on ne peut toujours savoir ou
prévoir quels types de sites (ou portions de sites) font partie du Web invisible.
Voici quelques facteurs :
 
Quels sites offrent le contenu de leur base de données en pages statiques (visible, hybride,
invisible) ?
Politique d'inclusion ou d'exclusion des moteurs de recherche.
Autres exemples de sites dits invisibles
NASA Image Exchange
http://nix.nasa.gov/
JSTOR project
http://www.jstor.org
Right-to-Know Network
http://www.rtk.net/
National Climatic Data Center
http://www.ncdc.noaa.gov/oa/ncdc.html
Voir aussi Search Engine Land
http://searchengineland.com
104
Accès à des données publiques via Google
http://www.google.com/publicdata/directory
105
L'ambiguïté du Web invisible...
Source: Deep Web: 20,000 lieues sous Google
http://leblogalupus.com/2013/08/25/deep-web-20000-lieues-sous-google/
106
Une recherche efficace et exhaustive favorisera une
approche moteur et
une approche répertoire multiples.
Il faut en effet passer à travers plusieurs outils de
recherche.
Évitez d’utiliser qu'un seul outil de recherche.
Bonne recherche !
107
Merci de votre attention
Patrice Leroux
patrice.leroux@umontreal.ca
http://twitter.com/patriceleroux
http://patriceleroux.blogspot.com/
108

Contenu connexe

Tendances

La recherche d\'information sur internet
La recherche d\'information sur internetLa recherche d\'information sur internet
La recherche d\'information sur internet
alexartiste
 
Web de données - une introduction
Web de données - une introductionWeb de données - une introduction
Web de données - une introduction
Thomas Francart
 
Classificateur d'URL
Classificateur d'URLClassificateur d'URL
Classificateur d'URLmartin255
 
RDF : une introduction
RDF : une introductionRDF : une introduction
RDF : une introduction
Thomas Francart
 
Recherche
RechercheRecherche
Recherche
Patrice Leroux
 
Découvrir les données de data.bnf.fr en utilisant SPARQL
Découvrir les données de data.bnf.fr en utilisant SPARQLDécouvrir les données de data.bnf.fr en utilisant SPARQL
Découvrir les données de data.bnf.fr en utilisant SPARQL
Thomas Francart
 
Techniques de recherches sur google par Abdoul Wahab Diaby
Techniques de recherches sur google par Abdoul Wahab DiabyTechniques de recherches sur google par Abdoul Wahab Diaby
Techniques de recherches sur google par Abdoul Wahab Diaby
Abdoul Wahab Diaby
 
CIDOC-CRM + SPARQL Tutorial sur les données Doremus
CIDOC-CRM + SPARQL Tutorial sur les données DoremusCIDOC-CRM + SPARQL Tutorial sur les données Doremus
CIDOC-CRM + SPARQL Tutorial sur les données Doremus
Thomas Francart
 
Naviguer sur internet
Naviguer sur internetNaviguer sur internet
Naviguer sur internet
Espace Public Numérique Orsay
 
SPARQL sur les données CIDOC-CRM du British Museum
SPARQL sur les données CIDOC-CRM du British MuseumSPARQL sur les données CIDOC-CRM du British Museum
SPARQL sur les données CIDOC-CRM du British Museum
Thomas Francart
 
Du bon usage de google : la recherche d'information sur le Web
Du bon usage de google : la recherche d'information sur le WebDu bon usage de google : la recherche d'information sur le Web
Du bon usage de google : la recherche d'information sur le Web
Christophe Charmetton
 
Trouver sur Internet
Trouver sur Internet Trouver sur Internet
Trouver sur Internet
MEMOIRE PATRIMOINE CLOHARS CARNOET
 
Recherche Efficace Dans Internet Formation
Recherche Efficace Dans Internet FormationRecherche Efficace Dans Internet Formation
Recherche Efficace Dans Internet Formation
Cegep de la Pocatiere - CEC de Montmagny
 
Mieux utiliser google
Mieux utiliser googleMieux utiliser google
Mieux utiliser google
Alain Ternet
 
Boostez vos recherches sur Internet
Boostez vos recherches sur InternetBoostez vos recherches sur Internet
Boostez vos recherches sur Internet
Béatrice Foenix-Riou
 
Google : trucs et astuces pour les pros de l'infodoc, BFR Consultants
Google : trucs et astuces pour les pros de l'infodoc, BFR ConsultantsGoogle : trucs et astuces pour les pros de l'infodoc, BFR Consultants
Google : trucs et astuces pour les pros de l'infodoc, BFR Consultants
Béatrice Foenix-Riou
 
03 recherche avancée 1.7
03   recherche avancée 1.703   recherche avancée 1.7
03 recherche avancée 1.7
wiemyassine
 

Tendances (18)

La recherche d\'information sur internet
La recherche d\'information sur internetLa recherche d\'information sur internet
La recherche d\'information sur internet
 
Web de données - une introduction
Web de données - une introductionWeb de données - une introduction
Web de données - une introduction
 
Classificateur d'URL
Classificateur d'URLClassificateur d'URL
Classificateur d'URL
 
RDF : une introduction
RDF : une introductionRDF : une introduction
RDF : une introduction
 
Recherche
RechercheRecherche
Recherche
 
C2i d4 scd-amu 2016
C2i d4 scd-amu 2016C2i d4 scd-amu 2016
C2i d4 scd-amu 2016
 
Découvrir les données de data.bnf.fr en utilisant SPARQL
Découvrir les données de data.bnf.fr en utilisant SPARQLDécouvrir les données de data.bnf.fr en utilisant SPARQL
Découvrir les données de data.bnf.fr en utilisant SPARQL
 
Techniques de recherches sur google par Abdoul Wahab Diaby
Techniques de recherches sur google par Abdoul Wahab DiabyTechniques de recherches sur google par Abdoul Wahab Diaby
Techniques de recherches sur google par Abdoul Wahab Diaby
 
CIDOC-CRM + SPARQL Tutorial sur les données Doremus
CIDOC-CRM + SPARQL Tutorial sur les données DoremusCIDOC-CRM + SPARQL Tutorial sur les données Doremus
CIDOC-CRM + SPARQL Tutorial sur les données Doremus
 
Naviguer sur internet
Naviguer sur internetNaviguer sur internet
Naviguer sur internet
 
SPARQL sur les données CIDOC-CRM du British Museum
SPARQL sur les données CIDOC-CRM du British MuseumSPARQL sur les données CIDOC-CRM du British Museum
SPARQL sur les données CIDOC-CRM du British Museum
 
Du bon usage de google : la recherche d'information sur le Web
Du bon usage de google : la recherche d'information sur le WebDu bon usage de google : la recherche d'information sur le Web
Du bon usage de google : la recherche d'information sur le Web
 
Trouver sur Internet
Trouver sur Internet Trouver sur Internet
Trouver sur Internet
 
Recherche Efficace Dans Internet Formation
Recherche Efficace Dans Internet FormationRecherche Efficace Dans Internet Formation
Recherche Efficace Dans Internet Formation
 
Mieux utiliser google
Mieux utiliser googleMieux utiliser google
Mieux utiliser google
 
Boostez vos recherches sur Internet
Boostez vos recherches sur InternetBoostez vos recherches sur Internet
Boostez vos recherches sur Internet
 
Google : trucs et astuces pour les pros de l'infodoc, BFR Consultants
Google : trucs et astuces pour les pros de l'infodoc, BFR ConsultantsGoogle : trucs et astuces pour les pros de l'infodoc, BFR Consultants
Google : trucs et astuces pour les pros de l'infodoc, BFR Consultants
 
03 recherche avancée 1.7
03   recherche avancée 1.703   recherche avancée 1.7
03 recherche avancée 1.7
 

En vedette

Natural Link Building2.0
Natural Link Building2.0Natural Link Building2.0
Natural Link Building2.0
DML Srl
 
Stage Explorer Google 24novembre09
Stage Explorer Google 24novembre09Stage Explorer Google 24novembre09
Stage Explorer Google 24novembre09
URFIST de Rennes
 
23k guestbooks mix
23k guestbooks mix23k guestbooks mix
23k guestbooks mix
Waleed Ahmad
 
Recoleccion de Informacion con Google (OWASP Argentina)
Recoleccion de Informacion con Google (OWASP Argentina)Recoleccion de Informacion con Google (OWASP Argentina)
Recoleccion de Informacion con Google (OWASP Argentina)
Maximiliano Soler
 
Marketing De Buscadores Mondragon Unibertsitatea
Marketing De Buscadores Mondragon UnibertsitateaMarketing De Buscadores Mondragon Unibertsitatea
Marketing De Buscadores Mondragon Unibertsitatea
Iñaki Lakarra
 
Esboço de projeto dengue
Esboço de projeto  dengueEsboço de projeto  dengue
Esboço de projeto dengue
Marta Durão Nunes
 
Ijm 06 10_012
Ijm 06 10_012Ijm 06 10_012
Ijm 06 10_012
IAEME Publication
 
互联网搜索技巧
互联网搜索技巧互联网搜索技巧
互联网搜索技巧
bemyfriend
 
Attack_Simulation_and_Threat_Modeling
Attack_Simulation_and_Threat_ModelingAttack_Simulation_and_Threat_Modeling
Attack_Simulation_and_Threat_Modeling
Oluseyi Akindeinde
 
Daron Yöndem - ie8 Ebook Tr
Daron Yöndem - ie8 Ebook TrDaron Yöndem - ie8 Ebook Tr
Daron Yöndem - ie8 Ebook Tr
Bilgisayar Kulübü
 
Recherche
RechercheRecherche
Recherche
Patrice Leroux
 
Catalog
CatalogCatalog
Logminingsurvey
LogminingsurveyLogminingsurvey
Logminingsurvey
drewz lin
 
Ajax, JSF, Facelets, Eclipse & Maven tutorials
Ajax, JSF, Facelets, Eclipse & Maven tutorialsAjax, JSF, Facelets, Eclipse & Maven tutorials
Ajax, JSF, Facelets, Eclipse & Maven tutorials
Raghavan Mohan
 
IoF South West Conference
IoF South West ConferenceIoF South West Conference
IoF South West Conference
Jonathan Waddingham
 
Web Application Hacking 2004
Web Application Hacking 2004Web Application Hacking 2004
Web Application Hacking 2004
Mike Spaulding
 
00 a linguagem html
00 a linguagem html00 a linguagem html
00 a linguagem html
Vasco Ferreira
 
Medication Reconciliation in Electronic Health Information Exchange
Medication Reconciliation in Electronic Health Information ExchangeMedication Reconciliation in Electronic Health Information Exchange
Medication Reconciliation in Electronic Health Information Exchange
Tomasz Adamusiak
 
JSF2 and JSP
JSF2 and JSPJSF2 and JSP
JSF2 and JSP
Armen Arzumanyan
 
Bollean Search - NageshRao
Bollean Search - NageshRaoBollean Search - NageshRao
Bollean Search - NageshRao
Nagesh Rao is Hiring Testing People at AUS
 

En vedette (20)

Natural Link Building2.0
Natural Link Building2.0Natural Link Building2.0
Natural Link Building2.0
 
Stage Explorer Google 24novembre09
Stage Explorer Google 24novembre09Stage Explorer Google 24novembre09
Stage Explorer Google 24novembre09
 
23k guestbooks mix
23k guestbooks mix23k guestbooks mix
23k guestbooks mix
 
Recoleccion de Informacion con Google (OWASP Argentina)
Recoleccion de Informacion con Google (OWASP Argentina)Recoleccion de Informacion con Google (OWASP Argentina)
Recoleccion de Informacion con Google (OWASP Argentina)
 
Marketing De Buscadores Mondragon Unibertsitatea
Marketing De Buscadores Mondragon UnibertsitateaMarketing De Buscadores Mondragon Unibertsitatea
Marketing De Buscadores Mondragon Unibertsitatea
 
Esboço de projeto dengue
Esboço de projeto  dengueEsboço de projeto  dengue
Esboço de projeto dengue
 
Ijm 06 10_012
Ijm 06 10_012Ijm 06 10_012
Ijm 06 10_012
 
互联网搜索技巧
互联网搜索技巧互联网搜索技巧
互联网搜索技巧
 
Attack_Simulation_and_Threat_Modeling
Attack_Simulation_and_Threat_ModelingAttack_Simulation_and_Threat_Modeling
Attack_Simulation_and_Threat_Modeling
 
Daron Yöndem - ie8 Ebook Tr
Daron Yöndem - ie8 Ebook TrDaron Yöndem - ie8 Ebook Tr
Daron Yöndem - ie8 Ebook Tr
 
Recherche
RechercheRecherche
Recherche
 
Catalog
CatalogCatalog
Catalog
 
Logminingsurvey
LogminingsurveyLogminingsurvey
Logminingsurvey
 
Ajax, JSF, Facelets, Eclipse & Maven tutorials
Ajax, JSF, Facelets, Eclipse & Maven tutorialsAjax, JSF, Facelets, Eclipse & Maven tutorials
Ajax, JSF, Facelets, Eclipse & Maven tutorials
 
IoF South West Conference
IoF South West ConferenceIoF South West Conference
IoF South West Conference
 
Web Application Hacking 2004
Web Application Hacking 2004Web Application Hacking 2004
Web Application Hacking 2004
 
00 a linguagem html
00 a linguagem html00 a linguagem html
00 a linguagem html
 
Medication Reconciliation in Electronic Health Information Exchange
Medication Reconciliation in Electronic Health Information ExchangeMedication Reconciliation in Electronic Health Information Exchange
Medication Reconciliation in Electronic Health Information Exchange
 
JSF2 and JSP
JSF2 and JSPJSF2 and JSP
JSF2 and JSP
 
Bollean Search - NageshRao
Bollean Search - NageshRaoBollean Search - NageshRao
Bollean Search - NageshRao
 

Similaire à Recherche web 2013

Techniques de recherches sur google
Techniques de recherches sur googleTechniques de recherches sur google
Techniques de recherches sur google
Abdoul Wahab Diaby
 
Formation AJPro fact-checking 2 octobre 2019 1/2
Formation AJPro fact-checking 2 octobre 2019 1/2Formation AJPro fact-checking 2 octobre 2019 1/2
Formation AJPro fact-checking 2 octobre 2019 1/2
Ettore Rizza
 
Optimiser ses recherches sur Internet
Optimiser ses recherches sur InternetOptimiser ses recherches sur Internet
Optimiser ses recherches sur Internet
lerig
 
La recherche sur internet
La recherche sur internetLa recherche sur internet
La recherche sur internet
Toufik74200
 
Fiche pratique Google : trucs et astuces / CIST Agropolis - révision décembr...
Fiche pratique Google : trucs et astuces /  CIST Agropolis - révision décembr...Fiche pratique Google : trucs et astuces /  CIST Agropolis - révision décembr...
Fiche pratique Google : trucs et astuces / CIST Agropolis - révision décembr...
Agropolis International
 
Search The Web
Search The WebSearch The Web
Search The Web
anne.wiener
 
Google Hummingbird : ce que cela change pour le SEO - conférence SEO Campus 2014
Google Hummingbird : ce que cela change pour le SEO - conférence SEO Campus 2014Google Hummingbird : ce que cela change pour le SEO - conférence SEO Campus 2014
Google Hummingbird : ce que cela change pour le SEO - conférence SEO Campus 2014
Woptimo
 
03 recherche avancée 1.7
03   recherche avancée 1.703   recherche avancée 1.7
03 recherche avancée 1.7
aboumariouma
 
Petit déjeuner du 29 mars - Quel contenu créer pour un Google transformé en m...
Petit déjeuner du 29 mars - Quel contenu créer pour un Google transformé en m...Petit déjeuner du 29 mars - Quel contenu créer pour un Google transformé en m...
Petit déjeuner du 29 mars - Quel contenu créer pour un Google transformé en m...
Peak Ace
 
Utiliser Le MultiméDia Dans Un Projet Danimation
Utiliser Le MultiméDia Dans Un Projet DanimationUtiliser Le MultiméDia Dans Un Projet Danimation
Utiliser Le MultiméDia Dans Un Projet Danimation
Bibliothèques Brest
 
Bien utiliser Google
Bien utiliser GoogleBien utiliser Google
Bien utiliser Google
D1clic
 
Formation référencement 2016
Formation référencement 2016Formation référencement 2016
Formation référencement 2016
Guillaume Eouzan
 
Exposé méthodologie générale zaky
Exposé méthodologie générale zakyExposé méthodologie générale zaky
Exposé méthodologie générale zakyNajlaa Zouaoui
 
Guide de la recherche sur internet
Guide de la recherche sur internetGuide de la recherche sur internet
Guide de la recherche sur internetYoussef Bensafi
 
Faites votre propre Knowledge Graph - L'extraction d'information et la fouill...
Faites votre propre Knowledge Graph - L'extraction d'information et la fouill...Faites votre propre Knowledge Graph - L'extraction d'information et la fouill...
Faites votre propre Knowledge Graph - L'extraction d'information et la fouill...
Philippe YONNET
 
Vendre'tips astuces de recherche google - juillet 2013
Vendre'tips   astuces de recherche google - juillet 2013Vendre'tips   astuces de recherche google - juillet 2013
Vendre'tips astuces de recherche google - juillet 2013
Lily G
 
Vendretips - Optimisez son utilisation des moteurs de recherche
Vendretips - Optimisez son utilisation des moteurs de recherche Vendretips - Optimisez son utilisation des moteurs de recherche
Vendretips - Optimisez son utilisation des moteurs de recherche
Clémence Bertrand-Jaume
 

Similaire à Recherche web 2013 (20)

Techniques de recherches sur google
Techniques de recherches sur googleTechniques de recherches sur google
Techniques de recherches sur google
 
Formation AJPro fact-checking 2 octobre 2019 1/2
Formation AJPro fact-checking 2 octobre 2019 1/2Formation AJPro fact-checking 2 octobre 2019 1/2
Formation AJPro fact-checking 2 octobre 2019 1/2
 
Google
Google Google
Google
 
Optimiser ses recherches sur Internet
Optimiser ses recherches sur InternetOptimiser ses recherches sur Internet
Optimiser ses recherches sur Internet
 
Recheche d'info sur Internet
Recheche d'info sur InternetRecheche d'info sur Internet
Recheche d'info sur Internet
 
La recherche sur internet
La recherche sur internetLa recherche sur internet
La recherche sur internet
 
Fiche pratique Google : trucs et astuces / CIST Agropolis - révision décembr...
Fiche pratique Google : trucs et astuces /  CIST Agropolis - révision décembr...Fiche pratique Google : trucs et astuces /  CIST Agropolis - révision décembr...
Fiche pratique Google : trucs et astuces / CIST Agropolis - révision décembr...
 
Search The Web
Search The WebSearch The Web
Search The Web
 
Recherche
RechercheRecherche
Recherche
 
Google Hummingbird : ce que cela change pour le SEO - conférence SEO Campus 2014
Google Hummingbird : ce que cela change pour le SEO - conférence SEO Campus 2014Google Hummingbird : ce que cela change pour le SEO - conférence SEO Campus 2014
Google Hummingbird : ce que cela change pour le SEO - conférence SEO Campus 2014
 
03 recherche avancée 1.7
03   recherche avancée 1.703   recherche avancée 1.7
03 recherche avancée 1.7
 
Petit déjeuner du 29 mars - Quel contenu créer pour un Google transformé en m...
Petit déjeuner du 29 mars - Quel contenu créer pour un Google transformé en m...Petit déjeuner du 29 mars - Quel contenu créer pour un Google transformé en m...
Petit déjeuner du 29 mars - Quel contenu créer pour un Google transformé en m...
 
Utiliser Le MultiméDia Dans Un Projet Danimation
Utiliser Le MultiméDia Dans Un Projet DanimationUtiliser Le MultiméDia Dans Un Projet Danimation
Utiliser Le MultiméDia Dans Un Projet Danimation
 
Bien utiliser Google
Bien utiliser GoogleBien utiliser Google
Bien utiliser Google
 
Formation référencement 2016
Formation référencement 2016Formation référencement 2016
Formation référencement 2016
 
Exposé méthodologie générale zaky
Exposé méthodologie générale zakyExposé méthodologie générale zaky
Exposé méthodologie générale zaky
 
Guide de la recherche sur internet
Guide de la recherche sur internetGuide de la recherche sur internet
Guide de la recherche sur internet
 
Faites votre propre Knowledge Graph - L'extraction d'information et la fouill...
Faites votre propre Knowledge Graph - L'extraction d'information et la fouill...Faites votre propre Knowledge Graph - L'extraction d'information et la fouill...
Faites votre propre Knowledge Graph - L'extraction d'information et la fouill...
 
Vendre'tips astuces de recherche google - juillet 2013
Vendre'tips   astuces de recherche google - juillet 2013Vendre'tips   astuces de recherche google - juillet 2013
Vendre'tips astuces de recherche google - juillet 2013
 
Vendretips - Optimisez son utilisation des moteurs de recherche
Vendretips - Optimisez son utilisation des moteurs de recherche Vendretips - Optimisez son utilisation des moteurs de recherche
Vendretips - Optimisez son utilisation des moteurs de recherche
 

Plus de Patrice Leroux

Rep2400 plan cours_h2019_sl
Rep2400 plan cours_h2019_slRep2400 plan cours_h2019_sl
Rep2400 plan cours_h2019_sl
Patrice Leroux
 
Rep2400 lectures h2019
Rep2400 lectures h2019Rep2400 lectures h2019
Rep2400 lectures h2019
Patrice Leroux
 
Rep2400 lectures h2017
Rep2400 lectures h2017Rep2400 lectures h2017
Rep2400 lectures h2017
Patrice Leroux
 
Rep2400 h17 ss
Rep2400 h17 ssRep2400 h17 ss
Rep2400 h17 ss
Patrice Leroux
 
Entrevue avec les médias (FESP)
Entrevue avec les médias (FESP)Entrevue avec les médias (FESP)
Entrevue avec les médias (FESP)
Patrice Leroux
 
Rep2400 plan cours_h2016
Rep2400 plan cours_h2016Rep2400 plan cours_h2016
Rep2400 plan cours_h2016
Patrice Leroux
 
Utilisation d'une communauté (dév. projet)
Utilisation d'une communauté (dév. projet)Utilisation d'une communauté (dév. projet)
Utilisation d'une communauté (dév. projet)
Patrice Leroux
 
Reputation p leroux_bio_qc_2014
Reputation p leroux_bio_qc_2014Reputation p leroux_bio_qc_2014
Reputation p leroux_bio_qc_2014
Patrice Leroux
 
Eréputation_PLeroux_TCTIC14
Eréputation_PLeroux_TCTIC14Eréputation_PLeroux_TCTIC14
Eréputation_PLeroux_TCTIC14
Patrice Leroux
 
Vocabulaire des relations publiques (II)
Vocabulaire des relations publiques (II)Vocabulaire des relations publiques (II)
Vocabulaire des relations publiques (II)
Patrice Leroux
 
Relations avec les médias
Relations avec les médiasRelations avec les médias
Relations avec les médias
Patrice Leroux
 
Responsabilité sociale 2013
Responsabilité sociale 2013Responsabilité sociale 2013
Responsabilité sociale 2013
Patrice Leroux
 
Identites_Statuts_Pouvoir_(3)
Identites_Statuts_Pouvoir_(3)Identites_Statuts_Pouvoir_(3)
Identites_Statuts_Pouvoir_(3)
Patrice Leroux
 
Gestion de crise_v4
Gestion de crise_v4Gestion de crise_v4
Gestion de crise_v4
Patrice Leroux
 
Entreprise20 2013
Entreprise20 2013Entreprise20 2013
Entreprise20 2013
Patrice Leroux
 
Relations avec les médias
Relations avec les médiasRelations avec les médias
Relations avec les médias
Patrice Leroux
 
Monitoring 4
Monitoring 4Monitoring 4
Monitoring 4
Patrice Leroux
 
Planification stratégique: médias sociaux
Planification stratégique: médias sociauxPlanification stratégique: médias sociaux
Planification stratégique: médias sociaux
Patrice Leroux
 
Reseaux sociaux 2013
Reseaux sociaux 2013Reseaux sociaux 2013
Reseaux sociaux 2013
Patrice Leroux
 
Twitter v5 2013
Twitter v5 2013Twitter v5 2013
Twitter v5 2013
Patrice Leroux
 

Plus de Patrice Leroux (20)

Rep2400 plan cours_h2019_sl
Rep2400 plan cours_h2019_slRep2400 plan cours_h2019_sl
Rep2400 plan cours_h2019_sl
 
Rep2400 lectures h2019
Rep2400 lectures h2019Rep2400 lectures h2019
Rep2400 lectures h2019
 
Rep2400 lectures h2017
Rep2400 lectures h2017Rep2400 lectures h2017
Rep2400 lectures h2017
 
Rep2400 h17 ss
Rep2400 h17 ssRep2400 h17 ss
Rep2400 h17 ss
 
Entrevue avec les médias (FESP)
Entrevue avec les médias (FESP)Entrevue avec les médias (FESP)
Entrevue avec les médias (FESP)
 
Rep2400 plan cours_h2016
Rep2400 plan cours_h2016Rep2400 plan cours_h2016
Rep2400 plan cours_h2016
 
Utilisation d'une communauté (dév. projet)
Utilisation d'une communauté (dév. projet)Utilisation d'une communauté (dév. projet)
Utilisation d'une communauté (dév. projet)
 
Reputation p leroux_bio_qc_2014
Reputation p leroux_bio_qc_2014Reputation p leroux_bio_qc_2014
Reputation p leroux_bio_qc_2014
 
Eréputation_PLeroux_TCTIC14
Eréputation_PLeroux_TCTIC14Eréputation_PLeroux_TCTIC14
Eréputation_PLeroux_TCTIC14
 
Vocabulaire des relations publiques (II)
Vocabulaire des relations publiques (II)Vocabulaire des relations publiques (II)
Vocabulaire des relations publiques (II)
 
Relations avec les médias
Relations avec les médiasRelations avec les médias
Relations avec les médias
 
Responsabilité sociale 2013
Responsabilité sociale 2013Responsabilité sociale 2013
Responsabilité sociale 2013
 
Identites_Statuts_Pouvoir_(3)
Identites_Statuts_Pouvoir_(3)Identites_Statuts_Pouvoir_(3)
Identites_Statuts_Pouvoir_(3)
 
Gestion de crise_v4
Gestion de crise_v4Gestion de crise_v4
Gestion de crise_v4
 
Entreprise20 2013
Entreprise20 2013Entreprise20 2013
Entreprise20 2013
 
Relations avec les médias
Relations avec les médiasRelations avec les médias
Relations avec les médias
 
Monitoring 4
Monitoring 4Monitoring 4
Monitoring 4
 
Planification stratégique: médias sociaux
Planification stratégique: médias sociauxPlanification stratégique: médias sociaux
Planification stratégique: médias sociaux
 
Reseaux sociaux 2013
Reseaux sociaux 2013Reseaux sociaux 2013
Reseaux sociaux 2013
 
Twitter v5 2013
Twitter v5 2013Twitter v5 2013
Twitter v5 2013
 

Dernier

Iris van Herpen. pptx
Iris            van        Herpen.     pptxIris            van        Herpen.     pptx
Iris van Herpen. pptx
Txaruka
 
Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...
Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...
Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...
M2i Formation
 
Iris van Herpen. pptx
Iris         van         Herpen.      pptxIris         van         Herpen.      pptx
Iris van Herpen. pptx
Txaruka
 
Burkina Faso library newsletter May 2024
Burkina Faso library newsletter May 2024Burkina Faso library newsletter May 2024
Burkina Faso library newsletter May 2024
Friends of African Village Libraries
 
Formation Intelligence Artificielle pour dirigeants- IT6-DIGITALIX 24_opt OK_...
Formation Intelligence Artificielle pour dirigeants- IT6-DIGITALIX 24_opt OK_...Formation Intelligence Artificielle pour dirigeants- IT6-DIGITALIX 24_opt OK_...
Formation Intelligence Artificielle pour dirigeants- IT6-DIGITALIX 24_opt OK_...
cristionobedi
 
Iris van Herpen. pptx
Iris         van        Herpen.      pptxIris         van        Herpen.      pptx
Iris van Herpen. pptx
Txaruka
 
Newsletter SPW Agriculture en province du Luxembourg du 12-06-24
Newsletter SPW Agriculture en province du Luxembourg du 12-06-24Newsletter SPW Agriculture en province du Luxembourg du 12-06-24
Newsletter SPW Agriculture en province du Luxembourg du 12-06-24
BenotGeorges3
 
Cycle de Formation Théâtrale 2024 / 2025
Cycle de Formation Théâtrale 2024 / 2025Cycle de Formation Théâtrale 2024 / 2025
Cycle de Formation Théâtrale 2024 / 2025
Billy DEYLORD
 

Dernier (8)

Iris van Herpen. pptx
Iris            van        Herpen.     pptxIris            van        Herpen.     pptx
Iris van Herpen. pptx
 
Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...
Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...
Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...
 
Iris van Herpen. pptx
Iris         van         Herpen.      pptxIris         van         Herpen.      pptx
Iris van Herpen. pptx
 
Burkina Faso library newsletter May 2024
Burkina Faso library newsletter May 2024Burkina Faso library newsletter May 2024
Burkina Faso library newsletter May 2024
 
Formation Intelligence Artificielle pour dirigeants- IT6-DIGITALIX 24_opt OK_...
Formation Intelligence Artificielle pour dirigeants- IT6-DIGITALIX 24_opt OK_...Formation Intelligence Artificielle pour dirigeants- IT6-DIGITALIX 24_opt OK_...
Formation Intelligence Artificielle pour dirigeants- IT6-DIGITALIX 24_opt OK_...
 
Iris van Herpen. pptx
Iris         van        Herpen.      pptxIris         van        Herpen.      pptx
Iris van Herpen. pptx
 
Newsletter SPW Agriculture en province du Luxembourg du 12-06-24
Newsletter SPW Agriculture en province du Luxembourg du 12-06-24Newsletter SPW Agriculture en province du Luxembourg du 12-06-24
Newsletter SPW Agriculture en province du Luxembourg du 12-06-24
 
Cycle de Formation Théâtrale 2024 / 2025
Cycle de Formation Théâtrale 2024 / 2025Cycle de Formation Théâtrale 2024 / 2025
Cycle de Formation Théâtrale 2024 / 2025
 

Recherche web 2013

  • 1. REP2400 Internet et relations publiques La recherche web A2013 1
  • 2. Enjeux de la recherche Moteurs de recherche:le cas Google Stratégies d’interrogation Écueils de la personnalisation de la recherche Médias sociaux et recherche Évaluation de l’information Le Web dit invisible ou Web profond (Bases de données spécialisées) 2
  • 3. Cinq de ces dix propriétés sont des moteurs de recherche (ou variantes)... Source: http://stephenslighthouse.com/2012/03/14/how-people-spend-their-time-online/ Les chiffres diffèrent beaucoup entre le graphique ci-dessus et cette autre compilation de http://www.ebizmba.com/articles/search-engines Difficile aussi de croire que FB recevait 137 millions de visiteurs unique par mois au début de 2012 ! Leçon # 1: ne jamais se fier sur une seule ressource http://news.cnet.com/8301-1023_3-57566550-93/facebook-by-the-numbers-1.06-billion-monthly-active-users/ 3
  • 4. Source: Top-10 US sites & Social Networks 2011 (Hitwise) http://www.hitwise.com/us/datacenter/main/dashboard-10133.html Top 15 search engines (September 2012) http://www.ebizmba.com/articles/search-engines 4
  • 5. Source: Top-20 US sites & engines en 2010 (Hitwise) http://www.hitwise.com/us/datacenter/main/dashboard-10133.html Voir aussi:Search Engine Trends (Bing dépasse Yahoo en 2012) http://www.experian.com/hitwise/online-trends-search-engine.html 5
  • 6. 20  +  stats  on  user  behaviour  (e-­‐Consultancy h7p://econsultancy.com/us/blog/7027-­‐20-­‐stats-­‐you-­‐might-­‐not-­‐know-­‐about-­‐user-­‐search-­‐behaviour 6
  • 7. Source: Longer search queries of eight or more words increase 3% in september 2011 http://www.hitwise.com/us/about-us/press-center/press-releases/google-share-of-searches-66-percent-in-sept-2011/ 7
  • 8. Source: Top-15 moteurs de recherche (US) en 2013 http://www.ebizmba.com/articles/search-engines 8
  • 9. La recherche dans Internet (WWW) Comment les données sont-elles cataloguées et indexées ? Quelques outils de recherche disponibles. Les techniques à utiliser. Les comportements des chercheurs Vers la recherche collaborative ? Bots, Blogs and news Agregators (mis à jour en 2011) par Marcus P. Zillman http://www.botsblogs.com/ 100 useful tips to search the deep web (Alisa Miller) http://www.online-college-blog.com/features/100-useful-tips-and-tools-to-research-the-deep-web/ 9
  • 10. Quelques mythes On trouve tout dans Internet C'est facile de chercher et de trouver Les sources sont fiables et à jour... LES RECHERCHES DANS INTERNET PEUVENT SE FAIRE À PARTIR DES RESSOURCES SUIVANTES, ENTRE AUTRES : Moteurs de recherche et Annuaires (catologues/répertoires) + Les Newgroups (groupes de discussion) dont les contenus peuvent être accessibles avec un lecteur de nouvelles... http://alt.binaries.movies.french.usenetor.com/ http://groups.google.com/group/tourisme-recherches-institutions-pratiques?lnk= Par le biais du web, les «news» étaient accessibles avec Google Groupes (désactivé en 2011 mais 20 ans d’archives toujours disponibles...) Les blogues Certains réseaux sociaux ouverts (ou par compte Google) Sites de signets sociaux Twitter (temps réel) Le Web profond dit invisible 10
  • 11. Moteurs de recherche : Il s'agit de programmes informatiques permettant de faire des recherches dans les bases de données, conçues par les robots collecteurs. Dans Internet, les moteurs nous proposent leur information grâce à 3 fonctions ou étapes principales : 1) Un robot collecteur : ( crawler, spider, bot) Il indexe le web automatiquement 24 heures par jour en "glanant" (en scannant) les informations dans le texte visible d'un site (les premiers mots ou phrases) et dans le texte invisible (i.e. dans le code HTML, où on retrouve les méta-étiquettes, entre autres). N.B. : Les meilleurs glaneurs/robots peuvent indexer plusieurs millions de pages par jour ( ils prennent quelques heures, jours et semaines pour faire le tour du Web en entier). 11
  • 12. Le robot visite chaque page (ou pages représentatives) d'un site (qui veut bien être trouvé ou découvert !) et lit les pages ainsi que les hyperliens offerts dans le but de découvrir les autres pages (ou fichiers). 2) Un programme crée un index ou catalogue immense (base de données/statique) à partir des sites (fichiers) visités. 3) Un autre programme (le service de requêtes) reçoit votre requête, la compare à ses entrées de données (catalogue) et renvoie ses résultats. C'est dans la fenêtre de requête des moteurs qu'on tape les informations et qu'on interroge leurs bases de données. La recherche d'information se fait donc par interrogation. Il existe des milliers de moteurs de recherche... Search Engine Colossus (par pays, par thèmes, etc.) http://www.searchenginecolossus.com/ 12
  • 13. Principales techniques de recherche Identification du sujet : Contexte et objet de la recherche; délimitation de la recherche (langues, pays, etc.); genre de réponses désirées. Quelle est votre connaissance sémantique du sujet ou de la discipline recherchée ? Formulation du sujet : Quels mots ou expressions précisent ou traduisent le mieux les concepts de la recherche; choix de mots-clés et de termes à retenir; trouver des équivalences (synonymes, acronymes et mots en anglais ou dans une autre langue). 13
  • 14. Recherche sur les termes exactes Exemple concernant l'exactitude des termes anglais sur Google...     Source: http://www.googleguide.com/interpreting_queries.html 14
  • 15. La stratégie de recherche inclut la traduction de mots clés et leur regroupement en fonctions de règles syntaxiques propres aux moteurs de recherche. On peut combiner des mots ou des termes dans le but de traduire la requête en une expression de recherche. Attention aux majuscules et minuscules sur certains moteurs Requête saisie en minuscules Toutes les occurrences seront recherchées : ibm trouve ibm, IBM ou Ibm Requête saisie en majuscules Idem: IBM trouve IBM, ibm, Ibm ou IbM Lettres accentuées L'occurrence exacte est recherchée : électricité trouve électricité mais pas electricite ou electricité (HotBot) Requête saisie sans accents Toutes les occurrences sont recherchées : electricite trouve electricite, électricité ou electricité (pas toujours vrai sur certains moteurs) 15
  • 16. Requête saisie sans accents Toutes les occurrences sont recherchées : electricite trouve electricite, électricité ou electricité (pas toujours vrai sur certains moteurs). Ordre des mots Sur certains moteurs, la recherche (Paris Montréal) ne donne pas les mêmes résultats que la recherche (Montréal Paris) surtout pour le classement des résultats. Majuscules, minuscules et accents sur Google Les recherches Google ne tiennent pas compte de la « casse » des lettres (MAJUSCULES/ minuscules). Quelle que soit la typographie utilisée, Google interprète toujours les lettres composant vos termes de recherche comme des minuscules. Par défaut, les recherches Google ne tiennent pas compte des accents ou autres signes diacritiques (cédille, tilde espagnol, umlaut allemand, etc.). Ainsi les termes [FRANÇAIS] et [FRANCAIS] retrouvent les mêmes pages. Pour indiquer que ces deux termes ont une signification différente, utilisez-les l’un après l’autre. Google ne prend plus en compte le signe plus ( + ) devant un mot. Pour certains mots français dont la graphie est semblable à l'anglais (éléphant/elephant), il vaut mieux insérer les accents, SI on veut obtenir uniquement des documents en français.   Par contre, pour les mots français dont la graphie n'a pas de correspondance en anglais, on favorisera un meilleur taux de rappel (résultat) si le mot en question n'est pas accentué, i.e. zebre ou lieu de zèbre. 16
  • 17. Les 3 opérateurs "booléens" Nommés ainsi en l'honneur de Georges Boole (1815-1864) mathématicien et logicien anglais, inventeur de la logique symbolique moderne et de l'algèbre booléienne. 1-(AND) (Principe d'association) Représenté par le symbole + ou la saisie en majuscules AND. Sur Google, le + est implicite et on ne peut plus l’utiliser pour «forcer» la présence d’un mot. Il faut utiliser l’expression (champ) intext: ou la fonction Mot à mot (voir menu dans la colonne de gauche de Google) Correspond à la conjonction ET en français. Exemple : la requête moteur de recherche en français force Google à trouver les pages qui contiennent à la fois les mots moteur ET recherche ET français. +moteur +recherche +français Dans certains cas, Google peut omettre certains mots de votre expression de recherche... Les articles, adjectifs indéfinis, préposition et/ou déterminants de toutes sortes (le, la, les, en, des, du, pour, et, ou etc..) sont ignorés. Les Américains appellent ces mots des "Stop Words" ou mots-vides. 17
  • 18. 2-(OR/OU)(Principe de regroupement) Parfois représenté par le symbole ( | ) Correspond à la conjonction OU en français. Exemple : moteur OU recherche OU français force le moteur à trouver les pages qui contiennent l'un ou l'autre des mots, soit moteur, soit recherche, soit français ou les trois. Avec Google, l'opérateur OU doit être saisi en MAJUSCULE obligatoirement. Source:http://support.google.com/websearch/bin/answer.py?hl=fr&answer=136861&topic=1221265&ctx=topic Le sigle | est rarement utilisé pour le OU mais fonctionne dans Google. 18
  • 19. La recherche «adaptée»... Les résultats obtenus par ma propre recherche risquent d’être assez différents des vôtres ! Quand Google omet des mots que vous avez inscrits... Source: Dear Google, stop messing with my search (Karen Blakeman) http://www.rba.co.uk/wordpress/2011/11/08/dear-google-stop-messing-with-my-search/ 19
  • 20. Dans les deux exemples suivants, le moteur tentera de trouver des pages contenant au moins le premier de ces mots, les deux premiers ou les trois à la fois: blouse, shirt, chemise. Cliquez sur les expressions de recherche suivantes (si ça ne fonctionne pas, réécrivez-les telles quelles dans Google…) [ blouse OU shirt OU chemise ] [ blouse|shirt|chemise ] Remarque: avec l'opérateur OR un espace doit précéder le mot alors que le signe | ne nécessite aucun espace précédant le mot. Source: http://www.googleguide.com/or_operator.html 20
  • 21. 3-(NOT/ANDNOT)(Principe d'exclusion) Représenté par le symbole (-) Correspond à SAUF/Excepté en français. Exemple : moteur -voiture forcerait le moteur à trouver les pages qui contiennent le mot moteur mais SANS le mot voiture. Avec Google, l'opérateur (-) doit être utilisé devant le mot à exclure (sans espace) et non le NOT ou ANDNOT Si on veut trouver plus facilement une recette de "salsa", on risque d'avoir de meilleurs résultats avec: En anglais: [ salsa -danse] j’obtiens des résultats reliés à la danse ? En anglais: [ salsa salsa -dance ] La répétition du mot salsa ne semble pas avoir porté fruit... En français [ salsa -musique -danse -cours ] Avec la combinaison suivante, je devrais trouver en théorie des informations avec les mots moteur et hybride mais sans les mots voiture et automobile. Les résultats ne sont pas très concluants... [-voiture -automobile moteur hybride] Différence avec l'ordre suivant ? [moteur hybride -voiture -automobile] [moteur moteur hybride -voiture -automobile] et avec la répétition du mot moteur ? Combien de mots-clés peut-on utiliser dans une requête ? Jusqu'à 32 mots incluant les opérateurs mais pas les "stop-words", i.e. les articles, pronoms ou conjonctions, etc.: Exemple: le, du, des, quand, ou, où (mots-vides) 21
  • 22. Source: Advanced Web Searching (Karen Blakeman) http://fr.slideshare.net/KarenBlakeman/advanced-web-searching-ifeg-3rd-april-2012 22
  • 23. L'utilisation de parenthèses (Hotbot) Lorsqu'on utilise simultanément plusieurs opérateurs booléens pour raffiner une recherche, on peut utiliser les parenthèses. Exemples : salade (thon AND Crabe) -Cesar = Je veux avoir des informations sur des salades de thon, de crabe ou les deux, mais pas d'informations sur la salade césar Les parenthèses permettent aussi de coupler des requêtes : Exemple : (+moteur +voiture) -(+moteur +recherche) Seul Hotbot acceptait encore bien les parenthèses... 23
  • 24. Les opérateurs de proximité L'adjacence (ADJ) ( base de données) Pour introduire une proximité nette entre les mots Exemple : Relations ADJ Publiques. Dans Google «Relations Publiques» (ou fonction Mot à mot) Public ADJ Relations N.B.: Très peu de moteurs acceptent l'adjacence (ADJ) et les résultats sont peu concluants dans Google avec cet opérateur...mais cela pourrait être utile ailleurs... La proximité (~) (base de données) Pour introduire une notion de proximité entre des mots mais pas aussi nette que l’ADJ. Les mots doivent être proches l'un de l'autre. Représenté par le sigle NEAR ou ONEAR et aussi par le symbole ~ Exemple : conception AND fabrication NEAR ordinateur ou computer NEAR translation = computer ~translation Il s'agit donc d'une recherche sur la conception et la fabrication assistées par ordinateur (CAO-FAO) et sur la traduction assistée par ordinateur (TAO). 24
  • 25. Dans Google, on utilise le symbole ~ pour trouver un synonyme du mot qu'on fait précédé par ~. Exemple: [~portable] Exemple: [~portable téléphonie -ordinateur] Google trouve des informations similaires à quelques mots ou à tous les mots d'une requête précédée du ~ Le masque (?) Le masque sert à spécifier le nombre exact de caractères à rechercher (ou quand on cherche des mots différenciés que par un seul caractère) On représente le masque par le symbole ? (interrogation) wom?n (woman, women) français?? (française et françaises) 25
  • 26. Les guillemets Pour trouver un groupe de mots ou une phrase exacte. Pour trouver une expression particulière... On utilisera les guillemets. Représenté par "_" Exemple: "moteur de recherche" recherche les trois mots les uns à côté des autres et dans cet ordre. "Histoire de la renaissance italienne" ou "Post-secondary education in the USA" N.B.: Les guillemets fonctionnent assez bien avec certains «autres» moteurs mais parfois Google demande de les retirer... 26
  • 27. 27
  • 28. La troncature (base de données) Pour faire une recherche sur une partie d'un mot. Utilisez la troncature pour obtenir de l'information à partir d'un même radical (troncature à gauche) ou d'un suffixe (troncature à droite). Représentée par le symbole * (astérisque) appelé aussi en anglais Wildcard Exemples: bio* peut chercher.. (biologie, biographie, biochimie, biotechnologie, biochemistry, biography, biology, etc.) *sexuel peut chercher… (transexuel, homosexuel, bisexuel) Notez bien que - dans Google - la troncature placée avant ou après un mot peut chercher aussi des termes généralement associés au mot en question (dans une requête plus complexe). Voir diapo #57 par exemple. 28
  • 29. Avec Google on peut utiliser le * pour tenter de trouver un ou des mots manquants dans une phrase ou pour trouver des ressources dans lesquelles apparaissent des mots qu'on fait précéder du signe * Exemple: [*google *ma *vie] Si vous n'êtes pas certain du titre d'un livre (ou d’une chanson) mais que vous en connaissez quelques mots, Google peut vous aider à retrouver le titre précis. Comment s'intitulait déjà un des livres de J.K. Rowling? ? ? ? [Harry Potter et les * de la mort] ? ? ? Source: http://www.googleguide.com/wildcard_operator.html 29
  • 30. Les méta-données ou la recherche par zone spécifique Il est aussi très utile de connaître la spécificité des documents Internet en utilisant les métadonnées ou les champs à inscrire dans la fenêtre de requête. On nomme aussi ces champs ou métadonnées recherche linguistique ou par zone. Exemples de métadonnées (champs par zones) les plus connues : Avec Google: title: ou intitle: Récupère les sites dont le titre spécifié apparaît dans une page. title:soleil trouve toutes les pages contenant le mot soleil dans le titre. N.B.: Parfois ce champ s'écrit intitle: au lieu de title: url: ou inurl: Récupère selon combinaison (nom du serveur, répertoire, fichier) url:jardin récupère ou trouve toutes les pages de tous les serveurs ayant le mot jardin à n'importe quel endroit : nom de domaine (URL), répertoire d'accès, nom de fichiers. 30
  • 31. intext: Récupère des documents contenant un mot particulier. intext:impluvium trouve des documents contenant le mot impluvium. inlink: curation inlink:lapresse.ca Recherche des documents qui contiennent le mot curation soit dans le site de www.lapresse.ca ou qui nomme la presse ou y pointe un lien. site: et -site: Recherche à l’intérieur d’un site spécifique gaz de schiste site:gouv.qc.ca trouve des documents contenant les mots gaz de schiste, mais seulement sur le site du gouvernement du Québec L’expression -site: est particulièrement utile pour exclure spécifiquement un nom de domaine. gaz de schiste -site:gouv.qc.ca gaz de schiste -url:gouv.qc.ca (-url fonctionne aussi bien) 31
  • 32. Est-il possible de combiner une zone avec un opérateur ? OUI ! Exemples : allinurl: www.honda.com +hybrid (mais on n’a plus besoin du + chez Google) On recherche des documents qui contiennent le mot hybride sur le site http://www.honda.com/ intitle:education superieure fr On recherche des ressources dont le titre porte précisément sur l'éducation supérieure et on tient à ce que ces informations soient en français. filetype:pdf curation francais (cherche un document Pdf sur la curation en français) Peut on combiner deux zones ? NON ! OUI ! (voir prochaine diapo) inurl:garden intext:roses Les opérateurs (anciens moteurs) http://searchengineshowdown.com/features/ Boolean Logic http://internettutorials.net/boolean.asp 32
  • 33. Source:  How to use Google Search More effectively (Josh Catone) [Infog.] http://mashable.com/2011/11/24/google-search-infographic/ 33
  • 34. OU ? Google decides that coots are really lions (Karen Blakeman) http://www.rba.co.uk/wordpress/2011/02/12/google-decides-that-coots-are-really-lions/ Update: http://www.rba.co.uk/wordpress/2011/02/21/update-on-coots-vs-lions/ Source : Image du macroule Auteur: Luc Viatour http://commons.wikimedia.org/wiki/User:Lviatour http://fr.wikipedia.org/wiki/Fichier:Fulica_atra_Luc_Viatour.jpg Source: Image du lion Auteur: James Temple http://www.flickr.com/photos/82932964@N00/312326732 https://commons.wikimedia.org/wiki/File:Panthera_leo_Sabi_Sands.jpg#filehistory 34
  • 35. Source: Advanced Web Searching (Karen Blakeman) http://fr.slideshare.net/KarenBlakeman/advanced-web-searching-ifeg-3rd-april-2012 35
  • 36. Tendances en recherche web Socialisation Personnalisation Localisation (mobilité) Voir mon billet au sujet de La recherche web en 2012 (et la présentation de Karen Blakeman) http://patriceleroux.blogspot.ca/2012/04/la-recherche-web-en-2012.html 36
  • 37. (RAPPEL) Personnalisation de la recherche... Source: Eli Pariser, Beware online «filter bubbles» (2011) http://www.ted.com/talks/eli_pariser_beware_online_filter_bubbles.html Voir aussi : Google Personalisation: Web History isn’t the only problem (Karen Blakeman) http://www.rba.co.uk/wordpress/2012/02/22/google-personalisation-web-history-isnt-the-only-problem/ 37
  • 38. Source: Advanced Web Searching (Karen Blakeman) http://fr.slideshare.net/KarenBlakeman/advanced-web-searching-ifeg-3rd-april-2012 Google Dashboard https://www.google.com/dashboard/ 38
  • 39. Visualiser et gérer toutes ses données avec le tableau de bord Google (Dashboard) https://www.google.com/settings/dashboard?hl=fr 39
  • 40. Télécharger (et archiver toutes ses données de Google) avec le service Takeout https://www.google.com/settings/exportdata?hl=fr Voir aussi The Data Liberation Front http://www.dataliberation.org/ 40
  • 41. 41
  • 42. Règles de confidentialité Google http://www.google.com/policies/privacy/ Voir aussi: Google personalisation: web history isn’t the only problem (Karen Blakeman) http://www.rba.co.uk/wordpress/2012/02/22/google-personalisation-web-history-isnt-the-only-problem/ 42
  • 43. Supprimer les cookies permet de dépersonnaliser la recherche selon vos activités passées et votre historique de navigation... 43
  • 45. Sécurité numérique, les bases https://www.wefightcensorship.org/fr/article/securite-numerique-baseshtml.html 45
  • 46. Google: un cas particulier (ancienne interface ci-dessus) http://www.google.ca/ 46
  • 47. Google: Pas seulement qu’un algorithme... Source: http://www.davidcarlehq.com/2012/09/le-guide-de-levaluateur-google-coule-en-ligne-voici-les-criteres-de-qualite-de- lalgorithme-naturel/ Lien vers le document «coulé»... : http://pdfcast.org/pdf/google-guidelines Voir aussi: Google Search Ranking factors 2012 (Martin Missfeldt) http://www.tagseoblog.com/google-search-ranking-factors-2012-infographic 47
  • 49. [...] «So what’s our straightforward definition of the ideal search engine? Your best friend with instant access to all the world’s facts and a photographic memory of everything you’ve seen and know. That search engine could tailor answers to you based on your preferences, your existing knowledge and the best available information; it could ask for clarification and present the answers in whatever setting or media worked best.» [...] Marissa Mayer, V-P, Recherche-Produits et expérience utilisateur (chez Google jusqu’en 2012) Source: http://googleblog.blogspot.com/2008/09/future-of-search.html Une pub de Google durant le SuperBowl de 2010 (une vidéo disponible depuis plusieurs mois...) http://www.youtube.com/watch?v=nnsSUqgkDwU Is Google Making Us Stupid ? (Nicholas Carr) http://www.theatlantic.com/doc/200807/google Traduction française :(Framablog) http://www.framablog.org/index.php/post/2008/12/07/est-ce-que-google-nous-rend-idiot Are we renting our collective intelligence to Google ? (Matteo Pasquinelli) http://mastersofmedia.hum.uva.nl/2009/11/16/matteo-pasquinelli-are-we-renting-our-collective-intelligence-to- google/ 49
  • 50. La fonction Recherche avancée de Google n’est plus aussi apparente qu’auparavant... Elle apparaît dans le menu outil lors de l’affichage d’un résultat de recherche et non plus sur sa page d’accueil Il faut développer le réflexe d’utiliser les fonctions de recherche avancée... http://www.google.ca/advanced_search?hl=fr 50
  • 51. 51
  • 52. PageRank de Google PageRank est un champion de la démocratie : il profite des innombrables liens du Web pour évaluer le contenu des pages Web -- et leur pertinence vis-à-vis des requêtes exprimées. Le principe de PageRank est simple : tout lien pointant de la page A à la page B est considéré comme un vote de la page A en faveur de la page B. Toutefois, Google ne limite pas son évaluation au nombre de « votes » (liens) reçus par la page ; il procède également à une analyse de la page qui contient le lien. Les liens présents dans des pages jugées importantes par Google ont plus de « poids », et contribuent ainsi à « élire » d'autres pages. Source:http://www.google.ca/intl/fr/why_use.html Plusieurs centaines de millions de requêtes par jour ! Des fonctions et services moins connus ou utilisés... Le choix parmi 45 langues (2012): http://www.google.ca/preferences?hl=fr#languages   Google News/Actualités (+4500 sources médias dont 500 en français) http://news.google.com/news?cf=all&ned=fr_ca&ict=ln   Alerte Google (monitoring de l'actualité) http://www.google.ca/alerts http://www.googlealert.com   Google Images http://images.google.ca/ Google Scholar (en français aussi maintenant) http://scholar.google.com/ 52
  • 53. Google...suite Google Blog Search http://blogsearch.google.com/ La numérisation de tous les livres... http://books.google.com/ Localisation de magasins pour les achats:(ancien Froogle/Google Shopping) http://www.google.com/products Recherches dans un lieu géographique précis. (Google Maps) http://local.google.com/ Google Earth (Images satellites...) http://earth.google.com/ Rechercher dans les données publiques http://www.google.com/publicdata/directory# Moteur de recherches personnalisées Google http://www.google.com/cse/ Google (vue d'ensemble des services et options) http://www.google.com/help/features.html Le blogue Inside Search http://insidesearch.blogspot.ca/ Quelques bonnes références: Guide Google de Nancy Blachman http://www.googleguide.com/ Centre d’aide de Google:http://www.google.com/support/ 53
  • 54. http://translate.google.com/ Voir aussi: A fresh look for Google translate on iOS... http://insidesearch.blogspot.ca/2013/09/a-fresh-look-for-google-translate-on.html 54
  • 55. Le niveau de lecture (Reading level) ne semble pas exister dans l’interface française... Advanced=associé à des recherches universitaires ou des terminologies spécialisées Cette fonction semble fonctionner qu’en anglais.... 55
  • 56. Tendances des recherches sur Google http://www.google.com/insights/search/?hl=fr 56
  • 59. Google Goggles Recherche visuelle/photographique Il n’y a plus d’entrée de texte... Application pour mobile http://www.google.com/mobile/goggles/#text Voir entrevue avec Marissa Mayer, V-P Google, produits de recherche et expérience-utilisateur (LeWeb/Paris/2009) http://www.ustream.tv/recorded/2759667 Pour la musique, voir http://www.shazam.com/ 59
  • 61. Recherche par image (tout de même assez précis comme résultat) http://images.google.fr/ 61
  • 62. Recherche par image par le biais de Google Images http://images.google.fr/ Aucune différence entre une image de moi, une image prise par moi (de quelqu’un d’autre) ou d’une image de moi prise par quelqu’un d’autre...ou encore d’images d’autres Patrice Leroux de ce monde... 62
  • 63. Google Art Project ( entente avec plus de 150 musées et galeries) http://www.google.com/culturalinstitute/project/art-project?hl=fr 63
  • 64. Pourquoi la vidéo domine la recherche ? (enfin presque...) «Pourquoi préfère-t-on passer plus de temps à regarder la TV qu’à lire la presse ? Nous sommes tout simplement fainéants. C’est plus facile et surtout plus accessible de s’informer avec des images animées, qu’avec du texte statique.» (Laurent Maisonnave) http://www.youtube.com/ YouTube 1er moteur de recherche devant Google (Laurent Maisonnave) http://zelaurent.com/video-news/youtube-1er-moteur-de-recherche-devant-google/ 64
  • 65. Recherche sociale de Google: http://www.youtube.com/watch?v=aYf5iSA6t6g Accéder aux recherches sociales de Google: http://www.google.com/support/websearch/bin/answer.py?answer=165228 Explication vidéo de Matt Cutts: http://www.youtube.com/watch?v=BlpTjP6h6Ms Voir aussi Social Search: http://www.socialsearch.com/ 65
  • 66. Recherche avec les mots Internet et relations publiques dans Google+ parmi Tout (la priorité des résultats proviendraient tout de même de mes cercles). 66
  • 67. Recherche avec les mots Internet relations publiques dans Google avec la fonction Mot à mot Voir colonne de gauche sous Tous les résultats 67
  • 68. Recherche avec les mots New York dans Google+ parmi mes cercles 68
  • 69. Recherche avec les mots New York dans Google+ parmi la rubrique De vous (donc de moi seulement) 69
  • 70. Catalogues, annuaires et répertoires: Les informations sont constituées, organisées en catégories et même filtrées par des personnes. (pensez curation web) L'intervention humaine faisait en sorte que l'information était souvent moins à jour qu'avec les moteurs. Par contre, plusieurs répertoires sont devenus hybrides en intégrant à la fois un répertoire et un moteur. Exemple: Yahoo La recherche d'information se fait donc plutôt par navigation dans le classement (hiérarchies et répertoires structurés par des humains). On gagne en qualité ce qu’on perd en quantité ? Avec le phénomène «l’infobésité», les annuaires et catalogues pourraient renaître...(curation) Exemple : http://www.mahalo.com/ 70
  • 71. Répertoires et annuaires généralistes (quelques exemples) Purdue (OWL) Search & Directory list https://owl.english.purdue.edu/owl/resource/558/06/ Family Friendly Sites: http://familyfriendlysites.com/ World Site Index: http://www.worldsiteindex.com/ Greenstalk:http://www.greenstalk.com/ Open Directory Project (AOL): http://www.dmoz.org/ Links To Go: http://www.links2go.com/ Splash Directory: http://www.splashdirectory.com/ Global Web Links: http://www.global-weblinks.com/ Annuaires et répertoires spécialisés Jobboom:http://www.jobboom.com/ Passeport santé:http://www.passeportsante.net/ France Culture: http://www.culture.fr/fr/sections/ Voir aussi: Les 25 répertoires les plus puissants sur la toile http://www.searchenginepeople.com/francais/liste-des-25-repertoires-les-plus-puissants-sur-la-toile 71
  • 72. Internet Archive : un vrai trésor. http://archive.org/ À la recherche de sites disparus... avec son Way Back Machine (+150 milliards de documents) http://www.archive.org/ 72
  • 73. Autres moteurs HotBot:http://www.hotbot.com/ AOL Search:http://search.aol.com/ Lycos: http://www.lycos.com/ Search Cube: http://www.search-cube.com/ Exalead:http://www.exalead.com/search/ Quixey: http://www.quixey.com/ Référence Search Engine Watch http://searchenginewatch.com/reports 73
  • 74. Source: Advanced Web Searching (Karen Blakeman) http://fr.slideshare.net/KarenBlakeman/advanced-web-searching-ifeg-3rd-april-2012 Voir aussi: Sanity Checking Google (The Disruptive Searcher) http://disruptivesearcher.wordpress.com/2012/02/27/sanity-checking-google/ 74
  • 75. http://www.bing.com/ Introducing the New Bing: Spend Less Time Searching, More Time Doing http://www.bing.com/community/site_blogs/b/search/archive/2012/05/10/spend-less-time-searching-more-time-doing- introducing-the-new-bing.aspx Bing’s Advanced Search Operators: 8 Tips for Better Searches http://www.howtogeek.com/106751/how-to-use-bings-advanced-search-operators-8-tips-for-better-searches/ 75
  • 76. «I also don’t know which papers written by Scott Wilson were written by the Scott I know and which one’s were written by the Scott Wilson who is based at the University of British Columbia. Will the real Scott Wilson please stand up ! » Analyse du service Academic Search de Microsoft (Brian kelly) http://ukwebfocus.wordpress.com/2011/09/20/will-the-real-scott-wilson-please-stand-up-please-stand-up/ Academic Search de Microsoft http://academic.research.microsoft.com/ 76
  • 80. Pas de personnalisation ni de suivi (tracking) http://duckduckgo.com/ Voir aussi: http://duckduckgo.com/goodies.html Ce moteur a affiché une ressource que je ne retrouvais plus sur Google (avec mon nom comme requête...) Translating Tweetdeck: http://tweetdeck.posterous.com/translating-tweetdeck-the-next-five-languages 80
  • 81. Search Team ( vers de la recherche web collaborative ?) http://searchteam.com/ 81
  • 82. Recherche avancée de Flickr http://www.flickr.com/search/advanced/ Voir aussi http://www.morguefile.com/ 82
  • 83. Méta-moteurs MetaCrawler: http://www.metacrawler.com Beaucoup: http://www.beaucoup.com Surfwax:http://www.surfwax.com Dogpile: http://www.dogpile.com IceRocket: http://www.icerocket.com Applications à télécharger ? Pas nécessaire ! WebFerret:http://www.webferret.com(Win) Copernic:http://www.copernic.com (Win) Références: UC Berleley http://www.lib.berkeley.edu/TeachingLib/Guides/Internet/MetaSearch.html RBS Search strategies (Karen Blakeman) http://www.rba.co.uk/search/index.shtml 83
  • 84. http://ca.millionshort.com/ Moteur/répertoire qui retire jusqu’à un million de sites parmi les plus populaires du web dans ses pages de résultats... 84
  • 85. Différence entre Google et Million Short pour la même requête (moins le top 10k sites pour Million Short) 85
  • 86. Mais SURTOUT... Il faut lire les "modes d'emploi", les guides et les FAQ de chacun des moteurs et savoir comment utiliser les fonctions de recherche raffinée telles le "Advanced Search", le "Power Search" et le "Related Search". Apprenez à lire (à interpréter) rapidement les informations (sites) que vous retournent les moteurs, notamment grâce aux titres, aux résumés, à l'adresse web (nom de domaine)... 86
  • 87. Autres ressources pour la recherche Groupes de discussion http://groups.google.com/ BlogPulse http://www.blogpulse.com/ Technorati http://technorati.com/ La recherche de périodiques électroniques par le biais du réseau des bibliothèques de l'Université de Montréal Périodiques électroniques (UdeM) http://opurl.bib.umontreal.ca:9003/sfx_local/a-z/default Le portail de la Bibliothèque et Archives nationales du Québec http://www.banq.qc.ca/ Voir aussi Questia (Plus grande bibliothèque en ligne ?) http://www.questia.com/ 87
  • 88. Ne pas oublier Twitter pour la recherche en temps réel ! http://search.twitter.com Mais voir aussi OneRiot: http://www.oneriot.com Real-Time Search and your business http://www.clickz.com/3636242 88
  • 89. Utilisation des opérateurs pour plus de précision sur Twitter 89
  • 90. Problèmes ??? Difficultés ??? Pas assez de résultats ? (silence) Trouver de nouveaux synonymes, acronymes ou termes plus conceptuels se rapprochant de votre recherche. Trop de résultats ? (bruit) Utiliser les opérateurs booléens et combiner certains mots; Utiliser des métadonnés (champs); Utiliser les fonctions de recherche raffinée des moteurs. 90
  • 91. Évaluation et validation de l'information trouvée Quelques concepts importants: Fiabilité (auteur, expertise) Objectifs/Buts (éditorial, pour ou contre une cause?) Équilibre ( faits bruts, point de vue différent ?) Mise à jour (actualité, date de parution ?) Type de couverture (rapport complet, études, petit paragraphe ?) Les sources semblent bien documentées ? (liens fonctionnels, sites reconnus, etc.) Autres sources Web offrant lien vers le site en question ? Quel rang dans un moteur de recherche ? Équilibre ? (opinions, biais, pamphlet, autres points de vue ?) Types de référence offerts (Livre blanc, rapport, petit paragraphe ?) Pertinence (rapport statistique ou article) Réputation et crédibilité de la source (commanditaire ?) Reconnaissance professionnelle ou institutionnelle ? 91
  • 92. Si c'est écrit, c'est vrai ? (Réseau UQuébec) http://youtu.be/lXwgv8kq6rA Lire aussi «60 000 times faster than text»...Really ? (Darren Kuropatwa) http://adifference.blogspot.ca/2012/07/60-000-times-faster-than-text-really.html 92
  • 93. Quelques références utiles.... UQAM/Bibliothèques http://www.bibliotheques.uqam.ca/InfoSphere/sciences/module7/evaluer.html Déterminer la fiabilité de l’information (Bibliothèques UdeM) http://guides.bib.umontreal.ca/disciplines/74-Determiner-la-fiabilite-de-l-information Robert Harris/Virtual Salt http://www.virtualsalt.com/evalu8it.htm Évaluation de l’information présente sur Internet (Université de Lyon) http://sapristi-docinsa.insa-lyon.fr/conseils-pour-chercher/evaluer-linformation 93
  • 94. Le Web invisible ou profond... Quelques définitions Web Invisible: informations que les moteurs de recherche conventionnels ne peuvent trouver et répertorier. Web caché: synonyme de Web invisible. Web profond: terme utilisé d’abord par BrightPlanet qui le préfère à Web invisible. Selon BrightPlanet, les informations ne sont pas nécessairement invisibles mais plutôt cachées. Il s'agit d'apprendre comment les trouver ! Web de surface: informations disponibles par le biais des moteurs et répertoires. La majorité des gens ne savent pas que plusieurs documents parmi les plus crédibles du Web, c.-à-d. ceux qui font autorité, demeurent "invisibles" auprès des moteurs de recherche comme Google, Yahoo! ou Bing. La plupart de ces documents dits invisibles proviennent des bases de données des universités, bibliothèques, agences gouvernementales, associations, entreprises... partout dans le monde ! Références A+ DeepWeb (Wikipedia): http://en.wikipedia.org/wiki/Deep_web Inventeur du terme «DeepWeb» (Mike. K. Bergman) http://www.mkbergman.com/about-mike/ The DeepWeb Internet Tutorials http://www.internettutorials.net/deepweb.asp 94
  • 95. «99% des contenus du web profond demeurent accessibles dans le Web; cependant la plupart se trouve dans des bases de données que les moteurs n’indexent pas». (Steve Gruchawka) Références A+: Deep Web expliqué par osti.gov: http://www.youtube.com/watch?v=YskdGh8XU5I Invisible or Deep Web: What it is, How to find it, and Its inherent ambiguity (UC-Berkeley) http://www.lib.berkeley.edu/TeachingLib/Guides/Internet/InvisibleWeb.html Voir autre vidéo Deep Web: http://www.osti.gov/media/DeepWebVideo Source de l’image Iceberg: http://elibrary.icrisat.org/Google Search/Surface Web.htm Source du graphique: http://21cif.com/resources/materials/webinar/ 95
  • 96. Web profond: exemples de sites contenant des bases de donnés qu’il faut interroger pour accéder aux informations. Références A+: Steve Gruchawka: http://techdeepweb.com Source de l’image: http://pipl.com/help/deep-web/ 96
  • 97. Le Web profond, c'est aussi... Pages discrètes: existantes mais non liées par des hyperliens Bases de données accessibles à travers une requête ou formulaire Pages générées de façon dynamique (ASP, Cold Fusion); Il est plus facile (et aussi moins onéreux) de générer une réponse de façon dynamique par requête plutôt que d'entreposer (archiver) toutes les pages possibles contenant toutes les réponses possibles de toutes les questions possibles... Pages contenant des scripts (code avec un "?" par exemple) Par exemple, Google Scholar ne peut que pointer vers des citations de références de périodiques très spécialisés (revues savantes, etc.). Il ne peut aller directement vers un contenu complet et protégé (mot de passe, abonnement payant, etc.) des bases de données des grandes universités. Véritable Intranet (entre les murs d'un immeuble, sans plus) Ex: Compagnies d'assurance Intranet/Extranet/ou wiki interne: Le wiki interne de la Faculté de l'éducation permanente https://intrawiki.umontreal.ca/ Une recherche dans une bibliothèque virtuelle. (La requête disparaît lorsque la session se termine). 97
  • 98. Pourquoi les moteurs n'indexent pas tout le Web ? Les robots des moteurs sont surtout conçus pour chercher des pages en HTML (statiques) qui reposent dans un serveur. Depuis 2005-2006,plusieurs moteurs comme Google peuvent trouver des pages dynamiques (avec un lien stable)... Un moteur ne peut pas "penser" ni taper du texte...(code utilisateur, mot de passe, autre texte, opérateurs propres au moteur de recherche interne). On entend souvent dire que les méthodes de recherche de base et leur technologies n'ont pas évolué de manière vraiment significative depuis les débuts d'Internet... On commence à entendre parler de "smart robots" qui pourraient indexés le Web profond. C’est déjà commencé... Seuls des fichiers HTML, les fichiers musicaux ( MP3, midi, etc.) et certaines images (gif, jpg) accompagnés de texte sont indexés convenablement. Tout ce qui est en «flash» n’est pas indexé.... 98
  • 99. Comment trouver des informations du Web profond ? Pensez toujours en fonctions des bases de données Bases de données: “Ensemble structuré d'éléments d'information, généralement agencés sous forme de tables, dans lesquels les données sont organisées selon certains critères en vue de permettre leur exploitation”. Source: Grand dictionnaire http://gdt.oqlf.gouv.qc.ca/ficheOqlf.aspx?Id_Fiche=8355656 Mot clé à ajouter à votre requête: database Certains répertoires du Web permettent la recherche par mot clé ou par navigation à l'intérieur de liens pointant vers des bases de données... Exemples (par où commencer): Infomine: http://infomine.ucr.edu Internet Public Library (IPL2): http://www.ipl.org   Répertoire des bases de données gratuites disponibles dans Internet http://dadi.univ-lyon1.fr/ Libdex (Index des grandes bibliothèques du monde entier) http://www.libdex.com/ 99
  • 100. 1e niveau de recherche: Accès à une base de données par le biais d’un moteur conventionnel. 2e niveau:interrogation profonde d’une base de données. Avec Google, par exemple, on peut trouver des bases de données en ajoutant comme mots clés le mot database: Exemples simples de requêtes de recherche: Accident Avion OR Plane +database (Avec Google) www.google.ca Languages database (Avec Google) database Toxic Products (Google) Autres mots clés à utiliser pour faire des recherches dans le Web profond, en plus des mots reliés à une industrie particulière: Portal Compliance Index Références A+ Research Beyond Google: http://oedb.org/library/college-basics/research-beyond-google 100
  • 101. Web Profond/Recherche sémantique Quelques ressources List of Academic databases and search engines http://en.wikipedia.org/wiki/List_of_academic_databases_and_search_engines Hakia:http://www.hakia.com Quintura:http://www.quintura.com Biznar:http://biznar.com/biznar/ Complete planet: http://www.completeplanet.com Pipl:http://www.pipl.com DeepPeep:http://www.deeppeep.org Internet Archive: http://www.archive.org Beaucoup: http://www.beaucoup.com IncyWincy: http://www.incywincy.com/ Deep Web Research 2010 (Marcus P. Zellman) http://www.llrx.com/features/deepweb2010.htm Exploring a DeepWeb that Google can’t grasp http://www.nytimes.com/2009/02/23/technology/internet/23search.html?_r=1&th&emc=th Voir aussi:Ressources d’images (web profond) http://www.readwriteweb.com/archives/ digital_image_resources_on_the_deep_web.php 101
  • 102. Exemples de base de donnés du Web profond (art, littérature, gouvernements, affaires, etc.) Musée du Louvre: http://www.louvre.fr/llv/oeuvres/bdd_oeuvre.jsp?bmLocale=fr_FR Musée Guggenheim: http://www.guggenheim.org/new-york/collections/collection-online Smithsonian Institution:http://www.siris.si.edu Library of Congress:http://www.loc.gov/search/new/ Projet Gutenberg:http://www.gutenberg.org/wiki/Main_Page US Consumer Product Safety Commission:http://www.cpsc.gov/cpscpub/prerel/ prerel.html American Association of Advertising Agencies: http://www.aaaa.org/eweb/ dynamicpage.aspx?webcode=findagency Hoovers: http://www.hoovers.com Documents de la CIA (Accès information/FOI): http://www.foia.cia.gov FreeLunch:http://www.economy.com/freelunch/default.asp FlightWise:http://flightwise.com/default.aspx Voir aussi: 99 Resources to Research and Mine the Invisible Web http://www.collegedegree.com/library/college-life/99-resources-to/ 102
  • 103. Un wiki offrant une base de données (entre autres) http://www.alacrawiki.com/ 103
  • 104. L'ambiguïté du Web invisible...   Selon les spécialistes en sciences de l'information de Berkeley, on ne peut toujours savoir ou prévoir quels types de sites (ou portions de sites) font partie du Web invisible. Voici quelques facteurs :   Quels sites offrent le contenu de leur base de données en pages statiques (visible, hybride, invisible) ? Politique d'inclusion ou d'exclusion des moteurs de recherche. Autres exemples de sites dits invisibles NASA Image Exchange http://nix.nasa.gov/ JSTOR project http://www.jstor.org Right-to-Know Network http://www.rtk.net/ National Climatic Data Center http://www.ncdc.noaa.gov/oa/ncdc.html Voir aussi Search Engine Land http://searchengineland.com 104
  • 105. Accès à des données publiques via Google http://www.google.com/publicdata/directory 105
  • 106. L'ambiguïté du Web invisible... Source: Deep Web: 20,000 lieues sous Google http://leblogalupus.com/2013/08/25/deep-web-20000-lieues-sous-google/ 106
  • 107. Une recherche efficace et exhaustive favorisera une approche moteur et une approche répertoire multiples. Il faut en effet passer à travers plusieurs outils de recherche. Évitez d’utiliser qu'un seul outil de recherche. Bonne recherche ! 107
  • 108. Merci de votre attention Patrice Leroux patrice.leroux@umontreal.ca http://twitter.com/patriceleroux http://patriceleroux.blogspot.com/ 108