SlideShare une entreprise Scribd logo
1  sur  69
REP2400  Internet et relations publiques ,[object Object],[object Object]
Quelques mythes On trouve tout dans Internet C'est facile de chercher et de trouver Les sources sont fiables et à jour... LES RECHERCHES DANS INTERNET PEUVENT SE FAIRE À PARTIR  DES RESSOURCES SUIVANTES, ENTRE AUTRES : Moteurs de recherche et Annuaires  (catologues/répertoires) + Les Newgroups (groupes de discussion) dont les contenus peuvent être accessibles avec un  lecteur de nouvelles ... http://alt.binaries.movies.french.usenetor.com/ http://groups.google.com/group/tourisme-recherches-institutions-pratiques?lnk= Par le biais du web, les «news» étaient accessibles avec   Google Groupe s  (désactivé en 2011 mais 20 ans d’archives toujours disponibles...) Les blogues Certains réseaux sociaux ouverts (ou par compte Google) Sites de signets sociaux Twitter (temps réel) Le Web profond dit invisible
[object Object],[object Object]
[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object]
La recherche dans Internet (WWW) Comment les données sont-elles cataloguées et indexées ? Quelques outils de recherche disponibles. Les techniques à utiliser. Les comportements des chercheurs Vers la recherche collaborative ? ,[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object]
Catalogues, annuaires et répertoires: Les informations sont constituées, organisées en catégories et même filtrées par des  personnes .  L'intervention humaine faisait en sorte que l'information était souvent moins à jour qu'avec les moteurs.  Par contre, plusieurs répertoires sont devenus hybrides en intégrant à la fois un répertoire et un moteur. Exemple: Yahoo La recherche d'information se fait donc plutôt par  navigation   dans le classement (hiérarchies et répertoires structurés).   On gagne en qualité ce qu’on perd en quantité ? Avec le phénomène de la «curation», les annuaires et catalogues pourraient renaître...
Répertoires et annuaires généralistes (quelques exemples) Family Friendly Sites :  http://familyfriendlysites.com / World Site Index:   http://www.worldsiteindex.com / Greenstalk: http://www.greenstalk.com / Open Directory Project (AOL) :  http://www.dmoz.org/ Links To Go:   http://www.links2go.com / Splash Directory :  http://www.splashdirectory.com / Global Web Links :  http://www.global-weblinks.com / Annuaires et répertoires spécialisés Jobboom : http://www.jobboom.com / Passeport santé : http://www.passeportsante.net / Branchez-vous (affaires) :  http://mesfinances.branchez-vous.com / France Culture:   http://www.culture.fr/fr/sections/ ,[object Object],[object Object],[object Object]
[object Object],[object Object]
[object Object],[object Object]
Moteurs de recherche : Il s'agit de programmes informatiques permettant de  faire des recherches dans les bases de données, conçues par les robots collecteurs. Dans Internet, les moteurs nous proposent leur information grâce à 3 fonctions ou étapes principales : 1) Un robot collecteur  : ( crawler, spider, bot) Il indexe le web automatiquement 24 heures par jour  en "glanant" ( en  scannant ) les informations dans le texte visible  d'un site (les premiers mots ou phrases) et dans le texte invisible (i.e. dans le code HTML, où on retrouve les  méta-étiquettes ). N.B. : Les meilleurs robots peuvent indexer plusieurs millions de pages par jour ( ils prennent quelques semaines pour faire le tour du Web en entier).
Le robot visite chaque page (ou pages représentatives)  d'un site (qui veut bien être trouvé ou découvert !) et lit  les pages ainsi que les hyperliens offerts dans le but de découvrir les autres pages (ou fichiers). 2) Un programme  crée un index ou catalogue immense   (base de données/statique) à partir des sites (fichiers) visités. 3) Un autre programme (le service de requêtes)  reçoit  votre requête, la compare à ses entrées de données (catalogue) et renvoie ses résultats. C'est dans la  fenêtre de requête  des moteurs qu'on tape les informations et qu'on interroge leurs bases de données. La recherche d'information se fait donc par  interrogation. Il existe des milliers de moteurs de recherche... Search Engine Colossus ( par pays, par thèmes, etc.) http://www.searchenginecolossus.com/
Google: un cas particulier ,[object Object]
[...] «So what’s our straightforward definition of the ideal search engine?  Your best friend with instant access to all the world’s facts and a photographic memory of everything you’ve seen and know. That search engine could tailor answers to you based on your preferences, your existing knowledge and the best available information; it could ask for clarification and present the answers in whatever setting or media worked best.» [...] Marissa Mayer, V-P, Recherche-Produits et expérience utilisateur (Google) Source:  http://googleblog.blogspot.com/2008/09/future-of-search.html ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object]
PageRank de Google PageRank est un champion de la démocratie : il profite des innombrables liens du Web pour évaluer le contenu des pages Web -- et leur pertinence vis-à-vis des requêtes exprimées. Le principe de PageRank est simple : tout lien pointant de la page A à la page B est considéré comme un vote de la page A en faveur de la page B. Toutefois, Google ne limite pas son évaluation au nombre de « votes » (liens) reçus par la page ; il procède également à une analyse de la page qui contient le lien. Les liens présents dans des pages jugées importantes par Google ont plus de « poids », et contribuent ainsi à « élire » d'autres pages. Source: http://www.google.ca/intl/fr/why_use.html Plusieurs centaines de millions de requêtes par jour ! Des fonctions et services moins connus ou utilisés... Le choix parmi 45 langues (2011): http://www.google.ca/preferences?hl=fr   Google News/Actualités (+4500 sources médias dont 500 en français) http://news.google.com/news?cf=all&ned=fr_ca&ict=ln   Alerte Google (monitoring de l'actualité) http://www.google.ca/alerts http://www.googlealert.com   Google Images http://images.google.ca / Google Scholar (anglais seulement) http://scholar.google.com/
Google...suite Google Blog Search http://blogsearch.google.com/ La numérisation de tous les livres... http://books.google.com /   Localisation de magasins pour les achats:(ancien Froogle) http://www.google.com/product s   Recherches dans un lieu géographique précis. (Google Maps) http://local.google.com /   Recherches selon un domaine spécialisé (Special Searches) Gouv. US http://www.google.com/options/specialsearches.htm l Google Earth (Images satellites...) http://earth.google.com / Google Experimental Labs http://www.google.com/experimental/ Google (vue d'ensemble des services et options) http://www.google.com/help/features.html   ,[object Object],[object Object],[object Object]
Pourquoi la vidéo domine la recherche ? (enfin presque...) Pourquoi préfère-t-on passer plus de temps à regarder la TV qu’à lire la presse ?  Nous sommes tout simplement fainéants . C’est plus facile et surtout plus accessible de s’informer avec des images animées, qu’avec du texte statique. (Laurent Maisonnave) ,[object Object],[object Object],[object Object]
[object Object],[object Object]
[object Object]
Google Goggles Recherche visuelle/photographique Il n’y a plus d’entrée de texte... Application pour mobile http://www.google.com/mobile/goggles/#text ,[object Object],[object Object],[object Object]
Une tentative de compétition envers les  agrégateurs  de nouvelles. Le succès n’est pas toujours assuré pour Google... Fastflip a été retiré en septembre 2011...  Et Google Wheel en juin 2011 ,[object Object]
Recherche sociale de Google: http://www.youtube.com/watch?v=aYf5iSA6t6g ,[object Object],[object Object],[object Object],[object Object],[object Object]
http://search.yahoo.com / http://ca.yahoo.com /
[object Object],[object Object],[object Object],[object Object]
[object Object]
Autres moteurs HotBot: http://www.hotbot.com / AOL Search: http://search.aol.com / Lycos:   http://www.lycos.com / Search Cube:   http://www.search-cube.com / Exalead: http://www.exalead.com/search/ Quixey:   http://www.quixey.com/ ,[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object]
Une recherche efficace et exhaustive favorisera une  approche moteur  et  une  approche répertoire  multiples.   Il faut en effet passer à travers plusieurs outils de recherche. Évitez d’utiliser qu'un seul outil de recherche.
Principales techniques de recherche   Identification du sujet :   Contexte et objet de la recherche; délimitation de la recherche (langues, pays, etc.); genre de réponses désirées. Quelle est votre connaissance sémantique du sujet ou de la discipline recherchée ? Formulation du sujet :   Quels mots ou expressions précisent ou traduisent le mieux les concepts de la recherche; choix de mots-clés et de termes à retenir; trouver des équivalences (synonymes, acronymes et mots en anglais ou dans une autre langue).
Recherche sur les termes exactes Exemple concernant l'exactitude des termes anglais sur Google...     Source:   http://www.googleguide.com/interpreting_queries.html
La stratégie de recherche inclut la traduction de mots clés et leur regroupement en fonctions de règles syntaxiques propres aux moteurs de recherche. On peut combiner des mots ou des termes dans le but de   traduire la requête en une  expression de recherche . Attention aux majuscules et minuscules sur certains moteurs Requête saisie en minuscules Toutes les occurrences seront recherchées :   ibm trouve ibm, IBM ou Ibm Requête saisie en majuscules Idem:   IBM trouve IBM,  ibm, Ibm ou IbM Lettres accentuées   L'occurrence exacte est recherchée :   électricité trouve électricité mais pas  electricite  ou  electricité  (HotBot) Requête saisie sans accents   Toutes les occurrences sont  recherchées :   electricite trouve electricite,  électricité  ou  electricité  (pas toujours vrai sur certains moteurs)
Requête saisie sans accents   Toutes les occurrences sont  recherchées :   electricite trouve electricite,  électricité  ou  electricité  (pas toujours vrai sur certains moteurs). Ordre des mots Sur certains moteurs, la recherche ( Paris Montréal ) ne donne pas les mêmes résultats que la recherche ( Monréal Paris ) surtout pour le classement des résultats. Majuscules, minuscules et accents sur Google Les recherches Google ne tiennent pas compte de la « casse » des lettres (MAJUSCULES/minuscules).  Quelle que soit la typographie utilisée, Google interprète toujours les lettres composant vos termes de recherche comme des minuscules.  Par défaut, les recherches Google ne tiennent pas compte des accents ou autres signes diacritiques (cédille, tilde espagnol,  umlaut  allemand, etc.). Ainsi les termes [FRANÇAIS] et [FRANCAIS] retrouvent les mêmes pages. Pour indiquer que ces deux termes ont une signification différente, utilisez un signe plus ( + ), soit les termes de recherche [+FRANÇAIS] et [+FRANCAIS]. Pour certains mots français dont la graphie est semblable à l'anglais (éléphant/elephant), il vaut mieux insérer les accents,  SI  on veut obtenir uniquement des documents  en français .   Par contre, pour les mots français dont la graphie n'a pas de correspondance en anglais, on favorisera un meilleur taux de rappel (résultat) si le mot en question n'est pas accentué, i.e.  zebre  ou lieu de  zèbre .
Les 3 opérateurs "booléens"   Nommés ainsi en l'honneur de Georges Boole (1815-1864) mathématicien et logicien anglais, inventeur de la logique symbolique moderne et de l'algèbre booléienne. 1 -( AND )  (Principe d'association)   Souvent représenté par le symbole  +  et la saisie en majuscules   AND.  Sur Google, par défaut. Le + est implicite. Correspond à la conjonction  ET  en français. Exemple : la requête  moteur de recherche en français  force Google à trouver les pages qui contiennent à la fois les mots  moteur   ET   recherche   ET  français . +moteur +recherche +français Les articles, adjectifs indéfinis, préposition et/ou déterminants de toutes sortes (le, la, les, en, des, du, pour, et, ou etc..) sont ignorés. Les Américains appellent ces mots des "Stop Words" ou mots-vides.  
2 -( OR ) (Principe de regroupement)   Parfois représenté par le symbole (  |  ) Correspond à la conjonction OU en français. Exemple :    moteur   OR  recherche   OR  français   force le moteur à trouver les pages qui contiennent l'un ou l'autre des mots, soit moteur, soit recherche, soit français ou les trois. Avec Google,  l'opérateur  OR  doit être saisi en MAJUSCULE obligatoirement. Le  OR  était  l'opérateur par défaut de Gigablast  http://gigablast.com/ Le sigle  |   est rarement utilisé pour le  OR  mais fonctionne dans Google.
Dans les deux exemples suivants, le moteur tentera de trouver des pages contenant au moins le premier de ces mots, les deux premiers ou les trois  à la fois: blouse, shirt, chemise. [  blouse OR shirt OR chemise  ] [  blouse|shirt|chemise  ] Remarque: avec l'opérateur  OR  un espace doit précéder le mot alors que le signe  |  ne nécessite aucun espace précédant le mot. Source:  http://www.googleguide.com/or_operator.html
3-( NOT/ANDNOT ) (Principe d'exclusion)   Représenté par le symbole ( - ) Correspond à   SAUF/Excepté  en français. Exemple :   +moteur  -voiture  force le moteur à trouver les pages qui contiennent le mot  moteur  mais  SANS  le mot  voiture .     Avec Google,  l'opérateur ( - ) doit être utilisé devant le mot à exclure (sans espace) et non le NOT ou ANDNOT Si on veut trouver plus facilement une recette de "salsa", on risque d'avoir de meilleurs résultats avec: En anglais: [  salsa –dance –class  ] En français [  salsa -musique -danse -cours  ] Avec la combinaison suivante, je devrais trouver en théorie des informations avec les mots  moteur  et  hybride  mais sans les mots  voiture  et  automobile [ -voiture -automobile moteur hybride ] Différence avec l'ordre suivant ? [ moteur hybride -voiture -automobile ] Combien de mots-clés peut-on utiliser dans une requête ? Jusqu'à 32 mots incluant les opérateurs mais pas les "stop-words", i.e. les articles, pronoms ou conjonctions, etc.: Exemple:  le, du, des, quand, ou, où (mots-vides)
L'utilisation de parenthèses Lorsqu'on utilise simultanément plusieurs opérateurs booléens pour raffiner une recherche, on peut utiliser les parenthèses.    Exemples : salade (thon AND Crabe) -Cesar = Je veux avoir des informations sur des salades de thon, de crabe ou les deux, mais pas d'informations sur la salade césar Les parenthèses permettent aussi de coupler des requêtes : Exemple :  (+moteur +voiture) -(+moteur +recherche) Seul Hotbot acceptait encore bien les parenthèses...
Les opérateurs de proximité L'adjacence    ( ADJ)  ( base de données) Pour introduire une proximité nette entre les mots Exemple : Relations  ADJ  Publiques  Public  ADJ  Relations    N.B.: Très peu de moteurs acceptent l'adjacence (ADJ) et les résultats sont peu concluants dans Google avec cet opérateur...mais cela pourrait être utile ailleurs... La proximité  ( ~)   (base de données) Pour introduire une notion de proximité entre des mots mais pas aussi nette que l’ADJ. Les mots doivent être  proches  l'un de l'autre.   Représenté par le sigle  NEAR  ou  ONEAR  et   aussi par le symbole   ~ Exemple : conception  AND  fabrication  NEAR  ordinateur  ou  computer  NEAR   translation = computer  ~ translation Il s'agit donc d'une recherche sur la conception et la fabrication assistées par ordinateur (CAO-FAO) et sur la traduction assistée par ordinateur (TAO).
Dans Google, on utilise le symbole  ~  pour trouver un synonyme du mot qu'on fait précédé par  ~. Exemple:  [ ~portable ] Exemple:  [ ~portable +téléphonie -ordinateur ] Google trouve des informations similaires à quelques mots ou à tous les mots d'une requête précédée du  ~ Le masque  (?) Le  masque  sert à spécifier le nombre exact de caractères à rechercher (ou quand on cherche des mots différenciés que par un seul caractère) On représente le masque par le symbole  ?  (interrogation) wom ? n  (wom a n, wom e n) français ??  (française et françaises)
Les guillemets Pour trouver un groupe de mots ou une phrase exacte. Pour trouver une expression particulière... On utilisera les guillemets . Représenté par  " _ " Exemple: "moteur de recherche" recherche les trois mots les uns à côté des autres et dans cet ordre. "Histoire de la renaissance italienne"   ou   "Post-secondary education in the USA" N.B.: Les guillemets fonctionnent assez bien avec certains «autres» moteurs mais parfois Google demande de les retirer...
La troncature   (base de donnés) Pour faire une recherche sur une partie d'un mot Utilisez la  troncature  pour obtenir de l'information à partir d'un même radical (troncature à gauche) ou d'un suffixe (troncature à droite). Représentée par le symbole  *  (astérisque) appelé aussi en anglais ( Wildcard  ) Exemples: bio *   (biologie, biographie, biochimie, biotechnologie,  biochemistry, biography, biology, etc.) * sexuel   (transexuel, homosexuel, bisexuel) mot *   ( moteur, moteur s , motard, motard s , motorisé, motte, motrice, etc.)
Avec Google on utilise le  *  pour tenter de trouver un ou des mots manquants dans une phrase ou pour trouver des ressources dans lesquelles apparaissent des mots qu'on fait précéder du signe  * Exemple:  [ google *ma *vie ] Si vous n'êtes pas certain du titre d'un livre (ou d’une chanson) mais que vous en connaissez quelques mots, Google peut vous aider à retrouver le titre précis. Comment s'intitulait déjà le célèbre livre de Dany Laferrière ? ? ? ? [  faire *l'amour *nègre  ] ? ? ?   Source:  http://www.googleguide.com/wildcard_operator.html
Les méta-données ou la recherche par zone spécifique   Il est aussi très utile de connaître la spécificité des documents Internet en utilisant les métadonnées ou les champs à inscrire dans la fenêtre de requête. On nomme aussi ces champs ou métadonnées  recherche linguistique ou par zone . Exemples de métadonnées (champs par zones) les plus connues : Avec Google, il faut faire précéder chacune par allin: title: ou allintitle: ou allin            Récupère les sites dont le titre spécifié apparaît dans une page.  allin:soleil  trouve toutes les pages contenant le mot soleil dans le  titre . N.B.: Parfois ce champ s'écrit  intitle:  ou lieu de  title: url: ou allinurl:            Récupère selon combinaison (nom du serveur, répertoire, fichier) url:jardin  récupère ou trouve toutes les pages de tous les serveurs ayant le mot jardin à n'importe quel endroit : nom de domaine (URL), répertoire d'accès, nom de fichiers.
text: allintext:           Récupère les pages contenant un mot particulier allintext:impluvium   trouve les pages contenant le terme impluvium like:           Récupère les pages semblables ou en rapport avec l'adresse like: www.amazon.com     récupère des sites vendant des livres semblables à amazon.com inlink:            Récupère les sites offrant un lien vers un site particulier (référence) inlink: www.cyberpresse.ca On recherche des documents (sites web) qui contiennent un lien vers une page de site dont l'adresse contient l'expression  www.cyberpresse.ca
Est-il possible de combiner une zone   avec un opérateur ?  OUI ! Exemples : allinurl: www.honda.com +hybrid On recherche des documents qui contiennent le mot hybride sur le site  www.honda.ca / allintitle:éducation supérieure +fr On recherche des sites ou pages web dont le titre porte  précisément sur l'éducation supérieure et on tient à ce  que ces informations proviennent de sites hébergés sur des  serveurs de France.  Peut on combiner deux  zones  ?  NON !   allinurl:garden allintext:css Les opérateurs (anciens moteurs) http://searchengineshowdown.com/features/ Boolean Logic http://internettutorials.net/boolean.asp
[object Object],[object Object]
Méta-moteurs MetaCrawler:   http://www.metacrawler.com / Beaucoup:   http://www.beaucoup.com / Surfwax : http://www.surfwax.com / Clusty:   http://clusty.com / Mamma: http://www.mamma.com / Dogpile:   http://www.dogpile.com / IceRocket:   http://www.icerocket.com / Applications à télécharger WebFerret: http://www.webferret.com / Copernic: http://www.copernic.com / Référence A+: UC Berleley http://www.lib.berkeley.edu/TeachingLib/Guides/Internet/MetaSearch.html
Mais SURTOUT... Il faut lire les "modes d'emploi", les guides et les FAQ de chacun des moteurs et savoir comment utiliser les fonctions de recherche raffinée telles le " Advanced Search ", le " Power Search " et le " Related Search ". Apprenez à lire (à interpréter) rapidement les informations (sites)  que vous retournent les moteurs, notamment grâce aux titres, aux résumés, à l'adresse web (nom de domaine)...
Autres ressources pour la recherche Groupes de discussion http://groups.google.com/ Recherche de blogues de Google http://blogsearch.google.fr/blogsearch/advanced_blog_search   BlogPulse http://www.blogpulse.com /   Technorati http://technorati.com/   La recherche de périodiques électroniques par le biais du réseau des bibliothèques de l'Université de Montréal Entente entre Eureka.cc et biblio branchée http://www.bib.umontreal.ca/SB/PEL/ Le portail de la Bibliothèque et Archives nationales du Québec http://www.banq.qc.ca/ Voir aussi Questia (Plus grande bibliothèque en ligne ?) http://www.questia.com/ À la recherche de sites disparus... sur Internet Archive avec son Way Back Machine (+150 milliards de documents) http://www.archive.org/
Problèmes ??? Difficultés ??? Pas assez de résultats ?  (silence) Trouver de nouveaux synonymes, acronymes ou termes plus conceptuels se rapprochant de votre recherche. Trop de résultats ?  (bruit)     Utiliser les opérateurs booléens et combiner certains mots; Utiliser des métadonnés (champs); Utiliser les fonctions de recherche raffinée des moteurs.
Si c'est écrit, c'est vrai ? (Réseau UQuébec) http://youtu.be/lXwgv8kq6rA
Évaluation et validation de l'information trouvée Quelques concepts importants: Fiabilité  (auteur, expertise) Objectifs /Buts (éditorial, pour ou contre une cause?) Équilibre  ( faits bruts, point de vue différent ?) Mise à jour  (actualité, date de parution ?) Type de couverture  (rapport complet, études, petit paragraphe ?) Les sources semblent bien documentées ?  (liens fonctionnels, sites reconnus, etc.) Autres sources Web offrant lien vers le site en question ? Quel rang dans un moteur de recherche ?  Équilibre ? (opinions, biais, pamphlet, autres points de vue ?) Types de référence offerts (Livre blanc, rapport, petit paragraphe ?) Pertinence (rapport statistique ou article) Réputation et crédibilité de la source (commanditaire ?) Reconnaissance professionnelle ou institutionnelle ?
Quelques références utiles.... UQAM/Bibliothèques http://www.bibliotheques.uqam.ca/InfoSphere/sciences/module7/evaluer.html Déterminer la fiabilité de l’information (Bibliothèques UdeM) http://guides.bib.umontreal.ca/disciplines/74-Determiner-la-fiabilite-de-l-information Robert Harris/Virtual Salt http://www.virtualsalt.com/evalu8it.htm Évaluation de l’information présente sur Internet (Université de Lyon) http://sapristi-docinsa.insa-lyon.fr/conseils-pour-chercher/evaluer-linformation
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Le Web invisible ou profond... Quelques définitions Web Invisible:  informations que les moteurs de recherche conventionnels ne peuvent trouver et répertorier. Web caché:  synonyme de Web invisible. Web profond:   terme utilisé d’abord par BrightPlanet qui le préfère à Web invisible. Selon BrightPlanet, les informations ne sont pas nécessairement invisibles mais plutôt cachées. Il s'agit d'apprendre comment les trouver ! Web de surface : informations disponibles par le biais des moteurs et répertoires. La majorité des gens ne savent pas que plusieurs documents parmi les plus crédibles du Web, c.-à-d. ceux qui font autorité, demeurent "invisibles" auprès des moteurs de recherche comme Google, Yahoo! ou Bing. La plupart de ces documents dits invisibles proviennent des  bases de données  des universités, bibliothèques, agences gouvernementales, associations, entreprises... partout dans le monde ! Références A+ DeepWeb (Wikipedia): http://en.wikipedia.org/wiki/Deep_web Inventeur du terme «DeepWeb» (Mike. K. Bergman) http://www.mkbergman.com/about-mike/ The DeepWeb Internet Tutorials http://www.internettutorials.net/deepweb.asp
«99% des contenus du web profond demeurent accessibles dans le Web; cependant la plupart se trouve dans des  bases de données  que les moteurs n’indexent pas».  (Steve Gruchawka) ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object]
Le Web profond, c'est aussi... Pages discrètes: existantes mais non liées par des hyperliens Bases de données accessibles à travers une  requête  ou  formulaire Pages générées de façon dynamique (ASP, Cold Fusion);  Il est plus facile (et aussi moins onéreux) de générer une réponse de façon dynamique par requête plutôt que d'entreposer (archiver) toutes les pages possibles contenant toutes les réponses possibles de toutes les questions possibles... Pages contenant des scripts (code avec un "?" par exemple) Par exemple,  Google Scholar   ne peut que pointer vers des citations de références de périodiques très spécialisés (revues savantes, etc.). Il ne peut aller directement vers un contenu complet et protégé (mot de passe, abonnement payant, etc.) des bases de données des grandes universités. Véritable Intranet (entre les murs d'un immeuble, sans plus) Ex: Compagnies d'assurance Intranet/Extranet: L'Intranet de la Faculté de l'éducation permanente http://ocean.sim.umontreal.ca/fep/ Une recherche dans une bibliothèque virtuelle.  ( La requête disparaît lorsque la session se termine ).
Pourquoi les moteurs n'indexent pas tout le Web ? Les robots des moteurs sont surtout conçus pour chercher des pages en HTML (statiques) qui reposent dans un serveur. Depuis 2005-2006,plusieurs moteurs comme Google peuvent trouver des pages dynamiques (avec un lien stable)... Un moteur ne peut pas "penser" ni taper du texte...(code utilisateur, mot de passe, autre texte, opérateurs propres au moteur de recherche interne). On entend souvent dire que les méthodes de recherche de base et leur technologies n'ont pas évolué de manière vraiment significative depuis les débuts d'Internet... On commence à entendre parler de "smart robots" qui pourraient indexés le Web profond .  C’est déjà commencé... Seuls des fichiers HTML, les fichiers musicaux ( MP3, midi, etc.) et certaines images (gif, jpg) accompagnés de texte sont indexés convenablement. Tout ce qui est en «flash» n’est pas indexé....
Comment trouver des informations du Web profond ? Pensez toujours en fonctions des  bases de données Bases de données: “ Ensemble structuré d'éléments d'information, généralement agencés sous forme de tables, dans lesquels les données sont organisées selon certains critères en vue de permettre leur exploitation”. Source: Grand dictionnaire  http://www.granddictionnaire.com/btml/fra/r_motclef/index800_1.asp Mot clé à ajouter à votre requête:  database Certains répertoires du Web permettent la recherche par mot clé ou par navigation à l'intérieur de liens pointant vers des bases de données... Exemples (par où commencer): Infomine:  http://infomine.ucr.edu Internet Public Library (IPL2):  http://www.ipl.org Intute:  http://www.intute.ac.uk  (jusqu’en 2014....)   Répertoire des bases de données gratuites disponibles dans Internet http://dadi.univ-lyon1.fr/ Libdex (Index des grandes bibliothèques du monde entier) http://www.libdex.com/
1e niveau de recherche: Accès à une base de données par le biais d’un moteur conventionnel. 2e niveau:interrogation profonde d’une base de données. Avec Google, par exemple, on peut trouver des bases de données en ajoutant comme mots clés le mot  database: Exemples simples de requêtes de recherche: Accident +Avion (plane) +databas e    (Avec Google)   www.google.ca Languages +database   (Avec Google) database +Toxic +Product s  (Google) Autres mots clés à utiliser pour faire des recherches dans le Web profond, en plus des mots reliés à une industrie particulière: Portal Compliance Index ,[object Object],[object Object],[object Object]
Web Profond/Recherche sémantique Quelques ressources Hakia: http://www.hakia.com Quintura: http://www.quintura.com Biznar: http://biznar.com/biznar/ Complete planet:  http://www.completeplanet.com Pipl: http://www.pipl.com DeepPeep: http://www.deeppeep.org Internet Archive:  http://www.archive.org Beaucoup:  http://www.beaucoup.com IncyWincy:  http://www.incywincy.com/ ,[object Object],[object Object],[object Object],[object Object],[object Object]
Exemples de base de donnés du Web profond  (art, littérature, gouvernements, affaires, etc.) Musée du Louvre:  http://www.louvre.fr/llv/oeuvres/bdd_oeuvre.jsp?bmLocale=fr_FR Musée Guggenheim:  http://www.guggenheim.org/new-york/collections/collection-online Smithsonian Institution: http://www.siris.si.edu Library of Congress: http://www.loc.gov/search/new/ Projet Gutenberg: http://www.gutenberg.org/wiki/Main_Page US Consumer Product Safety Commission: http://www.cpsc.gov/cpscpub/prerel/prerel.html American Association of Advertising Agencies:  http://www.aaaa.org/eweb/dynamicpage.aspx?webcode=findagency Hoovers:  http://www.hoovers.com Documents de la CIA (Accès information/FOI):  http://www.foia.cia.gov FreeLunch: http://www.economy.com/freelunch/default.asp FlightWise: http://flightwise.com/default.aspx ,[object Object],[object Object],[object Object]
L'ambiguïté du Web invisible...   Selon les spécialistes en sciences de l'information de Berkeley, on ne peut toujours savoir ou prévoir quels types de sites ( ou portions de sites) font partie du Web invisible.  Voici quelques facteurs :   Quels sites offrent le contenu de leur base de données en pages statiques ( visible ,  hybride ,  invisible ). Politique d'inclusion ou d'exclusion des moteurs de recherche. Autres exemples de sites dits invisibles NASA Image Exchange   http://nix.nasa.gov/ JSTOR project   http://www.jstor.org   Right-to-Know Network   http://www.rtk.net/ National Climatic Data Center   http://www.ncdc.noaa.gov/oa/ncdc.html Voir aussi Search Engine Land http://searchengineland.com
Merci de votre attention ,[object Object],[object Object],[object Object],[object Object]

Contenu connexe

Tendances

Quels outils pour quelles recherches ? Panorama des outils du web
Quels outils pour quelles recherches ? Panorama des outils du webQuels outils pour quelles recherches ? Panorama des outils du web
Quels outils pour quelles recherches ? Panorama des outils du webURFIST de Rennes
 
Outils de recherche du web hors Google
Outils de recherche du web hors GoogleOutils de recherche du web hors Google
Outils de recherche du web hors GoogleURFIST de Rennes
 
Les outils de recherche et veille sur le web
Les outils de recherche et veille sur le webLes outils de recherche et veille sur le web
Les outils de recherche et veille sur le webechangeurba
 
Moteurs de recherche, finir avec les idées reçues
Moteurs de recherche, finir avec les idées reçuesMoteurs de recherche, finir avec les idées reçues
Moteurs de recherche, finir avec les idées reçuesAref Jdey
 
Outils de recherche du web : approfondir Google
Outils de recherche du web : approfondir GoogleOutils de recherche du web : approfondir Google
Outils de recherche du web : approfondir GoogleURFIST de Rennes
 
Recherche eveillée sur Internet : mode d'emploi - BFR Consultants
Recherche eveillée sur Internet : mode d'emploi - BFR ConsultantsRecherche eveillée sur Internet : mode d'emploi - BFR Consultants
Recherche eveillée sur Internet : mode d'emploi - BFR ConsultantsBéatrice Foenix-Riou
 
Quelles alternatives à Google dans le domaine scientifique
Quelles alternatives à Google dans le domaine scientifiqueQuelles alternatives à Google dans le domaine scientifique
Quelles alternatives à Google dans le domaine scientifiqueBéatrice Foenix-Riou
 
Présentation du Web Invisible
Présentation du Web InvisiblePrésentation du Web Invisible
Présentation du Web InvisibleIANTE Réunion
 
Recherches sur Internet : Y a-t-il une vie sans Google ? BFR Consultants
Recherches sur Internet : Y a-t-il une vie sans Google ? BFR ConsultantsRecherches sur Internet : Y a-t-il une vie sans Google ? BFR Consultants
Recherches sur Internet : Y a-t-il une vie sans Google ? BFR ConsultantsBéatrice Foenix-Riou
 
Veille 4 - I Choquet - organiser la veille
Veille 4 - I Choquet - organiser la veilleVeille 4 - I Choquet - organiser la veille
Veille 4 - I Choquet - organiser la veilleUniversité de Metz
 
L’internet des sciences humaines et sociales. Recherches - Perspectives
L’internet des sciences humaines et sociales. Recherches - Perspectives L’internet des sciences humaines et sociales. Recherches - Perspectives
L’internet des sciences humaines et sociales. Recherches - Perspectives Phonothèque MMSH
 
Moteurs de recherche : sortir de Google
Moteurs de recherche : sortir de GoogleMoteurs de recherche : sortir de Google
Moteurs de recherche : sortir de GoogleAref Jdey
 
Moteur de recherche et chaîne du livre
Moteur de recherche et chaîne du livreMoteur de recherche et chaîne du livre
Moteur de recherche et chaîne du livreolivier
 
Les moteurs de recherche scientifique
Les moteurs de recherche scientifiqueLes moteurs de recherche scientifique
Les moteurs de recherche scientifiqueURFIST de Rennes
 
La curation et ses différents outils infoMatinale ADBS/Doc Forum Curation inf...
La curation et ses différents outils infoMatinale ADBS/Doc Forum Curation inf...La curation et ses différents outils infoMatinale ADBS/Doc Forum Curation inf...
La curation et ses différents outils infoMatinale ADBS/Doc Forum Curation inf...François Magnan
 
Du bon usage de google : la recherche d'information sur le Web
Du bon usage de google : la recherche d'information sur le WebDu bon usage de google : la recherche d'information sur le Web
Du bon usage de google : la recherche d'information sur le WebChristophe Charmetton
 
Recherche et veille documentaire
Recherche et veille documentaireRecherche et veille documentaire
Recherche et veille documentaireFrançois Magnan
 
Bnf 15 Dec Véronique Mesguich
Bnf 15 Dec Véronique MesguichBnf 15 Dec Véronique Mesguich
Bnf 15 Dec Véronique MesguichBibliolab
 
Curation urfist fevrier_mars_2013
Curation urfist fevrier_mars_2013Curation urfist fevrier_mars_2013
Curation urfist fevrier_mars_2013François Magnan
 

Tendances (20)

Quels outils pour quelles recherches ? Panorama des outils du web
Quels outils pour quelles recherches ? Panorama des outils du webQuels outils pour quelles recherches ? Panorama des outils du web
Quels outils pour quelles recherches ? Panorama des outils du web
 
Outils de recherche du web hors Google
Outils de recherche du web hors GoogleOutils de recherche du web hors Google
Outils de recherche du web hors Google
 
Les outils de recherche et veille sur le web
Les outils de recherche et veille sur le webLes outils de recherche et veille sur le web
Les outils de recherche et veille sur le web
 
Moteurs de recherche, finir avec les idées reçues
Moteurs de recherche, finir avec les idées reçuesMoteurs de recherche, finir avec les idées reçues
Moteurs de recherche, finir avec les idées reçues
 
Outils de recherche du web : approfondir Google
Outils de recherche du web : approfondir GoogleOutils de recherche du web : approfondir Google
Outils de recherche du web : approfondir Google
 
Recherche eveillée sur Internet : mode d'emploi - BFR Consultants
Recherche eveillée sur Internet : mode d'emploi - BFR ConsultantsRecherche eveillée sur Internet : mode d'emploi - BFR Consultants
Recherche eveillée sur Internet : mode d'emploi - BFR Consultants
 
Quelles alternatives à Google dans le domaine scientifique
Quelles alternatives à Google dans le domaine scientifiqueQuelles alternatives à Google dans le domaine scientifique
Quelles alternatives à Google dans le domaine scientifique
 
Présentation du Web Invisible
Présentation du Web InvisiblePrésentation du Web Invisible
Présentation du Web Invisible
 
Recherches sur Internet : Y a-t-il une vie sans Google ? BFR Consultants
Recherches sur Internet : Y a-t-il une vie sans Google ? BFR ConsultantsRecherches sur Internet : Y a-t-il une vie sans Google ? BFR Consultants
Recherches sur Internet : Y a-t-il une vie sans Google ? BFR Consultants
 
Veille 4 - I Choquet - organiser la veille
Veille 4 - I Choquet - organiser la veilleVeille 4 - I Choquet - organiser la veille
Veille 4 - I Choquet - organiser la veille
 
L’internet des sciences humaines et sociales. Recherches - Perspectives
L’internet des sciences humaines et sociales. Recherches - Perspectives L’internet des sciences humaines et sociales. Recherches - Perspectives
L’internet des sciences humaines et sociales. Recherches - Perspectives
 
Boostez vos recherches sur Internet
Boostez vos recherches sur InternetBoostez vos recherches sur Internet
Boostez vos recherches sur Internet
 
Moteurs de recherche : sortir de Google
Moteurs de recherche : sortir de GoogleMoteurs de recherche : sortir de Google
Moteurs de recherche : sortir de Google
 
Moteur de recherche et chaîne du livre
Moteur de recherche et chaîne du livreMoteur de recherche et chaîne du livre
Moteur de recherche et chaîne du livre
 
Les moteurs de recherche scientifique
Les moteurs de recherche scientifiqueLes moteurs de recherche scientifique
Les moteurs de recherche scientifique
 
La curation et ses différents outils infoMatinale ADBS/Doc Forum Curation inf...
La curation et ses différents outils infoMatinale ADBS/Doc Forum Curation inf...La curation et ses différents outils infoMatinale ADBS/Doc Forum Curation inf...
La curation et ses différents outils infoMatinale ADBS/Doc Forum Curation inf...
 
Du bon usage de google : la recherche d'information sur le Web
Du bon usage de google : la recherche d'information sur le WebDu bon usage de google : la recherche d'information sur le Web
Du bon usage de google : la recherche d'information sur le Web
 
Recherche et veille documentaire
Recherche et veille documentaireRecherche et veille documentaire
Recherche et veille documentaire
 
Bnf 15 Dec Véronique Mesguich
Bnf 15 Dec Véronique MesguichBnf 15 Dec Véronique Mesguich
Bnf 15 Dec Véronique Mesguich
 
Curation urfist fevrier_mars_2013
Curation urfist fevrier_mars_2013Curation urfist fevrier_mars_2013
Curation urfist fevrier_mars_2013
 

En vedette

NKFUST IMBA Introduction 3
NKFUST IMBA Introduction 3NKFUST IMBA Introduction 3
NKFUST IMBA Introduction 3Sophy Chang
 
NKFUST IMBA Introduction 2
NKFUST IMBA Introduction 2NKFUST IMBA Introduction 2
NKFUST IMBA Introduction 2Sophy Chang
 
Ada augusta byron king andrea e natalia padín- xuño 13
Ada augusta byron king  andrea e natalia padín- xuño 13Ada augusta byron king  andrea e natalia padín- xuño 13
Ada augusta byron king andrea e natalia padín- xuño 13Isidro2013
 
Roman Vocabulary
Roman VocabularyRoman Vocabulary
Roman VocabularyLyricus
 
1st Ignite Seoul 2. 이미영
1st Ignite Seoul  2. 이미영1st Ignite Seoul  2. 이미영
1st Ignite Seoul 2. 이미영Jinho Jung
 

En vedette (7)

Naxos music library
Naxos music libraryNaxos music library
Naxos music library
 
NKFUST IMBA Introduction 3
NKFUST IMBA Introduction 3NKFUST IMBA Introduction 3
NKFUST IMBA Introduction 3
 
NKFUST IMBA Introduction 2
NKFUST IMBA Introduction 2NKFUST IMBA Introduction 2
NKFUST IMBA Introduction 2
 
Naxos music library
Naxos music libraryNaxos music library
Naxos music library
 
Ada augusta byron king andrea e natalia padín- xuño 13
Ada augusta byron king  andrea e natalia padín- xuño 13Ada augusta byron king  andrea e natalia padín- xuño 13
Ada augusta byron king andrea e natalia padín- xuño 13
 
Roman Vocabulary
Roman VocabularyRoman Vocabulary
Roman Vocabulary
 
1st Ignite Seoul 2. 이미영
1st Ignite Seoul  2. 이미영1st Ignite Seoul  2. 이미영
1st Ignite Seoul 2. 이미영
 

Similaire à Recherche

Sites internet de services d'archives : comment faire connaître son site ?
Sites internet de services d'archives : comment faire connaître son site ?Sites internet de services d'archives : comment faire connaître son site ?
Sites internet de services d'archives : comment faire connaître son site ?Julie Scheffer
 
2011 06 gestion_recherche_info_internet
2011 06 gestion_recherche_info_internet2011 06 gestion_recherche_info_internet
2011 06 gestion_recherche_info_internetRobin Masur
 
Recherche d'infos sur Internet
Recherche d'infos sur InternetRecherche d'infos sur Internet
Recherche d'infos sur Internetmichelenorris
 
Utiliser Le MultiméDia Dans Un Projet Danimation
Utiliser Le MultiméDia Dans Un Projet DanimationUtiliser Le MultiméDia Dans Un Projet Danimation
Utiliser Le MultiméDia Dans Un Projet DanimationBibliothèques Brest
 
Cours referencement origine
Cours referencement origineCours referencement origine
Cours referencement origineRémi Bachelet
 
Etat de l'art de la recherche en Ligne
Etat de l'art de la recherche en LigneEtat de l'art de la recherche en Ligne
Etat de l'art de la recherche en LigneGeliMeng
 
Etat De Lart De La Recherche En Ligne
Etat De Lart De La Recherche En LigneEtat De Lart De La Recherche En Ligne
Etat De Lart De La Recherche En Lignemenggeli
 
Google : trucs et astuces pour les pros de l'infodoc, BFR Consultants
Google : trucs et astuces pour les pros de l'infodoc, BFR ConsultantsGoogle : trucs et astuces pour les pros de l'infodoc, BFR Consultants
Google : trucs et astuces pour les pros de l'infodoc, BFR ConsultantsBéatrice Foenix-Riou
 
S'informer avec les outils du Web 2.0
S'informer avec les outils du Web 2.0S'informer avec les outils du Web 2.0
S'informer avec les outils du Web 2.0cdeacf
 
Veille, les outils qui font gagner du temps
Veille, les outils qui font gagner du tempsVeille, les outils qui font gagner du temps
Veille, les outils qui font gagner du tempsechangeurba
 
Formation Internet Isop 7 juin 2010
Formation Internet Isop 7 juin 2010Formation Internet Isop 7 juin 2010
Formation Internet Isop 7 juin 2010Letaillieur
 
Formation Internet isop 7 juin 2010
Formation Internet isop 7 juin 2010Formation Internet isop 7 juin 2010
Formation Internet isop 7 juin 2010Letaillieur
 
Comment mettre en place un système de veille et de curation de l'information ...
Comment mettre en place un système de veille et de curation de l'information ...Comment mettre en place un système de veille et de curation de l'information ...
Comment mettre en place un système de veille et de curation de l'information ...CYB@RDECHE
 

Similaire à Recherche (20)

Sites internet de services d'archives : comment faire connaître son site ?
Sites internet de services d'archives : comment faire connaître son site ?Sites internet de services d'archives : comment faire connaître son site ?
Sites internet de services d'archives : comment faire connaître son site ?
 
Recherche web
Recherche webRecherche web
Recherche web
 
2011 06 gestion_recherche_info_internet
2011 06 gestion_recherche_info_internet2011 06 gestion_recherche_info_internet
2011 06 gestion_recherche_info_internet
 
Recheche d'info sur Internet
Recheche d'info sur InternetRecheche d'info sur Internet
Recheche d'info sur Internet
 
Recherche d'infos sur Internet
Recherche d'infos sur InternetRecherche d'infos sur Internet
Recherche d'infos sur Internet
 
Utiliser Le MultiméDia Dans Un Projet Danimation
Utiliser Le MultiméDia Dans Un Projet DanimationUtiliser Le MultiméDia Dans Un Projet Danimation
Utiliser Le MultiméDia Dans Un Projet Danimation
 
Cours referencement origine
Cours referencement origineCours referencement origine
Cours referencement origine
 
Recherche web 2013
Recherche web 2013Recherche web 2013
Recherche web 2013
 
Etat de l'art de la recherche en Ligne
Etat de l'art de la recherche en LigneEtat de l'art de la recherche en Ligne
Etat de l'art de la recherche en Ligne
 
Etat De Lart De La Recherche En Ligne
Etat De Lart De La Recherche En LigneEtat De Lart De La Recherche En Ligne
Etat De Lart De La Recherche En Ligne
 
Initiation la rechercher sur le web
Initiation la rechercher sur le webInitiation la rechercher sur le web
Initiation la rechercher sur le web
 
Google : trucs et astuces pour les pros de l'infodoc, BFR Consultants
Google : trucs et astuces pour les pros de l'infodoc, BFR ConsultantsGoogle : trucs et astuces pour les pros de l'infodoc, BFR Consultants
Google : trucs et astuces pour les pros de l'infodoc, BFR Consultants
 
S'informer avec les outils du Web 2.0
S'informer avec les outils du Web 2.0S'informer avec les outils du Web 2.0
S'informer avec les outils du Web 2.0
 
Veille, les outils qui font gagner du temps
Veille, les outils qui font gagner du tempsVeille, les outils qui font gagner du temps
Veille, les outils qui font gagner du temps
 
Formation Internet Isop 7 juin 2010
Formation Internet Isop 7 juin 2010Formation Internet Isop 7 juin 2010
Formation Internet Isop 7 juin 2010
 
Formation Internet isop 7 juin 2010
Formation Internet isop 7 juin 2010Formation Internet isop 7 juin 2010
Formation Internet isop 7 juin 2010
 
Veille informationnelle
Veille informationnelleVeille informationnelle
Veille informationnelle
 
Comment mettre en place un système de veille et de curation de l'information ...
Comment mettre en place un système de veille et de curation de l'information ...Comment mettre en place un système de veille et de curation de l'information ...
Comment mettre en place un système de veille et de curation de l'information ...
 
Réferencement naturel
Réferencement naturelRéferencement naturel
Réferencement naturel
 
Wurfing8
Wurfing8Wurfing8
Wurfing8
 

Plus de Patrice Leroux

Rep2400 plan cours_h2019_sl
Rep2400 plan cours_h2019_slRep2400 plan cours_h2019_sl
Rep2400 plan cours_h2019_slPatrice Leroux
 
Rep2400 lectures h2019
Rep2400 lectures h2019Rep2400 lectures h2019
Rep2400 lectures h2019Patrice Leroux
 
Rep2400 lectures h2017
Rep2400 lectures h2017Rep2400 lectures h2017
Rep2400 lectures h2017Patrice Leroux
 
Entrevue avec les médias (FESP)
Entrevue avec les médias (FESP)Entrevue avec les médias (FESP)
Entrevue avec les médias (FESP)Patrice Leroux
 
Rep2400 plan cours_h2016
Rep2400 plan cours_h2016Rep2400 plan cours_h2016
Rep2400 plan cours_h2016Patrice Leroux
 
Utilisation d'une communauté (dév. projet)
Utilisation d'une communauté (dév. projet)Utilisation d'une communauté (dév. projet)
Utilisation d'une communauté (dév. projet)Patrice Leroux
 
Reputation p leroux_bio_qc_2014
Reputation p leroux_bio_qc_2014Reputation p leroux_bio_qc_2014
Reputation p leroux_bio_qc_2014Patrice Leroux
 
Eréputation_PLeroux_TCTIC14
Eréputation_PLeroux_TCTIC14Eréputation_PLeroux_TCTIC14
Eréputation_PLeroux_TCTIC14Patrice Leroux
 
Vocabulaire des relations publiques (II)
Vocabulaire des relations publiques (II)Vocabulaire des relations publiques (II)
Vocabulaire des relations publiques (II)Patrice Leroux
 
Relations avec les médias
Relations avec les médiasRelations avec les médias
Relations avec les médiasPatrice Leroux
 
Responsabilité sociale 2013
Responsabilité sociale 2013Responsabilité sociale 2013
Responsabilité sociale 2013Patrice Leroux
 
Identites_Statuts_Pouvoir_(3)
Identites_Statuts_Pouvoir_(3)Identites_Statuts_Pouvoir_(3)
Identites_Statuts_Pouvoir_(3)Patrice Leroux
 
Relations avec les médias
Relations avec les médiasRelations avec les médias
Relations avec les médiasPatrice Leroux
 
Planification stratégique: médias sociaux
Planification stratégique: médias sociauxPlanification stratégique: médias sociaux
Planification stratégique: médias sociauxPatrice Leroux
 

Plus de Patrice Leroux (20)

Rep2400 plan cours_h2019_sl
Rep2400 plan cours_h2019_slRep2400 plan cours_h2019_sl
Rep2400 plan cours_h2019_sl
 
Rep2400 lectures h2019
Rep2400 lectures h2019Rep2400 lectures h2019
Rep2400 lectures h2019
 
Rep2400 lectures h2017
Rep2400 lectures h2017Rep2400 lectures h2017
Rep2400 lectures h2017
 
Rep2400 h17 ss
Rep2400 h17 ssRep2400 h17 ss
Rep2400 h17 ss
 
Entrevue avec les médias (FESP)
Entrevue avec les médias (FESP)Entrevue avec les médias (FESP)
Entrevue avec les médias (FESP)
 
Rep2400 plan cours_h2016
Rep2400 plan cours_h2016Rep2400 plan cours_h2016
Rep2400 plan cours_h2016
 
Utilisation d'une communauté (dév. projet)
Utilisation d'une communauté (dév. projet)Utilisation d'une communauté (dév. projet)
Utilisation d'une communauté (dév. projet)
 
Reputation p leroux_bio_qc_2014
Reputation p leroux_bio_qc_2014Reputation p leroux_bio_qc_2014
Reputation p leroux_bio_qc_2014
 
Eréputation_PLeroux_TCTIC14
Eréputation_PLeroux_TCTIC14Eréputation_PLeroux_TCTIC14
Eréputation_PLeroux_TCTIC14
 
Vocabulaire des relations publiques (II)
Vocabulaire des relations publiques (II)Vocabulaire des relations publiques (II)
Vocabulaire des relations publiques (II)
 
Relations avec les médias
Relations avec les médiasRelations avec les médias
Relations avec les médias
 
Responsabilité sociale 2013
Responsabilité sociale 2013Responsabilité sociale 2013
Responsabilité sociale 2013
 
Identites_Statuts_Pouvoir_(3)
Identites_Statuts_Pouvoir_(3)Identites_Statuts_Pouvoir_(3)
Identites_Statuts_Pouvoir_(3)
 
Gestion de crise_v4
Gestion de crise_v4Gestion de crise_v4
Gestion de crise_v4
 
Entreprise20 2013
Entreprise20 2013Entreprise20 2013
Entreprise20 2013
 
Relations avec les médias
Relations avec les médiasRelations avec les médias
Relations avec les médias
 
Monitoring 4
Monitoring 4Monitoring 4
Monitoring 4
 
Planification stratégique: médias sociaux
Planification stratégique: médias sociauxPlanification stratégique: médias sociaux
Planification stratégique: médias sociaux
 
Reseaux sociaux 2013
Reseaux sociaux 2013Reseaux sociaux 2013
Reseaux sociaux 2013
 
Twitter v5 2013
Twitter v5 2013Twitter v5 2013
Twitter v5 2013
 

Dernier

LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...Faga1939
 
MaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.pptMaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.pptssusercbaa22
 
gestion des conflits dans les entreprises
gestion des  conflits dans les entreprisesgestion des  conflits dans les entreprises
gestion des conflits dans les entreprisesMajdaKtiri2
 
présentation sur l'échafaudage dans des travaux en hauteur
présentation sur l'échafaudage dans des travaux en hauteurprésentation sur l'échafaudage dans des travaux en hauteur
présentation sur l'échafaudage dans des travaux en hauteurdinaelchaine
 
Mécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.pptMécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.pptssusercbaa22
 
presentation l'interactionnisme symbolique finale.pptx
presentation l'interactionnisme symbolique  finale.pptxpresentation l'interactionnisme symbolique  finale.pptx
presentation l'interactionnisme symbolique finale.pptxMalikaIdseaid1
 
Fondation Louis Vuitton. pptx
Fondation      Louis      Vuitton.   pptxFondation      Louis      Vuitton.   pptx
Fondation Louis Vuitton. pptxTxaruka
 
Grammaire pour les élèves de la 6ème.doc
Grammaire pour les élèves de la  6ème.docGrammaire pour les élèves de la  6ème.doc
Grammaire pour les élèves de la 6ème.docKarimKhrifech
 
Cours-irrigation_et_drainage_cours1.pptx
Cours-irrigation_et_drainage_cours1.pptxCours-irrigation_et_drainage_cours1.pptx
Cours-irrigation_et_drainage_cours1.pptxlamourfrantz
 
MICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdf
MICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdfMICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdf
MICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdfssuser40e112
 
Approche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptxApproche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptxssusercbaa22
 
Formation M2i - Comprendre les neurosciences pour développer son leadership
Formation M2i - Comprendre les neurosciences pour développer son leadershipFormation M2i - Comprendre les neurosciences pour développer son leadership
Formation M2i - Comprendre les neurosciences pour développer son leadershipM2i Formation
 
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...M2i Formation
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film françaisTxaruka
 
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptxSAID MASHATE
 
A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.Franck Apolis
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.Txaruka
 
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptxSUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptxssuserbd075f
 

Dernier (20)

LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
 
MaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.pptMaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.ppt
 
gestion des conflits dans les entreprises
gestion des  conflits dans les entreprisesgestion des  conflits dans les entreprises
gestion des conflits dans les entreprises
 
présentation sur l'échafaudage dans des travaux en hauteur
présentation sur l'échafaudage dans des travaux en hauteurprésentation sur l'échafaudage dans des travaux en hauteur
présentation sur l'échafaudage dans des travaux en hauteur
 
Mécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.pptMécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.ppt
 
presentation l'interactionnisme symbolique finale.pptx
presentation l'interactionnisme symbolique  finale.pptxpresentation l'interactionnisme symbolique  finale.pptx
presentation l'interactionnisme symbolique finale.pptx
 
Fondation Louis Vuitton. pptx
Fondation      Louis      Vuitton.   pptxFondation      Louis      Vuitton.   pptx
Fondation Louis Vuitton. pptx
 
Grammaire pour les élèves de la 6ème.doc
Grammaire pour les élèves de la  6ème.docGrammaire pour les élèves de la  6ème.doc
Grammaire pour les élèves de la 6ème.doc
 
Cours-irrigation_et_drainage_cours1.pptx
Cours-irrigation_et_drainage_cours1.pptxCours-irrigation_et_drainage_cours1.pptx
Cours-irrigation_et_drainage_cours1.pptx
 
MICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdf
MICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdfMICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdf
MICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdf
 
Approche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptxApproche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptx
 
Evaluación Alumnos de Ecole Victor Hugo
Evaluación Alumnos de Ecole  Victor HugoEvaluación Alumnos de Ecole  Victor Hugo
Evaluación Alumnos de Ecole Victor Hugo
 
Formation M2i - Comprendre les neurosciences pour développer son leadership
Formation M2i - Comprendre les neurosciences pour développer son leadershipFormation M2i - Comprendre les neurosciences pour développer son leadership
Formation M2i - Comprendre les neurosciences pour développer son leadership
 
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film français
 
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
 
A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.
 
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptxSUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
 
Pâques de Sainte Marie-Euphrasie Pelletier
Pâques de Sainte Marie-Euphrasie PelletierPâques de Sainte Marie-Euphrasie Pelletier
Pâques de Sainte Marie-Euphrasie Pelletier
 

Recherche

  • 1.
  • 2. Quelques mythes On trouve tout dans Internet C'est facile de chercher et de trouver Les sources sont fiables et à jour... LES RECHERCHES DANS INTERNET PEUVENT SE FAIRE À PARTIR DES RESSOURCES SUIVANTES, ENTRE AUTRES : Moteurs de recherche et Annuaires (catologues/répertoires) + Les Newgroups (groupes de discussion) dont les contenus peuvent être accessibles avec un lecteur de nouvelles ... http://alt.binaries.movies.french.usenetor.com/ http://groups.google.com/group/tourisme-recherches-institutions-pratiques?lnk= Par le biais du web, les «news» étaient accessibles avec Google Groupe s (désactivé en 2011 mais 20 ans d’archives toujours disponibles...) Les blogues Certains réseaux sociaux ouverts (ou par compte Google) Sites de signets sociaux Twitter (temps réel) Le Web profond dit invisible
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10. Catalogues, annuaires et répertoires: Les informations sont constituées, organisées en catégories et même filtrées par des personnes .  L'intervention humaine faisait en sorte que l'information était souvent moins à jour qu'avec les moteurs. Par contre, plusieurs répertoires sont devenus hybrides en intégrant à la fois un répertoire et un moteur. Exemple: Yahoo La recherche d'information se fait donc plutôt par navigation   dans le classement (hiérarchies et répertoires structurés).   On gagne en qualité ce qu’on perd en quantité ? Avec le phénomène de la «curation», les annuaires et catalogues pourraient renaître...
  • 11.
  • 12.
  • 13.
  • 14. Moteurs de recherche : Il s'agit de programmes informatiques permettant de faire des recherches dans les bases de données, conçues par les robots collecteurs. Dans Internet, les moteurs nous proposent leur information grâce à 3 fonctions ou étapes principales : 1) Un robot collecteur : ( crawler, spider, bot) Il indexe le web automatiquement 24 heures par jour en "glanant" ( en scannant ) les informations dans le texte visible  d'un site (les premiers mots ou phrases) et dans le texte invisible (i.e. dans le code HTML, où on retrouve les méta-étiquettes ). N.B. : Les meilleurs robots peuvent indexer plusieurs millions de pages par jour ( ils prennent quelques semaines pour faire le tour du Web en entier).
  • 15. Le robot visite chaque page (ou pages représentatives) d'un site (qui veut bien être trouvé ou découvert !) et lit les pages ainsi que les hyperliens offerts dans le but de découvrir les autres pages (ou fichiers). 2) Un programme crée un index ou catalogue immense (base de données/statique) à partir des sites (fichiers) visités. 3) Un autre programme (le service de requêtes) reçoit votre requête, la compare à ses entrées de données (catalogue) et renvoie ses résultats. C'est dans la fenêtre de requête des moteurs qu'on tape les informations et qu'on interroge leurs bases de données. La recherche d'information se fait donc par interrogation. Il existe des milliers de moteurs de recherche... Search Engine Colossus ( par pays, par thèmes, etc.) http://www.searchenginecolossus.com/
  • 16.
  • 17.
  • 18.
  • 19. PageRank de Google PageRank est un champion de la démocratie : il profite des innombrables liens du Web pour évaluer le contenu des pages Web -- et leur pertinence vis-à-vis des requêtes exprimées. Le principe de PageRank est simple : tout lien pointant de la page A à la page B est considéré comme un vote de la page A en faveur de la page B. Toutefois, Google ne limite pas son évaluation au nombre de « votes » (liens) reçus par la page ; il procède également à une analyse de la page qui contient le lien. Les liens présents dans des pages jugées importantes par Google ont plus de « poids », et contribuent ainsi à « élire » d'autres pages. Source: http://www.google.ca/intl/fr/why_use.html Plusieurs centaines de millions de requêtes par jour ! Des fonctions et services moins connus ou utilisés... Le choix parmi 45 langues (2011): http://www.google.ca/preferences?hl=fr   Google News/Actualités (+4500 sources médias dont 500 en français) http://news.google.com/news?cf=all&ned=fr_ca&ict=ln   Alerte Google (monitoring de l'actualité) http://www.google.ca/alerts http://www.googlealert.com   Google Images http://images.google.ca / Google Scholar (anglais seulement) http://scholar.google.com/
  • 20.
  • 21.
  • 22.
  • 23.
  • 24.
  • 25.
  • 26.
  • 28.
  • 29.
  • 30.
  • 31.
  • 32. Une recherche efficace et exhaustive favorisera une approche moteur et une approche répertoire multiples.   Il faut en effet passer à travers plusieurs outils de recherche. Évitez d’utiliser qu'un seul outil de recherche.
  • 33. Principales techniques de recherche Identification du sujet : Contexte et objet de la recherche; délimitation de la recherche (langues, pays, etc.); genre de réponses désirées. Quelle est votre connaissance sémantique du sujet ou de la discipline recherchée ? Formulation du sujet : Quels mots ou expressions précisent ou traduisent le mieux les concepts de la recherche; choix de mots-clés et de termes à retenir; trouver des équivalences (synonymes, acronymes et mots en anglais ou dans une autre langue).
  • 34. Recherche sur les termes exactes Exemple concernant l'exactitude des termes anglais sur Google...     Source: http://www.googleguide.com/interpreting_queries.html
  • 35. La stratégie de recherche inclut la traduction de mots clés et leur regroupement en fonctions de règles syntaxiques propres aux moteurs de recherche. On peut combiner des mots ou des termes dans le but de traduire la requête en une expression de recherche . Attention aux majuscules et minuscules sur certains moteurs Requête saisie en minuscules Toutes les occurrences seront recherchées : ibm trouve ibm, IBM ou Ibm Requête saisie en majuscules Idem: IBM trouve IBM,  ibm, Ibm ou IbM Lettres accentuées L'occurrence exacte est recherchée : électricité trouve électricité mais pas electricite ou electricité (HotBot) Requête saisie sans accents Toutes les occurrences sont  recherchées : electricite trouve electricite, électricité ou electricité (pas toujours vrai sur certains moteurs)
  • 36. Requête saisie sans accents Toutes les occurrences sont  recherchées : electricite trouve electricite, électricité ou electricité (pas toujours vrai sur certains moteurs). Ordre des mots Sur certains moteurs, la recherche ( Paris Montréal ) ne donne pas les mêmes résultats que la recherche ( Monréal Paris ) surtout pour le classement des résultats. Majuscules, minuscules et accents sur Google Les recherches Google ne tiennent pas compte de la « casse » des lettres (MAJUSCULES/minuscules). Quelle que soit la typographie utilisée, Google interprète toujours les lettres composant vos termes de recherche comme des minuscules. Par défaut, les recherches Google ne tiennent pas compte des accents ou autres signes diacritiques (cédille, tilde espagnol, umlaut allemand, etc.). Ainsi les termes [FRANÇAIS] et [FRANCAIS] retrouvent les mêmes pages. Pour indiquer que ces deux termes ont une signification différente, utilisez un signe plus ( + ), soit les termes de recherche [+FRANÇAIS] et [+FRANCAIS]. Pour certains mots français dont la graphie est semblable à l'anglais (éléphant/elephant), il vaut mieux insérer les accents, SI on veut obtenir uniquement des documents en français .   Par contre, pour les mots français dont la graphie n'a pas de correspondance en anglais, on favorisera un meilleur taux de rappel (résultat) si le mot en question n'est pas accentué, i.e. zebre ou lieu de zèbre .
  • 37. Les 3 opérateurs "booléens" Nommés ainsi en l'honneur de Georges Boole (1815-1864) mathématicien et logicien anglais, inventeur de la logique symbolique moderne et de l'algèbre booléienne. 1 -( AND ) (Principe d'association) Souvent représenté par le symbole + et la saisie en majuscules AND. Sur Google, par défaut. Le + est implicite. Correspond à la conjonction ET en français. Exemple : la requête moteur de recherche en français force Google à trouver les pages qui contiennent à la fois les mots moteur ET recherche ET français . +moteur +recherche +français Les articles, adjectifs indéfinis, préposition et/ou déterminants de toutes sortes (le, la, les, en, des, du, pour, et, ou etc..) sont ignorés. Les Américains appellent ces mots des "Stop Words" ou mots-vides.  
  • 38. 2 -( OR ) (Principe de regroupement) Parfois représenté par le symbole ( | ) Correspond à la conjonction OU en français. Exemple :  moteur  OR recherche OR français force le moteur à trouver les pages qui contiennent l'un ou l'autre des mots, soit moteur, soit recherche, soit français ou les trois. Avec Google,  l'opérateur OR doit être saisi en MAJUSCULE obligatoirement. Le OR était  l'opérateur par défaut de Gigablast http://gigablast.com/ Le sigle | est rarement utilisé pour le OR mais fonctionne dans Google.
  • 39. Dans les deux exemples suivants, le moteur tentera de trouver des pages contenant au moins le premier de ces mots, les deux premiers ou les trois  à la fois: blouse, shirt, chemise. [  blouse OR shirt OR chemise  ] [  blouse|shirt|chemise  ] Remarque: avec l'opérateur OR un espace doit précéder le mot alors que le signe | ne nécessite aucun espace précédant le mot. Source: http://www.googleguide.com/or_operator.html
  • 40. 3-( NOT/ANDNOT ) (Principe d'exclusion) Représenté par le symbole ( - ) Correspond à  SAUF/Excepté en français. Exemple :  +moteur  -voiture force le moteur à trouver les pages qui contiennent le mot moteur mais SANS le mot voiture .   Avec Google,  l'opérateur ( - ) doit être utilisé devant le mot à exclure (sans espace) et non le NOT ou ANDNOT Si on veut trouver plus facilement une recette de "salsa", on risque d'avoir de meilleurs résultats avec: En anglais: [  salsa –dance –class  ] En français [  salsa -musique -danse -cours  ] Avec la combinaison suivante, je devrais trouver en théorie des informations avec les mots moteur et hybride mais sans les mots voiture et automobile [ -voiture -automobile moteur hybride ] Différence avec l'ordre suivant ? [ moteur hybride -voiture -automobile ] Combien de mots-clés peut-on utiliser dans une requête ? Jusqu'à 32 mots incluant les opérateurs mais pas les "stop-words", i.e. les articles, pronoms ou conjonctions, etc.: Exemple:  le, du, des, quand, ou, où (mots-vides)
  • 41. L'utilisation de parenthèses Lorsqu'on utilise simultanément plusieurs opérateurs booléens pour raffiner une recherche, on peut utiliser les parenthèses.   Exemples : salade (thon AND Crabe) -Cesar = Je veux avoir des informations sur des salades de thon, de crabe ou les deux, mais pas d'informations sur la salade césar Les parenthèses permettent aussi de coupler des requêtes : Exemple :  (+moteur +voiture) -(+moteur +recherche) Seul Hotbot acceptait encore bien les parenthèses...
  • 42. Les opérateurs de proximité L'adjacence   ( ADJ) ( base de données) Pour introduire une proximité nette entre les mots Exemple : Relations ADJ Publiques Public ADJ Relations   N.B.: Très peu de moteurs acceptent l'adjacence (ADJ) et les résultats sont peu concluants dans Google avec cet opérateur...mais cela pourrait être utile ailleurs... La proximité ( ~) (base de données) Pour introduire une notion de proximité entre des mots mais pas aussi nette que l’ADJ. Les mots doivent être proches l'un de l'autre. Représenté par le sigle NEAR ou ONEAR et   aussi par le symbole  ~ Exemple : conception AND fabrication NEAR ordinateur ou computer NEAR   translation = computer ~ translation Il s'agit donc d'une recherche sur la conception et la fabrication assistées par ordinateur (CAO-FAO) et sur la traduction assistée par ordinateur (TAO).
  • 43. Dans Google, on utilise le symbole ~ pour trouver un synonyme du mot qu'on fait précédé par ~. Exemple: [ ~portable ] Exemple: [ ~portable +téléphonie -ordinateur ] Google trouve des informations similaires à quelques mots ou à tous les mots d'une requête précédée du ~ Le masque (?) Le masque sert à spécifier le nombre exact de caractères à rechercher (ou quand on cherche des mots différenciés que par un seul caractère) On représente le masque par le symbole ? (interrogation) wom ? n (wom a n, wom e n) français ?? (française et françaises)
  • 44. Les guillemets Pour trouver un groupe de mots ou une phrase exacte. Pour trouver une expression particulière... On utilisera les guillemets . Représenté par " _ " Exemple: "moteur de recherche" recherche les trois mots les uns à côté des autres et dans cet ordre. "Histoire de la renaissance italienne" ou "Post-secondary education in the USA" N.B.: Les guillemets fonctionnent assez bien avec certains «autres» moteurs mais parfois Google demande de les retirer...
  • 45. La troncature   (base de donnés) Pour faire une recherche sur une partie d'un mot Utilisez la troncature pour obtenir de l'information à partir d'un même radical (troncature à gauche) ou d'un suffixe (troncature à droite). Représentée par le symbole * (astérisque) appelé aussi en anglais ( Wildcard ) Exemples: bio * (biologie, biographie, biochimie, biotechnologie, biochemistry, biography, biology, etc.) * sexuel (transexuel, homosexuel, bisexuel) mot * ( moteur, moteur s , motard, motard s , motorisé, motte, motrice, etc.)
  • 46. Avec Google on utilise le * pour tenter de trouver un ou des mots manquants dans une phrase ou pour trouver des ressources dans lesquelles apparaissent des mots qu'on fait précéder du signe * Exemple:  [ google *ma *vie ] Si vous n'êtes pas certain du titre d'un livre (ou d’une chanson) mais que vous en connaissez quelques mots, Google peut vous aider à retrouver le titre précis. Comment s'intitulait déjà le célèbre livre de Dany Laferrière ? ? ? ? [ faire *l'amour *nègre ] ? ? ?   Source: http://www.googleguide.com/wildcard_operator.html
  • 47. Les méta-données ou la recherche par zone spécifique Il est aussi très utile de connaître la spécificité des documents Internet en utilisant les métadonnées ou les champs à inscrire dans la fenêtre de requête. On nomme aussi ces champs ou métadonnées recherche linguistique ou par zone . Exemples de métadonnées (champs par zones) les plus connues : Avec Google, il faut faire précéder chacune par allin: title: ou allintitle: ou allin            Récupère les sites dont le titre spécifié apparaît dans une page.  allin:soleil trouve toutes les pages contenant le mot soleil dans le titre . N.B.: Parfois ce champ s'écrit intitle: ou lieu de title: url: ou allinurl:            Récupère selon combinaison (nom du serveur, répertoire, fichier) url:jardin récupère ou trouve toutes les pages de tous les serveurs ayant le mot jardin à n'importe quel endroit : nom de domaine (URL), répertoire d'accès, nom de fichiers.
  • 48. text: allintext:          Récupère les pages contenant un mot particulier allintext:impluvium trouve les pages contenant le terme impluvium like:          Récupère les pages semblables ou en rapport avec l'adresse like: www.amazon.com   récupère des sites vendant des livres semblables à amazon.com inlink:           Récupère les sites offrant un lien vers un site particulier (référence) inlink: www.cyberpresse.ca On recherche des documents (sites web) qui contiennent un lien vers une page de site dont l'adresse contient l'expression www.cyberpresse.ca
  • 49. Est-il possible de combiner une zone avec un opérateur ? OUI ! Exemples : allinurl: www.honda.com +hybrid On recherche des documents qui contiennent le mot hybride sur le site www.honda.ca / allintitle:éducation supérieure +fr On recherche des sites ou pages web dont le titre porte précisément sur l'éducation supérieure et on tient à ce que ces informations proviennent de sites hébergés sur des serveurs de France. Peut on combiner deux zones ? NON !   allinurl:garden allintext:css Les opérateurs (anciens moteurs) http://searchengineshowdown.com/features/ Boolean Logic http://internettutorials.net/boolean.asp
  • 50.
  • 51. Méta-moteurs MetaCrawler: http://www.metacrawler.com / Beaucoup: http://www.beaucoup.com / Surfwax : http://www.surfwax.com / Clusty: http://clusty.com / Mamma: http://www.mamma.com / Dogpile: http://www.dogpile.com / IceRocket: http://www.icerocket.com / Applications à télécharger WebFerret: http://www.webferret.com / Copernic: http://www.copernic.com / Référence A+: UC Berleley http://www.lib.berkeley.edu/TeachingLib/Guides/Internet/MetaSearch.html
  • 52. Mais SURTOUT... Il faut lire les "modes d'emploi", les guides et les FAQ de chacun des moteurs et savoir comment utiliser les fonctions de recherche raffinée telles le " Advanced Search ", le " Power Search " et le " Related Search ". Apprenez à lire (à interpréter) rapidement les informations (sites) que vous retournent les moteurs, notamment grâce aux titres, aux résumés, à l'adresse web (nom de domaine)...
  • 53. Autres ressources pour la recherche Groupes de discussion http://groups.google.com/ Recherche de blogues de Google http://blogsearch.google.fr/blogsearch/advanced_blog_search   BlogPulse http://www.blogpulse.com /   Technorati http://technorati.com/   La recherche de périodiques électroniques par le biais du réseau des bibliothèques de l'Université de Montréal Entente entre Eureka.cc et biblio branchée http://www.bib.umontreal.ca/SB/PEL/ Le portail de la Bibliothèque et Archives nationales du Québec http://www.banq.qc.ca/ Voir aussi Questia (Plus grande bibliothèque en ligne ?) http://www.questia.com/ À la recherche de sites disparus... sur Internet Archive avec son Way Back Machine (+150 milliards de documents) http://www.archive.org/
  • 54. Problèmes ??? Difficultés ??? Pas assez de résultats ? (silence) Trouver de nouveaux synonymes, acronymes ou termes plus conceptuels se rapprochant de votre recherche. Trop de résultats ? (bruit)   Utiliser les opérateurs booléens et combiner certains mots; Utiliser des métadonnés (champs); Utiliser les fonctions de recherche raffinée des moteurs.
  • 55. Si c'est écrit, c'est vrai ? (Réseau UQuébec) http://youtu.be/lXwgv8kq6rA
  • 56. Évaluation et validation de l'information trouvée Quelques concepts importants: Fiabilité (auteur, expertise) Objectifs /Buts (éditorial, pour ou contre une cause?) Équilibre ( faits bruts, point de vue différent ?) Mise à jour (actualité, date de parution ?) Type de couverture (rapport complet, études, petit paragraphe ?) Les sources semblent bien documentées ? (liens fonctionnels, sites reconnus, etc.) Autres sources Web offrant lien vers le site en question ? Quel rang dans un moteur de recherche ? Équilibre ? (opinions, biais, pamphlet, autres points de vue ?) Types de référence offerts (Livre blanc, rapport, petit paragraphe ?) Pertinence (rapport statistique ou article) Réputation et crédibilité de la source (commanditaire ?) Reconnaissance professionnelle ou institutionnelle ?
  • 57. Quelques références utiles.... UQAM/Bibliothèques http://www.bibliotheques.uqam.ca/InfoSphere/sciences/module7/evaluer.html Déterminer la fiabilité de l’information (Bibliothèques UdeM) http://guides.bib.umontreal.ca/disciplines/74-Determiner-la-fiabilite-de-l-information Robert Harris/Virtual Salt http://www.virtualsalt.com/evalu8it.htm Évaluation de l’information présente sur Internet (Université de Lyon) http://sapristi-docinsa.insa-lyon.fr/conseils-pour-chercher/evaluer-linformation
  • 58.
  • 59. Le Web invisible ou profond... Quelques définitions Web Invisible: informations que les moteurs de recherche conventionnels ne peuvent trouver et répertorier. Web caché: synonyme de Web invisible. Web profond:   terme utilisé d’abord par BrightPlanet qui le préfère à Web invisible. Selon BrightPlanet, les informations ne sont pas nécessairement invisibles mais plutôt cachées. Il s'agit d'apprendre comment les trouver ! Web de surface : informations disponibles par le biais des moteurs et répertoires. La majorité des gens ne savent pas que plusieurs documents parmi les plus crédibles du Web, c.-à-d. ceux qui font autorité, demeurent "invisibles" auprès des moteurs de recherche comme Google, Yahoo! ou Bing. La plupart de ces documents dits invisibles proviennent des bases de données des universités, bibliothèques, agences gouvernementales, associations, entreprises... partout dans le monde ! Références A+ DeepWeb (Wikipedia): http://en.wikipedia.org/wiki/Deep_web Inventeur du terme «DeepWeb» (Mike. K. Bergman) http://www.mkbergman.com/about-mike/ The DeepWeb Internet Tutorials http://www.internettutorials.net/deepweb.asp
  • 60.
  • 61.
  • 62. Le Web profond, c'est aussi... Pages discrètes: existantes mais non liées par des hyperliens Bases de données accessibles à travers une requête ou formulaire Pages générées de façon dynamique (ASP, Cold Fusion); Il est plus facile (et aussi moins onéreux) de générer une réponse de façon dynamique par requête plutôt que d'entreposer (archiver) toutes les pages possibles contenant toutes les réponses possibles de toutes les questions possibles... Pages contenant des scripts (code avec un "?" par exemple) Par exemple, Google Scholar  ne peut que pointer vers des citations de références de périodiques très spécialisés (revues savantes, etc.). Il ne peut aller directement vers un contenu complet et protégé (mot de passe, abonnement payant, etc.) des bases de données des grandes universités. Véritable Intranet (entre les murs d'un immeuble, sans plus) Ex: Compagnies d'assurance Intranet/Extranet: L'Intranet de la Faculté de l'éducation permanente http://ocean.sim.umontreal.ca/fep/ Une recherche dans une bibliothèque virtuelle. ( La requête disparaît lorsque la session se termine ).
  • 63. Pourquoi les moteurs n'indexent pas tout le Web ? Les robots des moteurs sont surtout conçus pour chercher des pages en HTML (statiques) qui reposent dans un serveur. Depuis 2005-2006,plusieurs moteurs comme Google peuvent trouver des pages dynamiques (avec un lien stable)... Un moteur ne peut pas "penser" ni taper du texte...(code utilisateur, mot de passe, autre texte, opérateurs propres au moteur de recherche interne). On entend souvent dire que les méthodes de recherche de base et leur technologies n'ont pas évolué de manière vraiment significative depuis les débuts d'Internet... On commence à entendre parler de "smart robots" qui pourraient indexés le Web profond . C’est déjà commencé... Seuls des fichiers HTML, les fichiers musicaux ( MP3, midi, etc.) et certaines images (gif, jpg) accompagnés de texte sont indexés convenablement. Tout ce qui est en «flash» n’est pas indexé....
  • 64. Comment trouver des informations du Web profond ? Pensez toujours en fonctions des bases de données Bases de données: “ Ensemble structuré d'éléments d'information, généralement agencés sous forme de tables, dans lesquels les données sont organisées selon certains critères en vue de permettre leur exploitation”. Source: Grand dictionnaire http://www.granddictionnaire.com/btml/fra/r_motclef/index800_1.asp Mot clé à ajouter à votre requête: database Certains répertoires du Web permettent la recherche par mot clé ou par navigation à l'intérieur de liens pointant vers des bases de données... Exemples (par où commencer): Infomine: http://infomine.ucr.edu Internet Public Library (IPL2): http://www.ipl.org Intute: http://www.intute.ac.uk (jusqu’en 2014....)   Répertoire des bases de données gratuites disponibles dans Internet http://dadi.univ-lyon1.fr/ Libdex (Index des grandes bibliothèques du monde entier) http://www.libdex.com/
  • 65.
  • 66.
  • 67.
  • 68. L'ambiguïté du Web invisible...   Selon les spécialistes en sciences de l'information de Berkeley, on ne peut toujours savoir ou prévoir quels types de sites ( ou portions de sites) font partie du Web invisible. Voici quelques facteurs :   Quels sites offrent le contenu de leur base de données en pages statiques ( visible , hybride , invisible ). Politique d'inclusion ou d'exclusion des moteurs de recherche. Autres exemples de sites dits invisibles NASA Image Exchange http://nix.nasa.gov/ JSTOR project http://www.jstor.org Right-to-Know Network http://www.rtk.net/ National Climatic Data Center http://www.ncdc.noaa.gov/oa/ncdc.html Voir aussi Search Engine Land http://searchengineland.com
  • 69.