Master 2 Professionnel « Journalisme, enquête et reportage » IEP Rennes   Recherche d’information sur Internet   Alexandre Serres URFIST de Bretagne-Pays de la Loire 16 novembre 2009
Présentation : URFIST ? Unité Régionale de Formation à l’Information Scientifique et Technique Missions :   Formation des usagers à l’usage de l’information et des TIC Formation de formateurs  Veille Scientifique & Technologique Des services :   des stages de formation des supports en ligne des outils en libre accès des ressources  Voir le site :  http://www.sites.univ-rennes2.fr/urfist/ Un réseau de 7 URFIST    Au service de la communauté universitaire et des professionnels de l’information
Web 2.0 ? Personnalisation ? Indice de popularité ? Syndication de contenus ? Googlisation ? Serendipité ? Métamoteur ? Agrégateurs de presse ?
PLAN 1/ Introduction à la recherche d’information sur Internet : contexte, enjeux, méthodologies. 2/ Repérer les sources d’information pour le journalisme et les médias 3/ Connaître et utiliser les outils de recherche : moteurs, métamoteurs...  4/ Faire de la veille : fils RSS, pages personnalisables, Twitter... 5/ Utiliser les platesformes de partage 6/ Quelques ressources pour aller plus loin
1.1 Introduction : le contexte informationnel  Complexité d'Internet : Enchevêtrement des applications Messagerie, forums, web... Diversité du web : blogs, sites, réseaux sociaux...  Imbroglios socio-techniques Abondance de l’information : Métaphore du "déluge informationnel" Evolution du nombre de noms de domaines Explosion des pages web Explosion du nombre d'internautes
Réalité documentaire :   1996 : entre 100 et 250 000 sites web 2006 : entre 80 et 100 millions de sites En 2008 : plus de 1000 milliards de pages web  En deux ans,  plus de contenu créé que dans toute l’histoire de l’humanité 93 %  de ce contenu =  électronique 70% des données  créées  par des individus Réalité sociale :  250 millions d’utilisateurs sur  Facebook 1.1 Introduction : le contexte informationnel ; le « déluge informationnel »
1.1 Introduction : du “web 1.0” au “web 2.0”
1.1 Le contexte informationnel :  caractéristiques de l’information Hétérogénéité, fragmentation : des sources des documents des contenus des supports des points de vue Manque de « structuration » : Pages HTML Différences entre bases de données et pages web Coexistence pages web  "statiques" "dynamiques"
1.2 Introduction : quelques enjeux de la « RII » Quels changements majeurs de la recherche d’information, avec Internet ? Du monde professionnel au grand public : Usager « seul face aux outils » De l’ordre au désordre :  Usager « seul face aux documents » De la confiance  a priori  à la validation personnelle: Usager « seul face à l’information »  Du monde non-marchand à l’économie de l’attention: Usager « seul face aux liens commerciaux » De la transparence à la traçabilité généralisée :  Usager « seul face à ses traces » De l’individu à la communauté :   Les usagers en réseau
1.2 Introduction. Quelques enjeux de la « RII » : la « googlisation » Googlisation : utilisation exclusive des services de Google Différents problèmes :  Dangers du monopole :  “ le monde selon Google”, monopole d’une entreprise sur tous les secteurs de l’information  Problèmes du classement, de pertinence des résultats  Problèmes de la traçabilité, de la conservation des données personnelles  Risques d’addiction, de “googlisation” des usages    Enjeux de la formation pour diversifier les outils, prendre du recul
1.2 Introduction. Quelques enjeux de la « RII » : la « googlisation » Source :  S2M
  1.2 Quelques enjeux de la « RII » : : la confusion des pratiques informationnelles chercher communiquer Tagger / indexer organiser s’orienter partager (d’après O. Ertzscheid) google talk earth print orkut API’s
1.2 Quelques enjeux… :  l ’économie de l’attention Enjeu majeur sur le web : comment capter et garder l’attention des usagers ?  La variante internet du « temps de cerveau disponible » :  «  Les internautes vous paient avec le temps qu'ils passent sur vos contenus, ils vous paient avec leur attention. C'est cette attention, que les annonceurs veulent »  . David Eun, responsable des partenariats de contenus chez Google à New York (janv 08)
1.2 Quelques enjeux… :  le positionnement payant Différence entre liens naturels et liens sponsorisés ?  Problèmes et enjeux :  De plus en plus d’usagers arrivent sur des sites via les liens sponsorisés De plus en plus d’entreprises investissent dans des campagnes de liens sponsorisés Question : savoir distinguer un lien sponsorisé d’un lien naturel Question par rapport à la recherche, l’accès à l’information, son usage Problème : près de 60 % des gens ignorent la différence Risques des liens sponsorisés : 8,5% des liens sponsorisés conduiraient vers des sites représentant un risque pour l’internaute  (étude McAfee Site Advisor, Mai 2006)
1.2 L e positionnement payant 97 % du CA   ( 5,7 Mrds de $, fin 08)   Liens « naturels » Liens commerciaux
1.2 Quelques enjeux :  La traçabilité généralisée Types de données détenues par les grands portails :  Les requêtes sur les moteurs :  Ce qui m’intéresse Les blogs :  Mes opinions Les réseaux sociaux:  Mes réseaux personnels La messagerie, les forums, le « chat » :  Avec qui je communique et sur quoi Création de gigantesques base de données sur les goûts et habitudes des internautes  Enjeux :   Profilage marketing Pouvoir considérable accordé aux outils Risques d’intrusion de pouvoirs autoritaires (cf Chine, Iran...)
1.2 Quelques enjeux :  La traçabilité généralisée (source :  F.  Cavazza )
1.3 Introduction : m éthodologie(s) de la recherche d’information Pas de méthodologie définitive, universelle, linéaire sur le web Démarche itérative,  sérendipité Importance :  du questionnement de la question  : bien savoir ce que l'on cherche de la connaissance des sources  : partir de sources fiables, procéder par navigation de la maîtrise des outils :  utiliser le mode avancé de l'évaluation des ressources  trouvées de l'utilisation des outils de veille et de traitement de l’information
1.3 Méthodologies : Les 10 règles de la recherche d'information Maîtriser les outils de navigation maîtriser l'interrogation avancée connaître différents outils Savoir questionner identifier l'objet de la recherche bien cerner le sujet traduire concepts en mots-clés identifier les sources pertinentes Choisir les bons mots-clés Chercher l'information à la source trouver les sites de référence privilégier les sources primaires
1.3 Méthodologies : Les 10 règles de la recherche d'information Toujours analyser l'information recouper, critiquer, comparer... Garder les traces  bookmark du navigateur outils de gestion de signets  Zotero, Delicious... Maîtriser le temps faire plan de recherche éviter l'exhaustivité Rester clair sur ses objectifs
1.3 Méthodologies : Les 10 règles de la recherche d'information Utiliser différents types d'outils combiner moteurs, annuaires, métamoteurs... Etre "agile" lecture rapide rebondir d'un document à l'autre Mais… éviter le zapping (d’après V. Mesguich, A. Thomas,  Net Recherche 2009 , ADBS, 2009)
2/ Repérer les sources d’information Diversité des sources d’information :  Médias, presse  Bibliothèques, centres documentaires Institutions, organismes Personnes, chercheurs Banques de données Sites web, blogs Réseaux sociaux ... Diversité des outils de repérage des sources :  Catalogues de bibliothèques, réseaux bibliographiques  Annuaires thématiques Portails du web Distinguer sources d’information primaire   et secondaire
2/ Différence entre sources d’information primaire /secondaire Critère : le « degré d’élaboration » ou d’originalité du document  Source d’information primaire   :   donne accès au  texte intégral ,  d’origine , des documents primaires   Exemples : base de données de texte intégral, bibliothèque numérique, portail, moteur de recherche  Source d’information secondaire  :   donne accès aux  références  des documents primaires Exemples : catalogues, annuaires, bases de données bibliographiques …  Analogie avec la différence entre sources primaires et secondaires en journalisme Pour la méthodologie de la RI :     Importance du critère pour la recherche Intérêt de débuter une recherche par des outils et des sources secondaires : catalogues, annuaires, etc.
2/ Repérer les sources d’information  :   sources d’information secondaire Annuaires, répertoires de sources  : Annuaires de bibliothèques Répertoires de catalogues de bibliothèques en ligne Répertoires de laboratoires, de chercheurs… Répertoires de bases de données Sélections de ressources Annuaires thématiques d’Internet Sources d’information bibliographique : Catalogues de bibliothèques  Bases de données bibliographiques
2/ Repérer les sources d’information  :   sources d’information primaire Portails spécialisés  Bases de données d’articles de presse  Agrégateurs de presse  Archives textuelles en ligne :   Bibliothèques de revues Bibliothèques numériques Archives ouvertes Thèses en ligne Revues et journaux en ligne  Sites de presse Blogs de journalistes Sites d’images  Wikis spécialisés Listes de discussion, forums …
2.1.1 Pour repérer des sites web :  l es annuaires thématiques Définition :  outil de recherche (appelé aussi index ou  répertoire ), qui classe un ensemble de  sites web  suivant une  thématique arborescente Premiers  outils du web :   Virtual Library en 1991, Yahoo en 1994   Plusieurs types d’annuaires :   Généralistes  (Yahoo) ou  spécialisés  (UREC) Privés  (Yahoo) ou  publics  (Virtual Library) Collectifs  (Open Directory) ou  individuels  (Quartier Français…)
2.1.1 Pour repérer des sites web :  l es annuaires thématiques Des principes communs : Sélection humaine de ressources  Recensement de sites web (et non de pages web) Pré-catégorisation des ressources Arborescence Description manuelle des sites Moteur de recherche interne à l’annuaire  Importance des problèmes de classement des sites, de représentation des connaissances et des ressources Déclin des annuaires généralistes, maintien des annuaires spécialisés
2.1.1 Pour repérer des sites web :  l es annuaires thématiques Usages :   Recherche d’information sur un sujet   large Première approche d’un domaine :  Exemple de la presse  : recherche des titres de la  PQR sur l’Open Directory Recherche géographique :  voir partie annuaire sur  Breizhoo.fr Recherche de sites de référence : ex. des Signets de la BNF utiles pour défricher un domaine, pour les premières recherches sur un sujet Complémentarité des annuaires et des moteurs
2.1.1 Pour repérer des sites web :  l es annuaires thématiques Annuaires généralistes ou spécialisés :  Open Directory  : http://dmoz.org/ Annuaire collaboratif   Guide Yahoo  : À la fois portail, annuaire, et moteur Virtual Library  : http://vlib.org/  Annuaire de ressources scientifiques IndexWeb Annuaires spécialisés sur la presse :  Les Signets de la Bnf : presse Francofil : Les médias dans les pays francophones WebdoPresse  annuaire suisse de plus de 17000 sites de médias dans le monde Bibliothèque virtuelle de périodiques
2.1.2 Pour repérer des bases de données : les  répertoires de bases de données Le répertoire   DADI  ( Répertoire des bases de Données grAtuites sur Internet ) ;  Produit par l’URFIST de Lyon  Plus de 1000 bases de données recensées Tous les domaines couverts Accès par navigation et par requête Accès libre par Internet :  http://dadi.univ-lyon1.fr/
2.1.3 Pour trouver des références bibliographiques :  le catalogue SUDOC ( Système Universitaire de DOCumentation) Catalogue collectif de 1000 bibliothèques universitaires et de recherche :  > 9 millions de notices bibliographiques (ouvrages, périodiques, thèses…) Catalogue de > 400 000 notices de périodiques, dans 2400 bibliothèques et centres de documentation Répertoire des 3000 établissements du réseau SUDOC http:// www.sudoc.abes.fr /DB=2.1/LNG=FR/ Intérêt :  Accès unique pour les recherches bibliographiques : De livres De thèses De périodiques (uniquement sur les collections de périodiques) Prêt Entre Bibliothèques (PEB) Répertoire des BU
2.2.1 Source d’information primaire :  les portails   Définition :  "Ressource accessible via Internet, constituant un point d'accès unique, simplifié, facile d'emploi et unifié, pour un public cible, à des ressources (services, produits) électroniques distantes, variées et hétérogènes".  (Sylvie Dalbin, Instruments de recherche sur le Web, in  La Recherche d'information sur les réseaux,  cours INRIA 2002) Dispositif :  documentaire (ressources informationnelles), communicationnel, éditorial, technique... Diversité des ressources et services : recherche d ’information, achats/ventes, informations générales, spécialisées, personnalisation, messagerie, forums, services d’alerte… Portails généralistes / spécialisés Exemples :  Yahoo.fr ,  BusinessCom ,  Fabula ,  Culture.fr
2.2.1 Pour trouver des ressources sur la presse : les  portails spécialisées Categorynet.com  (portail de la presse et des médias) :  Créé en 1998 par Greg Manset ; entreprise de presse et réseau de journalistes Press List  (portail européen des métiers du journalisme) :  Créé en 2000 par Perry Petrakis, journaliste indépendant Journalistes.enligne-fr.com  (portail emplois, missions et stages des journalistes) : Créé en 2000  ; fait partie d’un dispositif de 1000 sites d’annonces d’emploi   PortailPresse   :  Créé en 2002 par la Fédération Nationale de la Presse Française
2.2.2 Pour chercher dans les articles de presse : les agrégateurs de presse Apparus vers la fin des 90’ Regroupent des milliers d’articles de presse sur une même plate forme, dans le même format Permettent l’interrogation simultanée de plusieurs titres de presse Possibilité de requêtes complexes : bases de données Accessibles sur abonnement Requêtes parfois gratuites, mais consultation payante des articles Pour en savoir plus : benchmark des  agrégateurs ,  Archimag
2.2.2 Pour chercher dans les articles de presse : les agrégateurs de presse Europresse :  www.europresse.com Plus de 20 millions d’articles Plus de 20 ans d’archives > 3000 sources françaises, sources canadiennes, texte intégral  Presse généraliste/spécialisée, quotidienne.. > en accès gratuit : recherche de sources possible Lexis Nexis  :  11 000 titres de la presse internationale en texte intégral  Spécialisé sur l’information juridique France Actu Régions  :  Accès à PQR Accès aux articles du jour de plus de 25 quotidiens régionaux
2.2.2 Pour chercher dans les articles de presse : les agrégateurs de presse FACTIVA :  http://www.factiva.com/ “ Factiva propose aux entreprises actualités et informations essentielles avec des outils et services de livraison de contenu. La base Factiva (+ 10000 sources) inclut l’association exclusive Wall Street Journal, Financial Times®, DJ et Reuters, AFP, AP… » (Journal du Net) Voir présentation sur : http://www.gfii.asso.fr/rubrique.php3?id_rubrique=72 Accessible à Rennes 1 et Rennes 2
2.2.3 Pour survoler l’actualité :  les moteurs d’actualité Principes :  Modules ou services proposés par les outils de recherche Agrégation de multiples sources d’actualité :  Presse, blogs, sites web… Revues de presse automatisées Services gratuits Nombreux moteurs d’actualité Précurseur : Google News Concurrence aiguë, enjeux économiques importants Problèmes et conflits juridiques
2.2.3 Pour survoler l’actualité :  les moteurs d’actualité   :  Google News Google News ( Actualités )  :  Créé  à la suite du 11/09/01 Lancé en  mars 2002 Diffusion en continu d’infos sur l’actualité  Sélection de  25 000 sources  d’information (avec les archives) + de 500 sources sur version française Plus de 40 versions nationales de Google News Automatisation complète Collecte et analyse de chaque source par un robot spécial Classement automatique des informations dans des rubriques prédéfinies :  Nombreux conflits :  Avec les agences de presse, les journaux...
2.2.3 Pour survoler l’actualité :  les moteurs d’actualité   :  Google News Fonctionnalités :  Personnalisation :  Ouvrir  Modifier   cette  page  Voir aussi sur  les  InfoStratèges .com Veille :   Syndication de fils RSS  Abonnement gratuit aux alertes  : par thèmes... > Nouveauté :  Recherche d’informations locales  pour la France Google  News Archive Search  :  Archives de presse Lancé en 2006, généralisé en 2008  Recherche dans 200 ans d’archives de journaux Affichage de chronologies Pour en savoir plus : voir  brochure de Google
2.2.3 Pour survoler l’actualité :  les moteurs d’actualité   :  Google News Syntaxe  de recherche :   intitle:  et  allintitle:  : dans le titre des articles intext:  et  allintext:  : dans le texte des articles inurl:   : dans un site particulier source:  : sur une source précise Source:Libération location:  : dans un pays précis Location:Algérie
2.2.3 Pour survoler l’actualité :  les moteurs d’actualité et de blogs   Wikio   indexe sources de presse et blogs ;  annonce > 143 000 blogs et sites d’actualités indexés (dont plus de 133 000 blogs) modules spécialisés sur les Actualités, les blogs, le shopping, et « Live » : suivi de l’actualité en temps réel (de l’indexation…) agrégation des billets et nouvelles, selon plus de 30 000 catégories  Technologie d’indexation sémantique classement des blogs « influents »  par catégories, selon le nombre de rétroliens ; voir  http:// www.wikio.fr / blogs /top/politique Nombreuses innovations technologiques : cf les  Wikio   Labs   voir notamment  Backlink   Factory  
2.2.3 Pour survoler l’actualité :  les moteurs d’actualité NewsBrief  : l’information en temps réel Union Européenne > 1400 portails, 20 flux d’actualités commerciales, sites spécialisés Surveillance quotidienne Mises à jour toutes les 10 mns Classement des informations Clusterisation : par thèmes, par Directions Générales de l’UE Possibilité d’abonnements RSS
2.2.3 Pour analyser l’actualité :  les moteurs d’actualité NewsExplorer   : analyse multilingue Analyse de l’information une fois par jour Résumé des 20 faits marquants Nombreuses fonctionnalités :  Carte des lieux de l’actualité Analyse des actualités : tous les articles sur le sujet… Chronologie des événements Fiches sur personnalités Recherche rétrospective sur les événements majeurs d’un pays …
2.2.3 Pour survoler l’actualité :  autres moteurs d’actualité Anglophones :  Yahoo News Alltheweb  News Rocket News Digg Topix  : 2004 Agrégateur d’actualités localisées Voir  Bases Francophones  : Yahoo France Actualités DeepIndex News Widepress Voir  Archimag Outils de visualisation :  Nuages de tags à partir de Google News, sur les termes de l'actualité : Newzingo   Google News Cloud
2.2.4 Pour trouver des revues en texte intégral : les répertoires de revues BNF, Périodiques électroniques  : Catalogue des périodiques électroniques de la BNF Accès au texte intégral de près de vingt mille périodiques électroniques de toutes disciplines. DOAJ  (Directory of Open Access Journals) http://www.doaj.org Répertoire de plus de 4400 périodiques électroniques, en libre accès
2.2.5 Pour trouver des blogs  Typologie des blogs : Blogs « introspectifs » : journal « extime » Blogs d'actualité et d'opinion : Blogs de journalistes Coulisses de Bruxelles , de Jean Quatremer Journalistiques Blogs politiques : Blogs thématiques : passionnés, experts, professionnels... Blogs juridiques :   Law X.0 Blogs d'entreprise Blogs scientifiques :  entre 3 et 10 000 blogs scientifiques dans le monde, dont 2 000 aux USA  
2.2.5 Pour trouver des blogs Utiliser :  la  blogroll  d'un blog :  Ex.  UrfistInfo   des moteurs de blogs :   Technorati   Google Blog Search Ask  Blog Wikio BlogPulse Des annuaires : Voir sur  Open Directory Des plateformes de blogs scientifiques : Hypothèses Des listes de blogs : Blogs scientifiques : Academic blogs in French
3/ Connaître et utiliser les outils de recherche : moteurs, métamoteurs...
3.1  Les moteurs de recherche Définition :  outil automatisé d’indexation et de recherche  des ressources du web Fonctionnement :   3 modules autonomes : robot collecteur : collecte des données  module d’indexation : base de données du moteur module de requête : gestion des requêtes et des résultats
3.1 Fonctionnement des moteurs de recherche Source :  R. Viseur, CETIC
3.1 La gestion des requêtes : fonctionnalités de filtrage des requêtes  Nombreuses possibilités de filtrage :   géographique du web :  mondial, francophone linguistique :  choix de la langue des ressources des types de ressources :  images, audio… des ressources internet :  web, forum, messagerie, weblogs des formats :  HTML, PDF, DOC, PPT, XLS, RTF… des dates :  nombreuses options des champs :  titre, URL, host, domaine… thématique :  choix du domaine de recherche (Alta Vista)    voir Google, Exalead, Yahoo Search
3.1 Maîtriser l’interrogation avancée sur Google : les opérateurs de recherche Opérateurs booléens et de présence :  AND  :  implicite  ; différent de + +  : prend en compte  l’orthographe exacte -  :  exclut  un ou plusieurs termes (SAUF) OR ( ou  |)  :  l’un ou l’autre  ou tous les termes Opérateurs numériques :   ..  = entre ( 200..300 euros)   ..200 = <200 200.. = >200
3.1 Maîtriser l’interrogation avancée sur Google : les opérateurs de recherche Opérateurs linguistiques :  «… »  :  recherche d’expression exacte   *  : astérisque permet de  remplacer un terme   ~ :   recherche   sur   les synonymes  (dans version anglaise) define:  :  pour trouver la définition d’un mot Règle des requêtes :   limite des 10 mots
3.1 Maîtriser l’interrogation avancée sur Google : les opérateurs de recherche Filtrage sur le type de documents :  filetype: ou ext:  :  recherche sur le  format ou l’extension de fichier Opérateurs de filtrage sur une page web :  pour utiliser les caractéristiques d’une page web site:  recherche sur le  nom de domaine ( hostname ) Lister toutes les pages d’un site Rechercher des fichiers particuliers sur un site (croiser ext: et site:) Affiner une recherche sur un type de sites inurl:  et  allinurl:  : recherche sur  l’URL de la page intitle:  et  allintitle:  : affinement de la recherche sur  le titre de la page  (balise Title) inanchor:  et  allinanchor:  : recherches sur les  liens contenant les mots-clés
3.1 Maîtriser l’interrogation avancée sur Google : les opérateurs de recherche Opérateurs de fonctions :  pour trouver des informations sur une page ou un site cache:  : affiche la version cache du document related:  : affiche les pages similaires au site ou à la page indiquée link:  :   affiche les pages liées à un site (fonction bridée sur Google) info:  : récapitule toutes les informations dont dispose Google sur un site :  version cache, pages similaires, pages liées, pages du site …  Opérateurs spécifiques à  Google.com  :   view:info  : permet de chercher dans les mots des résumés, selon quatre critères : dates, distances, lieux et images view:timeline  : présente les résultats sous forme chronologique, permet de chercher sur une date view:map  : géolocalise les résultats sur Google Maps et permet de chercher par lieux
3.1. Moteurs de recherche :  pour sortir de la « googlisation » Autres moteurs généralistes:  Exalead   Yahoo Search Bing Ask  Com
3.2 Les métamoteurs Définition :  Un métamoteur est un outil de recherche qui  interroge en parallèle plusieurs outils  (moteurs et annuaires),  rapatrie leurs réponses et les organise , selon des méthodes de classement spécifiques, pour  fournir aux utilisateurs une présentation structurée  des résultats. Diversité des métamoteurs :  En ligne / hors-ligne Généraux / spécialisés
3.2 Les métamoteurs Fonctionnement, éléments d’un métamoteur pas de base de données en propre  outils intermédiaires : une seule requête posée sur différents outils Exploitation des résultats des autres outils Généralement, fusion des résultats et élimination des doublons Classement des résultats selon critères propres au métamoteur Présentation des résultats, selon différentes méthodes : linéaires, cartographiques
3.2 Les métamoteurs Utilisation, intérêt :  Simplification  :  Une seule requête pour plusieurs outils  Elargissement de la recherche  : :  Possibilité d’interroger plusieurs sources : d’une dizaine à un millier (Copernic) Renforcement de la pertinence :   Sélection des documents plus poussée, par le calcul de  pertinence opéré sur plusieurs outils Utiles pour le panorama des ressources  sur un thème Exploitation parfois sophistiquée des résultats Outils paramétrables, personnalisables
3.2 Les métamoteurs Exemples de métamoteurs :  Francophones :   Ixquick   : http://www.ixquick.com   Kartoo   : http://www.kartoo.com/  Anglo-saxons :   Mamma   : http://www.mamma.com  Clusty   :  http://clusty.com/ Internet  Sleuth   : http://www.isleuth.com   SurfWax   : http://www.surfwax.com
4/ Faire de la veille : alertes, fils RSS, pages personnalisables...
4.1 Faire de la veille :  les alertes Qu’est-ce  qu’une alerte ?  Répétition automatique d’une requête à chaque mise à jour d’une source d'information (base de données, catalogue, revue, moteur de recherche…).  Résultats adressés périodiquement à l’utilisateur par messagerie ou sous forme de flux RSS.  DSI (diffusion sélective de l’information) : alerte mise en place par un service documentaire pour un ou plusieurs usagers.  A quoi sert une alerte ?  À surveiller : l'évolution d'un thème les  travaux d'un auteur ou d'une institution  sans avoir à réinterroger une source d’information.
4.1 Faire de la veille :  les alertes Comment mettre en place une alerte ?  Ouvrir un compte, définir un profil Définir la source : revue, site… définir la requête  : mots-clés.. Définir la périodicité des alertes Définir le mode de transmission : mel, fils RSS  Exemples :  Sur les bases de données : voir  Services d’alertes dans les bases de données Sur Google :  Alertes  Google
4.2 Faire de la veille :   La syndication de contenus   Syndication de contenus  : possibilité de publier automatiquement sur un site web des informations issues d'un autre site web Un  fil RSS  = un  fichier texte  au  format XML  (eXtended Markup Language) RSS peut signifier :  Really Simple Syndication Rich Site Summary RDF (Resource Description Framework) Site Summary  (plus rare)
4.2 Faire de la veille :   La syndication de contenus Comment reconnaître les fils RSS ?  Logos sur les sites, ou bien RSS, ou ATOM  :  En lien, derrière le logo :  l'adresse URL du fichier texte permettant la syndication Exemple : passer la souris sur un fil RSS et observer la barre d'état du navigateur Lors de la mise à jour d’un site web, un fichier texte au format XML contenant une description synthétique des nouveautés du site est généré en temps réel  Plusieurs formats de fils RSS : RSS 2.0  et  Atom  ; compatibles
4.2 Faire de la veille :   La syndication de contenus Outils :  En lecture : agrégateurs de fils RSS Pour l’édition : éditeurs de fils RSS  Plusieurs types d'agrégateurs :  Agrégateurs en ligne :  MetaRSS , « pages perso » Agrégateurs en local :  FeedReader  ; voir liste sur  RSS et podcasts  ;  Agrégateurs intégrés : Au logiciel de messagerie : Thunderbird Au navigateur : Firefox, Safari, OPera
4.2 Faire de la veille :   La syndication de contenus Omniprésence des fils RSS :  blogs sites d'actualité :  journaux , agrégateurs de presse sites de revues spécialisées  Sites d'entreprise Résultats de moteurs de recherche Sites web dynamiques Bookmarks sociaux etc.
4.2 Faire de la veille :   La syndication de contenus Plusieurs fonctions des fils RSS :  Suivre l’actualité d’un site : réception de toutes les nouveautés Se tenir informé :  Sur l'actualité : tous les journaux proposent des fils RSS Sur un domaine : suivi de blogs et de sites spécialisés Outil de veille et de surveillance, technique du  push
4.3 Faire de la veille :   Les pages personnalisables Définition : Pages personnalisables : Possibilité de gérer et d’organiser soi-même ses flux RSS Pages web organisées en onglets et boîtes  Fournies gratuitement Exemples : Netvibes PagesFlakes iGoogle
4.3 Faire de la veille :   Les pages personnalisables Fonctions : Pour la gestion et la recherche d’information Choix personnel des sources : sites web, blogs, fils RSS … Divers services : calendrier, agenda … Bureau virtuel Outils de veille, de surveillance Outils d’information, de publication  Développement des portails Netvibes  Pages personnalisables Netvibes rendues publiques  Urfist  de Rennes Documentation Française Docsdocs
5. Plates-formes de partage   Les signets  Les photos, les vidéos  Les diaporamas Les CV, les réseaux sociaux L'information d'actualité
5.1 Plates-formes de partage de signets Principes :  Externalisation de ses bookmarks   Indexation libre par tags   Classement des signets  par catégories et par tags Indication du nombre de signalements  d'un même signet  Création de réseaux de partage :  «  social bookmarking  » Intérêt :  Simplicité :  de collecte et de gestion des signets  Plus-value documentaire :   Tags Catégories Plus-value sociale : Capitalisation du réseau Réseaux de confiance
5.1 Plates-formes de partage de signets Généralistes  :  Delicious  : Yahoo Yahoo! Favoris  : Yahoo  Blogmarks  : entreprise française Blinklist  : MindValley Labs, entreprise de Malaisie  Diigo    Scientifiques  :  Connotea  : revue Nature 2collab  : Elsevier Bibsonomy  : Université de Kassel (Allemagne)
5.2 Les plates-formes de partage multimédias Recherche dans les sites de partage de documents multimédias Les images : Flickr , racheté par Yahoo! En 2OO5 =  partage de photos Mise à disposition du   moteur de recherche  pour recherche à travers des millions de photos mises en ligne par l’ensemble des utilisateurs Menu Organize  pour organiser ses photos Attribution de  mots clés, de tags
5.2 Plates-formes de partage de diaporamas SlideShare   Site de partage et récupération de présentations / diapositives  Powerpoint, mais pas seulement : aussi pdf, OpenOffice, Word, documents depuis Google Docs… Transformation  des présentations en format flash Après inscription, possibilité de stocker et de publier les présentations, soit dans un réseau limité, soit publiquement.
5.3 Sites d'actualité collaborative AgoraVox  : Site collaboratif d'actualité, créé par J. de Rosnay et C. Revelli Projet emblématique du web 2.0 et du pouvoir donné aux internautes (« pronétaires ») Trois principes :  «  1- Nous sommes tous des capteurs d’information 2- Le passage des mass-médias aux médias des masses 3- Une politique éditoriale et un comité rédactionnel inédits »
6/ Supports et ressources pour aller plus loin… Supports de l’URFIST de Rennes : Les supports sur la recherche d’information Ressources sur les outils de recherche  Evaluation de l’information sur Internet Supports des autres URFIST :   Voir adresses sur  UrfistInfo Quelques autres sites-ressources : AERIS SAPRISTI
Contact   Adresse mel :  [email_address] Site :  http://www.sites.univ-rennes2.fr/urfist/

Cours en Master 2 IEP Journalisme 2009-2010

  • 1.
    Master 2 Professionnel« Journalisme, enquête et reportage » IEP Rennes Recherche d’information sur Internet Alexandre Serres URFIST de Bretagne-Pays de la Loire 16 novembre 2009
  • 2.
    Présentation : URFIST? Unité Régionale de Formation à l’Information Scientifique et Technique Missions : Formation des usagers à l’usage de l’information et des TIC Formation de formateurs Veille Scientifique & Technologique Des services : des stages de formation des supports en ligne des outils en libre accès des ressources Voir le site : http://www.sites.univ-rennes2.fr/urfist/ Un réseau de 7 URFIST  Au service de la communauté universitaire et des professionnels de l’information
  • 3.
    Web 2.0 ?Personnalisation ? Indice de popularité ? Syndication de contenus ? Googlisation ? Serendipité ? Métamoteur ? Agrégateurs de presse ?
  • 4.
    PLAN 1/ Introductionà la recherche d’information sur Internet : contexte, enjeux, méthodologies. 2/ Repérer les sources d’information pour le journalisme et les médias 3/ Connaître et utiliser les outils de recherche : moteurs, métamoteurs... 4/ Faire de la veille : fils RSS, pages personnalisables, Twitter... 5/ Utiliser les platesformes de partage 6/ Quelques ressources pour aller plus loin
  • 5.
    1.1 Introduction :le contexte informationnel Complexité d'Internet : Enchevêtrement des applications Messagerie, forums, web... Diversité du web : blogs, sites, réseaux sociaux... Imbroglios socio-techniques Abondance de l’information : Métaphore du &quot;déluge informationnel&quot; Evolution du nombre de noms de domaines Explosion des pages web Explosion du nombre d'internautes
  • 6.
    Réalité documentaire : 1996 : entre 100 et 250 000 sites web 2006 : entre 80 et 100 millions de sites En 2008 : plus de 1000 milliards de pages web En deux ans, plus de contenu créé que dans toute l’histoire de l’humanité 93 % de ce contenu = électronique 70% des données créées par des individus Réalité sociale : 250 millions d’utilisateurs sur Facebook 1.1 Introduction : le contexte informationnel ; le « déluge informationnel »
  • 7.
    1.1 Introduction :du “web 1.0” au “web 2.0”
  • 8.
    1.1 Le contexteinformationnel : caractéristiques de l’information Hétérogénéité, fragmentation : des sources des documents des contenus des supports des points de vue Manque de « structuration » : Pages HTML Différences entre bases de données et pages web Coexistence pages web &quot;statiques&quot; &quot;dynamiques&quot;
  • 9.
    1.2 Introduction :quelques enjeux de la « RII » Quels changements majeurs de la recherche d’information, avec Internet ? Du monde professionnel au grand public : Usager « seul face aux outils » De l’ordre au désordre : Usager « seul face aux documents » De la confiance a priori à la validation personnelle: Usager « seul face à l’information » Du monde non-marchand à l’économie de l’attention: Usager « seul face aux liens commerciaux » De la transparence à la traçabilité généralisée : Usager « seul face à ses traces » De l’individu à la communauté : Les usagers en réseau
  • 10.
    1.2 Introduction. Quelquesenjeux de la « RII » : la « googlisation » Googlisation : utilisation exclusive des services de Google Différents problèmes : Dangers du monopole : “ le monde selon Google”, monopole d’une entreprise sur tous les secteurs de l’information Problèmes du classement, de pertinence des résultats Problèmes de la traçabilité, de la conservation des données personnelles Risques d’addiction, de “googlisation” des usages  Enjeux de la formation pour diversifier les outils, prendre du recul
  • 11.
    1.2 Introduction. Quelquesenjeux de la « RII » : la « googlisation » Source : S2M
  • 12.
    1.2Quelques enjeux de la « RII » : : la confusion des pratiques informationnelles chercher communiquer Tagger / indexer organiser s’orienter partager (d’après O. Ertzscheid) google talk earth print orkut API’s
  • 13.
    1.2 Quelques enjeux…: l ’économie de l’attention Enjeu majeur sur le web : comment capter et garder l’attention des usagers ? La variante internet du « temps de cerveau disponible » : «  Les internautes vous paient avec le temps qu'ils passent sur vos contenus, ils vous paient avec leur attention. C'est cette attention, que les annonceurs veulent »  . David Eun, responsable des partenariats de contenus chez Google à New York (janv 08)
  • 14.
    1.2 Quelques enjeux…: le positionnement payant Différence entre liens naturels et liens sponsorisés ? Problèmes et enjeux : De plus en plus d’usagers arrivent sur des sites via les liens sponsorisés De plus en plus d’entreprises investissent dans des campagnes de liens sponsorisés Question : savoir distinguer un lien sponsorisé d’un lien naturel Question par rapport à la recherche, l’accès à l’information, son usage Problème : près de 60 % des gens ignorent la différence Risques des liens sponsorisés : 8,5% des liens sponsorisés conduiraient vers des sites représentant un risque pour l’internaute (étude McAfee Site Advisor, Mai 2006)
  • 15.
    1.2 L epositionnement payant 97 % du CA ( 5,7 Mrds de $, fin 08) Liens « naturels » Liens commerciaux
  • 16.
    1.2 Quelques enjeux: La traçabilité généralisée Types de données détenues par les grands portails : Les requêtes sur les moteurs : Ce qui m’intéresse Les blogs : Mes opinions Les réseaux sociaux: Mes réseaux personnels La messagerie, les forums, le « chat » : Avec qui je communique et sur quoi Création de gigantesques base de données sur les goûts et habitudes des internautes Enjeux : Profilage marketing Pouvoir considérable accordé aux outils Risques d’intrusion de pouvoirs autoritaires (cf Chine, Iran...)
  • 17.
    1.2 Quelques enjeux: La traçabilité généralisée (source : F. Cavazza )
  • 18.
    1.3 Introduction :m éthodologie(s) de la recherche d’information Pas de méthodologie définitive, universelle, linéaire sur le web Démarche itérative, sérendipité Importance : du questionnement de la question : bien savoir ce que l'on cherche de la connaissance des sources : partir de sources fiables, procéder par navigation de la maîtrise des outils : utiliser le mode avancé de l'évaluation des ressources trouvées de l'utilisation des outils de veille et de traitement de l’information
  • 19.
    1.3 Méthodologies :Les 10 règles de la recherche d'information Maîtriser les outils de navigation maîtriser l'interrogation avancée connaître différents outils Savoir questionner identifier l'objet de la recherche bien cerner le sujet traduire concepts en mots-clés identifier les sources pertinentes Choisir les bons mots-clés Chercher l'information à la source trouver les sites de référence privilégier les sources primaires
  • 20.
    1.3 Méthodologies :Les 10 règles de la recherche d'information Toujours analyser l'information recouper, critiquer, comparer... Garder les traces bookmark du navigateur outils de gestion de signets Zotero, Delicious... Maîtriser le temps faire plan de recherche éviter l'exhaustivité Rester clair sur ses objectifs
  • 21.
    1.3 Méthodologies :Les 10 règles de la recherche d'information Utiliser différents types d'outils combiner moteurs, annuaires, métamoteurs... Etre &quot;agile&quot; lecture rapide rebondir d'un document à l'autre Mais… éviter le zapping (d’après V. Mesguich, A. Thomas, Net Recherche 2009 , ADBS, 2009)
  • 22.
    2/ Repérer lessources d’information Diversité des sources d’information : Médias, presse Bibliothèques, centres documentaires Institutions, organismes Personnes, chercheurs Banques de données Sites web, blogs Réseaux sociaux ... Diversité des outils de repérage des sources : Catalogues de bibliothèques, réseaux bibliographiques Annuaires thématiques Portails du web Distinguer sources d’information primaire et secondaire
  • 23.
    2/ Différence entresources d’information primaire /secondaire Critère : le « degré d’élaboration » ou d’originalité du document Source d’information primaire : donne accès au texte intégral , d’origine , des documents primaires Exemples : base de données de texte intégral, bibliothèque numérique, portail, moteur de recherche Source d’information secondaire : donne accès aux références des documents primaires Exemples : catalogues, annuaires, bases de données bibliographiques … Analogie avec la différence entre sources primaires et secondaires en journalisme Pour la méthodologie de la RI :  Importance du critère pour la recherche Intérêt de débuter une recherche par des outils et des sources secondaires : catalogues, annuaires, etc.
  • 24.
    2/ Repérer lessources d’information : sources d’information secondaire Annuaires, répertoires de sources : Annuaires de bibliothèques Répertoires de catalogues de bibliothèques en ligne Répertoires de laboratoires, de chercheurs… Répertoires de bases de données Sélections de ressources Annuaires thématiques d’Internet Sources d’information bibliographique : Catalogues de bibliothèques Bases de données bibliographiques
  • 25.
    2/ Repérer lessources d’information : sources d’information primaire Portails spécialisés Bases de données d’articles de presse Agrégateurs de presse Archives textuelles en ligne : Bibliothèques de revues Bibliothèques numériques Archives ouvertes Thèses en ligne Revues et journaux en ligne Sites de presse Blogs de journalistes Sites d’images Wikis spécialisés Listes de discussion, forums …
  • 26.
    2.1.1 Pour repérerdes sites web : l es annuaires thématiques Définition : outil de recherche (appelé aussi index ou répertoire ), qui classe un ensemble de sites web suivant une thématique arborescente Premiers outils du web : Virtual Library en 1991, Yahoo en 1994 Plusieurs types d’annuaires : Généralistes (Yahoo) ou spécialisés (UREC) Privés (Yahoo) ou publics (Virtual Library) Collectifs (Open Directory) ou individuels (Quartier Français…)
  • 27.
    2.1.1 Pour repérerdes sites web : l es annuaires thématiques Des principes communs : Sélection humaine de ressources Recensement de sites web (et non de pages web) Pré-catégorisation des ressources Arborescence Description manuelle des sites Moteur de recherche interne à l’annuaire Importance des problèmes de classement des sites, de représentation des connaissances et des ressources Déclin des annuaires généralistes, maintien des annuaires spécialisés
  • 28.
    2.1.1 Pour repérerdes sites web : l es annuaires thématiques Usages : Recherche d’information sur un sujet large Première approche d’un domaine : Exemple de la presse : recherche des titres de la PQR sur l’Open Directory Recherche géographique : voir partie annuaire sur Breizhoo.fr Recherche de sites de référence : ex. des Signets de la BNF utiles pour défricher un domaine, pour les premières recherches sur un sujet Complémentarité des annuaires et des moteurs
  • 29.
    2.1.1 Pour repérerdes sites web : l es annuaires thématiques Annuaires généralistes ou spécialisés : Open Directory : http://dmoz.org/ Annuaire collaboratif Guide Yahoo : À la fois portail, annuaire, et moteur Virtual Library : http://vlib.org/ Annuaire de ressources scientifiques IndexWeb Annuaires spécialisés sur la presse : Les Signets de la Bnf : presse Francofil : Les médias dans les pays francophones WebdoPresse annuaire suisse de plus de 17000 sites de médias dans le monde Bibliothèque virtuelle de périodiques
  • 30.
    2.1.2 Pour repérerdes bases de données : les répertoires de bases de données Le répertoire DADI ( Répertoire des bases de Données grAtuites sur Internet ) ; Produit par l’URFIST de Lyon Plus de 1000 bases de données recensées Tous les domaines couverts Accès par navigation et par requête Accès libre par Internet : http://dadi.univ-lyon1.fr/
  • 31.
    2.1.3 Pour trouverdes références bibliographiques : le catalogue SUDOC ( Système Universitaire de DOCumentation) Catalogue collectif de 1000 bibliothèques universitaires et de recherche : > 9 millions de notices bibliographiques (ouvrages, périodiques, thèses…) Catalogue de > 400 000 notices de périodiques, dans 2400 bibliothèques et centres de documentation Répertoire des 3000 établissements du réseau SUDOC http:// www.sudoc.abes.fr /DB=2.1/LNG=FR/ Intérêt : Accès unique pour les recherches bibliographiques : De livres De thèses De périodiques (uniquement sur les collections de périodiques) Prêt Entre Bibliothèques (PEB) Répertoire des BU
  • 32.
    2.2.1 Source d’informationprimaire : les portails Définition : &quot;Ressource accessible via Internet, constituant un point d'accès unique, simplifié, facile d'emploi et unifié, pour un public cible, à des ressources (services, produits) électroniques distantes, variées et hétérogènes&quot;. (Sylvie Dalbin, Instruments de recherche sur le Web, in La Recherche d'information sur les réseaux, cours INRIA 2002) Dispositif : documentaire (ressources informationnelles), communicationnel, éditorial, technique... Diversité des ressources et services : recherche d ’information, achats/ventes, informations générales, spécialisées, personnalisation, messagerie, forums, services d’alerte… Portails généralistes / spécialisés Exemples : Yahoo.fr , BusinessCom , Fabula , Culture.fr
  • 33.
    2.2.1 Pour trouverdes ressources sur la presse : les portails spécialisées Categorynet.com (portail de la presse et des médias) : Créé en 1998 par Greg Manset ; entreprise de presse et réseau de journalistes Press List (portail européen des métiers du journalisme) : Créé en 2000 par Perry Petrakis, journaliste indépendant Journalistes.enligne-fr.com (portail emplois, missions et stages des journalistes) : Créé en 2000 ; fait partie d’un dispositif de 1000 sites d’annonces d’emploi PortailPresse : Créé en 2002 par la Fédération Nationale de la Presse Française
  • 34.
    2.2.2 Pour chercherdans les articles de presse : les agrégateurs de presse Apparus vers la fin des 90’ Regroupent des milliers d’articles de presse sur une même plate forme, dans le même format Permettent l’interrogation simultanée de plusieurs titres de presse Possibilité de requêtes complexes : bases de données Accessibles sur abonnement Requêtes parfois gratuites, mais consultation payante des articles Pour en savoir plus : benchmark des agrégateurs , Archimag
  • 35.
    2.2.2 Pour chercherdans les articles de presse : les agrégateurs de presse Europresse : www.europresse.com Plus de 20 millions d’articles Plus de 20 ans d’archives > 3000 sources françaises, sources canadiennes, texte intégral Presse généraliste/spécialisée, quotidienne.. > en accès gratuit : recherche de sources possible Lexis Nexis : 11 000 titres de la presse internationale en texte intégral Spécialisé sur l’information juridique France Actu Régions : Accès à PQR Accès aux articles du jour de plus de 25 quotidiens régionaux
  • 36.
    2.2.2 Pour chercherdans les articles de presse : les agrégateurs de presse FACTIVA : http://www.factiva.com/ “ Factiva propose aux entreprises actualités et informations essentielles avec des outils et services de livraison de contenu. La base Factiva (+ 10000 sources) inclut l’association exclusive Wall Street Journal, Financial Times®, DJ et Reuters, AFP, AP… » (Journal du Net) Voir présentation sur : http://www.gfii.asso.fr/rubrique.php3?id_rubrique=72 Accessible à Rennes 1 et Rennes 2
  • 37.
    2.2.3 Pour survolerl’actualité : les moteurs d’actualité Principes : Modules ou services proposés par les outils de recherche Agrégation de multiples sources d’actualité : Presse, blogs, sites web… Revues de presse automatisées Services gratuits Nombreux moteurs d’actualité Précurseur : Google News Concurrence aiguë, enjeux économiques importants Problèmes et conflits juridiques
  • 38.
    2.2.3 Pour survolerl’actualité : les moteurs d’actualité : Google News Google News ( Actualités ) : Créé à la suite du 11/09/01 Lancé en mars 2002 Diffusion en continu d’infos sur l’actualité Sélection de 25 000 sources d’information (avec les archives) + de 500 sources sur version française Plus de 40 versions nationales de Google News Automatisation complète Collecte et analyse de chaque source par un robot spécial Classement automatique des informations dans des rubriques prédéfinies : Nombreux conflits : Avec les agences de presse, les journaux...
  • 39.
    2.2.3 Pour survolerl’actualité : les moteurs d’actualité : Google News Fonctionnalités : Personnalisation : Ouvrir Modifier cette page Voir aussi sur les InfoStratèges .com Veille : Syndication de fils RSS Abonnement gratuit aux alertes : par thèmes... > Nouveauté : Recherche d’informations locales pour la France Google News Archive Search : Archives de presse Lancé en 2006, généralisé en 2008 Recherche dans 200 ans d’archives de journaux Affichage de chronologies Pour en savoir plus : voir brochure de Google
  • 40.
    2.2.3 Pour survolerl’actualité : les moteurs d’actualité : Google News Syntaxe de recherche : intitle: et allintitle: : dans le titre des articles intext: et allintext: : dans le texte des articles inurl: : dans un site particulier source: : sur une source précise Source:Libération location: : dans un pays précis Location:Algérie
  • 41.
    2.2.3 Pour survolerl’actualité : les moteurs d’actualité et de blogs Wikio indexe sources de presse et blogs ; annonce > 143 000 blogs et sites d’actualités indexés (dont plus de 133 000 blogs) modules spécialisés sur les Actualités, les blogs, le shopping, et « Live » : suivi de l’actualité en temps réel (de l’indexation…) agrégation des billets et nouvelles, selon plus de 30 000 catégories  Technologie d’indexation sémantique classement des blogs « influents » par catégories, selon le nombre de rétroliens ; voir http:// www.wikio.fr / blogs /top/politique Nombreuses innovations technologiques : cf les Wikio Labs voir notamment Backlink Factory  
  • 42.
    2.2.3 Pour survolerl’actualité : les moteurs d’actualité NewsBrief : l’information en temps réel Union Européenne > 1400 portails, 20 flux d’actualités commerciales, sites spécialisés Surveillance quotidienne Mises à jour toutes les 10 mns Classement des informations Clusterisation : par thèmes, par Directions Générales de l’UE Possibilité d’abonnements RSS
  • 43.
    2.2.3 Pour analyserl’actualité : les moteurs d’actualité NewsExplorer : analyse multilingue Analyse de l’information une fois par jour Résumé des 20 faits marquants Nombreuses fonctionnalités : Carte des lieux de l’actualité Analyse des actualités : tous les articles sur le sujet… Chronologie des événements Fiches sur personnalités Recherche rétrospective sur les événements majeurs d’un pays …
  • 44.
    2.2.3 Pour survolerl’actualité : autres moteurs d’actualité Anglophones : Yahoo News Alltheweb News Rocket News Digg Topix : 2004 Agrégateur d’actualités localisées Voir Bases Francophones : Yahoo France Actualités DeepIndex News Widepress Voir Archimag Outils de visualisation : Nuages de tags à partir de Google News, sur les termes de l'actualité : Newzingo Google News Cloud
  • 45.
    2.2.4 Pour trouverdes revues en texte intégral : les répertoires de revues BNF, Périodiques électroniques : Catalogue des périodiques électroniques de la BNF Accès au texte intégral de près de vingt mille périodiques électroniques de toutes disciplines. DOAJ (Directory of Open Access Journals) http://www.doaj.org Répertoire de plus de 4400 périodiques électroniques, en libre accès
  • 46.
    2.2.5 Pour trouverdes blogs Typologie des blogs : Blogs « introspectifs » : journal « extime » Blogs d'actualité et d'opinion : Blogs de journalistes Coulisses de Bruxelles , de Jean Quatremer Journalistiques Blogs politiques : Blogs thématiques : passionnés, experts, professionnels... Blogs juridiques : Law X.0 Blogs d'entreprise Blogs scientifiques : entre 3 et 10 000 blogs scientifiques dans le monde, dont 2 000 aux USA  
  • 47.
    2.2.5 Pour trouverdes blogs Utiliser : la blogroll d'un blog : Ex. UrfistInfo des moteurs de blogs : Technorati Google Blog Search Ask Blog Wikio BlogPulse Des annuaires : Voir sur Open Directory Des plateformes de blogs scientifiques : Hypothèses Des listes de blogs : Blogs scientifiques : Academic blogs in French
  • 48.
    3/ Connaître etutiliser les outils de recherche : moteurs, métamoteurs...
  • 49.
    3.1 Lesmoteurs de recherche Définition : outil automatisé d’indexation et de recherche des ressources du web Fonctionnement : 3 modules autonomes : robot collecteur : collecte des données module d’indexation : base de données du moteur module de requête : gestion des requêtes et des résultats
  • 50.
    3.1 Fonctionnement desmoteurs de recherche Source : R. Viseur, CETIC
  • 51.
    3.1 La gestiondes requêtes : fonctionnalités de filtrage des requêtes Nombreuses possibilités de filtrage : géographique du web : mondial, francophone linguistique : choix de la langue des ressources des types de ressources : images, audio… des ressources internet : web, forum, messagerie, weblogs des formats : HTML, PDF, DOC, PPT, XLS, RTF… des dates : nombreuses options des champs : titre, URL, host, domaine… thématique : choix du domaine de recherche (Alta Vista)  voir Google, Exalead, Yahoo Search
  • 52.
    3.1 Maîtriser l’interrogationavancée sur Google : les opérateurs de recherche Opérateurs booléens et de présence : AND : implicite ; différent de + + : prend en compte l’orthographe exacte - : exclut un ou plusieurs termes (SAUF) OR ( ou |) : l’un ou l’autre ou tous les termes Opérateurs numériques : .. = entre ( 200..300 euros) ..200 = <200 200.. = >200
  • 53.
    3.1 Maîtriser l’interrogationavancée sur Google : les opérateurs de recherche Opérateurs linguistiques : «… » : recherche d’expression exacte * : astérisque permet de remplacer un terme ~ : recherche sur les synonymes (dans version anglaise) define: : pour trouver la définition d’un mot Règle des requêtes : limite des 10 mots
  • 54.
    3.1 Maîtriser l’interrogationavancée sur Google : les opérateurs de recherche Filtrage sur le type de documents : filetype: ou ext: : recherche sur le format ou l’extension de fichier Opérateurs de filtrage sur une page web : pour utiliser les caractéristiques d’une page web site: recherche sur le nom de domaine ( hostname ) Lister toutes les pages d’un site Rechercher des fichiers particuliers sur un site (croiser ext: et site:) Affiner une recherche sur un type de sites inurl: et allinurl: : recherche sur l’URL de la page intitle: et allintitle: : affinement de la recherche sur le titre de la page (balise Title) inanchor: et allinanchor: : recherches sur les liens contenant les mots-clés
  • 55.
    3.1 Maîtriser l’interrogationavancée sur Google : les opérateurs de recherche Opérateurs de fonctions : pour trouver des informations sur une page ou un site cache: : affiche la version cache du document related: : affiche les pages similaires au site ou à la page indiquée link: : affiche les pages liées à un site (fonction bridée sur Google) info: : récapitule toutes les informations dont dispose Google sur un site : version cache, pages similaires, pages liées, pages du site … Opérateurs spécifiques à Google.com : view:info : permet de chercher dans les mots des résumés, selon quatre critères : dates, distances, lieux et images view:timeline : présente les résultats sous forme chronologique, permet de chercher sur une date view:map : géolocalise les résultats sur Google Maps et permet de chercher par lieux
  • 56.
    3.1. Moteurs derecherche : pour sortir de la « googlisation » Autres moteurs généralistes: Exalead Yahoo Search Bing Ask Com
  • 57.
    3.2 Les métamoteursDéfinition : Un métamoteur est un outil de recherche qui interroge en parallèle plusieurs outils (moteurs et annuaires), rapatrie leurs réponses et les organise , selon des méthodes de classement spécifiques, pour fournir aux utilisateurs une présentation structurée des résultats. Diversité des métamoteurs : En ligne / hors-ligne Généraux / spécialisés
  • 58.
    3.2 Les métamoteursFonctionnement, éléments d’un métamoteur pas de base de données en propre outils intermédiaires : une seule requête posée sur différents outils Exploitation des résultats des autres outils Généralement, fusion des résultats et élimination des doublons Classement des résultats selon critères propres au métamoteur Présentation des résultats, selon différentes méthodes : linéaires, cartographiques
  • 59.
    3.2 Les métamoteursUtilisation, intérêt : Simplification : Une seule requête pour plusieurs outils Elargissement de la recherche : : Possibilité d’interroger plusieurs sources : d’une dizaine à un millier (Copernic) Renforcement de la pertinence : Sélection des documents plus poussée, par le calcul de pertinence opéré sur plusieurs outils Utiles pour le panorama des ressources sur un thème Exploitation parfois sophistiquée des résultats Outils paramétrables, personnalisables
  • 60.
    3.2 Les métamoteursExemples de métamoteurs : Francophones : Ixquick : http://www.ixquick.com Kartoo : http://www.kartoo.com/ Anglo-saxons : Mamma : http://www.mamma.com Clusty : http://clusty.com/ Internet Sleuth   : http://www.isleuth.com SurfWax : http://www.surfwax.com
  • 61.
    4/ Faire dela veille : alertes, fils RSS, pages personnalisables...
  • 62.
    4.1 Faire dela veille : les alertes Qu’est-ce qu’une alerte ? Répétition automatique d’une requête à chaque mise à jour d’une source d'information (base de données, catalogue, revue, moteur de recherche…). Résultats adressés périodiquement à l’utilisateur par messagerie ou sous forme de flux RSS. DSI (diffusion sélective de l’information) : alerte mise en place par un service documentaire pour un ou plusieurs usagers. A quoi sert une alerte ? À surveiller : l'évolution d'un thème les  travaux d'un auteur ou d'une institution sans avoir à réinterroger une source d’information.
  • 63.
    4.1 Faire dela veille : les alertes Comment mettre en place une alerte ? Ouvrir un compte, définir un profil Définir la source : revue, site… définir la requête : mots-clés.. Définir la périodicité des alertes Définir le mode de transmission : mel, fils RSS Exemples : Sur les bases de données : voir Services d’alertes dans les bases de données Sur Google : Alertes Google
  • 64.
    4.2 Faire dela veille : La syndication de contenus Syndication de contenus : possibilité de publier automatiquement sur un site web des informations issues d'un autre site web Un fil RSS = un fichier texte au format XML (eXtended Markup Language) RSS peut signifier : Really Simple Syndication Rich Site Summary RDF (Resource Description Framework) Site Summary (plus rare)
  • 65.
    4.2 Faire dela veille : La syndication de contenus Comment reconnaître les fils RSS ? Logos sur les sites, ou bien RSS, ou ATOM : En lien, derrière le logo : l'adresse URL du fichier texte permettant la syndication Exemple : passer la souris sur un fil RSS et observer la barre d'état du navigateur Lors de la mise à jour d’un site web, un fichier texte au format XML contenant une description synthétique des nouveautés du site est généré en temps réel Plusieurs formats de fils RSS : RSS 2.0 et Atom ; compatibles
  • 66.
    4.2 Faire dela veille : La syndication de contenus Outils : En lecture : agrégateurs de fils RSS Pour l’édition : éditeurs de fils RSS Plusieurs types d'agrégateurs : Agrégateurs en ligne : MetaRSS , « pages perso » Agrégateurs en local : FeedReader ; voir liste sur RSS et podcasts ; Agrégateurs intégrés : Au logiciel de messagerie : Thunderbird Au navigateur : Firefox, Safari, OPera
  • 67.
    4.2 Faire dela veille : La syndication de contenus Omniprésence des fils RSS : blogs sites d'actualité : journaux , agrégateurs de presse sites de revues spécialisées Sites d'entreprise Résultats de moteurs de recherche Sites web dynamiques Bookmarks sociaux etc.
  • 68.
    4.2 Faire dela veille : La syndication de contenus Plusieurs fonctions des fils RSS : Suivre l’actualité d’un site : réception de toutes les nouveautés Se tenir informé : Sur l'actualité : tous les journaux proposent des fils RSS Sur un domaine : suivi de blogs et de sites spécialisés Outil de veille et de surveillance, technique du push
  • 69.
    4.3 Faire dela veille : Les pages personnalisables Définition : Pages personnalisables : Possibilité de gérer et d’organiser soi-même ses flux RSS Pages web organisées en onglets et boîtes Fournies gratuitement Exemples : Netvibes PagesFlakes iGoogle
  • 70.
    4.3 Faire dela veille : Les pages personnalisables Fonctions : Pour la gestion et la recherche d’information Choix personnel des sources : sites web, blogs, fils RSS … Divers services : calendrier, agenda … Bureau virtuel Outils de veille, de surveillance Outils d’information, de publication Développement des portails Netvibes Pages personnalisables Netvibes rendues publiques Urfist de Rennes Documentation Française Docsdocs
  • 71.
    5. Plates-formes departage Les signets Les photos, les vidéos Les diaporamas Les CV, les réseaux sociaux L'information d'actualité
  • 72.
    5.1 Plates-formes departage de signets Principes : Externalisation de ses bookmarks Indexation libre par tags Classement des signets par catégories et par tags Indication du nombre de signalements d'un même signet Création de réseaux de partage : « social bookmarking » Intérêt : Simplicité : de collecte et de gestion des signets Plus-value documentaire : Tags Catégories Plus-value sociale : Capitalisation du réseau Réseaux de confiance
  • 73.
    5.1 Plates-formes departage de signets Généralistes : Delicious : Yahoo Yahoo! Favoris : Yahoo Blogmarks : entreprise française Blinklist : MindValley Labs, entreprise de Malaisie Diigo Scientifiques : Connotea : revue Nature 2collab : Elsevier Bibsonomy : Université de Kassel (Allemagne)
  • 74.
    5.2 Les plates-formesde partage multimédias Recherche dans les sites de partage de documents multimédias Les images : Flickr , racheté par Yahoo! En 2OO5 = partage de photos Mise à disposition du moteur de recherche pour recherche à travers des millions de photos mises en ligne par l’ensemble des utilisateurs Menu Organize pour organiser ses photos Attribution de mots clés, de tags
  • 75.
    5.2 Plates-formes departage de diaporamas SlideShare Site de partage et récupération de présentations / diapositives Powerpoint, mais pas seulement : aussi pdf, OpenOffice, Word, documents depuis Google Docs… Transformation des présentations en format flash Après inscription, possibilité de stocker et de publier les présentations, soit dans un réseau limité, soit publiquement.
  • 76.
    5.3 Sites d'actualitécollaborative AgoraVox : Site collaboratif d'actualité, créé par J. de Rosnay et C. Revelli Projet emblématique du web 2.0 et du pouvoir donné aux internautes (« pronétaires ») Trois principes : «  1- Nous sommes tous des capteurs d’information 2- Le passage des mass-médias aux médias des masses 3- Une politique éditoriale et un comité rédactionnel inédits »
  • 77.
    6/ Supports etressources pour aller plus loin… Supports de l’URFIST de Rennes : Les supports sur la recherche d’information Ressources sur les outils de recherche Evaluation de l’information sur Internet Supports des autres URFIST : Voir adresses sur UrfistInfo Quelques autres sites-ressources : AERIS SAPRISTI
  • 78.
    Contact Adresse mel : [email_address] Site : http://www.sites.univ-rennes2.fr/urfist/

Notes de l'éditeur

  • #15 D’après un rapport, 60 % des personnes ignorent l’existence des liens sponsorisés
  • #17 - SeekPort : « Lors de vos connexions sur le site de Seekport, certaines informations non nominatives sont automatiquement collectées et conservées : Le User Agent (le nom de votre navigateur), Votre adresse IP, La date et l&apos;heure d&apos;accès à notre site, Le http code (l&apos;état de connexion à notre serveur), Le cas échéant, le site web par lequel vous êtes arrivé sur Seekport. En aucun cas nous ne collectons de données nominatives vous concernant. Nous n&apos;enregistrons que des informations anonymes, dans le but d&apos;établir des statistiques. La seule exception concerne l&apos;organisation de jeux concours où vous pouvez être amené à saisir des informations personnelles. Toutefois ces informations ne sont pas conservées une fois l&apos;évènement terminé. «
  • #20 4/ Les 10 règles de la recherche d&apos;information D&apos;après Mesguich, Véronique, Thomas, Armelle. Net recherche 2009. Le guide pratique pour mieux trouver l&apos;information utile et surveiller le web. 3ème éd. Paris : ADBS Editions, 2009
  • #21 4/ Les 10 règles de la recherche d&apos;information D&apos;après Mesguich, Véronique, Thomas, Armelle. Net recherche 2009. Le guide pratique pour mieux trouver l&apos;information utile et surveiller le web. 3ème éd. Paris : ADBS Editions, 2009
  • #22 4/ Les 10 règles de la recherche d&apos;information D&apos;après Mesguich, Véronique, Thomas, Armelle. Net recherche 2009. Le guide pratique pour mieux trouver l&apos;information utile et surveiller le web. 3ème éd. Paris : ADBS Editions, 2009
  • #33 Exemple de portails spécialisés : - ConnectSciences - Ploteus : nouveau portail européen (www.ploteus.net) dédié aux ressources d’information en Europe. Ploteus : point d&apos;accès central («one-stop-shop ») aux sites nationaux et régionaux recensant les possibilités d&apos;apprentissage. Informations sur chaque niveau d&apos;étude et de formation, des écoles primaires à l&apos;enseignement universitaire en passant par les cours du soir. Large dimension européenne : en plus des états membres de l&apos;UE, il couvre les membres de l&apos;EFTA (European Free Trade Association) et les pays candidats à l’entrée dans l’Union Européenne. Ploteus : acronyme de «Portal on Learning Opportunities Throughout the European Space » et signifie « navigateur » en grec ancien.
  • #59 * Sur les évolutions : - intérêt des métamoteurs off line : Copernic, Strategic Finder, BullsEye ; outils de veille - innovations de Kartoo, MapStan, Vivisimo
  • #60 * Sur les évolutions : - intérêt des métamoteurs off line : Copernic, Strategic Finder, BullsEye ; outils de veille - innovations de Kartoo, MapStan, Vivisimo
  • #61 * Sur les évolutions : - intérêt des métamoteurs off line : Copernic, Strategic Finder, BullsEye ; outils de veille - innovations de Kartoo, MapStan, Vivisimo
  • #69 Équivalent sonore: les podcasts