Ce diaporama a bien été signalé.
Le téléchargement de votre SlideShare est en cours. ×

Outils de recherche du web hors Google

Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Chargement dans…3
×

Consultez-les par la suite

1 sur 53 Publicité

Outils de recherche du web hors Google

Télécharger pour lire hors ligne

Support du stage de l'URFIST de Rennes, du 21 octobre 2010, animé par Marie-Laure Malingre et Alexandre Serres. Ce stage visait une connaissance théorique et pratique des moteurs de recherche : fonctionnement et typologie des moteurs ; exploration de différents types de moteurs autres que Google : moteurs généralistes et spécialisés.

Support du stage de l'URFIST de Rennes, du 21 octobre 2010, animé par Marie-Laure Malingre et Alexandre Serres. Ce stage visait une connaissance théorique et pratique des moteurs de recherche : fonctionnement et typologie des moteurs ; exploration de différents types de moteurs autres que Google : moteurs généralistes et spécialisés.

Publicité
Publicité

Plus De Contenu Connexe

Diaporamas pour vous (20)

Les utilisateurs ont également aimé (18)

Publicité

Similaire à Outils de recherche du web hors Google (20)

Plus récents (20)

Publicité

Outils de recherche du web hors Google

  1. 1. Outils de recherche du web, hors Google... <ul><ul><li>Stage URFIST de Rennes </li></ul></ul><ul><ul><li>21 octobre 2010 </li></ul></ul><ul><ul><li>Marie-Laure Malingre </li></ul></ul><ul><ul><li>Alexandre Serres </li></ul></ul>
  2. 2. PLAN <ul><li>1/ Introduction </li></ul><ul><li>2/ Quelques moteurs généralistes </li></ul><ul><li>3/ Pour les recherches spécialisées : </li></ul><ul><ul><li>Pour trouver : des blogs, des actualités, des personnes, des documents scientifiques, des images, des vidéos, des podcasts, des documents PDF, des tweets… </li></ul></ul><ul><li>4/ La dernière tendance : les moteurs en temps réel </li></ul><ul><li>5/ Participer aux moteurs de recherche </li></ul><ul><li>6/ Les moteurs sémantiques </li></ul><ul><li>7/ Moteurs visuels </li></ul>
  3. 3. PLAN <ul><li>1/ Introduction : </li></ul><ul><ul><li>Des ressources pour s’informer et se former </li></ul></ul><ul><ul><li>Rappels sur le fonctionnement des moteurs de recherche </li></ul></ul><ul><ul><li>Proposition de typologies des moteurs </li></ul></ul>
  4. 4. 1.1 Des ressources pour se former et s’informer <ul><li>Difficultés de la veille sur les outils de recherche : </li></ul><ul><ul><li>Rapidité des innovations </li></ul></ul><ul><ul><li>Surabondance des sources </li></ul></ul><ul><li>Remèdes dans les outils eux-mêmes : </li></ul><ul><ul><li>Fils RSS, portail Netvibes, blogs, Twitter… </li></ul></ul><ul><li>Deux ressources de l’URFIST de Rennes : </li></ul><ul><ul><li>Sélection de ressources sur les outils de recherche </li></ul></ul><ul><ul><li>Le portail Netvibes de l’ URFIST de Rennes : onglet Recherche d’information </li></ul></ul>
  5. 5. 1.2 Fonctionnement des moteurs de recherche Source : R. Viseur, CETIC
  6. 6. 1.3 Typologies des moteurs de recherche <ul><li>Difficultés des typologies </li></ul><ul><li>Plusieurs catégories de critères : </li></ul><ul><ul><li>L’offre des ressources : </li></ul></ul><ul><ul><ul><li>Moteurs généralistes / spécialisés </li></ul></ul></ul><ul><ul><ul><ul><li>Diversité des spécialisations </li></ul></ul></ul></ul><ul><ul><li>L’implication des internautes : </li></ul></ul><ul><ul><ul><li>Moteurs participatifs : </li></ul></ul></ul><ul><ul><ul><ul><li>collaboratifs, personnalisables… </li></ul></ul></ul></ul><ul><ul><li>La présentation des résultats : </li></ul></ul><ul><ul><ul><li>Moteurs linéaires, visuels, cartographiques… </li></ul></ul></ul><ul><ul><li>Mode d’indexation : </li></ul></ul><ul><ul><ul><li>Moteurs sémantiques… </li></ul></ul></ul><ul><ul><ul><ul><li>Difficulté du critère de l’indexation </li></ul></ul></ul></ul><ul><ul><li>« Fonctionnement » des moteurs : </li></ul></ul><ul><ul><ul><li>Moteurs en temps réel </li></ul></ul></ul>
  7. 7. 1.3 Typologies des moteurs de recherche : l’offre des ressources <ul><li>Critère : type de ressources collectées </li></ul><ul><li>Distinction principale : </li></ul><ul><ul><li>Moteurs généralistes : G., Yahoo, Exalead, Ask, Bing… </li></ul></ul><ul><ul><ul><li>caractéristique historique des grands moteurs : collecte et indexation de tous les types de ressources </li></ul></ul></ul><ul><ul><li>Moteurs spécialisés : </li></ul></ul><ul><ul><ul><li>Tendance lourde des moteurs : </li></ul></ul></ul><ul><ul><ul><ul><li>Modules spécialisés à l’intérieur des moteurs généralistes </li></ul></ul></ul></ul><ul><ul><ul><li>Infinité des types de spécialisations </li></ul></ul></ul><ul><ul><ul><li>Explosion du nombre d’outils </li></ul></ul></ul>
  8. 8. 1.3 L’offre des ressources : diversité des spécialisations <ul><li>Choix retenu pour l’exploration : </li></ul><ul><ul><li>3 critères de spécialisations : </li></ul></ul><ul><ul><ul><li>Selon les ressources internet : </li></ul></ul></ul><ul><ul><ul><ul><li>Moteurs de blogs, de forums, de listes de diffusion, de FAQ, de wikis, de fils RSS, de tweets… </li></ul></ul></ul></ul><ul><ul><ul><li>Selon la nature du contenu : </li></ul></ul></ul><ul><ul><ul><ul><li>Moteurs scientifiques, d’actualité, de personnes, de produits… </li></ul></ul></ul></ul><ul><ul><ul><li>Selon la nature du média : </li></ul></ul></ul><ul><ul><ul><ul><li>Moteurs d’images, de vidéos, de podcasts, de photos.. </li></ul></ul></ul></ul><ul><li>Autres critères possibles : </li></ul><ul><ul><li>langue, géographie, domaine thématique…et maintenant dimension temporelle, accès au contenu </li></ul></ul>
  9. 9. 1.3 Typologies… : l’implication des internautes <ul><li>Difficultés de caractérisation du critère, très récent : </li></ul><ul><ul><li>Intégration des aspects « web 2.0 » dans les moteurs </li></ul></ul><ul><li>Critère principal : aspect « social » des moteurs de recherche </li></ul><ul><ul><li>Degré, nature, modalités… d’implication des internautes dans le moteur de recherche </li></ul></ul><ul><li>Deux types de moteurs : </li></ul><ul><ul><li>Moteurs collaboratifs : Wikia, Yoople </li></ul></ul><ul><ul><li>Moteurs personnalisables : Rollyo </li></ul></ul><ul><li>Tendance importante de développement des moteurs : enjeux économiques, image des outils… </li></ul>
  10. 10. 1.3 Typologies… : la présentation des résultats <ul><li>Innovations souvent spectaculaires : les interfaces, la présentation des données </li></ul><ul><li>Distinctions possibles : </li></ul><ul><ul><li>Moteurs linéaires, classiques </li></ul></ul><ul><ul><li>Moteurs cartographiques, à clusters </li></ul></ul><ul><ul><li>Moteurs visuels </li></ul></ul><ul><ul><li>Moteurs parlants ? </li></ul></ul><ul><ul><li>… </li></ul></ul>
  11. 11. 1.3 Typologies… : l’indexation des données <ul><li>Critère : mode d’indexation des données </li></ul><ul><li>Typologie possible selon les différents niveaux d’indexation linguistique : </li></ul><ul><ul><li>Moteurs d’indexation : </li></ul></ul><ul><ul><ul><li>Morphologique </li></ul></ul></ul><ul><ul><ul><li>Lexicale </li></ul></ul></ul><ul><ul><ul><li>Syntaxique </li></ul></ul></ul><ul><ul><ul><li>Sémantique </li></ul></ul></ul><ul><li>Typologie difficile à utiliser en pratique </li></ul><ul><li>Imbrication des modalités d’indexation </li></ul><ul><li>Enjeux des moteurs sémantiques </li></ul>
  12. 12. 1.3 Typologies… : les moteurs « temps réel » <ul><li>Collecte, indexation et recherche en temps réel des ressources du web </li></ul><ul><ul><li>Appelés aussi moteurs synchrones ; </li></ul></ul><ul><li>Dernier terrain d’innovation, dernier champ de bataille des moteurs de recherche </li></ul><ul><ul><li>Concurrence très vive Google, Bing et Yahoo </li></ul></ul><ul><li>Enjeux : indexation de Twitter, des blogs, des réseaux sociaux… </li></ul><ul><li>Essor des outils depuis deux ans : 20 en juin 2009… </li></ul>
  13. 13. PLAN <ul><li>2/ D’autres moteurs généralistes : </li></ul><ul><ul><li>Yahoo </li></ul></ul><ul><ul><li>Exalead </li></ul></ul><ul><ul><li>Bing </li></ul></ul>
  14. 14. 2.1 Les moteurs généralistes : Yahoo Search FR / Yahoo.com <ul><li>Trio de tête concurrentiel des moteurs de recherche </li></ul><ul><ul><li>Google / Yahoo / Bing (Microsoft) </li></ul></ul><ul><li>Evolutions récentes </li></ul><ul><ul><li>Décembre 2009 : intégration Facebook Connect </li></ul></ul><ul><ul><li>Février 2010 : accord Yahoo! / Twitter : intégration des résultats de Twitter et gestion Twitter depuis Yahoo! </li></ul></ul><ul><ul><li>Intégration Yahoo / Bing (août 2010) </li></ul></ul><ul><ul><ul><li>Effectif sur Yahoo.com ; pour début 2011 sur Yahoo.fr </li></ul></ul></ul><ul><ul><ul><li>Recherche Yahoo motorisée par Bing : indexation par Microsoft </li></ul></ul></ul><ul><ul><ul><li>Gestion des liens sponsorisés par Yahoo </li></ul></ul></ul><ul><ul><ul><li>Maintien des contenus spécifiques (portail) </li></ul></ul></ul><ul><li>Stratégie axée sur l’expérience utilisateur </li></ul><ul><ul><li>Yahoo garde le contrôle sur “l’expérience utilisateur” de son moteur </li></ul></ul>
  15. 15. 2.1 Les moteurs généralistes : Yahoo Search FR / Yahoo.com Les autres modules : Images, Vidéo, Local, Shopping, News + Maps, People, Product, Creative Commons, Travel, Job, Finances, Sports… - Bloc-note (Search Pad) - Résultats sécurisés (SearchScan) et filtre parental - Vignettes images, etc. - Flux RSS de la requête - Page personnalisable My Yahoo (compte) - Sur des sources - Sur des types de documents (requêtes sur musique, cinéma, actualités) [actuellement seulement sur yahoo.com] - Sur les mots associés - Opérateurs booléens - Phrase exacte - Critères : titre, date, site/domaine, url, format, pays, langue, lien - Suggestions de recherche (Search Assist) = autocomplétion + concepts associés Web Fonctions connexes / page de résultats Affinement des résultats Requête Search
  16. 16. Search Pad SearchScan Filtrage sur sources Termes associés Search Assist Filtrage sur types de documents Modules Flux RSS de la requête Compte Yahoo
  17. 17. 2.1 Les moteurs généralistes : Yahoo Search FR / Yahoo.com <ul><ul><li>Yahoo! Buzz, http://buzz.yahoo.com/ </li></ul></ul><ul><ul><li>Yahoo! /mobiles, http://m.yahoo.com/ </li></ul></ul><ul><ul><li>Yahoo! Search BOSS, http://developer.yahoo.com/search/boss/ (Build Your Own Search Service) </li></ul></ul><ul><ul><ul><li>BOSS : voir moteur Trogdor , recherche instantanée </li></ul></ul></ul><ul><ul><ul><li>V2 en 2011; devient payant </li></ul></ul></ul><ul><ul><li>Yahoo Site Explorer, https://siteexplorer.search.yahoo.com/mysites </li></ul></ul><ul><ul><ul><li>Devrait être intégré dans le Bing Webmaster Center </li></ul></ul></ul><ul><ul><li>Yahoo Search Monkey, http:// developer.yahoo.com / searchmonkey / </li></ul></ul><ul><ul><ul><li>partiellement stoppé </li></ul></ul></ul>Outils de Yahoo autour du Search
  18. 18. 2.2 Les moteurs généralistes : Exalead <ul><li>Moteur très innovant créé par F. Bourdoncle et P. Bertin en 2000, reprise par Dassault (juin 2010) </li></ul><ul><ul><li>Entreprise française en plein développement </li></ul></ul><ul><ul><ul><li>Plateforme technologique et de services pour entreprises </li></ul></ul></ul><ul><ul><ul><li>Moteur grand public, audience en hausse : </li></ul></ul></ul><ul><ul><ul><ul><li>1 million de visiteurs uniques / mois : site web </li></ul></ul></ul></ul><ul><ul><ul><ul><li>100 millions sur l’ensemble des applications Exalead (sites web de ses clients) </li></ul></ul></ul></ul><ul><ul><ul><li>Un module de recherche sur Wikipédia </li></ul></ul></ul><ul><ul><li>Orientation technique : </li></ul></ul><ul><ul><ul><li>Aider l'usager dans la recherche d'information </li></ul></ul></ul><ul><ul><ul><li>Intégration de la serendipité </li></ul></ul></ul><ul><ul><li>Exalead partie prenante du projet Quaero </li></ul></ul>
  19. 19. 2.2 Les moteurs généralistes : Exalead <ul><ul><li>Un moteur innovant dans le traitement et la présentation des résultats : </li></ul></ul><ul><ul><ul><li>Processus de catégorisation (a posteriori) </li></ul></ul></ul><ul><ul><ul><li>Analyse statistico-sémantique des pages de résultats, conduisant à l’identification des mots et expressions les plus fréquents </li></ul></ul></ul><ul><ul><ul><li>Aperçu graphique du contenu de la page / prévisualisation </li></ul></ul></ul><ul><ul><ul><li>Nombreuses possibilités d'affinement de la requête : </li></ul></ul></ul><ul><ul><ul><ul><li>Rubriques associées </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Limitation par zones géographiques </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Différents types de fichiers </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Recherches spécialisées : actualité, RSS... </li></ul></ul></ul></ul>
  20. 20. 2.2 Les moteurs généralistes : Exalead . La catégorisation <ul><li>Technologies plus complexes ; domaine d’innovations avancées des moteurs et métamoteurs : </li></ul><ul><ul><li>cf Exalead , certains métamoteurs ( Yippy ) </li></ul></ul><ul><li>Principes : </li></ul><ul><ul><li>organisation en temps réel d’un lot de résultats pour donner possibilité d’affiner ou étendre la requête </li></ul></ul><ul><ul><li>répartition des documents dans des catégories </li></ul></ul><ul><li>Intérêt pour la recherche : </li></ul><ul><ul><ul><li>aide à la sélection d’un mot-résultat </li></ul></ul></ul><ul><ul><ul><li>aide à l’élimination des corrélations inintéressantes, </li></ul></ul></ul><ul><ul><ul><li>suggestion d’idées et de pistes nouvelles </li></ul></ul></ul><ul><li> enjeu essentiel : mise en ordre du « chaos informationnel </li></ul>
  21. 21. 2.2 Les moteurs généralistes : Exalead <ul><li>Nouveaux moyens d’accéder, d’analyser et d’exploiter le contenu multimédia en ligne/ Nombreux projets touchant : </li></ul><ul><ul><li>La colorimétrie dans le cadre de la recherche d’images </li></ul></ul><ul><ul><li>La recherche et la navigation cartographiques </li></ul></ul><ul><ul><li>La recherche en temps réel au sein de vidéos </li></ul></ul><ul><ul><li>La représentation visuelle des relations sémantiques </li></ul></ul><ul><ul><li>L’exploitation du contenu provenant des médias sociaux </li></ul></ul>
  22. 22. 2.2 Les moteurs généralistes : Exalead <ul><li>Récentes innovations : </li></ul><ul><ul><li>Offre payante de CloudView (nuage informationnel) </li></ul></ul><ul><ul><ul><li>Nombreuses applications </li></ul></ul></ul><ul><ul><li>Nouvelle interface web, en juillet 2009 : </li></ul></ul><ul><ul><ul><li>Auto-complétion des mots-clés de requête </li></ul></ul></ul><ul><ul><ul><ul><li>Suggestion de termes, au fur et à mesure de la saisie </li></ul></ul></ul></ul><ul><ul><ul><li>Recherches associées sous la barre de recherche </li></ul></ul></ul><ul><ul><ul><li>Affichage de diagrammes circulaires pour les pays et langues </li></ul></ul></ul><ul><ul><ul><li>Personnalisation de la “zapette” </li></ul></ul></ul><ul><ul><ul><li>Innovations dans l’affichage des images </li></ul></ul></ul><ul><ul><ul><li>Amélioration des interfaces </li></ul></ul></ul><ul><ul><li>Module Image ( Octobre 2009) : </li></ul></ul><ul><ul><ul><li>après le filtre visage, recherche d’images par la couleur avec Chromatik </li></ul></ul></ul>
  23. 23. 2.2 Les moteurs généralistes : Exalead <ul><li>Des applications associées (2009-2010) : </li></ul><ul><ul><li>Voxalead News / Quaero, http://voxaleadnews.labs.exalead.com/ </li></ul></ul><ul><ul><ul><li>Partenariat Exalead / Vecsys, recherche dans news, vidéos et podcasts de grandes chaînes d’information </li></ul></ul></ul><ul><ul><li>Tweepz, http://tweepz.com/ (recherche sur les profils twitter) </li></ul></ul><ul><ul><li>Sourcier http :// sourcier.labs.exalead.com/ (Géolocalisation), </li></ul></ul><ul><ul><li>Constellations, http://demos.labs.exalead.com/constellations/ </li></ul></ul><ul><li>La technologie Exalead dans plusieurs projets </li></ul><ul><ul><li>Glocal, voir sur le blog d’Exalead et sur le site du projet </li></ul></ul><ul><ul><li>I-search, v oir sur le blog d’Exalead et sur le site du projet </li></ul></ul><ul><ul><li>Hyper-TV (France 24 / Exalead) </li></ul></ul><ul><ul><ul><li>Prototype prévu pour début 2011 </li></ul></ul></ul>
  24. 24. 2.2 Les moteurs généralistes : Bing <ul><li>Le moteur de Microsoft : </li></ul><ul><ul><li>Successeur de Live Search </li></ul></ul><ul><ul><li>Rendu public en juin 2009 </li></ul></ul><ul><ul><li>En France, toujours en version bêta </li></ul></ul><ul><ul><li>Bing USA, plus intéressant et pertinent (10% de parts de marché) </li></ul></ul><ul><ul><ul><li>Nombreux modules de recherche : web, images, vidéos, shopping, actualités, cartes et voyages, social ... </li></ul></ul></ul><ul><ul><ul><li>Historique de recherche </li></ul></ul></ul><ul><ul><ul><li>“ Related Searches” </li></ul></ul></ul><ul><ul><ul><li>Richesse des opérateurs </li></ul></ul></ul><ul><ul><li>Accord Yahoo / Bing en 2010 (interface USA pour le moment) </li></ul></ul>
  25. 25. 2.2 Les moteurs généralistes : Bing <ul><ul><li>Bing Maps : améliorations successives et nouvelle interface (août 2010) </li></ul></ul><ul><ul><li>Bing Images : améliorations de la recherche d’images </li></ul></ul><ul><ul><ul><li>Tailles d’images </li></ul></ul></ul><ul><ul><ul><li>Liste des sites les utilisant </li></ul></ul></ul><ul><ul><ul><li>Liste des pages qui parlent de l’image </li></ul></ul></ul><ul><ul><li>Bing Video </li></ul></ul><ul><ul><ul><li>Nouvelle interface de recherche (fin 2009) </li></ul></ul></ul><ul><ul><ul><li>Partage de fichiers </li></ul></ul></ul><ul><ul><li>Bing social  : </li></ul></ul><ul><ul><ul><li>Facebook </li></ul></ul></ul><ul><ul><ul><ul><li>Recherche dans les pages « fans » + liens partagés </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Renforcement du partenariat : intégration dans les résultats de recherche des suggestions issues du bouton « j’aime » de Facebook </li></ul></ul></ul></ul><ul><ul><ul><li>Intégration des résultats Twitter </li></ul></ul></ul>Quelques innovations (2009/2010)
  26. 26. 2.2 Les moteurs généralistes : Bing <ul><ul><li>Recherche sémantique </li></ul></ul><ul><ul><ul><li>Intégration de Wolfram Alpha (moteur de connaissance, recherche sémantique, orienté sciences) </li></ul></ul></ul><ul><ul><li>Entités nommées </li></ul></ul><ul><ul><ul><li>Association et utilisation de Bing pour le moteur EntityCube , autre produit Microsoft (moteur sémantique) </li></ul></ul></ul><ul><ul><ul><li>Moteur de recherche travaillant sur les entités nommées </li></ul></ul></ul><ul><ul><li>Intégration de résultats en temps réel </li></ul></ul><ul><ul><ul><li>Résultats issus du site Foursquare dans les cartes Bing Maps </li></ul></ul></ul><ul><ul><ul><li>Mixage des informations sur les endroits à visiter et les avis des internautes sur ces derniers </li></ul></ul></ul>
  27. 27. PLAN <ul><li>3/ Outils spécialisés : </li></ul><ul><ul><li>Selon les ressources Internet </li></ul></ul><ul><ul><li>Selon la nature du contenu </li></ul></ul><ul><ul><li>Selon la nature du media </li></ul></ul>
  28. 28. 3.1 Outils spécialisés selon les ressources internet <ul><li>A chaque type de ressource son outil : </li></ul><ul><ul><li>Diversité des moteurs et outils </li></ul></ul><ul><li>Exemples pour trouver ou chercher dans : </li></ul><ul><ul><li>Des listes de diffusion  : Tile.net </li></ul></ul><ul><ul><li>Des forums  : BoardReader </li></ul></ul><ul><ul><li>Des FAQ  : QueryCat </li></ul></ul><ul><ul><li>Des wikis  : Qwika   </li></ul></ul><ul><ul><li>Des fils RSS  : RSSfeeds , Feediop (recherche en temps réel dans les flux RSS) </li></ul></ul><ul><ul><li>Des tags et des plateformes de partage de signets  : Keotag , TagLand </li></ul></ul>URFIST de Rennes, 2010
  29. 29. 3.1 Moteurs spécialisés selon les ressources internet : blogs <ul><li>Moteurs de recherche de blogs  : </li></ul><ul><ul><li>Technorati </li></ul></ul><ul><ul><ul><li>Recherche dans les blogs, dans les posts </li></ul></ul></ul><ul><ul><ul><li>Indicateur d’influence du blog </li></ul></ul></ul><ul><ul><ul><li>Mises à jour sur Facebook, Twitter, via le mail ou le fil RSS </li></ul></ul></ul><ul><ul><li>Wikio </li></ul></ul><ul><ul><ul><li>Recherche à la fois sur les blogs et médias </li></ul></ul></ul>
  30. 30. 3.1 Moteurs spécialisés selon les ressources internet : microblogging, Twitter <ul><li>Plusieurs outils de recherche spécialisés </li></ul><ul><li>Topsy : </li></ul><ul><ul><li>Recherche par mots-clés, par utilisateurs, par dates… </li></ul></ul><ul><ul><li>Affichage par périodes </li></ul></ul><ul><li>TwitterPowerSearch : </li></ul><ul><ul><li>Moteur de recherche en temps réel : </li></ul></ul><ul><ul><ul><li>Derniers tweets postés </li></ul></ul></ul><ul><ul><ul><li>Présentation des résultats de recherche en widgets </li></ul></ul></ul><ul><ul><ul><li>Outil de veille </li></ul></ul></ul><ul><li>TweetGrid : </li></ul><ul><ul><li>Tableau de recherche de tweets avec nombreuses fonctionnalités </li></ul></ul><ul><ul><li>Recherches possibles sur 9 critères </li></ul></ul><ul><ul><li>Recherche avancée </li></ul></ul><ul><ul><li>Affichage personnalisé en colonnes </li></ul></ul><ul><ul><li>Outil en temps réel </li></ul></ul><ul><ul><li>Sauvegarde de la veille </li></ul></ul><ul><li>Stickytter : </li></ul><ul><ul><li>outil de veille en temps réel </li></ul></ul>URFIST de Rennes, 2010 Voir sur Twittosphere.fr , le blog des applications pour Twitter : recense plus de 700 applications (sept. 09) !
  31. 31. 3.2 Moteurs spécialisés selon la nature des contenus : moteurs d’actualités <ul><li>Modules ou services proposés par les outils de recherche </li></ul><ul><li>Agrégation de multiples sources d’actualité : </li></ul><ul><ul><ul><li>Presse, blogs, sites web… </li></ul></ul></ul><ul><ul><ul><li>Revues de presse automatisées </li></ul></ul></ul><ul><li>Services gratuits : alertes… </li></ul><ul><li>Nombreux moteurs d’actualité : </li></ul><ul><ul><li>Précurseur : Google News </li></ul></ul><ul><ul><li>Modules spécialisés : Yahoo News, </li></ul></ul><ul><ul><ul><li>Concurrence aiguë, enjeux économiques importants </li></ul></ul></ul><ul><ul><ul><li>Problèmes et conflits juridiques </li></ul></ul></ul>
  32. 32. 3.2 Moteurs spécialisés : moteurs d’actualités <ul><li>Wikio : </li></ul><ul><ul><li>indexe sources de presse et blogs, vidéos, forums ; </li></ul></ul><ul><ul><li>annonce 375 587 blogs et sites d’actualités indexés </li></ul></ul><ul><ul><ul><li>Progression de plus de 300 000, en un an… </li></ul></ul></ul><ul><ul><li>4 modules spécialisés : Actualités, Shopping, Vidéos et Forums </li></ul></ul><ul><ul><ul><li>Système d’onglets : revue européenne de blogs, sujet d’actualité, Facebook </li></ul></ul></ul><ul><ul><ul><li>Possibilité de personnalisation : «  page perso . » </li></ul></ul></ul><ul><ul><li>agrégation des billets et nouvelles, selon plus de 30 000 catégories  </li></ul></ul><ul><ul><li>Technologie d’indexation sémantique </li></ul></ul><ul><ul><li>classement des blogs « influents » par catégories, selon le nombre de rétroliens ; voir http://www.wikio.fr/blogs/top/science </li></ul></ul><ul><ul><li>Nombreuses innovations technologiques : cf les Wikio Labs </li></ul></ul><ul><ul><ul><li>voir notamment Backlink Factory   </li></ul></ul></ul>
  33. 33. 3.2 Moteurs spécialisés : moteurs d’actualités <ul><li>Europe Media Monitor : portails d’information du Joint Research Center (JRC) de la Commission Européenne </li></ul><ul><li>Collecte, analyse, cartographie… de très nombreuses sources d’information, en 43 langues </li></ul><ul><li>Trois portails complémentaires : </li></ul><ul><ul><li>NewsBrief : actualité en temps réel </li></ul></ul><ul><ul><li>NewsExplorer : analyse de l’information </li></ul></ul><ul><ul><li>MediSys : information médicale </li></ul></ul><ul><ul><li>+ EMM-Labs </li></ul></ul>
  34. 34. 3.2 M oteurs d’actualités : Europe Media Monitor <ul><li>NewsBrief : l’information en temps réel </li></ul><ul><ul><li>Collecte sur + 4000 sites : </li></ul></ul><ul><ul><ul><li>1600 portails d’information, 20 flux d’actualités commerciales, sites spécialisés ; en 43 langues </li></ul></ul></ul><ul><ul><li>Surveillance quotidienne : </li></ul></ul><ul><ul><ul><li>Mises à jour toutes les 10 mns </li></ul></ul></ul><ul><ul><li>Classement des informations </li></ul></ul><ul><ul><li>Graphique des 10 derniers événements marquants </li></ul></ul><ul><ul><li>Clusterisation : par thèmes, par Directions Générales de l’UE </li></ul></ul><ul><ul><li>Possibilité d’abonnements RSS, mais pas par rubriques </li></ul></ul>
  35. 35. 3.2 M oteurs d’actualités : Europe Media Monitor <ul><li>NewsExplorer : analyse multilingue </li></ul><ul><ul><li>Analyse de l’information une fois par jour </li></ul></ul><ul><ul><ul><li>Résumé des 20 faits marquants </li></ul></ul></ul><ul><ul><ul><li>19 langues </li></ul></ul></ul><ul><ul><li>Nombreuses fonctionnalités : </li></ul></ul><ul><ul><ul><li>Carte des lieux de l’actualité </li></ul></ul></ul><ul><ul><ul><li>Analyse des actualités : tous les articles sur un sujet… </li></ul></ul></ul><ul><ul><ul><li>Chronologie des événements </li></ul></ul></ul><ul><ul><ul><li>Fiches sur personnalités </li></ul></ul></ul><ul><ul><ul><li>Visualisation des relations entre personnes </li></ul></ul></ul><ul><ul><ul><li>Recherche rétrospective sur les événements majeurs d’un pays </li></ul></ul></ul>
  36. 36. 3.3 Moteurs spécialisés : moteurs scientifiques <ul><li>Moteurs spécialisés sur les ressources académiques : </li></ul><ul><ul><li>JURN : moteur orienté Arts et Humanités, porte sur les revues en open access (anglais) </li></ul></ul><ul><ul><ul><li>Fonctionne avec Google CSE </li></ul></ul></ul><ul><ul><ul><li>3400 titres indexés en novembre 2009 </li></ul></ul></ul><ul><ul><ul><li>Sources principales :   DOAJ , NewJour, Open Access Newsletter </li></ul></ul></ul><ul><ul><li>Scirus : orienté Sciences exactes, produit par Elsevier </li></ul></ul><ul><ul><ul><li>Sources : Web, ScienceDirect, Bases de données (Medline…), Archives ouvertes, prépublications </li></ul></ul></ul><ul><ul><ul><li>410 millions de documents indexés </li></ul></ul></ul><ul><ul><ul><li>Interface de recherche avancée très complète </li></ul></ul></ul><ul><li>Positionnement des équipes de recherche </li></ul><ul><ul><li>AuthorMapper (Springer) </li></ul></ul><ul><li>Mise en contexte des mots clés </li></ul><ul><ul><li>Exemplar </li></ul></ul><ul><li>Moissonneurs OAI (Archives ouvertes) : </li></ul><ul><ul><li>Base (Université de Bielefeld) </li></ul></ul><ul><ul><li>Scientific Commons </li></ul></ul>
  37. 37. 3.4 Moteurs spécialisés : moteurs de recherche de personnes <ul><li>Essor des moteurs de recherche de personnes : </li></ul><ul><ul><li>Surveillance de la e-réputation </li></ul></ul><ul><li>Principes : agrégation de nombreuses sources (moteurs, blogs, annuaires, réseaux sociaux…) contenant des traces sur ou laissées par une personne </li></ul><ul><li>Nombreux moteurs : </li></ul><ul><ul><li>123People </li></ul></ul><ul><ul><li>Pipl </li></ul></ul><ul><ul><li>Whozat ? </li></ul></ul><ul><ul><li>Intelius </li></ul></ul><ul><ul><li>Winck </li></ul></ul><ul><ul><li>YoName </li></ul></ul><ul><li>Voir liste de 15 moteurs sur emandarine </li></ul><ul><li>Des extensions Firefox : </li></ul><ul><ul><li>Who is this person ? </li></ul></ul>
  38. 38. 3.5 Autres moteurs spécialisés selon la nature du contenu <ul><li>Pour trouver : </li></ul><ul><li>Des informations sur les entreprises : Kompass , Accoona , Societe.com </li></ul><ul><li>Des informations sur les produits : Kelkoo </li></ul><ul><li>Des offres d’emploi : Moovement.fr , Monster </li></ul><ul><li>Des sites, des villes, des organisations géolocalisées : Geolocalisation (France) </li></ul><ul><li>Des informations sur un secteur thématique : Moteurs sectoriels, ex : e-justice </li></ul><ul><li>Des sites similaires : Similar Site Search </li></ul><ul><li>Les tendances sur le web : Wasalive </li></ul>URFIST de Rennes, 2010
  39. 39. 3.6 Moteurs spécialisés : selon la nature du « média » <ul><li>Pour trouver : </li></ul><ul><li>Des images : </li></ul><ul><ul><li>Les modules images des moteurs : Exalead Images , Yahoo Images </li></ul></ul><ul><ul><li>Picsearch </li></ul></ul><ul><li>Des vidéos : </li></ul><ul><ul><li>Modules vidéos issus ou dérivés des moteurs généralistes : Exalead Vidéos , Voxalead News </li></ul></ul><ul><ul><li>Blinkx </li></ul></ul><ul><ul><ul><li>Recherche en texte intégral sur des émissions de télé et de radio grâce à un système de reconnaissance vocale </li></ul></ul></ul><ul><li>Des musiques : </li></ul><ul><ul><li>Midomi </li></ul></ul>URFIST de Rennes, 2010
  40. 40. 3.6 Moteurs spécialisés : selon la nature du « média » <ul><li>Pour trouver : </li></ul><ul><li>Des sons : </li></ul><ul><ul><li>FindSounds </li></ul></ul><ul><li>Des diapositives : </li></ul><ul><ul><li>SlideFinder </li></ul></ul><ul><li>Des fichiers PDF : </li></ul><ul><ul><li>PDFGeni.com </li></ul></ul>
  41. 41. PLAN <ul><li>4/ Moteurs en temps réel : </li></ul><ul><ul><li>Critères du temps réel </li></ul></ul><ul><ul><li>Intérêt </li></ul></ul><ul><ul><li>Un exemple : Social Mention Search </li></ul></ul>
  42. 42. 4.1 Moteurs en temps réel : caractéristiques <ul><li>Collecte, indexation, ou recherche en temps réel ? </li></ul><ul><ul><li>Distinguer par ex. de la recherche instantanée: </li></ul></ul><ul><ul><ul><li>Google Instant , Yahoo </li></ul></ul></ul><ul><ul><ul><li>Réactualisation très rapide de l’index </li></ul></ul></ul><ul><li>Essor des moteurs en temps réel, avec : </li></ul><ul><ul><li>Syndication de contenus </li></ul></ul><ul><ul><li>News des médias </li></ul></ul><ul><ul><li>Réseaux sociaux </li></ul></ul><ul><ul><li>Et surtout Twitter et micro-blogging </li></ul></ul><ul><li>Nombreux moteurs autonomes, intervention des géants G, Y, B </li></ul><ul><li>Demande d’instantanéité : </li></ul><ul><ul><li>Mais effets pervers du temps réel </li></ul></ul>
  43. 43. 4.1 Moteurs en temps réel : caractéristiques <ul><li>Principaux critères, selon Comparatif de 14 moteurs, de C. Deschamps : </li></ul><ul><ul><li>Nombre et type de sources collectées </li></ul></ul><ul><ul><li>Représentation graphique des données : </li></ul></ul><ul><ul><ul><li>Graphiques de tendances… </li></ul></ul></ul><ul><ul><li>Possibilité d’abonnement aux flux RSS par requêtes </li></ul></ul><ul><ul><li>Défilement de l’information en temps réel </li></ul></ul>
  44. 44. 4.2 Moteurs en temps réel : intérêt <ul><li>Suivi de l’actualité en temps réel : </li></ul><ul><ul><li>Exemple sur SocialMention , Collecta </li></ul></ul><ul><li>Suivi d’un thème sur Twitter, les réseaux sociaux… </li></ul><ul><li>Nouveaux outils de veille sur un sujet, une personne… </li></ul><ul><ul><li>Voir Stickytter : outil de veille en temps réel </li></ul></ul><ul><li>Analyse, représentation de l’information </li></ul>
  45. 45. 4.3 Moteurs en temps réel : exemple de Social Mention Search <ul><li>Moteur social de recherche en temps réel, veille sur les réseaux sociaux </li></ul><ul><li>Nombreux atouts : </li></ul><ul><ul><li>Diversité et nombre de sources indexées : </li></ul></ul><ul><ul><ul><li>Blogs et commentaires de blogs, Twitter… </li></ul></ul></ul><ul><ul><ul><li>Plateformes de partage de signets </li></ul></ul></ul><ul><ul><ul><li>Sites de news généralistes </li></ul></ul></ul><ul><ul><ul><li>Images, vidéos, audio </li></ul></ul></ul><ul><ul><ul><li>Questions-réponses </li></ul></ul></ul><ul><ul><li>Interrogation avancée , possibilités de filtrage </li></ul></ul><ul><ul><li>Affichage enrichi des résultats : tris, graphiques… </li></ul></ul><ul><ul><li>Affichage des « tendances » : volume de recherches sur les requêtes </li></ul></ul><ul><ul><li>« E-réputation » : tri des résultats selon leur caractère « positif », « négatif » ou « neutre » sur le sujet de requête </li></ul></ul><ul><ul><li>Possibilité de syndication de contenus, d’alertes … </li></ul></ul><ul><ul><li>Inconvénient : lenteur ! </li></ul></ul>
  46. 46. 4.3 Moteurs en temps réel : autres moteurs <ul><li>Collecta : </li></ul><ul><ul><li>Collecte de blogs, de photos, de micro-blogging, vidéos, réseaux sociaux </li></ul></ul><ul><ul><li>Affinement possible : sur photos, vidéos, blogs… </li></ul></ul><ul><ul><li>Simplicité d’utilisation </li></ul></ul><ul><ul><li>Peu de fonctionnalités </li></ul></ul>
  47. 47. PLAN <ul><li>5/ Moteurs participatifs : </li></ul><ul><ul><li>Moteurs personnalisables </li></ul></ul><ul><ul><li>Moteurs contributifs </li></ul></ul><ul><li>Critère : implication des internautes </li></ul>
  48. 48. 4.1 Moteurs «participatifs » : moteurs personnalisables <ul><li>Des moteurs “sur mesure” / recherche verticale </li></ul><ul><ul><li>Choix par l’internaute du périmètre des recherches : ensemble donné de sites web, thématique précise, type d’informations </li></ul></ul><ul><ul><li>Compte gratuit </li></ul></ul><ul><ul><li>Système de veille </li></ul></ul><ul><li>Des plateformes ouvertes / API de recherche </li></ul><ul><ul><li>Création de moteurs à la demande </li></ul></ul><ul><ul><li>Personnalisation dans la page de résultats (ajouts, tri, présentation) </li></ul></ul>
  49. 49. 4.1 Moteurs «participatifs » : moteurs personnalisables <ul><li>Secteur investi par les “grands moteurs” : </li></ul><ul><ul><li>Google CSE : Google Custom Search Engine </li></ul></ul><ul><ul><li>Yahoo : Interface utilisateurs Alpha </li></ul></ul><ul><ul><li>Pour les développeurs : </li></ul></ul><ul><ul><ul><li>Yahoo : Yahoo! Search Boss </li></ul></ul></ul><ul><li>Mais aussi par d’autres acteurs : </li></ul><ul><ul><li>Créer son moteur personnalisé avec : </li></ul></ul><ul><ul><li>Rollyo : http://www.rollyo.com/ </li></ul></ul><ul><ul><li>Les Swickis d’Eurekster : http://www.eurekster.com/ </li></ul></ul>URFIST de Rennes, 2010
  50. 50. 4.2 Moteurs «participatifs » : moteurs « contributifs » <ul><li>Enrichissement de la recherche par les internautes </li></ul><ul><ul><li>Yoople </li></ul></ul><ul><ul><ul><li>Avec Yahoo </li></ul></ul></ul><ul><ul><ul><li>Procédure hybride : Intervention dans le classement des résultats </li></ul></ul></ul><ul><ul><ul><li>Yoople factor </li></ul></ul></ul><ul><ul><ul><li>Problème de la manipulation à grande échelle des résultats </li></ul></ul></ul><ul><ul><li>Yoono </li></ul></ul><ul><ul><ul><li>Plugin pour navigateur (Firefox, Chrome) + version Desktop </li></ul></ul></ul><ul><ul><ul><li>Fondé sur les favoris internet des utilisateurs </li></ul></ul></ul><ul><ul><ul><li>4 fonctions : gestionnaire avancé de favoris; moteur pour accélérer les recherches thématiques; lecteurs RSS; espace communautaire </li></ul></ul></ul><ul><ul><li>Questions réponses avec WikiaAnswers </li></ul></ul>URFIST de Rennes, 2010
  51. 51. 5.1 L es moteurs de recherche sémantique <ul><li>Hakia : </li></ul><ul><ul><ul><li>Lancé en 2006 </li></ul></ul></ul><ul><ul><ul><li>moteur de requêtes en langage naturel </li></ul></ul></ul><ul><ul><ul><li>mélange d'analyse sémantique, d'ontologie, de logique floue et d'intelligence artificielle </li></ul></ul></ul><ul><ul><ul><li>Affichage des résultats par types de sources : web, Twitter, vidéos… </li></ul></ul></ul><ul><li>Et aussi : Wolfram Alpha , Kngine , EntityCube … </li></ul>
  52. 52. 6.1 Présentation des résultats : moteurs visuels, cartographiques <ul><li>Moteurs visuels : = Améliorations apportées à la liste linéaire de résultats </li></ul><ul><ul><li>Aperçus graphiques sur Exalead </li></ul></ul><ul><ul><ul><li>Vignettes et aperçus des sites en parallèle à la liste des résultats </li></ul></ul></ul><ul><ul><li>Nuage de mots clés : Quintura </li></ul></ul><ul><li>Moteurs (carto)graphiques : </li></ul><ul><ul><li>Clusters : Cluuz </li></ul></ul><ul><ul><li>Cartes interactives : Flokoon , Webbrain (sur l’Open Directory) </li></ul></ul><ul><ul><li>« Un moteur de recherche graphique pour appuyer la sérendipité » ( C. Deschamps ) : Spezify </li></ul></ul>URFIST de Rennes, 2010
  53. 53. En guise de conclusion ;) <ul><li>Google sans Google : pour sortir de (et retourner à) Google tout à la fois : </li></ul><ul><ul><li>http://forum.webrankinfo.com/les-parodies-les-autres-google-t4172.html </li></ul></ul><ul><ul><ul><li>… </li></ul></ul></ul>

×