Outils de recherche et de veille sur l'actualité
Upcoming SlideShare
Loading in...5
×
 

Like this? Share it with your network

Share

Outils de recherche et de veille sur l'actualité

le

  • 14,875 vues

Support du stage "Outils de recherche et de veille sur l'actualité", organisé par l'URFIST de Rennes, le 14 octobre 2014 (enrichissement et mise à jour du support précédent : datajournalisme, ...

Support du stage "Outils de recherche et de veille sur l'actualité", organisé par l'URFIST de Rennes, le 14 octobre 2014 (enrichissement et mise à jour du support précédent : datajournalisme, twitter, texmix...)

Statistiques

Vues

Total des vues
14,875
Vues sur SlideShare
7,970
Vues externes
6,905

Actions

J'aime
18
Téléchargements
327
Commentaires
1

17 Ajouts 6,905

http://www.scoop.it 4372
http://www.sites.univ-rennes2.fr 2219
http://www.lycee-pablo-picasso.fr 220
http://lalist.inist.fr 49
http://www.twylah.com 16
http://www.pearltrees.com 7
http://slides.diigo.com 6
https://www.rebelmouse.com 5
http://webmail2.net2000.ch 2
http://www.linkedin.com 2
http://messagerie-13.sfr.fr 1
http://projets-vsa.info 1
http://news.google.com 1
http://webcache.googleusercontent.com 1
https://hootsuite.scoop.it 1
http://v75l.xiti.com 1
http://172.16.90.102 1
Plus...

Accessibilité

Détails de l'import

Uploaded via as Microsoft PowerPoint

Droits d'utilisation

CC Attribution-NonCommercial-NoDerivs LicenseCC Attribution-NonCommercial-NoDerivs LicenseCC Attribution-NonCommercial-NoDerivs License

Report content

Signalé comme inapproprié Signaler comme inapproprié
Signaler comme inapproprié

Indiquez la raison pour laquelle vous avez signalé cette présentation comme n'étant pas appropriée.

Annuler
  • Full Name Full Name Comment goes here.
    Êtes-vous sûr de vouloir
    Votre message apparaîtra ici
    Processing...
Poster un commentaire
Modifier votre commentaire

Outils de recherche et de veille sur l'actualité Presentation Transcript

  • 1. Outils de recherche et de veille sur l'actualité (news, médias sociaux...) 14 octobre 2014 Marie-Laure Malingre, Alexandre Serres URFIST de Rennes
  • 2. 2 Plus de 30 outils à utiliser
  • 3. 3 SOMMAIRE PLAN • Quelques repères – 1/ Introduction : données, enjeux… sur la recherche d’information d’actualités – 2/ Les outils : périmètre, typologies, principes • Comment cerner et surveiller un sujet d’actualité sur le Web ? – 3/ Méthodologie de recherche – 4/ Quelle actualité du sujet – 5/ Comment trouver des journaux, des journalistes, des sites de presse ? – 6/ Quels médias, quelles sources sur le sujet ? – 7/ Quels acteurs concernés ? – 8/ Quelles données factuelles ? – 9/ Quelles interventions publiques filmées ? – 10/ Quel impact dans la blogosphère et les réseaux sociaux ? – 11/ Quelle évolution dans le traitement du sujet sur le web ?
  • 4. Introduction : données, enjeux, questions sur la recherche d’information d’actualités
  • 5. INTRODUCTION : repères sur les pratiques médiatiques en France Source : Baromètre TNS-SOFRES 2013 5
  • 6. 6 INTRODUCTION : repères sur les pratiques médiatiques en France • Un intérêt important pour l’actualité, mais en légère baisse : 69 % des Français • Médias utilisés pour « avoir des nouvelles » : (en 2013) • La télévision : 69 % • La radio : 33 % • Internet : 27 % (+ 20% depuis 2004) • La presse écrite : 24 % ; • Forte progression d’Internet : • pour approfondir un sujet (+25%) • avoir plusieurs points de vue Source : Baromètre des médias 2014, TNS-SOFRES (+24%) • Quelle confiance envers les médias ? • Crédibilité globale moyenne • La radio : média jugé le plus crédible (58 %) • Confiance en légère hausse envers Internet : • Confiance : 37 % (35 en 2013)
  • 7. 7 INTRODUCTION : données sur les sites d’information • Sites de presse et d’information parmi les plus visités : • le Figaro et le Monde, en octobre 2014 • 14ème et 15ème sites les plus consultés en France, selon Alexa • 5ème et 6ème (sur les sites français) ,selon l’OJD • Près de la moitié des internautes européens consultent les sites d’information (voir l’étude de Comscore, janvier 2012) : • Novembre 2011 : sur les 379 millions d’Européens ayant consulté internet, + de 181 millions de visiteurs uniques sur les sites d’information • Internet premier média d’information pour une part croissante de la population
  • 8. 8 INTRODUCTION : quelles sources de trafic vers les sites d’actualité ? • En France, en 2012: • Etude d’AT Internet, en août 2012, sur 19 sites d’actualité français • Google : 39,7 % ! • Facebook et Twitter à l’origine de < 4 % du trafic
  • 9. En France, janvier 2014 : • Google : 39 % • Facebook : 7,1% INTRODUCTION : quelles sources de trafic vers les sites d’actualité ? Source : JournalduNet
  • 10. 10 INTRODUCTION : les outils de recherche comme sources de trafic • « Effet Saint- Matthieu » : • Renforcement de la visibilité des principaux sites d’information français (Le Monde, le Figaro, Nouvel Obs…) sur Google News • Selon une étude (octobre 2012) de Résonéo
  • 11. Les outils : périmètre, typologies, principes
  • 12. 12 Cartographie des producteurs Périmètre d’information médiatique en ligne http://www.ardepmp.com/IMG/pdf/ producteurs_d-info_en_ligne.pdf
  • 13. 13 Périmètre Diversification des portes d’entrée d’un article > Article de Marco Bertolini : Ecrire pour la presse web
  • 14. 14 • 2 champs principaux : – Les outils de recherche sur les médias d’actualité • Les articles de presse • les dépêches d’agence, les communiqués • les ressources audio-visuelles – Les outils de recherche sur les ressources du web social > « l’information en temps réel » • blogs • Twitter • … Périmètre
  • 15. 15 • Prise en compte et mixage éventuel de 4 types de spécialisations : – Le contenu : • Recherche sur l’information d’actualité – Le type de ressource internet : • Portails de presse, moteurs d’actualités, moteurs de blogs, de tweets, plateformes de curation… – Le média : • Texte, images, podcasts, vidéos… – La fonction : • Indexation, filtrage de l’information • Analyse de l’information Périmètre
  • 16. Typologie et principes des outils 16 • Annuaires, répertoires, portails – Annuaires de presse – Portails spécialisés – Navigation et recherche dans une sélection de ressources • Moteurs de recherche d’actualités – Modules spécialisés des moteurs de recherche du web – Outils ciblés – Indexation automatique d’un corpus spécialisé
  • 17. Typologie et principes des outils 17 • Agrégateurs et bases de données de presse – Accès à des sources spécifiques de presse ou à un ensemble de sources de presse agrégées sur des plateformes unifiées • Outils d’analyse de l’actualité – Fonctionnalités spécifiques de traitement de l’information d’actualité • Extraction, synthèse, cartographie, visualisation de tendances, de relations…
  • 18. Typologie et principes des outils 18 • Outils et ressources du journalisme de données : – Journalisme centré sur la recherche, l’exploration, le traitement et la visualisation d’ensembles de données. – S’intègre dans le mouvement du big data,visant à mettre à disposition des collections diversifiées de données – Sites ressources proposant des corpus de données – Outils de traitement et de visualisation
  • 19. Typologie et principes des outils 19 • Outils du web social – Moteurs de blogs : • Recherche de blogs via les moteurs généralistes du web • Outils spécialisés, permettant la recherche de blogs – Recherche sur les réseaux sociaux • Outils dédiés à la recherche sur Twitter, sur Facebook… • Moteurs de recherche temps réel sur les réseaux sociaux > métamoteurs
  • 20. Méthodologie de recherche sur un sujet d’actualité
  • 21. 21 Démarche méthodologique • Défricher le sujet, trouver des mots-clés • Voir les derniers événements, l’actualité du sujet : • les moteurs de recherche d’actualités, les outils d’analyse (Google News, NewsBrief) • Trouver des journaux, des journalistes, des sites de presse : • Les annuaires et portails spécialisés de presse • Qui parle de quoi ? Recherches sur les médias, les sources : • Les moteurs de recherche d’actualités, les outils d’analyse (Google News, Pickanews) • Quels sont les acteurs concernés par le sujet ? • Les agrégateurs de presse (Europresse), les outils d’analyse de l’actualité (NewsExplorer) • Quelles données brutes relatives à un sujet ? • Les sites et outils de data journalism
  • 22. 22 • Retrouver des vidéos et des déclarations d’acteurs du sujet • Utiliser Voxalead News • Quel impact dans la blogosphère ? • Quel impact sur Twitter, les réseaux sociaux, les plateformes du web social ? • Les outils de recherche dans les réseaux sociaux (Twitter Search, Topsy) • Quelle évolution dans le traitement du sujet ? • Google Trends, News Explorer • Retrouver des archives sur le sujet • Archives Google News • Faire de la veille sur le sujet • Les alertes, les flux RSS, les pages personnalisables, les outils de curation Démarche méthodologique
  • 23. Cerner un sujet d’actualité sur le web : Quelle actualité du sujet ?
  • 24. 24 Les moteurs de recherche d’actualités • Modules ou services proposés par les outils de recherche • Agrégation de multiples sources d’actualité : • Presse, blogs, sites web… • Revues de presse automatisées • Services gratuits : alertes… • Nombreux moteurs d’actualité : • Précurseur : Google News • Modules spécialisés : Yahoo News, • Concurrence aiguë, enjeux économiques importants • Problèmes et conflits juridiques
  • 25. • Google News (Actualités) : - Créé à la suite du 11/09/01, en décembre 2001 (par Krishna Bharat) - Lancement officiel en 2003. Diffusion en continu d’infos sur l’actualité - Sélection de 55 000 sources indexées tous pays confondus • + de 500 sources sur la version française - Plus de 72 versions nationales en 30 langues différentes - Automatisation complète ; collecte et analyse de chaque source par un robot ; classement automatique des informations dans des rubriques prédéfinies - Visibilité des sites de presse dans Google News : étude 2012 de la société Resoneo, cf. Abondance, novembre 2012 - Google et l’édition de presse - Nombreuses controverses au cours des dernières années - Actions d’apaisement de Google en direction des acteurs de la 25 presse Les moteurs d’actualités : Google News
  • 26. 26 Les moteurs d’actualités : Google News • Google News (Actualités) : - Fonds pour l’innovation numérique de la presse de 100 millions d’euros 16 millions d’euros à 23 médias de la presse française en 2013 (près de 2 millions chacun) Source : Libération Ecrans
  • 27. 27 Les moteurs d’actualités : Google News • Google News (Actualités) (source Café référencement : Google Actualités : quoi de neuf en 2014 ? ) • Le public : • 1 Mrd d’utilisateurs voient des résultats News sur Google chaque semaine • 6 Mrds de clics envoyés vers les sites de news chaque mois • L’algorithme • Classement selon : sujet, cluster, période de l’année, de la journée, signaux sociaux • Utilisation du News sitemap • Respect du fichier Robots.txt • Trafic • Baisse de trafic en visiteurs uniques sur Google News • Augmentation du trafic news sur google.fr via les résultats d’actualité • Indexation par le spider Google (il n’y a plus de spider spécifique)
  • 28. 28 Les moteurs d’actualités : Google News • Google News (Actualités) : • Quoi de neuf pour 2014 ? (source : http://www.cafe-referencement.com/, rubrique Google Actualités) • Google News en version Web App Mobile, lancée en décembre 2013 • Une version pour tablette • Lancement aux USA d’une possibilité pour les éditeurs d’envoyer un flux Choix des rédactions pour des catégories spécifiques en plus du flux global • Nouvel outil pour les éditeurs : Media Tools • Autres fonctions récentes : « In-Depth Articles », blocs d’actualité extensibles
  • 29. 29 Les moteurs d’actualités : Google News • Google News : 10 critères principaux de pertinence – Source : Actualités du site Abondance ( + 10 critères négatifs) – 1. L'autorité d'un site sur un sujet précis. – 2. La présence des mots clés demandés dans le titre de la page. – 3. L'autorité du nom de domaine en termes SEO. – 4. Les partages sociaux. – 5. Le fait d'être parmi les premiers à publier un article sur le sujet. – 6. Le nombre de citations par d'autres sites. – 7. Le fait que l'article soit unique et original. – 8. Le taux de clics dans les résultats de Google News. – 9. La qualité du contenu. – 10. L'utilisation d'un Sitemap spécifique de Google News
  • 30. 30 Les moteurs d’actualités : Google News Google Actualités Onebox Actualités de Google web
  • 31. 31 Les moteurs d’actualités : Google News • Les fonctionnalités : – La personnalisation : • Choix dans l’affichage des rubriques • Création de rubriques personnelles • Recherches d’informations locales • Paramétrer la fréquence des sources – La veille : • Syndication de fils RSS • Abonnement gratuit aux alertes : – par thèmes...
  • 32. 32 Les moteurs d’actualités : Google News Menu déroulant pour la recherche avancée depuis la fenêtre de saisie de la recherche simple
  • 33. 33 Les moteurs d’actualités : Google News • Syntaxe de recherche : • intitle: et allintitle: : dans le titre des articles • intext: et allintext: : dans le texte des articles • inurl: : dans un site particulier • source: : sur une source précise • Source:Libération • location: : dans un pays précis • Location:Algérie • + date d’ajout dans Google Actualités • Option prédéfinie, archives ou intervalle personnalisé
  • 34. 34 Les moteurs d’actualités : Google News • Recherche d’articles sur le sujet de la transition énergétique – Requête sur la phrase « transition énergétique » – Personnalisation des rubriques Actualité (colonne de gauche) : sélectionne les contenus récents dans le domaine • Créer une alerte (en bas de la page) – Nécessite un compte Google
  • 35. 35 Les moteurs d’actualité : News Brief • NewsBrief : l’information en temps réel • Moteur développé par l’Union Européenne • Collecte sur + 4300 sources : • 1600 portails d’information, 20 flux d’actualités commerciales, sites spécialisés ; en 60 langues • Surveillance quotidienne : • Mises à jour toutes les 10 mns • Classement des informations • Graphique des 10 derniers événements marquants • Clustérisation : par thèmes, par Directions Générales de l’UE • Possibilité d’abonnements RSS, mais pas par rubriques • Index de > 20 millions d’articles
  • 36. 36 News Brief : voir l’actualité du sujet • Sur NewsBrief : • Voir si la transition énergétique est à la une (Dépêches) • Vérifier si le sujet était présent à la une la veille (Dernières 24 heures) • Voir les Domaines de politiques européennes (EU Policy Areas) et les Thèmes dans lesquels le sujet de la transition énergétique est présent • Consulter la liste des sources (Sources list)
  • 37. 37 News Brief : voir l’actualité du sujet • Sur NewsBrief : • Requête avancée • Retrouver les articles consacrés à la transition énergétique parus : • dans Le Monde, Libération, Alternatives économiques, Huffington Post • depuis le 1/10/14 • Intérêt principal de NewsBrief : – Les événements les plus récents, l’actualité « chaude »
  • 38. 38 Europe Media Monitor et NewsBrief • Europe Media Monitor : portails d’information du Joint Research Center (JRC) de la Commission Européenne • Collecte, analyse, cartographie… de très nombreuses sources d’information, en 60 langues • Trois portails complémentaires : • NewsBrief : actualité en temps réel • NewsExplorer : analyse de l’information • MediSys : information médicale • + EMM-Labs
  • 39. 39 • QWANT : Les moteurs d’actualité : Qwant • Moteur généraliste frrançais lancé en janvier 2013 • JM Rozan, Société Pertimm, E. Leandri +entrée de Axel Springer en 2014 • Positionnement comme moteur de recherche de découverte • 500 millions de recherches en 2013 (1200 milliards pour Google), 1,2 milliard / estimations pour 2014 • Fondé sur plusieurs technologies big data • Politique annoncée de respect de la vie privée • Contenus : texte, photos, vidéos, actualité, presse • Présent dans 25 pays et accessible en 15 langues • Possibilité de géolocaliser une recherche • Prise en compte du contexte social des contenus : Twitter, (Voir JDN) Facebook, Google+ et LinkedIn ; utilisation de filtres
  • 40. 40 • QWANT : Les moteurs d’actualité : Qwant • Originalité dans la présentation des résultats •Affichage sur une seule page en 5 colonnes : • Web, actualités, Qnowledge graph, social, shopping • Onglet Médias • Lancement du “carnet de notes” avec système de Follower
  • 41. 41 Les moteurs d’actualités : autres outils • Anglophones : • Yahoo News • Topix : 2004, agrégateur d’actualités localisées • Européens : • Eufeeds / European Journalism Centre • Francophones : – Yahoo France Actualités – Webplanete news : • 884 sources d’information francophones – Twikle : • Agrégateur d'actualités et de contenus lancé en octobre 2012 • Indexe les contenus les plus partagés sur les réseaux sociaux • Recherche dans les tweets
  • 42. 42 Faire de la veille sur un sujet d’actualité : les alertes • Répétition automatique d’une requête à chaque mise à jour d’une source d’information • Résultats adressés périodiquement à l’utilisateur – par messagerie ou sous forme de flux RSS • L’alerte permet, sans avoir à réinterroger la source d’information, de surveiller : – L’évolution d’un thème – Les travaux d’un auteur ou d’une institution – Les nouveaux articles de la revue que l’on suit • Sur le sujet de la transition énergétique : – Créer une alerte sur Google Actualités
  • 43. Comment trouver des journaux, des journalistes, des sites de presse ?
  • 44. 44 Trouver des journaux et sites de presse 3. Recherches d’actualités : Annuaires de la presse et des médias • Pour trouver des journaux dans le monde entier : – Newspapermap.com (http://newspapermap.com/FR.html) : • annuaire cartographique de la presse mondiale • Plus de 10 000 journaux géolocalisés • Option de traduction par Google Translate • Guide Presse : – annuaire de la presse francophone en ligne • Journaux et magazines • Giga-Presse : – Annuaire francophone de la presse en ligne • 612 journaux francophones sélectionnés • Giga Presse Internationale : 10 000 journaux et magazines internationaux dans la rubrique « Monde » (beaucoup sont extraits de l’ODP) > Exercice : rechercher des titres de magazines professionnels français sur l’environnement et l’énergie
  • 45. 45 Trouver des journaux et sites de presse 3. Recherches d’actualités : Annuaires de la presse et des médias Retrouver des « Unes » de journaux : • SPQR : – Les unes du jour des journaux régionaux français sur le site du Syndicat de la Presse quotidienne régionale • Newseum : – Plateforme américaine – Partenariat avec plus de 2000 journaux dans le monde – Tri par région, carte, « unes » archivées
  • 46. 46 Trouver des journalistes • Categorynet.com (portail de la presse et des médias) : – Créé en 1998 par Greg Manset ; entreprise de presse et réseau de journalistes • Comprend un annuaire de liens – Pour trouver des annuaires de journalistes • AnnuaireJournalistes Réseau de pigistes : – Annuaire de près de 8700 journalistes freelance – Possibilité de recherche par thématiques > Exercice : trouver des journalistes spécialisés sur les questions d’énergie et d’environnement
  • 47. 47 Autres annuaires et portails de la presse et des médias 3. Recherches d’actualités : Annuaires de la presse et des médias • PQR : – Portail du Syndicat de la PQR – Toutes les informations sur la PQR • Info.presse.fr : – Portail commercial tous publics ; vente d’abonnements – Plus de 1000 titres de presse disponibles à l’abonnement
  • 48. Cerner un sujet d’actualité sur le Web : quels médias, quelles sources sur le sujet ?
  • 49. Recherche sur les sources avec Google Actualités 49 • Google News (Actualités) : – Filtrage possible sur la source > un titre particulier – Filtrage sur le lieu – Personnalisation relative aux sources (compte Google) • Personnalisation en augmentant la fréquence pour la catégorie choisie ou créée (énergie) • Ajuster la source / Ajuster la fréquence d’une source d’actualité, avec un compte Google • Paramètres : personnalisation sur les blogs / les communiqués de presse – Après connexion, création d’une rubrique personnalisée Energie par requête, filtrage sur le pays des sources, sur l’édition ou la langue Rubrique Energie sur les sources françaises
  • 50. 50 • Pickanews : Un moteur d’actualités : Pickanews – Edité par Press Index, société spécialisée sur la veille et les médias • Lancé en mai 2010 – Moteur plurimédia sur + de 50 000 sources d’information en Europe : • Presse écrite : > 30 000 titres • Web : > 40 000 sites d'information et blogs • Radio et TV : > 200 chaînes de radio et télévision • Réseaux sociaux : 3 (Facebook, Twitter, YouTube) – Outil à la fois gratuit et payant : • Consultation gratuite des résumés • Abonnements payants pour texte intégral des articles, fonctions de veille...
  • 51. 51 Un moteur d’actualités : Pickanews • Fonctionnalités gratuites intéressantes : • Filtrages possibles sur : • Les médias • La période (2 derniers mois) • Le sujet • Un titre de presse • Un pays • Graphiques sur : • L'évolution des citations • La ventilation des résultats par types de média • Le top des citations : • Le top des sources • Recherches sur un nom, une marque, une société Pour en savoir plus, voir Veille presse avec Pickanews
  • 52. 52 Recherche sur les médias et les sources • Sur Pickanews : • Faire une recherche sur la transition énergétique en France • Tester différentes requêtes • Identifier : • les médias • les sources sur internet • Les radios • Les télévisions • Les journaux • qui ont le plus parlé du sujet depuis deux mois • Repérer les périodes où l’on a le plus parlé du sujet • Retrouver des émissions de radios • Chercher les articles de la presse locale sur le sujet
  • 53. 53 Recherche sur les sources avec VoxEurop 3. Recherches d’actualités : Annuaires de la presse et des médias • VoxEurop : – Site d’information créé par un consortium de 4 magazines européens, spécialisés dans l’actualité internationale (dont « Courrier international ») – Créé en 2009 à Paris, sous le nom PressEurop – Soutien de la Commission européenne – Sélection d’articles dans plus de 200 titres de la presse internationale – Charte éditoriale : « participer au développement du débat démocratique informé au sein de l’UE » • TP sur VoxEurop : – Chercher des articles de la presse européenne sur la transition énergétique
  • 54. 54 Les agrégateurs de presse • Forte croissance des agrégateurs de presse et de veille médias depuis quelques années (Etude SerdaLab 2009/2010 L’information numérique professionnelle en France : Le marché et les tendances en 2009- 2010.) • Diversification des prestations proposées – Services d’agrégation et de recherche dans les contenus presse – Prestations de services autour de ces contenus – Secteur de la e-réputation • Extension du périmètre des sources – Presse, internet, télévision, radio • Personnalisation de l’offre • Quelques grands acteurs : – Europresse – Factiva
  • 55. 55 Les agrégateurs de presse : Europresse • Europresse: www.europresse.com – Agrégateur canadien (Cedrom-SNI) – 10231 sources reconnues – Plus de 3000 titres de presse de près de 100 pays (dominante : Etats-Unis, Canada, France ; langue anglaise 80%) – Plus de 25 ans d’archives – Actualité internationale, nationale, régionale, locale + BDD entreprises et profils biographiques – Presse généraliste / spécialisée, communiqués,blogs thématiques, sites web...  en accès gratuit : recherche de sources possible
  • 56. 56 Les agrégateurs de presse : Europresse
  • 57. 57 • Recherche sur les sources dans Europresse : – Filtrage sur les types de sources – Filtrage par source spécifique – Filtrage sur les sources de régions spécifiques – Filtrage sur la date – Possibilité de tri des résultats par sources – Recherche de journaux sous format PDF • Faire une recherche sur la transition énergétique et identifier les sources qui en ont le plus parlé – Presse nationale, régionale, presse spécialisée – Titres Les agrégateurs de presse : Europresse
  • 58. 58 Les agrégateurs de presse : Factiva • FACTIVA / Dow Jones : http://www.factiva.com/ – “Factiva propose aux entreprises actualités et informations essentielles avec des outils et services de livraison de contenu. La base Factiva (...) inclut l’association exclusive Wall Street Journal, Financial Times®, DJ et Reuters, AFP, AP… » (Journal du Net) – 35 000 sources , 900 fils d’agences, 200 pays, 28 langues : presse papier et web, 35 ans d'archives – Accessible par abonnement
  • 59. 59 Les agrégateurs de presse : Factiva • Nombreuses possibilités : – requêtes complexes : – Filtrage sur la langue, les dates.. – Affinement sur type de sources, de documents, dates, sujets… – Alertes • Voir Guide Formadoct sur l’utilisation de Factiva (dernière mise à jour décembre 2012)
  • 60. Cerner un sujet d’actualité sur le Web : quels acteurs concernés par le sujet ?
  • 61. 61 • Europresse, http:// www.europresse.com/ • Recherche biographique : • Par nom ou mot clé • Dans différentes sources • Possibilité de recherche avancée dans une source donnée Europresse
  • 62. 62 Les outils d’analyse de l’actualité : News Explorer • NewsExplorer : analyse multilingue • Produit également par Europe Media Monitor • Couplage avec NewsBrief • Analyse de l’information une fois par jour • Résumé des 20 faits marquants • 21 langues • Nombreuses fonctionnalités : • Carte des lieux de l’actualité • Analyse des actualités : tous les articles sur un sujet… • Chronologie des événements • Fiches sur personnalités • Visualisation des relations entre personnes • Recherche rétrospective sur les événements majeurs d’un pays
  • 63. • NewsExplorer : • Recherches sur le thème de la transition énergétique : • Nécessité de passer par les mots-clés de l’outil • Chercher le thème dans les sujets récemment traités, ou essayer différents mots-clés • Explorer les différents clusters 63 Les outils d’analyse de l’actualité : News Explorer
  • 64. 64 Les outils d’analyse de l’actualité : NewsExplorer Exemple de requête sur Edward Snowden Explore Relations : visualisation des personnes ou des organisations les plus fréquemment associées à la personne affichée Related People : personnes les plus fréquemment mentionnées dans les clusters sur le sujet, avec le nombre de mentions Associated People : personnes mentionnées en même temps que la personne affichée dans le cluster
  • 65. 65 Les outils d’analyse de l’actualité : NewsExplorer Other Names : noms d’organisations ou d’événements les plus mentionnés autour d’un événement, d’une date… Quotes from : citations de la personne, dans différentes langues Quotes about : citations à propos de la personne, dans différentes langues Related Stories : autres clusters d’actualités, dans lesquels la personne est le plus souvent citée
  • 66. 66 Les outils d’analyse de l’actualité : News Silobreaker • News Silobreaker : – Outil d’analyse en temps réel de l’actualité – Possibilité de requêtes avancées – Analyse des relations (Network) entre des entités nommées (personnes, pays, villes…) : • Cartographie des relations de co-occurrence entre entités • Analyse du volume de contenus – Analyse de tendances (Trends) : • Nombre d’articles sur un sujet, une entité… – Analyse des points chauds (Hot Spots) • Voir article de C. Deschamps
  • 67. Les outils d’analyse de l’actualité : Les outils de visualisation de l’actualité : News Silobreaker Newsmap • Newsmap : – Application de visualisation de l’actualité – Développée par un ingénieur designer américain, Markos Wescamp – Représentation des actualités de 15 pays, sous forme de vignettes proportionnelles au nombre d’articles ; – Accès aux articles de presse
  • 68. Les outils de cartographie de l’actualité : Infomous : Infomous – Permet de naviguer visuellement dans différentes sources – Détection des tendances de l’actualité •Fonctionnement : – Collecte des informations, à partir de différentes sources : • Fils RSS • Site web • Requête sur un mot-clé : sur Twitter, Facebook, Google… – Génération de cartes sémantiques à partir de ces sources : • Représentation des principaux mots-clés, des liens • Affichage de la source
  • 69. Infomous Les outils de cartographie de l’actualité : Infomous
  • 70. Les outils de cartographie de l’actualité : Infomous Infomous • Possibilité de créer soi-même des nuages de mots-clés :
  • 71. Quelles données brutes sur un sujet ? Le journalisme de données
  • 72. 72 • Définition : Chercher des données : le journalisme de données • « Le journalisme de données (data journalism en anglais), ou journalisme de bases de données (database journalism), est un mouvement visant à renouveler le journalisme par l'exploitation et la mise à la disposition du public de données statistiques » (Wikipedia) • Repères : • Des origines anciennes : • La carte du choléra à Londres en 1854, par John Snow. • Diagramme des causes de mortalité au sein de l'armée en Orient par Florence Nightingale. • Essor récent du journalisme de données, symptôme du « Big Data » • 2006 : 1ère apparition du terme, par Adrian Holovaty, créateur d’EveryBlock • Août 2010 : 1ère conférence internationale du datajournalism • 2010 : utilisation des données massives de Wikileaks, par les grands quotidiens internationaux (ex. du Guardian)
  • 73. 73 Chercher des données : le journalisme de données • Exemples de datajournalisme : • Très nombreux exemples, sur tous les sujets, dans tous les domaines, sur toutes les données • Voir dans le Guide du datajournalisme : • la base de données des salaires des fonctionnaires gouvernementaux développée par The Texas Tribune • De la visualisation : • Voir « La carte du déclin du communisme municipal dans les banlieues » sur Le Monde • Datajournalisme et visualisation de données : des exemples • Des analyses de corpus de textes : • L’analyse des discours de la campagne présidentielle de 2012
  • 74. 74 Chercher des données : le journalisme de données • Exemples de datajournalisme : • L’utilisation des données d’ameli.direct.fr (voir sur Guide du datajournalisme)
  • 75. 75 Chercher des données : le data journalisme • Guardian DataBlog : • Mise à disposition sur le blog : • de données brutes • d’outils de recherche et d’exploration des données • d’outils de visualisation des données • Exemples : • Elections US • Notes de frais des députés anglais • La révolution ukainienne avec 13 000 photos Instagram • Dépenses gouvernementales
  • 76. 76 Chercher des données : le data journalisme • OTMedia, Observatoire transmedia • Projet de recherche national (financement ANR) • Novembre 2010 – Novembre 2013 • Partenariats multiples : INA, INRIA, AFP, Sorbonne nouvelle… • Exploitation de données des médias • Objectifs : • « …mettre en place une plateforme d’analyse des différents flux médiatiques pour détecter, circonscrire, suivre, mesurer, analyser et étudier la propagation des évènements médiatiques et leurs dérivés » • Exemple : • « La crise syrienne, une vue de France au printemps 2012 »
  • 77. 77 Chercher des données : la visualisation de données mondiales Deux sites de visualisation de statistiques mondiales : •GapMinder : • Outil de visualisation de statistiques mondiales, sur la santé publique • Créé par Hans Rosling, professeur de santé publique • Consultation et utilisation interactive de statistiques mondiales • Exemple du graphique sur l’évolution de l’espérance de vie dans le monde, depuis 1800 • Nombreux usages pédagogiques • Ressources sur ThotCursus •WorldMapper : • Données démographiques • Cartes interactives
  • 78. 78 • Ressources : Chercher des données : le data journalisme • Guide du datajournalisme • définition et repères sur le datajournalism • Exemples, études de cas, modes de fonctionnement • GlobalVoices, un manuel du journalisme de données • INA global : le journalisme de données • Géoconfluences : Datajournalisme et visualisation de données • Liste du Guardian Datablog
  • 79. Cerner un sujet d’actualité sur le Web : quelles interventions publiques filmées ?
  • 80. 80 Les moteurs d’actualités : recherches vidéos • Apport des outils de recherche vidéo pour retrouver de l’information d’actualité • Voxalead News, http://voxaleadnews.labs.exalead.com/ • Création en collaboration avec Vecsys et le CNRS-LIMSI dans le cadre du projet Quaero. • Recherche dans les vidéos et fichiers audios de chaînes d’information • Affichage possible de l’actualité récente par graphiques et tags • Chaînes : CNN, france 24, iTélé, LCI, BBC, BFM, Europe 1, etc. • Adaptation du moteur de recherche Exalead • Recherche dans un grand nombre de podcasts (plus de 150 000 mis à jour quotidiennement) • 9 langues : Français, Anglais, Mandarin, Arabe, Russe, Espagnol, Italien, Allemand et Hollandais.
  • 81. 81 Les moteurs d’actualités : recherches vidéos • Combine des technologies de reconnaissance de la parole et d’indexation texte • Transcription et séquençage : permet de sélectionner un passage précis de la vidéo • Affinement : chaînes spécifiques, termes associés, personnes, organisme, évènement, localisation • Différents types d’affichage et d’accès
  • 82. 82 Les moteurs d’actualités : recherches vidéos Recherche par mot dans la vidéo Voxalead Requête sur Keith Alexander Texte de la vidéo et séquençage : passages cliquables amènent directement à l’endroit choisi dans la vidéo (déficiences possibles dans la transcription)
  • 83. Les moteurs d’actualités : recherches vidéos TexMix • Projet INRIA, IRISA, CNRS, INSA, Quaero, Université Rennes 1 • Structuration, navigation dans une collection de journaux TV 83 • Le principe de l’application • Segmentation thématique à partir de transcription de la parole • Caractérisation des segments obtenus • Extraction de mots clés • Enrichissement des séquences par des informations sur les personnes ou les locutions citées
  • 84. 84 Les moteurs d’actualités : recherches vidéos • Les modules de recherche de vidéos des moteurs généralistes • Exalead Vidéo • Google Vidéo • Yahoo Vidéo • Les plateformes spécialisées • Youtube • Blinkx
  • 85. Cerner un sujet d’actualité sur le Web : quel impact dans la blogosphère et les réseaux sociaux?
  • 86. 86 • Tendances : Outils de recherche de blogs – Baisse d’intérêt des grands moteurs de recherche pour les blogs : • Exemples de Google Blog Search ou de Technorati : plus de recherche vraiment spécifique sur les blogs • Sur Google, intégration récente de l’onglet Blog dans Google Actualités – Un métamoteur intéressant : IceRocket – Quelques petits moteurs de recherche : • Un moteur personnalisable : Keyblog • Les annuaires de blogs : – Une liste d’annuaires de blogs : LesAnnuaires, section Blogs – Quelques annuaires francophones, tous publics : • Annuaire de Blogs ADB : – 50 000 blogs recensés • Tout le monde en blogue – Des outils propres aux plateformes de blogs : • L’annuaire des blogs sur OverBlog • Pour les blogs scientifiques : – Hypothèses : en SHS
  • 87. 87 Moteurs de recherche de blogs : IceRocket • Module spécialisé du métamoteur IceRocket IceRocket, outil de veille : recherche dans les blogs, les actualités, Twitter, Facebook • Pour la recherche sur les blogs – Recherche avancée : auteur, recherche de posts, sur le titre du post, sur le tag du post, filtrage sur blog spécifique, sur lien du post, sur la date – Présentation des résultats de la recherche par dates – + résultats des posts publiés dans un intervalle de dates – Tri des résultats par langue – Fil RSS de la recherche – Fonction Trends > graphique de la popularité des mots clés utilisés
  • 88. 88 Recherche sur Twitter • Méthodes de recherche des tweets : – Moteur de Twitter : Twitter Search • >1000 tweets reçus par seconde (2010) • Traitement de 12 000 requêtes par seconde – Moteurs de recherche spécialisés, en temps réel : Topsy, SnapBird, twXplorer – Moteurs de recherche généralistes : Google… • Intégration des tweets dans les résultats – Applications autour de Twitter
  • 89. 89 Recherche sur Twitter : Twitter Search • Moteur de Twitter, racheté en 2008 • Nombreuses fonctionnalités : • Interface de recherche booléenne • Recherche sur les hashtags • Recherche sur un utilisateur • Recherche géographique • Recherche sur les smileys
  • 90. 90 Recherche sur Twitter • Recherche sur Twitter Search : – Termes de requêtes : • Hashtag : #transitionenergetique • Mot clé : transition energetique • Observer les réactions sur Twitter • Chercher un compte Twitter spécialisé • Comparer les résultats avec Topsy
  • 91. 91 Recherches booléennes Recherche sur un site, un utilisateur Recherche sur Twitter : Topsy Classement par pertinence, par date Recherche sur anciens tweets
  • 92. 92 Recherche sur Twitter : Topsy • Plusieurs possibilités de filtrage des résultats : • Par périodes de publication • Par types de supports • Par « Experts » : utilisateurs ayant le plus cité le mot-clé
  • 93. 93 • twXplorer : Recherche sur Twitter : twXplorer – Nouvel outil spécialisé sur Twitter, lancé en 2013 – Développé par le Knight Lab, de la Northwestern University of Illinois – Outil puissant, toujours en phase beta – 13 langues proposées – Nécessité de se connecter avec son compte Twitter – Requête sur un mot-clé ou un hashtag : • Sélection des 500 derniers tweets sur le sujet • Exclusion des doublons • Affichage des 100 premiers tweets – Tableau de bord avec des possibilités d’affinement : • Sur des termes, des hashtags – Affichage des liens contenus dans les tweets – Voir “twXplorer nouveau moteur de recherche pour Twitter” et “twXplorer, la recherche intelligente sur Twitter”
  • 94. 94 Recherche sur Twitter : twXplorer • Le tableau de bord de twXplorer :
  • 95. Moteurs de recherche en temps réel • Information de dernière minute, rapidité d’indexation • Essor des moteurs en temps réel, avec : 95 – Syndication de contenus, News des médias, Réseaux sociaux, Twitter et micro-blogging • Nombreux moteurs autonomes, intervention des géants Google, Yahoo, Bing • Demande d’instantanéité : – Mais effets pervers du temps réel
  • 96. Moteurs de recherche en temps réel • Principaux critères, selon Comparatif de 14 moteurs, de C. Deschamps : 96 – Nombre et type de sources collectées (« multimoteurs ») – Représentation graphique des données : • Graphiques de tendances… – Possibilité d’abonnement aux flux RSS par requêtes – Défilement de l’information en temps réel
  • 97. 97 Moteurs de recherche en temps réel • Suivi de l’actualité en temps réel : – Exemple sur SocialMention, Samepoint, 48ers… • Suivi d’un thème sur Twitter, les réseaux sociaux… • Outils de veille sur un sujet, une personne… • Analyse, représentation de l’information
  • 98. 98 Moteurs de recherche en temps réel : Social Mention Search • Social Mention, moteur social de recherche en temps réel, veille sur les réseaux sociaux – Diversité et nombre de sources indexées : • Blogs • Microblogging • Commentaires de blogs • Plateformes de partage de signets • Sites de news généralistes • Sites d’événements • Images / Vidéos / Audio • Questions-réponses • Réseaux sociaux
  • 99. 99 • Interface de recherche Moteurs de recherche en temps réel : Social Mention Search – Interface de recherche simple • Filtrage possible par les catégories de sources • Filtrage par les sources elles-mêmes
  • 100. 110000 Moteurs de recherche en temps réel : Social Mention Search • Interface de recherche – Interface de recherche avancée • Affichée à la suite d’une première requête
  • 101. Cerner un sujet d’actualité sur le Web : Quelle évolution dans le traitement ?
  • 102. 102 Repérer les tendances : Google Trends • Google Trends – Permet de voir l’évolution de la fréquence des termes de recherche – Exemple sur la transition énergétique :
  • 103. 103 Repérer les tendances : Google Trends • Google Trends : fonctionnalités – Chiffres indiqués : • Pas le nombre exact de requêtes • mais le rapport entre la quantité de recherches pour un terme donné, par rapport au nombre total de recherches effectuées sur Google au cours de la même période – Filtrages possibles sur : • Les modules de Google (Web, Actualités, Images…) • Les dates • Les pays • Les catégories • Les mots-clés associés
  • 104. 104 Repérer les tendances : Google Trends Exemple sur « energy transition »
  • 105. 105 Suivre une épidémie : Google Flu • Google Flu Trends : – Suivi en temps réel de deux épidémies mondiales : la grippe et la dengue – Application de Big Data développée par Google : • Analyse des millions de requêtes des internautes sur la grippe et la dengue • Localisation, détection des tendances • Application reconnue par les épidémiologistes
  • 106. Recherche d’archives avec Google News Archive 106 • La recherche sur les archives : • Sur Google News : – Archives de presse : http://news.google.com/newspapers – Lancé en 2006, généralisé en 2008 – Recherche dans 200 ans d’archives de journaux – Mais en 2011 : arrêt du projet de numérisation des archives – Actuellement, restent disponibles : 3,5 millions de publications issus de plus de 2000 journaux dans le monde, remontant jusqu’à 1752
  • 107. • European Library : • Données des bibliothèques nationales européennes • Accès à leurs ressources numériques et bibliographiques • Rubrique “Historic Newspapers” pour les archives de journaux 107 Recherche d’archives : European LIbrary
  • 108. Ressources • Pour retrouver les ressources explorées : – Liste Diigo « Veille Actualités »