• J'aime
Outils de recherche et de veille sur l'actualité
Prochain SlideShare
Chargement dans... 5
×

Outils de recherche et de veille sur l'actualité

  • 21,111 vues
Transféré le

Support du stage "Outils de recherche et de veille sur l'actualité", organisé par l'URFIST de Rennes, le 14 octobre 2014 (enrichissement et mise à jour du support précédent : datajournalisme, twitter, ...

Support du stage "Outils de recherche et de veille sur l'actualité", organisé par l'URFIST de Rennes, le 14 octobre 2014 (enrichissement et mise à jour du support précédent : datajournalisme, twitter, texmix...)

  • Full Name Full Name Comment goes here.
    Êtes-vous sûr de vouloir
    Votre message apparaîtra ici
Aucun téléchargement

Vues

Total des vues
21,111
Sur Slideshare
0
À partir des ajouts
0
Nombre d'ajouts
33

Actions

Partages
Téléchargements
478
Commentaires
2
J'aime
25

Ajouts 0

No embeds

Signaler un contenu

Signalé comme inapproprié Signaler comme inapproprié
Signaler comme inapproprié

Indiquez la raison pour laquelle vous avez signalé cette présentation comme n'étant pas appropriée.

Annuler
    No notes for slide

Transcript

  • 1. Outils de recherche et de veille sur l'actualité (news, médias sociaux...) 14 octobre 2014 Marie-Laure Malingre, Alexandre Serres URFIST de Rennes
  • 2. 2 Plus de 30 outils à utiliser
  • 3. 3 SOMMAIRE PLAN • Quelques repères – 1/ Introduction : données, enjeux… sur la recherche d’information d’actualités – 2/ Les outils : périmètre, typologies, principes • Comment cerner et surveiller un sujet d’actualité sur le Web ? – 3/ Méthodologie de recherche – 4/ Quelle actualité du sujet – 5/ Comment trouver des journaux, des journalistes, des sites de presse ? – 6/ Quels médias, quelles sources sur le sujet ? – 7/ Quels acteurs concernés ? – 8/ Quelles données factuelles ? – 9/ Quelles interventions publiques filmées ? – 10/ Quel impact dans la blogosphère et les réseaux sociaux ? – 11/ Quelle évolution dans le traitement du sujet sur le web ?
  • 4. Introduction : données, enjeux, questions sur la recherche d’information d’actualités
  • 5. INTRODUCTION : repères sur les pratiques médiatiques en France Source : Baromètre TNS-SOFRES 2013 5
  • 6. 6 INTRODUCTION : repères sur les pratiques médiatiques en France • Un intérêt important pour l’actualité, mais en légère baisse : 69 % des Français • Médias utilisés pour « avoir des nouvelles » : (en 2013) • La télévision : 69 % • La radio : 33 % • Internet : 27 % (+ 20% depuis 2004) • La presse écrite : 24 % ; • Forte progression d’Internet : • pour approfondir un sujet (+25%) • avoir plusieurs points de vue Source : Baromètre des médias 2014, TNS-SOFRES (+24%) • Quelle confiance envers les médias ? • Crédibilité globale moyenne • La radio : média jugé le plus crédible (58 %) • Confiance en légère hausse envers Internet : • Confiance : 37 % (35 en 2013)
  • 7. 7 INTRODUCTION : données sur les sites d’information • Sites de presse et d’information parmi les plus visités : • le Figaro et le Monde, en octobre 2014 • 14ème et 15ème sites les plus consultés en France, selon Alexa • 5ème et 6ème (sur les sites français) ,selon l’OJD • Près de la moitié des internautes européens consultent les sites d’information (voir l’étude de Comscore, janvier 2012) : • Novembre 2011 : sur les 379 millions d’Européens ayant consulté internet, + de 181 millions de visiteurs uniques sur les sites d’information • Internet premier média d’information pour une part croissante de la population
  • 8. 8 INTRODUCTION : quelles sources de trafic vers les sites d’actualité ? • En France, en 2012: • Etude d’AT Internet, en août 2012, sur 19 sites d’actualité français • Google : 39,7 % ! • Facebook et Twitter à l’origine de < 4 % du trafic
  • 9. En France, janvier 2014 : • Google : 39 % • Facebook : 7,1% INTRODUCTION : quelles sources de trafic vers les sites d’actualité ? Source : JournalduNet
  • 10. 10 INTRODUCTION : les outils de recherche comme sources de trafic • « Effet Saint- Matthieu » : • Renforcement de la visibilité des principaux sites d’information français (Le Monde, le Figaro, Nouvel Obs…) sur Google News • Selon une étude (octobre 2012) de Résonéo
  • 11. Les outils : périmètre, typologies, principes
  • 12. 12 Cartographie des producteurs Périmètre d’information médiatique en ligne http://www.ardepmp.com/IMG/pdf/ producteurs_d-info_en_ligne.pdf
  • 13. 13 Périmètre Diversification des portes d’entrée d’un article > Article de Marco Bertolini : Ecrire pour la presse web
  • 14. 14 • 2 champs principaux : – Les outils de recherche sur les médias d’actualité • Les articles de presse • les dépêches d’agence, les communiqués • les ressources audio-visuelles – Les outils de recherche sur les ressources du web social > « l’information en temps réel » • blogs • Twitter • … Périmètre
  • 15. 15 • Prise en compte et mixage éventuel de 4 types de spécialisations : – Le contenu : • Recherche sur l’information d’actualité – Le type de ressource internet : • Portails de presse, moteurs d’actualités, moteurs de blogs, de tweets, plateformes de curation… – Le média : • Texte, images, podcasts, vidéos… – La fonction : • Indexation, filtrage de l’information • Analyse de l’information Périmètre
  • 16. Typologie et principes des outils 16 • Annuaires, répertoires, portails – Annuaires de presse – Portails spécialisés – Navigation et recherche dans une sélection de ressources • Moteurs de recherche d’actualités – Modules spécialisés des moteurs de recherche du web – Outils ciblés – Indexation automatique d’un corpus spécialisé
  • 17. Typologie et principes des outils 17 • Agrégateurs et bases de données de presse – Accès à des sources spécifiques de presse ou à un ensemble de sources de presse agrégées sur des plateformes unifiées • Outils d’analyse de l’actualité – Fonctionnalités spécifiques de traitement de l’information d’actualité • Extraction, synthèse, cartographie, visualisation de tendances, de relations…
  • 18. Typologie et principes des outils 18 • Outils et ressources du journalisme de données : – Journalisme centré sur la recherche, l’exploration, le traitement et la visualisation d’ensembles de données. – S’intègre dans le mouvement du big data,visant à mettre à disposition des collections diversifiées de données – Sites ressources proposant des corpus de données – Outils de traitement et de visualisation
  • 19. Typologie et principes des outils 19 • Outils du web social – Moteurs de blogs : • Recherche de blogs via les moteurs généralistes du web • Outils spécialisés, permettant la recherche de blogs – Recherche sur les réseaux sociaux • Outils dédiés à la recherche sur Twitter, sur Facebook… • Moteurs de recherche temps réel sur les réseaux sociaux > métamoteurs
  • 20. Méthodologie de recherche sur un sujet d’actualité
  • 21. 21 Démarche méthodologique • Défricher le sujet, trouver des mots-clés • Voir les derniers événements, l’actualité du sujet : • les moteurs de recherche d’actualités, les outils d’analyse (Google News, NewsBrief) • Trouver des journaux, des journalistes, des sites de presse : • Les annuaires et portails spécialisés de presse • Qui parle de quoi ? Recherches sur les médias, les sources : • Les moteurs de recherche d’actualités, les outils d’analyse (Google News, Pickanews) • Quels sont les acteurs concernés par le sujet ? • Les agrégateurs de presse (Europresse), les outils d’analyse de l’actualité (NewsExplorer) • Quelles données brutes relatives à un sujet ? • Les sites et outils de data journalism
  • 22. 22 • Retrouver des vidéos et des déclarations d’acteurs du sujet • Utiliser Voxalead News • Quel impact dans la blogosphère ? • Quel impact sur Twitter, les réseaux sociaux, les plateformes du web social ? • Les outils de recherche dans les réseaux sociaux (Twitter Search, Topsy) • Quelle évolution dans le traitement du sujet ? • Google Trends, News Explorer • Retrouver des archives sur le sujet • Archives Google News • Faire de la veille sur le sujet • Les alertes, les flux RSS, les pages personnalisables, les outils de curation Démarche méthodologique
  • 23. Cerner un sujet d’actualité sur le web : Quelle actualité du sujet ?
  • 24. 24 Les moteurs de recherche d’actualités • Modules ou services proposés par les outils de recherche • Agrégation de multiples sources d’actualité : • Presse, blogs, sites web… • Revues de presse automatisées • Services gratuits : alertes… • Nombreux moteurs d’actualité : • Précurseur : Google News • Modules spécialisés : Yahoo News, • Concurrence aiguë, enjeux économiques importants • Problèmes et conflits juridiques
  • 25. • Google News (Actualités) : - Créé à la suite du 11/09/01, en décembre 2001 (par Krishna Bharat) - Lancement officiel en 2003. Diffusion en continu d’infos sur l’actualité - Sélection de 55 000 sources indexées tous pays confondus • + de 500 sources sur la version française - Plus de 72 versions nationales en 30 langues différentes - Automatisation complète ; collecte et analyse de chaque source par un robot ; classement automatique des informations dans des rubriques prédéfinies - Visibilité des sites de presse dans Google News : étude 2012 de la société Resoneo, cf. Abondance, novembre 2012 - Google et l’édition de presse - Nombreuses controverses au cours des dernières années - Actions d’apaisement de Google en direction des acteurs de la 25 presse Les moteurs d’actualités : Google News
  • 26. 26 Les moteurs d’actualités : Google News • Google News (Actualités) : - Fonds pour l’innovation numérique de la presse de 100 millions d’euros 16 millions d’euros à 23 médias de la presse française en 2013 (près de 2 millions chacun) Source : Libération Ecrans
  • 27. 27 Les moteurs d’actualités : Google News • Google News (Actualités) (source Café référencement : Google Actualités : quoi de neuf en 2014 ? ) • Le public : • 1 Mrd d’utilisateurs voient des résultats News sur Google chaque semaine • 6 Mrds de clics envoyés vers les sites de news chaque mois • L’algorithme • Classement selon : sujet, cluster, période de l’année, de la journée, signaux sociaux • Utilisation du News sitemap • Respect du fichier Robots.txt • Trafic • Baisse de trafic en visiteurs uniques sur Google News • Augmentation du trafic news sur google.fr via les résultats d’actualité • Indexation par le spider Google (il n’y a plus de spider spécifique)
  • 28. 28 Les moteurs d’actualités : Google News • Google News (Actualités) : • Quoi de neuf pour 2014 ? (source : http://www.cafe-referencement.com/, rubrique Google Actualités) • Google News en version Web App Mobile, lancée en décembre 2013 • Une version pour tablette • Lancement aux USA d’une possibilité pour les éditeurs d’envoyer un flux Choix des rédactions pour des catégories spécifiques en plus du flux global • Nouvel outil pour les éditeurs : Media Tools • Autres fonctions récentes : « In-Depth Articles », blocs d’actualité extensibles
  • 29. 29 Les moteurs d’actualités : Google News • Google News : 10 critères principaux de pertinence – Source : Actualités du site Abondance ( + 10 critères négatifs) – 1. L'autorité d'un site sur un sujet précis. – 2. La présence des mots clés demandés dans le titre de la page. – 3. L'autorité du nom de domaine en termes SEO. – 4. Les partages sociaux. – 5. Le fait d'être parmi les premiers à publier un article sur le sujet. – 6. Le nombre de citations par d'autres sites. – 7. Le fait que l'article soit unique et original. – 8. Le taux de clics dans les résultats de Google News. – 9. La qualité du contenu. – 10. L'utilisation d'un Sitemap spécifique de Google News
  • 30. 30 Les moteurs d’actualités : Google News Google Actualités Onebox Actualités de Google web
  • 31. 31 Les moteurs d’actualités : Google News • Les fonctionnalités : – La personnalisation : • Choix dans l’affichage des rubriques • Création de rubriques personnelles • Recherches d’informations locales • Paramétrer la fréquence des sources – La veille : • Syndication de fils RSS • Abonnement gratuit aux alertes : – par thèmes...
  • 32. 32 Les moteurs d’actualités : Google News Menu déroulant pour la recherche avancée depuis la fenêtre de saisie de la recherche simple
  • 33. 33 Les moteurs d’actualités : Google News • Syntaxe de recherche : • intitle: et allintitle: : dans le titre des articles • intext: et allintext: : dans le texte des articles • inurl: : dans un site particulier • source: : sur une source précise • Source:Libération • location: : dans un pays précis • Location:Algérie • + date d’ajout dans Google Actualités • Option prédéfinie, archives ou intervalle personnalisé
  • 34. 34 Les moteurs d’actualités : Google News • Recherche d’articles sur le sujet de la transition énergétique – Requête sur la phrase « transition énergétique » – Personnalisation des rubriques Actualité (colonne de gauche) : sélectionne les contenus récents dans le domaine • Créer une alerte (en bas de la page) – Nécessite un compte Google
  • 35. 35 Les moteurs d’actualité : News Brief • NewsBrief : l’information en temps réel • Moteur développé par l’Union Européenne • Collecte sur + 4300 sources : • 1600 portails d’information, 20 flux d’actualités commerciales, sites spécialisés ; en 60 langues • Surveillance quotidienne : • Mises à jour toutes les 10 mns • Classement des informations • Graphique des 10 derniers événements marquants • Clustérisation : par thèmes, par Directions Générales de l’UE • Possibilité d’abonnements RSS, mais pas par rubriques • Index de > 20 millions d’articles
  • 36. 36 News Brief : voir l’actualité du sujet • Sur NewsBrief : • Voir si la transition énergétique est à la une (Dépêches) • Vérifier si le sujet était présent à la une la veille (Dernières 24 heures) • Voir les Domaines de politiques européennes (EU Policy Areas) et les Thèmes dans lesquels le sujet de la transition énergétique est présent • Consulter la liste des sources (Sources list)
  • 37. 37 News Brief : voir l’actualité du sujet • Sur NewsBrief : • Requête avancée • Retrouver les articles consacrés à la transition énergétique parus : • dans Le Monde, Libération, Alternatives économiques, Huffington Post • depuis le 1/10/14 • Intérêt principal de NewsBrief : – Les événements les plus récents, l’actualité « chaude »
  • 38. 38 Europe Media Monitor et NewsBrief • Europe Media Monitor : portails d’information du Joint Research Center (JRC) de la Commission Européenne • Collecte, analyse, cartographie… de très nombreuses sources d’information, en 60 langues • Trois portails complémentaires : • NewsBrief : actualité en temps réel • NewsExplorer : analyse de l’information • MediSys : information médicale • + EMM-Labs
  • 39. 39 • QWANT : Les moteurs d’actualité : Qwant • Moteur généraliste frrançais lancé en janvier 2013 • JM Rozan, Société Pertimm, E. Leandri +entrée de Axel Springer en 2014 • Positionnement comme moteur de recherche de découverte • 500 millions de recherches en 2013 (1200 milliards pour Google), 1,2 milliard / estimations pour 2014 • Fondé sur plusieurs technologies big data • Politique annoncée de respect de la vie privée • Contenus : texte, photos, vidéos, actualité, presse • Présent dans 25 pays et accessible en 15 langues • Possibilité de géolocaliser une recherche • Prise en compte du contexte social des contenus : Twitter, (Voir JDN) Facebook, Google+ et LinkedIn ; utilisation de filtres
  • 40. 40 • QWANT : Les moteurs d’actualité : Qwant • Originalité dans la présentation des résultats •Affichage sur une seule page en 5 colonnes : • Web, actualités, Qnowledge graph, social, shopping • Onglet Médias • Lancement du “carnet de notes” avec système de Follower
  • 41. 41 Les moteurs d’actualités : autres outils • Anglophones : • Yahoo News • Topix : 2004, agrégateur d’actualités localisées • Européens : • Eufeeds / European Journalism Centre • Francophones : – Yahoo France Actualités – Webplanete news : • 884 sources d’information francophones – Twikle : • Agrégateur d'actualités et de contenus lancé en octobre 2012 • Indexe les contenus les plus partagés sur les réseaux sociaux • Recherche dans les tweets
  • 42. 42 Faire de la veille sur un sujet d’actualité : les alertes • Répétition automatique d’une requête à chaque mise à jour d’une source d’information • Résultats adressés périodiquement à l’utilisateur – par messagerie ou sous forme de flux RSS • L’alerte permet, sans avoir à réinterroger la source d’information, de surveiller : – L’évolution d’un thème – Les travaux d’un auteur ou d’une institution – Les nouveaux articles de la revue que l’on suit • Sur le sujet de la transition énergétique : – Créer une alerte sur Google Actualités
  • 43. Comment trouver des journaux, des journalistes, des sites de presse ?
  • 44. 44 Trouver des journaux et sites de presse 3. Recherches d’actualités : Annuaires de la presse et des médias • Pour trouver des journaux dans le monde entier : – Newspapermap.com (http://newspapermap.com/FR.html) : • annuaire cartographique de la presse mondiale • Plus de 10 000 journaux géolocalisés • Option de traduction par Google Translate • Guide Presse : – annuaire de la presse francophone en ligne • Journaux et magazines • Giga-Presse : – Annuaire francophone de la presse en ligne • 612 journaux francophones sélectionnés • Giga Presse Internationale : 10 000 journaux et magazines internationaux dans la rubrique « Monde » (beaucoup sont extraits de l’ODP) > Exercice : rechercher des titres de magazines professionnels français sur l’environnement et l’énergie
  • 45. 45 Trouver des journaux et sites de presse 3. Recherches d’actualités : Annuaires de la presse et des médias Retrouver des « Unes » de journaux : • SPQR : – Les unes du jour des journaux régionaux français sur le site du Syndicat de la Presse quotidienne régionale • Newseum : – Plateforme américaine – Partenariat avec plus de 2000 journaux dans le monde – Tri par région, carte, « unes » archivées
  • 46. 46 Trouver des journalistes • Categorynet.com (portail de la presse et des médias) : – Créé en 1998 par Greg Manset ; entreprise de presse et réseau de journalistes • Comprend un annuaire de liens – Pour trouver des annuaires de journalistes • AnnuaireJournalistes Réseau de pigistes : – Annuaire de près de 8700 journalistes freelance – Possibilité de recherche par thématiques > Exercice : trouver des journalistes spécialisés sur les questions d’énergie et d’environnement
  • 47. 47 Autres annuaires et portails de la presse et des médias 3. Recherches d’actualités : Annuaires de la presse et des médias • PQR : – Portail du Syndicat de la PQR – Toutes les informations sur la PQR • Info.presse.fr : – Portail commercial tous publics ; vente d’abonnements – Plus de 1000 titres de presse disponibles à l’abonnement
  • 48. Cerner un sujet d’actualité sur le Web : quels médias, quelles sources sur le sujet ?
  • 49. Recherche sur les sources avec Google Actualités 49 • Google News (Actualités) : – Filtrage possible sur la source > un titre particulier – Filtrage sur le lieu – Personnalisation relative aux sources (compte Google) • Personnalisation en augmentant la fréquence pour la catégorie choisie ou créée (énergie) • Ajuster la source / Ajuster la fréquence d’une source d’actualité, avec un compte Google • Paramètres : personnalisation sur les blogs / les communiqués de presse – Après connexion, création d’une rubrique personnalisée Energie par requête, filtrage sur le pays des sources, sur l’édition ou la langue Rubrique Energie sur les sources françaises
  • 50. 50 • Pickanews : Un moteur d’actualités : Pickanews – Edité par Press Index, société spécialisée sur la veille et les médias • Lancé en mai 2010 – Moteur plurimédia sur + de 50 000 sources d’information en Europe : • Presse écrite : > 30 000 titres • Web : > 40 000 sites d'information et blogs • Radio et TV : > 200 chaînes de radio et télévision • Réseaux sociaux : 3 (Facebook, Twitter, YouTube) – Outil à la fois gratuit et payant : • Consultation gratuite des résumés • Abonnements payants pour texte intégral des articles, fonctions de veille...
  • 51. 51 Un moteur d’actualités : Pickanews • Fonctionnalités gratuites intéressantes : • Filtrages possibles sur : • Les médias • La période (2 derniers mois) • Le sujet • Un titre de presse • Un pays • Graphiques sur : • L'évolution des citations • La ventilation des résultats par types de média • Le top des citations : • Le top des sources • Recherches sur un nom, une marque, une société Pour en savoir plus, voir Veille presse avec Pickanews
  • 52. 52 Recherche sur les médias et les sources • Sur Pickanews : • Faire une recherche sur la transition énergétique en France • Tester différentes requêtes • Identifier : • les médias • les sources sur internet • Les radios • Les télévisions • Les journaux • qui ont le plus parlé du sujet depuis deux mois • Repérer les périodes où l’on a le plus parlé du sujet • Retrouver des émissions de radios • Chercher les articles de la presse locale sur le sujet
  • 53. 53 Recherche sur les sources avec VoxEurop 3. Recherches d’actualités : Annuaires de la presse et des médias • VoxEurop : – Site d’information créé par un consortium de 4 magazines européens, spécialisés dans l’actualité internationale (dont « Courrier international ») – Créé en 2009 à Paris, sous le nom PressEurop – Soutien de la Commission européenne – Sélection d’articles dans plus de 200 titres de la presse internationale – Charte éditoriale : « participer au développement du débat démocratique informé au sein de l’UE » • TP sur VoxEurop : – Chercher des articles de la presse européenne sur la transition énergétique
  • 54. 54 Les agrégateurs de presse • Forte croissance des agrégateurs de presse et de veille médias depuis quelques années (Etude SerdaLab 2009/2010 L’information numérique professionnelle en France : Le marché et les tendances en 2009- 2010.) • Diversification des prestations proposées – Services d’agrégation et de recherche dans les contenus presse – Prestations de services autour de ces contenus – Secteur de la e-réputation • Extension du périmètre des sources – Presse, internet, télévision, radio • Personnalisation de l’offre • Quelques grands acteurs : – Europresse – Factiva
  • 55. 55 Les agrégateurs de presse : Europresse • Europresse: www.europresse.com – Agrégateur canadien (Cedrom-SNI) – 10231 sources reconnues – Plus de 3000 titres de presse de près de 100 pays (dominante : Etats-Unis, Canada, France ; langue anglaise 80%) – Plus de 25 ans d’archives – Actualité internationale, nationale, régionale, locale + BDD entreprises et profils biographiques – Presse généraliste / spécialisée, communiqués,blogs thématiques, sites web...  en accès gratuit : recherche de sources possible
  • 56. 56 Les agrégateurs de presse : Europresse
  • 57. 57 • Recherche sur les sources dans Europresse : – Filtrage sur les types de sources – Filtrage par source spécifique – Filtrage sur les sources de régions spécifiques – Filtrage sur la date – Possibilité de tri des résultats par sources – Recherche de journaux sous format PDF • Faire une recherche sur la transition énergétique et identifier les sources qui en ont le plus parlé – Presse nationale, régionale, presse spécialisée – Titres Les agrégateurs de presse : Europresse
  • 58. 58 Les agrégateurs de presse : Factiva • FACTIVA / Dow Jones : http://www.factiva.com/ – “Factiva propose aux entreprises actualités et informations essentielles avec des outils et services de livraison de contenu. La base Factiva (...) inclut l’association exclusive Wall Street Journal, Financial Times®, DJ et Reuters, AFP, AP… » (Journal du Net) – 35 000 sources , 900 fils d’agences, 200 pays, 28 langues : presse papier et web, 35 ans d'archives – Accessible par abonnement
  • 59. 59 Les agrégateurs de presse : Factiva • Nombreuses possibilités : – requêtes complexes : – Filtrage sur la langue, les dates.. – Affinement sur type de sources, de documents, dates, sujets… – Alertes • Voir Guide Formadoct sur l’utilisation de Factiva (dernière mise à jour décembre 2012)
  • 60. Cerner un sujet d’actualité sur le Web : quels acteurs concernés par le sujet ?
  • 61. 61 • Europresse, http:// www.europresse.com/ • Recherche biographique : • Par nom ou mot clé • Dans différentes sources • Possibilité de recherche avancée dans une source donnée Europresse
  • 62. 62 Les outils d’analyse de l’actualité : News Explorer • NewsExplorer : analyse multilingue • Produit également par Europe Media Monitor • Couplage avec NewsBrief • Analyse de l’information une fois par jour • Résumé des 20 faits marquants • 21 langues • Nombreuses fonctionnalités : • Carte des lieux de l’actualité • Analyse des actualités : tous les articles sur un sujet… • Chronologie des événements • Fiches sur personnalités • Visualisation des relations entre personnes • Recherche rétrospective sur les événements majeurs d’un pays
  • 63. • NewsExplorer : • Recherches sur le thème de la transition énergétique : • Nécessité de passer par les mots-clés de l’outil • Chercher le thème dans les sujets récemment traités, ou essayer différents mots-clés • Explorer les différents clusters 63 Les outils d’analyse de l’actualité : News Explorer
  • 64. 64 Les outils d’analyse de l’actualité : NewsExplorer Exemple de requête sur Edward Snowden Explore Relations : visualisation des personnes ou des organisations les plus fréquemment associées à la personne affichée Related People : personnes les plus fréquemment mentionnées dans les clusters sur le sujet, avec le nombre de mentions Associated People : personnes mentionnées en même temps que la personne affichée dans le cluster
  • 65. 65 Les outils d’analyse de l’actualité : NewsExplorer Other Names : noms d’organisations ou d’événements les plus mentionnés autour d’un événement, d’une date… Quotes from : citations de la personne, dans différentes langues Quotes about : citations à propos de la personne, dans différentes langues Related Stories : autres clusters d’actualités, dans lesquels la personne est le plus souvent citée
  • 66. 66 Les outils d’analyse de l’actualité : News Silobreaker • News Silobreaker : – Outil d’analyse en temps réel de l’actualité – Possibilité de requêtes avancées – Analyse des relations (Network) entre des entités nommées (personnes, pays, villes…) : • Cartographie des relations de co-occurrence entre entités • Analyse du volume de contenus – Analyse de tendances (Trends) : • Nombre d’articles sur un sujet, une entité… – Analyse des points chauds (Hot Spots) • Voir article de C. Deschamps
  • 67. Les outils d’analyse de l’actualité : Les outils de visualisation de l’actualité : News Silobreaker Newsmap • Newsmap : – Application de visualisation de l’actualité – Développée par un ingénieur designer américain, Markos Wescamp – Représentation des actualités de 15 pays, sous forme de vignettes proportionnelles au nombre d’articles ; – Accès aux articles de presse
  • 68. Les outils de cartographie de l’actualité : Infomous : Infomous – Permet de naviguer visuellement dans différentes sources – Détection des tendances de l’actualité •Fonctionnement : – Collecte des informations, à partir de différentes sources : • Fils RSS • Site web • Requête sur un mot-clé : sur Twitter, Facebook, Google… – Génération de cartes sémantiques à partir de ces sources : • Représentation des principaux mots-clés, des liens • Affichage de la source
  • 69. Infomous Les outils de cartographie de l’actualité : Infomous
  • 70. Les outils de cartographie de l’actualité : Infomous Infomous • Possibilité de créer soi-même des nuages de mots-clés :
  • 71. Quelles données brutes sur un sujet ? Le journalisme de données
  • 72. 72 • Définition : Chercher des données : le journalisme de données • « Le journalisme de données (data journalism en anglais), ou journalisme de bases de données (database journalism), est un mouvement visant à renouveler le journalisme par l'exploitation et la mise à la disposition du public de données statistiques » (Wikipedia) • Repères : • Des origines anciennes : • La carte du choléra à Londres en 1854, par John Snow. • Diagramme des causes de mortalité au sein de l'armée en Orient par Florence Nightingale. • Essor récent du journalisme de données, symptôme du « Big Data » • 2006 : 1ère apparition du terme, par Adrian Holovaty, créateur d’EveryBlock • Août 2010 : 1ère conférence internationale du datajournalism • 2010 : utilisation des données massives de Wikileaks, par les grands quotidiens internationaux (ex. du Guardian)
  • 73. 73 Chercher des données : le journalisme de données • Exemples de datajournalisme : • Très nombreux exemples, sur tous les sujets, dans tous les domaines, sur toutes les données • Voir dans le Guide du datajournalisme : • la base de données des salaires des fonctionnaires gouvernementaux développée par The Texas Tribune • De la visualisation : • Voir « La carte du déclin du communisme municipal dans les banlieues » sur Le Monde • Datajournalisme et visualisation de données : des exemples • Des analyses de corpus de textes : • L’analyse des discours de la campagne présidentielle de 2012
  • 74. 74 Chercher des données : le journalisme de données • Exemples de datajournalisme : • L’utilisation des données d’ameli.direct.fr (voir sur Guide du datajournalisme)
  • 75. 75 Chercher des données : le data journalisme • Guardian DataBlog : • Mise à disposition sur le blog : • de données brutes • d’outils de recherche et d’exploration des données • d’outils de visualisation des données • Exemples : • Elections US • Notes de frais des députés anglais • La révolution ukainienne avec 13 000 photos Instagram • Dépenses gouvernementales
  • 76. 76 Chercher des données : le data journalisme • OTMedia, Observatoire transmedia • Projet de recherche national (financement ANR) • Novembre 2010 – Novembre 2013 • Partenariats multiples : INA, INRIA, AFP, Sorbonne nouvelle… • Exploitation de données des médias • Objectifs : • « …mettre en place une plateforme d’analyse des différents flux médiatiques pour détecter, circonscrire, suivre, mesurer, analyser et étudier la propagation des évènements médiatiques et leurs dérivés » • Exemple : • « La crise syrienne, une vue de France au printemps 2012 »
  • 77. 77 Chercher des données : la visualisation de données mondiales Deux sites de visualisation de statistiques mondiales : •GapMinder : • Outil de visualisation de statistiques mondiales, sur la santé publique • Créé par Hans Rosling, professeur de santé publique • Consultation et utilisation interactive de statistiques mondiales • Exemple du graphique sur l’évolution de l’espérance de vie dans le monde, depuis 1800 • Nombreux usages pédagogiques • Ressources sur ThotCursus •WorldMapper : • Données démographiques • Cartes interactives
  • 78. 78 • Ressources : Chercher des données : le data journalisme • Guide du datajournalisme • définition et repères sur le datajournalism • Exemples, études de cas, modes de fonctionnement • GlobalVoices, un manuel du journalisme de données • INA global : le journalisme de données • Géoconfluences : Datajournalisme et visualisation de données • Liste du Guardian Datablog
  • 79. Cerner un sujet d’actualité sur le Web : quelles interventions publiques filmées ?
  • 80. 80 Les moteurs d’actualités : recherches vidéos • Apport des outils de recherche vidéo pour retrouver de l’information d’actualité • Voxalead News, http://voxaleadnews.labs.exalead.com/ • Création en collaboration avec Vecsys et le CNRS-LIMSI dans le cadre du projet Quaero. • Recherche dans les vidéos et fichiers audios de chaînes d’information • Affichage possible de l’actualité récente par graphiques et tags • Chaînes : CNN, france 24, iTélé, LCI, BBC, BFM, Europe 1, etc. • Adaptation du moteur de recherche Exalead • Recherche dans un grand nombre de podcasts (plus de 150 000 mis à jour quotidiennement) • 9 langues : Français, Anglais, Mandarin, Arabe, Russe, Espagnol, Italien, Allemand et Hollandais.
  • 81. 81 Les moteurs d’actualités : recherches vidéos • Combine des technologies de reconnaissance de la parole et d’indexation texte • Transcription et séquençage : permet de sélectionner un passage précis de la vidéo • Affinement : chaînes spécifiques, termes associés, personnes, organisme, évènement, localisation • Différents types d’affichage et d’accès
  • 82. 82 Les moteurs d’actualités : recherches vidéos Recherche par mot dans la vidéo Voxalead Requête sur Keith Alexander Texte de la vidéo et séquençage : passages cliquables amènent directement à l’endroit choisi dans la vidéo (déficiences possibles dans la transcription)
  • 83. Les moteurs d’actualités : recherches vidéos TexMix • Projet INRIA, IRISA, CNRS, INSA, Quaero, Université Rennes 1 • Structuration, navigation dans une collection de journaux TV 83 • Le principe de l’application • Segmentation thématique à partir de transcription de la parole • Caractérisation des segments obtenus • Extraction de mots clés • Enrichissement des séquences par des informations sur les personnes ou les locutions citées
  • 84. 84 Les moteurs d’actualités : recherches vidéos • Les modules de recherche de vidéos des moteurs généralistes • Exalead Vidéo • Google Vidéo • Yahoo Vidéo • Les plateformes spécialisées • Youtube • Blinkx
  • 85. Cerner un sujet d’actualité sur le Web : quel impact dans la blogosphère et les réseaux sociaux?
  • 86. 86 • Tendances : Outils de recherche de blogs – Baisse d’intérêt des grands moteurs de recherche pour les blogs : • Exemples de Google Blog Search ou de Technorati : plus de recherche vraiment spécifique sur les blogs • Sur Google, intégration récente de l’onglet Blog dans Google Actualités – Un métamoteur intéressant : IceRocket – Quelques petits moteurs de recherche : • Un moteur personnalisable : Keyblog • Les annuaires de blogs : – Une liste d’annuaires de blogs : LesAnnuaires, section Blogs – Quelques annuaires francophones, tous publics : • Annuaire de Blogs ADB : – 50 000 blogs recensés • Tout le monde en blogue – Des outils propres aux plateformes de blogs : • L’annuaire des blogs sur OverBlog • Pour les blogs scientifiques : – Hypothèses : en SHS
  • 87. 87 Moteurs de recherche de blogs : IceRocket • Module spécialisé du métamoteur IceRocket IceRocket, outil de veille : recherche dans les blogs, les actualités, Twitter, Facebook • Pour la recherche sur les blogs – Recherche avancée : auteur, recherche de posts, sur le titre du post, sur le tag du post, filtrage sur blog spécifique, sur lien du post, sur la date – Présentation des résultats de la recherche par dates – + résultats des posts publiés dans un intervalle de dates – Tri des résultats par langue – Fil RSS de la recherche – Fonction Trends > graphique de la popularité des mots clés utilisés
  • 88. 88 Recherche sur Twitter • Méthodes de recherche des tweets : – Moteur de Twitter : Twitter Search • >1000 tweets reçus par seconde (2010) • Traitement de 12 000 requêtes par seconde – Moteurs de recherche spécialisés, en temps réel : Topsy, SnapBird, twXplorer – Moteurs de recherche généralistes : Google… • Intégration des tweets dans les résultats – Applications autour de Twitter
  • 89. 89 Recherche sur Twitter : Twitter Search • Moteur de Twitter, racheté en 2008 • Nombreuses fonctionnalités : • Interface de recherche booléenne • Recherche sur les hashtags • Recherche sur un utilisateur • Recherche géographique • Recherche sur les smileys
  • 90. 90 Recherche sur Twitter • Recherche sur Twitter Search : – Termes de requêtes : • Hashtag : #transitionenergetique • Mot clé : transition energetique • Observer les réactions sur Twitter • Chercher un compte Twitter spécialisé • Comparer les résultats avec Topsy
  • 91. 91 Recherches booléennes Recherche sur un site, un utilisateur Recherche sur Twitter : Topsy Classement par pertinence, par date Recherche sur anciens tweets
  • 92. 92 Recherche sur Twitter : Topsy • Plusieurs possibilités de filtrage des résultats : • Par périodes de publication • Par types de supports • Par « Experts » : utilisateurs ayant le plus cité le mot-clé
  • 93. 93 • twXplorer : Recherche sur Twitter : twXplorer – Nouvel outil spécialisé sur Twitter, lancé en 2013 – Développé par le Knight Lab, de la Northwestern University of Illinois – Outil puissant, toujours en phase beta – 13 langues proposées – Nécessité de se connecter avec son compte Twitter – Requête sur un mot-clé ou un hashtag : • Sélection des 500 derniers tweets sur le sujet • Exclusion des doublons • Affichage des 100 premiers tweets – Tableau de bord avec des possibilités d’affinement : • Sur des termes, des hashtags – Affichage des liens contenus dans les tweets – Voir “twXplorer nouveau moteur de recherche pour Twitter” et “twXplorer, la recherche intelligente sur Twitter”
  • 94. 94 Recherche sur Twitter : twXplorer • Le tableau de bord de twXplorer :
  • 95. Moteurs de recherche en temps réel • Information de dernière minute, rapidité d’indexation • Essor des moteurs en temps réel, avec : 95 – Syndication de contenus, News des médias, Réseaux sociaux, Twitter et micro-blogging • Nombreux moteurs autonomes, intervention des géants Google, Yahoo, Bing • Demande d’instantanéité : – Mais effets pervers du temps réel
  • 96. Moteurs de recherche en temps réel • Principaux critères, selon Comparatif de 14 moteurs, de C. Deschamps : 96 – Nombre et type de sources collectées (« multimoteurs ») – Représentation graphique des données : • Graphiques de tendances… – Possibilité d’abonnement aux flux RSS par requêtes – Défilement de l’information en temps réel
  • 97. 97 Moteurs de recherche en temps réel • Suivi de l’actualité en temps réel : – Exemple sur SocialMention, Samepoint, 48ers… • Suivi d’un thème sur Twitter, les réseaux sociaux… • Outils de veille sur un sujet, une personne… • Analyse, représentation de l’information
  • 98. 98 Moteurs de recherche en temps réel : Social Mention Search • Social Mention, moteur social de recherche en temps réel, veille sur les réseaux sociaux – Diversité et nombre de sources indexées : • Blogs • Microblogging • Commentaires de blogs • Plateformes de partage de signets • Sites de news généralistes • Sites d’événements • Images / Vidéos / Audio • Questions-réponses • Réseaux sociaux
  • 99. 99 • Interface de recherche Moteurs de recherche en temps réel : Social Mention Search – Interface de recherche simple • Filtrage possible par les catégories de sources • Filtrage par les sources elles-mêmes
  • 100. 110000 Moteurs de recherche en temps réel : Social Mention Search • Interface de recherche – Interface de recherche avancée • Affichée à la suite d’une première requête
  • 101. Cerner un sujet d’actualité sur le Web : Quelle évolution dans le traitement ?
  • 102. 102 Repérer les tendances : Google Trends • Google Trends – Permet de voir l’évolution de la fréquence des termes de recherche – Exemple sur la transition énergétique :
  • 103. 103 Repérer les tendances : Google Trends • Google Trends : fonctionnalités – Chiffres indiqués : • Pas le nombre exact de requêtes • mais le rapport entre la quantité de recherches pour un terme donné, par rapport au nombre total de recherches effectuées sur Google au cours de la même période – Filtrages possibles sur : • Les modules de Google (Web, Actualités, Images…) • Les dates • Les pays • Les catégories • Les mots-clés associés
  • 104. 104 Repérer les tendances : Google Trends Exemple sur « energy transition »
  • 105. 105 Suivre une épidémie : Google Flu • Google Flu Trends : – Suivi en temps réel de deux épidémies mondiales : la grippe et la dengue – Application de Big Data développée par Google : • Analyse des millions de requêtes des internautes sur la grippe et la dengue • Localisation, détection des tendances • Application reconnue par les épidémiologistes
  • 106. Recherche d’archives avec Google News Archive 106 • La recherche sur les archives : • Sur Google News : – Archives de presse : http://news.google.com/newspapers – Lancé en 2006, généralisé en 2008 – Recherche dans 200 ans d’archives de journaux – Mais en 2011 : arrêt du projet de numérisation des archives – Actuellement, restent disponibles : 3,5 millions de publications issus de plus de 2000 journaux dans le monde, remontant jusqu’à 1752
  • 107. • European Library : • Données des bibliothèques nationales européennes • Accès à leurs ressources numériques et bibliographiques • Rubrique “Historic Newspapers” pour les archives de journaux 107 Recherche d’archives : European LIbrary
  • 108. Ressources • Pour retrouver les ressources explorées : – Liste Diigo « Veille Actualités »