Outils de recherche et de veille sur 
l'actualité (news, médias sociaux...) 
14 octobre 2014 
Marie-Laure Malingre, Alexandre Serres 
URFIST de Rennes
2 
Plus de 30 outils à utiliser
3 
SOMMAIRE PLAN 
• Quelques repères 
– 1/ Introduction : données, 
enjeux… sur la recherche 
d’information d’actualités 
– 2/ Les outils : périmètre, 
typologies, principes 
• Comment cerner et 
surveiller un sujet 
d’actualité sur le Web ? 
– 3/ Méthodologie de recherche 
– 4/ Quelle actualité du sujet 
– 5/ Comment trouver des 
journaux, des journalistes, 
des sites de presse ? 
– 6/ Quels médias, quelles sources 
sur le sujet ? 
– 7/ Quels acteurs concernés ? 
– 8/ Quelles données factuelles ? 
– 9/ Quelles interventions 
publiques filmées ? 
– 10/ Quel impact dans la 
blogosphère et les réseaux 
sociaux ? 
– 11/ Quelle évolution dans le 
traitement du sujet sur le web ?
Introduction : données, enjeux, 
questions sur la recherche 
d’information d’actualités
INTRODUCTION : repères sur les pratiques 
médiatiques en France 
Source : Baromètre TNS-SOFRES 2013 5
6 
INTRODUCTION : repères sur les pratiques 
médiatiques en France 
• Un intérêt important pour 
l’actualité, mais en légère 
baisse : 69 % des Français 
• Médias utilisés pour « avoir 
des nouvelles » : (en 2013) 
• La télévision : 69 % 
• La radio : 33 % 
• Internet : 27 % (+ 20% 
depuis 2004) 
• La presse écrite : 24 % ; 
• Forte progression d’Internet : 
• pour approfondir un sujet (+25%) 
• avoir plusieurs points de vue 
Source : 
Baromètre des médias 2014, TNS-SOFRES 
(+24%) 
• Quelle confiance 
envers les médias ? 
• Crédibilité globale 
moyenne 
• La radio : média jugé le 
plus crédible (58 %) 
• Confiance en légère 
hausse envers Internet : 
• Confiance : 37 % (35 en 
2013)
7 
INTRODUCTION : données sur les sites 
d’information 
• Sites de presse et d’information parmi les 
plus visités : 
• le Figaro et le Monde, en octobre 2014 
• 14ème et 15ème sites les plus consultés en France, selon Alexa 
• 5ème et 6ème (sur les sites français) ,selon l’OJD 
• Près de la moitié des internautes européens consultent les 
sites d’information (voir l’étude de Comscore, janvier 2012) : 
• Novembre 2011 : sur les 379 millions d’Européens ayant 
consulté internet, + de 181 millions de visiteurs uniques 
sur les sites d’information 
• Internet premier média d’information pour une 
part croissante de la population
8 
INTRODUCTION : quelles sources de trafic 
vers les sites d’actualité ? 
• En France, en 2012: 
• Etude d’AT Internet, 
en août 2012, sur 19 
sites d’actualité 
français 
• Google : 39,7 % ! 
• Facebook et Twitter 
à l’origine de < 4 % du trafic
En France, janvier 2014 : 
• Google : 39 % 
• Facebook : 7,1% 
INTRODUCTION : 
quelles sources de trafic vers les sites d’actualité ? 
Source : 
JournalduNet
10 
INTRODUCTION : les outils de recherche 
comme sources de trafic 
• « Effet Saint- 
Matthieu » : 
• Renforcement de la visibilité 
des principaux sites 
d’information français (Le 
Monde, le Figaro, Nouvel 
Obs…) sur Google News 
• Selon une étude (octobre 
2012) de Résonéo
Les outils : périmètre, 
typologies, principes
12 
Cartographie des producteurs Périmètre 
d’information médiatique en ligne 
http://www.ardepmp.com/IMG/pdf/ 
producteurs_d-info_en_ligne.pdf
13 
Périmètre 
Diversification des portes d’entrée 
d’un article > 
Article de Marco Bertolini : Ecrire 
pour la presse web
14 
• 2 champs principaux : 
– Les outils de recherche sur les médias d’actualité 
• Les articles de presse 
• les dépêches d’agence, les communiqués 
• les ressources audio-visuelles 
– Les outils de recherche sur les ressources du 
web social > « l’information en temps réel » 
• blogs 
• Twitter 
• … 
Périmètre
15 
• Prise en compte et mixage éventuel de 4 
types de spécialisations : 
– Le contenu : 
• Recherche sur l’information d’actualité 
– Le type de ressource internet : 
• Portails de presse, moteurs d’actualités, moteurs de blogs, 
de tweets, plateformes de curation… 
– Le média : 
• Texte, images, podcasts, vidéos… 
– La fonction : 
• Indexation, filtrage de l’information 
• Analyse de l’information 
Périmètre
Typologie et principes des outils 
16 
• Annuaires, répertoires, portails 
– Annuaires de presse 
– Portails spécialisés 
– Navigation et recherche dans une sélection de 
ressources 
• Moteurs de recherche d’actualités 
– Modules spécialisés des moteurs de recherche du 
web 
– Outils ciblés 
– Indexation automatique d’un corpus spécialisé
Typologie et principes des outils 
17 
• Agrégateurs et bases de données de 
presse 
– Accès à des sources spécifiques de presse ou 
à un ensemble de sources de presse agrégées 
sur des plateformes unifiées 
• Outils d’analyse de l’actualité 
– Fonctionnalités spécifiques de traitement de 
l’information d’actualité 
• Extraction, synthèse, cartographie, visualisation de 
tendances, de relations…
Typologie et principes des outils 
18 
• Outils et ressources du journalisme de 
données : 
– Journalisme centré sur la recherche, l’exploration, 
le traitement et la visualisation d’ensembles de 
données. 
– S’intègre dans le mouvement du big data,visant à 
mettre à disposition des collections diversifiées de 
données 
– Sites ressources proposant des corpus de 
données 
– Outils de traitement et de visualisation
Typologie et principes des outils 
19 
• Outils du web social 
– Moteurs de blogs : 
• Recherche de blogs via les moteurs généralistes du 
web 
• Outils spécialisés, permettant la recherche de blogs 
– Recherche sur les réseaux sociaux 
• Outils dédiés à la recherche sur Twitter, sur Facebook… 
• Moteurs de recherche temps réel sur les réseaux sociaux 
> métamoteurs
Méthodologie de recherche sur un 
sujet d’actualité
21 
Démarche méthodologique 
• Défricher le sujet, trouver des mots-clés 
• Voir les derniers événements, l’actualité du sujet : 
• les moteurs de recherche d’actualités, les outils d’analyse (Google 
News, NewsBrief) 
• Trouver des journaux, des journalistes, des sites de presse : 
• Les annuaires et portails spécialisés de presse 
• Qui parle de quoi ? Recherches sur les médias, les sources : 
• Les moteurs de recherche d’actualités, les outils d’analyse (Google 
News, Pickanews) 
• Quels sont les acteurs concernés par le sujet ? 
• Les agrégateurs de presse (Europresse), les outils d’analyse de 
l’actualité (NewsExplorer) 
• Quelles données brutes relatives à un sujet ? 
• Les sites et outils de data journalism
22 
• Retrouver des vidéos et des déclarations d’acteurs du sujet 
• Utiliser Voxalead News 
• Quel impact dans la blogosphère ? 
• Quel impact sur Twitter, les réseaux sociaux, les plateformes 
du web social ? 
• Les outils de recherche dans les réseaux sociaux (Twitter Search, 
Topsy) 
• Quelle évolution dans le traitement du sujet ? 
• Google Trends, News Explorer 
• Retrouver des archives sur le sujet 
• Archives Google News 
• Faire de la veille sur le sujet 
• Les alertes, les flux RSS, les pages personnalisables, les outils de 
curation 
Démarche méthodologique
Cerner un sujet d’actualité sur le web : 
Quelle actualité du sujet ?
24 
Les moteurs de recherche d’actualités 
• Modules ou services proposés par les 
outils de recherche 
• Agrégation de multiples sources 
d’actualité : 
• Presse, blogs, sites web… 
• Revues de presse automatisées 
• Services gratuits : alertes… 
• Nombreux moteurs d’actualité : 
• Précurseur : Google News 
• Modules spécialisés : Yahoo News, 
• Concurrence aiguë, enjeux économiques 
importants 
• Problèmes et conflits juridiques
• Google News (Actualités) : 
- Créé à la suite du 11/09/01, en décembre 2001 (par Krishna Bharat) 
- Lancement officiel en 2003. Diffusion en continu d’infos sur l’actualité 
- Sélection de 55 000 sources indexées tous pays confondus 
• + de 500 sources sur la version française 
- Plus de 72 versions nationales en 30 langues différentes 
- Automatisation complète ; collecte et analyse de chaque source par 
un robot ; classement automatique des informations dans des 
rubriques prédéfinies 
- Visibilité des sites de presse dans Google News : étude 2012 de la 
société Resoneo, cf. Abondance, novembre 2012 
- Google et l’édition de presse 
- Nombreuses controverses au cours des dernières années 
- Actions d’apaisement de Google en direction des acteurs de la 
25 
presse 
Les moteurs d’actualités : Google News
26 
Les moteurs d’actualités : Google News 
• Google News (Actualités) : 
- Fonds pour l’innovation numérique de la presse de 
100 millions d’euros 
16 millions d’euros à 
23 médias de la presse 
française en 2013 
(près de 2 millions 
chacun) 
Source : Libération Ecrans
27 
Les moteurs d’actualités : Google News 
• Google News (Actualités) (source Café référencement : 
Google Actualités : quoi de neuf en 2014 ? ) 
• Le public : 
• 1 Mrd d’utilisateurs voient des résultats News sur Google chaque 
semaine 
• 6 Mrds de clics envoyés vers les sites de news chaque mois 
• L’algorithme 
• Classement selon : sujet, cluster, période de l’année, de la journée, 
signaux sociaux 
• Utilisation du News sitemap 
• Respect du fichier Robots.txt 
• Trafic 
• Baisse de trafic en visiteurs uniques sur Google News 
• Augmentation du trafic news sur google.fr via les résultats d’actualité 
• Indexation par le spider Google (il n’y a plus de spider spécifique)
28 
Les moteurs d’actualités : Google News 
• Google News (Actualités) : 
• Quoi de neuf pour 2014 ? (source : 
http://www.cafe-referencement.com/, rubrique Google 
Actualités) 
• Google News en version Web App Mobile, lancée en décembre 
2013 
• Une version pour tablette 
• Lancement aux USA d’une possibilité pour les éditeurs d’envoyer 
un flux Choix des rédactions pour des catégories spécifiques en 
plus du flux global 
• Nouvel outil pour les éditeurs : Media Tools 
• Autres fonctions récentes : « In-Depth Articles », blocs d’actualité 
extensibles
29 
Les moteurs d’actualités : Google News 
• Google News : 10 critères principaux de pertinence 
– Source : Actualités du site Abondance ( + 10 critères négatifs) 
– 1. L'autorité d'un site sur un sujet précis. 
– 2. La présence des mots clés demandés dans le titre de la page. 
– 3. L'autorité du nom de domaine en termes SEO. 
– 4. Les partages sociaux. 
– 5. Le fait d'être parmi les premiers à publier un article sur le 
sujet. 
– 6. Le nombre de citations par d'autres sites. 
– 7. Le fait que l'article soit unique et original. 
– 8. Le taux de clics dans les résultats de Google News. 
– 9. La qualité du contenu. 
– 10. L'utilisation d'un Sitemap spécifique de Google News
30 
Les moteurs d’actualités : Google News 
Google Actualités Onebox Actualités de Google web
31 
Les moteurs d’actualités : Google News 
• Les fonctionnalités : 
– La personnalisation : 
• Choix dans l’affichage des 
rubriques 
• Création de rubriques 
personnelles 
• Recherches d’informations 
locales 
• Paramétrer la fréquence 
des sources 
– La veille : 
• Syndication de fils RSS 
• Abonnement gratuit aux 
alertes : 
– par thèmes...
32 
Les moteurs d’actualités : Google News 
Menu déroulant pour 
la recherche avancée 
depuis la fenêtre de saisie 
de la recherche simple
33 
Les moteurs d’actualités : Google News 
• Syntaxe de recherche : 
• intitle: et allintitle: : dans le titre des articles 
• intext: et allintext: : dans le texte des articles 
• inurl: : dans un site particulier 
• source: : sur une source précise 
• Source:Libération 
• location: : dans un pays précis 
• Location:Algérie 
• + date d’ajout dans Google Actualités 
• Option prédéfinie, archives ou intervalle personnalisé
34 
Les moteurs d’actualités : Google News 
• Recherche d’articles sur le 
sujet de la transition 
énergétique 
– Requête sur la phrase 
« transition énergétique » 
– Personnalisation des 
rubriques Actualité (colonne 
de gauche) : sélectionne les 
contenus récents dans le 
domaine 
• Créer une alerte (en bas de la 
page) 
– Nécessite un compte Google
35 
Les moteurs d’actualité : News Brief 
• NewsBrief : l’information en temps réel 
• Moteur développé par l’Union Européenne 
• Collecte sur + 4300 sources : 
• 1600 portails d’information, 20 flux d’actualités commerciales, 
sites spécialisés ; en 60 langues 
• Surveillance quotidienne : 
• Mises à jour toutes les 10 mns 
• Classement des informations 
• Graphique des 10 derniers événements marquants 
• Clustérisation : par thèmes, par Directions Générales de 
l’UE 
• Possibilité d’abonnements RSS, mais pas par rubriques 
• Index de > 20 millions d’articles
36 
News Brief : voir l’actualité du sujet 
• Sur NewsBrief : 
• Voir si la transition énergétique 
est à la une (Dépêches) 
• Vérifier si le sujet était présent à 
la une la veille (Dernières 24 
heures) 
• Voir les Domaines de politiques 
européennes (EU Policy Areas) et 
les Thèmes dans lesquels le sujet 
de la transition énergétique est 
présent 
• Consulter la liste des sources 
(Sources list)
37 
News Brief : voir l’actualité du sujet 
• Sur NewsBrief : 
• Requête avancée 
• Retrouver les articles 
consacrés à la transition 
énergétique parus : 
• dans Le Monde, Libération, 
Alternatives économiques, 
Huffington Post 
• depuis le 1/10/14 
• Intérêt principal de 
NewsBrief : 
– Les événements les plus 
récents, l’actualité 
« chaude »
38 
Europe Media Monitor et NewsBrief 
• Europe Media Monitor : portails d’information du Joint 
Research Center (JRC) de la Commission Européenne 
• Collecte, analyse, cartographie… de très nombreuses 
sources d’information, en 60 langues 
• Trois portails complémentaires : 
• NewsBrief : actualité en temps réel 
• NewsExplorer : analyse de l’information 
• MediSys : information médicale 
• + EMM-Labs
39 
• QWANT : 
Les moteurs d’actualité : Qwant 
• Moteur généraliste frrançais lancé en janvier 2013 
• JM Rozan, Société Pertimm, E. Leandri +entrée de Axel Springer 
en 2014 
• Positionnement comme moteur de recherche de découverte 
• 500 millions de recherches en 2013 (1200 milliards pour 
Google), 1,2 milliard / estimations pour 2014 
• Fondé sur plusieurs technologies big data 
• Politique annoncée de respect de la vie privée 
• Contenus : texte, photos, vidéos, actualité, presse 
• Présent dans 25 pays et accessible en 15 langues 
• Possibilité de géolocaliser une recherche 
• Prise en compte du contexte social des contenus : Twitter, 
(Voir JDN) 
Facebook, Google+ et LinkedIn ; utilisation de filtres
40 
• QWANT : 
Les moteurs d’actualité : Qwant 
• Originalité dans la présentation des résultats 
•Affichage sur une seule page en 5 colonnes : 
• Web, actualités, Qnowledge graph, social, shopping 
• Onglet Médias 
• Lancement du “carnet de notes” avec système de Follower
41 
Les moteurs d’actualités : autres outils 
• Anglophones : 
• Yahoo News 
• Topix : 2004, agrégateur 
d’actualités localisées 
• Européens : 
• Eufeeds / European 
Journalism Centre 
• Francophones : 
– Yahoo France Actualités 
– Webplanete news : 
• 884 sources d’information 
francophones 
– Twikle : 
• Agrégateur d'actualités et de 
contenus lancé en octobre 
2012 
• Indexe les contenus les plus 
partagés sur les réseaux 
sociaux 
• Recherche dans les tweets
42 
Faire de la veille sur un sujet d’actualité : 
les alertes 
• Répétition automatique d’une requête à chaque mise 
à jour d’une source d’information 
• Résultats adressés périodiquement à l’utilisateur 
– par messagerie ou sous forme de flux RSS 
• L’alerte permet, sans avoir à réinterroger la source 
d’information, de surveiller : 
– L’évolution d’un thème 
– Les travaux d’un auteur ou d’une institution 
– Les nouveaux articles de la revue que l’on suit 
• Sur le sujet de la transition énergétique : 
– Créer une alerte sur Google Actualités
Comment trouver des journaux, des 
journalistes, des sites de presse ?
44 
Trouver des journaux et sites de presse 
3. Recherches d’actualités : Annuaires de la presse et des médias 
• Pour trouver des journaux dans le monde entier : 
– Newspapermap.com (http://newspapermap.com/FR.html) : 
• annuaire cartographique de la presse mondiale 
• Plus de 10 000 journaux géolocalisés 
• Option de traduction par Google Translate 
• Guide Presse : 
– annuaire de la presse francophone en ligne 
• Journaux et magazines 
• Giga-Presse : 
– Annuaire francophone de la presse en ligne 
• 612 journaux francophones sélectionnés 
• Giga Presse Internationale : 
10 000 journaux et magazines internationaux dans la rubrique 
« Monde » (beaucoup sont extraits de l’ODP) 
> Exercice : rechercher des titres de magazines professionnels français sur 
l’environnement et l’énergie
45 
Trouver des journaux et sites de presse 
3. Recherches d’actualités : Annuaires de la presse et des médias 
Retrouver des « Unes » de journaux : 
• SPQR : 
– Les unes du jour des journaux régionaux français sur 
le site du Syndicat de la Presse quotidienne 
régionale 
• Newseum : 
– Plateforme américaine 
– Partenariat avec plus de 2000 journaux dans le 
monde 
– Tri par région, carte, « unes » archivées
46 
Trouver des journalistes 
• Categorynet.com (portail de la presse et des médias) : 
– Créé en 1998 par Greg Manset ; entreprise de presse et 
réseau de journalistes 
• Comprend un annuaire de liens 
– Pour trouver des annuaires de journalistes 
• AnnuaireJournalistes Réseau de pigistes : 
– Annuaire de près de 8700 journalistes freelance 
– Possibilité de recherche par thématiques 
> Exercice : trouver des journalistes spécialisés 
sur les questions d’énergie et 
d’environnement
47 
Autres annuaires et portails de la presse et 
des médias 
3. Recherches d’actualités : Annuaires de la presse et des médias 
• PQR : 
– Portail du Syndicat de la PQR 
– Toutes les informations sur la PQR 
• Info.presse.fr : 
– Portail commercial tous publics ; vente d’abonnements 
– Plus de 1000 titres de presse disponibles à l’abonnement
Cerner un sujet d’actualité sur le Web : 
quels médias, quelles sources sur le 
sujet ?
Recherche sur les sources avec Google Actualités 
49 
• Google News (Actualités) : 
– Filtrage possible sur la source > un 
titre particulier 
– Filtrage sur le lieu 
– Personnalisation relative aux 
sources (compte Google) 
• Personnalisation en augmentant la 
fréquence pour la catégorie choisie ou 
créée (énergie) 
• Ajuster la source / Ajuster la 
fréquence d’une source d’actualité, 
avec un compte Google 
• Paramètres : personnalisation sur les 
blogs / les communiqués de presse 
– Après connexion, création d’une 
rubrique personnalisée Energie par 
requête, filtrage sur le pays des 
sources, sur l’édition ou la langue 
Rubrique Energie sur 
les sources françaises
50 
• Pickanews : 
Un moteur d’actualités : Pickanews 
– Edité par Press Index, société spécialisée sur la veille et les 
médias 
• Lancé en mai 2010 
– Moteur plurimédia sur + de 50 000 sources d’information en 
Europe : 
• Presse écrite : > 30 000 titres 
• Web : > 40 000 sites d'information et blogs 
• Radio et TV : > 200 chaînes de radio et télévision 
• Réseaux sociaux : 3 (Facebook, Twitter, YouTube) 
– Outil à la fois gratuit et payant : 
• Consultation gratuite des résumés 
• Abonnements payants pour texte intégral des articles, 
fonctions de veille...
51 
Un moteur d’actualités : Pickanews 
• Fonctionnalités gratuites intéressantes : 
• Filtrages possibles sur : 
• Les médias 
• La période (2 derniers mois) 
• Le sujet 
• Un titre de presse 
• Un pays 
• Graphiques sur : 
• L'évolution des citations 
• La ventilation des résultats par types de média 
• Le top des citations : 
• Le top des sources 
• Recherches sur un nom, une marque, une société 
Pour en savoir plus, voir Veille presse avec Pickanews
52 
Recherche sur les médias et les sources 
• Sur Pickanews : 
• Faire une recherche sur la transition énergétique en France 
• Tester différentes requêtes 
• Identifier : 
• les médias 
• les sources sur internet 
• Les radios 
• Les télévisions 
• Les journaux 
• qui ont le plus parlé du sujet depuis deux mois 
• Repérer les périodes où l’on a le plus parlé du sujet 
• Retrouver des émissions de radios 
• Chercher les articles de la presse locale sur le sujet
53 
Recherche sur les sources avec VoxEurop 
3. Recherches d’actualités : Annuaires de la presse et des médias 
• VoxEurop : 
– Site d’information créé par un consortium de 4 magazines 
européens, spécialisés dans l’actualité internationale (dont 
« Courrier international ») 
– Créé en 2009 à Paris, sous le nom PressEurop 
– Soutien de la Commission européenne 
– Sélection d’articles dans plus de 200 titres de la presse 
internationale 
– Charte éditoriale : « participer au développement du débat 
démocratique informé au sein de l’UE » 
• TP sur VoxEurop : 
– Chercher des articles de la presse européenne sur la 
transition énergétique
54 
Les agrégateurs de presse 
• Forte croissance des 
agrégateurs de presse et 
de veille médias depuis 
quelques années 
(Etude SerdaLab 2009/2010 
L’information numérique 
professionnelle en France : Le 
marché et les tendances en 2009- 
2010.) 
• Diversification des 
prestations proposées 
– Services d’agrégation et de 
recherche dans les contenus 
presse 
– Prestations de services autour 
de ces contenus 
– Secteur de la e-réputation 
• Extension du périmètre 
des sources 
– Presse, internet, télévision, 
radio 
• Personnalisation de 
l’offre 
• Quelques grands 
acteurs : 
– Europresse 
– Factiva
55 
Les agrégateurs de presse : Europresse 
• Europresse: www.europresse.com 
– Agrégateur canadien (Cedrom-SNI) 
– 10231 sources reconnues 
– Plus de 3000 titres de presse de près de 
100 pays (dominante : Etats-Unis, 
Canada, France ; langue anglaise 80%) 
– Plus de 25 ans d’archives 
– Actualité internationale, nationale, 
régionale, locale + BDD entreprises et 
profils biographiques 
– Presse généraliste / spécialisée, 
communiqués,blogs thématiques, sites 
web... 
 en accès gratuit : recherche de sources 
possible
56 
Les agrégateurs de presse : Europresse
57 
• Recherche sur les sources dans 
Europresse : 
– Filtrage sur les types de sources 
– Filtrage par source spécifique 
– Filtrage sur les sources de régions 
spécifiques 
– Filtrage sur la date 
– Possibilité de tri des résultats par 
sources 
– Recherche de journaux sous 
format PDF 
• Faire une recherche sur la 
transition énergétique et 
identifier les sources qui en ont 
le plus parlé 
– Presse nationale, régionale, presse 
spécialisée 
– Titres 
Les agrégateurs de presse : Europresse
58 
Les agrégateurs de presse : Factiva 
• FACTIVA / Dow Jones : http://www.factiva.com/ 
– “Factiva propose aux entreprises actualités et 
informations essentielles avec des outils et services de 
livraison de contenu. La base Factiva (...) inclut 
l’association exclusive Wall Street Journal, Financial 
Times®, DJ et Reuters, AFP, AP… » (Journal du Net) 
– 35 000 sources , 900 fils d’agences, 200 pays, 28 
langues : presse papier et web, 35 ans d'archives 
– Accessible par abonnement
59 
Les agrégateurs de presse : Factiva 
• Nombreuses possibilités : 
– requêtes complexes : 
– Filtrage sur la langue, les dates.. 
– Affinement sur type de sources, de documents, dates, 
sujets… 
– Alertes 
• Voir Guide Formadoct sur l’utilisation de Factiva 
(dernière mise à jour décembre 2012)
Cerner un sujet d’actualité sur le Web : 
quels acteurs concernés par le sujet ?
61 
• Europresse, http:// 
www.europresse.com/ 
• Recherche biographique : 
• Par nom ou mot clé 
• Dans différentes sources 
• Possibilité de recherche 
avancée dans une source 
donnée 
Europresse
62 
Les outils d’analyse de l’actualité : News 
Explorer 
• NewsExplorer : analyse multilingue 
• Produit également par Europe Media Monitor 
• Couplage avec NewsBrief 
• Analyse de l’information une fois par jour 
• Résumé des 20 faits marquants 
• 21 langues 
• Nombreuses fonctionnalités : 
• Carte des lieux de l’actualité 
• Analyse des actualités : tous les articles sur un sujet… 
• Chronologie des événements 
• Fiches sur personnalités 
• Visualisation des relations entre personnes 
• Recherche rétrospective sur les événements majeurs d’un pays
• NewsExplorer : 
• Recherches sur le thème de la transition 
énergétique : 
• Nécessité de passer par les mots-clés 
de l’outil 
• Chercher le thème dans les sujets 
récemment traités, ou essayer 
différents mots-clés 
• Explorer les différents clusters 
63 
Les outils d’analyse de l’actualité : 
News Explorer
64 
Les outils d’analyse de l’actualité : 
NewsExplorer 
Exemple de requête sur Edward Snowden 
Explore Relations : 
visualisation des 
personnes ou des 
organisations les 
plus fréquemment 
associées à la 
personne affichée 
Related People : 
personnes les plus 
fréquemment 
mentionnées 
dans les clusters sur 
le sujet, 
avec le nombre de 
mentions 
Associated 
People : 
personnes 
mentionnées 
en même temps que 
la personne affichée 
dans le cluster
65 
Les outils d’analyse de l’actualité : 
NewsExplorer 
Other Names : 
noms d’organisations ou d’événements 
les plus mentionnés autour d’un 
événement, d’une date… 
Quotes from : 
citations de la personne, 
dans différentes langues 
Quotes about : 
citations à propos de la personne, 
dans différentes langues 
Related 
Stories : 
autres clusters 
d’actualités, 
dans lesquels la 
personne est le 
plus souvent 
citée
66 
Les outils d’analyse de l’actualité : 
News Silobreaker 
• News Silobreaker : 
– Outil d’analyse en temps réel de l’actualité 
– Possibilité de requêtes avancées 
– Analyse des relations (Network) entre des entités 
nommées (personnes, pays, villes…) : 
• Cartographie des relations de co-occurrence entre 
entités 
• Analyse du volume de contenus 
– Analyse de tendances (Trends) : 
• Nombre d’articles sur un sujet, une entité… 
– Analyse des points chauds (Hot Spots) 
• Voir article de C. Deschamps
Les outils d’analyse de l’actualité : 
Les outils de visualisation de l’actualité : 
News Silobreaker 
Newsmap 
• Newsmap : 
– Application de visualisation de l’actualité 
– Développée par un ingénieur designer 
américain, Markos Wescamp 
– Représentation des actualités de 15 pays, 
sous forme de vignettes proportionnelles au 
nombre d’articles ; 
– Accès aux articles de presse
Les outils de cartographie de l’actualité : 
Infomous : 
Infomous 
– Permet de naviguer visuellement dans différentes sources 
– Détection des tendances de l’actualité 
•Fonctionnement : 
– Collecte des informations, à partir de différentes sources : 
• Fils RSS 
• Site web 
• Requête sur un mot-clé : sur Twitter, Facebook, Google… 
– Génération de cartes sémantiques à partir de ces sources : 
• Représentation des principaux mots-clés, des liens 
• Affichage de la source
Infomous 
Les outils de cartographie de l’actualité : 
Infomous
Les outils de cartographie de l’actualité : 
Infomous 
Infomous 
• Possibilité de créer soi-même des nuages de mots-clés :
Quelles données brutes sur un sujet ? 
Le journalisme de données
72 
• Définition : 
Chercher des données : 
le journalisme de données 
• « Le journalisme de données (data journalism en anglais), ou 
journalisme de bases de données (database journalism), est un 
mouvement visant à renouveler le journalisme par l'exploitation et la mise 
à la disposition du public de données statistiques » (Wikipedia) 
• Repères : 
• Des origines anciennes : 
• La carte du choléra à Londres en 1854, par John Snow. 
• Diagramme des causes de mortalité au sein de l'armée en Orient par 
Florence Nightingale. 
• Essor récent du journalisme de données, symptôme du « Big Data » 
• 2006 : 1ère apparition du terme, par Adrian Holovaty, créateur 
d’EveryBlock 
• Août 2010 : 1ère conférence internationale du datajournalism 
• 2010 : utilisation des données massives de Wikileaks, par les grands 
quotidiens internationaux (ex. du Guardian)
73 
Chercher des données : 
le journalisme de données 
• Exemples de datajournalisme : 
• Très nombreux exemples, sur tous les sujets, dans tous 
les domaines, sur toutes les données 
• Voir dans le Guide du datajournalisme : 
• la base de données des salaires des fonctionnaires 
gouvernementaux développée par The Texas 
Tribune 
• De la visualisation : 
• Voir « 
La carte du déclin du communisme municipal dans les banlieues 
» sur Le Monde 
• Datajournalisme 
et visualisation de données : des exemples 
• Des analyses de corpus de textes : 
• L’analyse des discours de la campagne présidentielle de 2012
74 
Chercher des données : 
le journalisme de données 
• Exemples de datajournalisme : 
• L’utilisation des données d’ameli.direct.fr (voir sur Guide du 
datajournalisme)
75 
Chercher des données : 
le data journalisme 
• Guardian DataBlog : 
• Mise à disposition sur le blog : 
• de données brutes 
• d’outils de recherche et 
d’exploration des données 
• d’outils de visualisation des 
données 
• Exemples : 
• Elections US 
• Notes de frais des députés 
anglais 
• La révolution ukainienne avec 
13 000 photos Instagram 
• Dépenses gouvernementales
76 
Chercher des données : 
le data journalisme 
• OTMedia, Observatoire transmedia 
• Projet de recherche national (financement ANR) 
• Novembre 2010 – Novembre 2013 
• Partenariats multiples : INA, INRIA, AFP, Sorbonne nouvelle… 
• Exploitation de données des médias 
• Objectifs : 
• « …mettre en place une plateforme d’analyse des différents flux 
médiatiques pour détecter, circonscrire, suivre, mesurer, analyser 
et étudier la propagation des évènements médiatiques et leurs 
dérivés » 
• Exemple : 
• « La crise syrienne, une vue de France au printemps 2012 »
77 
Chercher des données : 
la visualisation de données mondiales 
Deux sites de visualisation de statistiques 
mondiales : 
•GapMinder : 
• Outil de visualisation de statistiques mondiales, sur la 
santé publique 
• Créé par Hans Rosling, professeur de santé publique 
• Consultation et utilisation interactive de statistiques 
mondiales 
• Exemple du graphique sur 
l’évolution de l’espérance de vie dans le monde, depuis 1800 
• Nombreux usages pédagogiques 
• Ressources sur ThotCursus 
•WorldMapper : 
• Données démographiques 
• Cartes interactives
78 
• Ressources : 
Chercher des données : 
le data journalisme 
• Guide du datajournalisme 
• définition et repères sur le datajournalism 
• Exemples, études de cas, modes de 
fonctionnement 
• GlobalVoices, 
un manuel du journalisme de données 
• INA global : le journalisme de données 
• Géoconfluences : Datajournalisme 
et visualisation de données 
• Liste du Guardian Datablog
Cerner un sujet d’actualité sur le Web : 
quelles interventions publiques filmées ?
80 
Les moteurs d’actualités : recherches vidéos 
• Apport des outils de recherche vidéo pour 
retrouver de l’information d’actualité 
• Voxalead News, http://voxaleadnews.labs.exalead.com/ 
• Création en collaboration avec Vecsys et le CNRS-LIMSI dans 
le cadre du projet Quaero. 
• Recherche dans les vidéos et fichiers audios de chaînes 
d’information 
• Affichage possible de l’actualité récente par graphiques et tags 
• Chaînes : CNN, france 24, iTélé, LCI, BBC, BFM, Europe 1, etc. 
• Adaptation du moteur de recherche Exalead 
• Recherche dans un grand nombre de podcasts (plus de 150 000 
mis à jour quotidiennement) 
• 9 langues : Français, Anglais, Mandarin, Arabe, Russe, Espagnol, 
Italien, Allemand et Hollandais.
81 
Les moteurs d’actualités : recherches vidéos 
• Combine des technologies de 
reconnaissance de la parole et 
d’indexation texte 
• Transcription et séquençage : 
permet de sélectionner un 
passage précis de la vidéo 
• Affinement : chaînes spécifiques, 
termes associés, personnes, 
organisme, évènement, 
localisation 
• Différents types d’affichage et 
d’accès
82 
Les moteurs d’actualités : recherches vidéos 
Recherche 
par mot 
dans la 
vidéo 
Voxalead 
Requête sur Keith Alexander 
Texte de la vidéo et séquençage 
: passages cliquables amènent 
directement à l’endroit choisi 
dans la vidéo (déficiences 
possibles dans la transcription)
Les moteurs d’actualités : recherches vidéos 
TexMix 
• Projet INRIA, IRISA, CNRS, INSA, Quaero, Université 
Rennes 1 
• Structuration, navigation dans une collection de 
journaux TV 
83 
• Le principe de l’application 
• Segmentation thématique à partir de transcription de la parole 
• Caractérisation des segments obtenus 
• Extraction de mots clés 
• Enrichissement des séquences par des informations sur les 
personnes ou les locutions citées
84 
Les moteurs d’actualités : recherches vidéos 
• Les modules de recherche de vidéos des moteurs 
généralistes 
• Exalead Vidéo 
• Google Vidéo 
• Yahoo Vidéo 
• Les plateformes spécialisées 
• Youtube 
• Blinkx
Cerner un sujet d’actualité sur le Web : 
quel impact dans la blogosphère et les 
réseaux sociaux?
86 
• Tendances : 
Outils de recherche de blogs 
– Baisse d’intérêt des grands moteurs de recherche pour les blogs : 
• Exemples de Google Blog Search ou de Technorati : plus de recherche 
vraiment spécifique sur les blogs 
• Sur Google, intégration récente de l’onglet Blog dans Google Actualités 
– Un métamoteur intéressant : IceRocket 
– Quelques petits moteurs de recherche : 
• Un moteur personnalisable : Keyblog 
• Les annuaires de blogs : 
– Une liste d’annuaires de blogs : LesAnnuaires, section 
Blogs 
– Quelques annuaires francophones, tous publics : 
• Annuaire de Blogs ADB : 
– 50 000 blogs recensés 
• Tout le monde en blogue 
– Des outils propres aux plateformes de blogs : 
• L’annuaire des blogs sur OverBlog 
• Pour les blogs scientifiques : 
– Hypothèses : en SHS
87 
Moteurs de recherche de blogs : IceRocket 
• Module spécialisé du métamoteur IceRocket 
IceRocket, outil de veille : recherche dans les blogs, les actualités, 
Twitter, Facebook 
• Pour la recherche sur les blogs 
– Recherche avancée : auteur, recherche de posts, sur le titre du post, 
sur le tag du post, filtrage sur blog spécifique, sur lien du post, sur la 
date 
– Présentation des résultats de la recherche par dates 
– + résultats des posts publiés dans un intervalle de dates 
– Tri des résultats par langue 
– Fil RSS de la recherche 
– Fonction Trends > graphique de la popularité des mots clés utilisés
88 
Recherche sur Twitter 
• Méthodes de recherche des tweets : 
– Moteur de Twitter : Twitter Search 
• >1000 tweets reçus par seconde (2010) 
• Traitement de 12 000 requêtes par seconde 
– Moteurs de recherche spécialisés, en temps 
réel : Topsy, SnapBird, twXplorer 
– Moteurs de recherche généralistes : Google… 
• Intégration des tweets dans les résultats 
– Applications autour de Twitter
89 
Recherche sur Twitter : Twitter Search 
• Moteur de Twitter, 
racheté en 2008 
• Nombreuses 
fonctionnalités : 
• Interface de recherche 
booléenne 
• Recherche sur les 
hashtags 
• Recherche sur un 
utilisateur 
• Recherche géographique 
• Recherche sur les 
smileys
90 
Recherche sur Twitter 
• Recherche sur Twitter Search : 
– Termes de requêtes : 
• Hashtag : #transitionenergetique 
• Mot clé : transition energetique 
• Observer les réactions sur Twitter 
• Chercher un compte Twitter spécialisé 
• Comparer les résultats avec Topsy
91 
Recherches booléennes 
Recherche 
sur un 
site, un 
utilisateur 
Recherche sur Twitter : Topsy 
Classement 
par 
pertinence, 
par date 
Recherche sur 
anciens tweets
92 
Recherche sur Twitter : Topsy 
• Plusieurs possibilités 
de filtrage des 
résultats : 
• Par périodes de 
publication 
• Par types de supports 
• Par « Experts » : 
utilisateurs ayant le 
plus cité le mot-clé
93 
• twXplorer : 
Recherche sur Twitter : twXplorer 
– Nouvel outil spécialisé sur Twitter, lancé en 2013 
– Développé par le Knight Lab, de la Northwestern University of Illinois 
– Outil puissant, toujours en phase beta 
– 13 langues proposées 
– Nécessité de se connecter avec son compte Twitter 
– Requête sur un mot-clé ou un hashtag : 
• Sélection des 500 derniers tweets sur le sujet 
• Exclusion des doublons 
• Affichage des 100 premiers tweets 
– Tableau de bord avec des possibilités d’affinement : 
• Sur des termes, des hashtags 
– Affichage des liens contenus dans les tweets 
– Voir “twXplorer nouveau moteur de recherche pour Twitter” et “twXplorer, 
la recherche intelligente sur Twitter”
94 
Recherche sur Twitter : twXplorer 
• Le tableau de bord de twXplorer :
Moteurs de recherche en temps réel 
• Information de dernière minute, rapidité d’indexation 
• Essor des moteurs en temps réel, avec : 
95 
– Syndication de contenus, News des médias, Réseaux sociaux, 
Twitter et micro-blogging 
• Nombreux moteurs autonomes, intervention des 
géants Google, Yahoo, Bing 
• Demande d’instantanéité : 
– Mais effets pervers du temps réel
Moteurs de recherche en temps réel 
• Principaux critères, selon Comparatif de 14 
moteurs, de C. Deschamps : 
96 
– Nombre et type de sources collectées (« multimoteurs ») 
– Représentation graphique des données : 
• Graphiques de tendances… 
– Possibilité d’abonnement aux flux RSS par requêtes 
– Défilement de l’information en temps réel
97 
Moteurs de recherche en temps réel 
• Suivi de l’actualité en temps réel : 
– Exemple sur SocialMention, Samepoint, 48ers… 
• Suivi d’un thème sur Twitter, les réseaux sociaux… 
• Outils de veille sur un sujet, une personne… 
• Analyse, représentation de l’information
98 
Moteurs de recherche en temps réel : 
Social Mention Search 
• Social Mention, moteur social de recherche en 
temps réel, veille sur les réseaux sociaux 
– Diversité et nombre de sources indexées : 
• Blogs 
• Microblogging 
• Commentaires de blogs 
• Plateformes de partage de signets 
• Sites de news généralistes 
• Sites d’événements 
• Images / Vidéos / Audio 
• Questions-réponses 
• Réseaux sociaux
99 
• Interface de 
recherche 
Moteurs de recherche en temps réel : 
Social Mention Search 
– Interface de recherche 
simple 
• Filtrage possible par les 
catégories de sources 
• Filtrage par les sources 
elles-mêmes
110000 
Moteurs de recherche en temps réel : 
Social Mention Search 
• Interface de recherche 
– Interface de recherche avancée 
• Affichée à la suite d’une première requête
Cerner un sujet d’actualité sur le Web : 
Quelle évolution dans le traitement ?
102 
Repérer les tendances : Google Trends 
• Google Trends 
– Permet de voir l’évolution de la fréquence des termes de recherche 
– Exemple sur la transition énergétique :
103 
Repérer les tendances : Google Trends 
• Google Trends : fonctionnalités 
– Chiffres indiqués : 
• Pas le nombre exact de requêtes 
• mais le rapport entre la quantité de recherches pour un terme 
donné, par rapport au nombre total de recherches effectuées 
sur Google au cours de la même période 
– Filtrages possibles sur : 
• Les modules de Google (Web, Actualités, Images…) 
• Les dates 
• Les pays 
• Les catégories 
• Les mots-clés associés
104 
Repérer les tendances : Google Trends 
Exemple sur « energy transition »
105 
Suivre une épidémie : Google Flu 
• Google Flu Trends : 
– Suivi en temps réel de deux épidémies 
mondiales : la grippe et la dengue 
– Application de Big Data développée par 
Google : 
• Analyse des millions de requêtes des internautes 
sur la grippe et la dengue 
• Localisation, détection des tendances 
• Application reconnue par les épidémiologistes
Recherche d’archives avec Google News Archive 
106 
• La recherche sur les archives : 
• Sur Google News : 
– Archives de presse : http://news.google.com/newspapers 
– Lancé en 2006, généralisé en 2008 
– Recherche dans 200 ans d’archives de journaux 
– Mais en 2011 : arrêt du projet de numérisation des archives 
– Actuellement, restent disponibles : 3,5 millions de 
publications issus de plus de 2000 journaux dans le monde, 
remontant jusqu’à 1752
• European Library : 
• Données des bibliothèques nationales européennes 
• Accès à leurs ressources numériques et bibliographiques 
• Rubrique “Historic Newspapers” pour les archives de journaux 
107 
Recherche d’archives : European LIbrary
Ressources 
• Pour retrouver les ressources explorées : 
– Liste Diigo « Veille Actualités »

Outils de recherche et de veille sur l'actualité

  • 1.
    Outils de rechercheet de veille sur l'actualité (news, médias sociaux...) 14 octobre 2014 Marie-Laure Malingre, Alexandre Serres URFIST de Rennes
  • 2.
    2 Plus de30 outils à utiliser
  • 3.
    3 SOMMAIRE PLAN • Quelques repères – 1/ Introduction : données, enjeux… sur la recherche d’information d’actualités – 2/ Les outils : périmètre, typologies, principes • Comment cerner et surveiller un sujet d’actualité sur le Web ? – 3/ Méthodologie de recherche – 4/ Quelle actualité du sujet – 5/ Comment trouver des journaux, des journalistes, des sites de presse ? – 6/ Quels médias, quelles sources sur le sujet ? – 7/ Quels acteurs concernés ? – 8/ Quelles données factuelles ? – 9/ Quelles interventions publiques filmées ? – 10/ Quel impact dans la blogosphère et les réseaux sociaux ? – 11/ Quelle évolution dans le traitement du sujet sur le web ?
  • 4.
    Introduction : données,enjeux, questions sur la recherche d’information d’actualités
  • 5.
    INTRODUCTION : repèressur les pratiques médiatiques en France Source : Baromètre TNS-SOFRES 2013 5
  • 6.
    6 INTRODUCTION :repères sur les pratiques médiatiques en France • Un intérêt important pour l’actualité, mais en légère baisse : 69 % des Français • Médias utilisés pour « avoir des nouvelles » : (en 2013) • La télévision : 69 % • La radio : 33 % • Internet : 27 % (+ 20% depuis 2004) • La presse écrite : 24 % ; • Forte progression d’Internet : • pour approfondir un sujet (+25%) • avoir plusieurs points de vue Source : Baromètre des médias 2014, TNS-SOFRES (+24%) • Quelle confiance envers les médias ? • Crédibilité globale moyenne • La radio : média jugé le plus crédible (58 %) • Confiance en légère hausse envers Internet : • Confiance : 37 % (35 en 2013)
  • 7.
    7 INTRODUCTION :données sur les sites d’information • Sites de presse et d’information parmi les plus visités : • le Figaro et le Monde, en octobre 2014 • 14ème et 15ème sites les plus consultés en France, selon Alexa • 5ème et 6ème (sur les sites français) ,selon l’OJD • Près de la moitié des internautes européens consultent les sites d’information (voir l’étude de Comscore, janvier 2012) : • Novembre 2011 : sur les 379 millions d’Européens ayant consulté internet, + de 181 millions de visiteurs uniques sur les sites d’information • Internet premier média d’information pour une part croissante de la population
  • 8.
    8 INTRODUCTION :quelles sources de trafic vers les sites d’actualité ? • En France, en 2012: • Etude d’AT Internet, en août 2012, sur 19 sites d’actualité français • Google : 39,7 % ! • Facebook et Twitter à l’origine de < 4 % du trafic
  • 9.
    En France, janvier2014 : • Google : 39 % • Facebook : 7,1% INTRODUCTION : quelles sources de trafic vers les sites d’actualité ? Source : JournalduNet
  • 10.
    10 INTRODUCTION :les outils de recherche comme sources de trafic • « Effet Saint- Matthieu » : • Renforcement de la visibilité des principaux sites d’information français (Le Monde, le Figaro, Nouvel Obs…) sur Google News • Selon une étude (octobre 2012) de Résonéo
  • 11.
    Les outils :périmètre, typologies, principes
  • 12.
    12 Cartographie desproducteurs Périmètre d’information médiatique en ligne http://www.ardepmp.com/IMG/pdf/ producteurs_d-info_en_ligne.pdf
  • 13.
    13 Périmètre Diversificationdes portes d’entrée d’un article > Article de Marco Bertolini : Ecrire pour la presse web
  • 14.
    14 • 2champs principaux : – Les outils de recherche sur les médias d’actualité • Les articles de presse • les dépêches d’agence, les communiqués • les ressources audio-visuelles – Les outils de recherche sur les ressources du web social > « l’information en temps réel » • blogs • Twitter • … Périmètre
  • 15.
    15 • Priseen compte et mixage éventuel de 4 types de spécialisations : – Le contenu : • Recherche sur l’information d’actualité – Le type de ressource internet : • Portails de presse, moteurs d’actualités, moteurs de blogs, de tweets, plateformes de curation… – Le média : • Texte, images, podcasts, vidéos… – La fonction : • Indexation, filtrage de l’information • Analyse de l’information Périmètre
  • 16.
    Typologie et principesdes outils 16 • Annuaires, répertoires, portails – Annuaires de presse – Portails spécialisés – Navigation et recherche dans une sélection de ressources • Moteurs de recherche d’actualités – Modules spécialisés des moteurs de recherche du web – Outils ciblés – Indexation automatique d’un corpus spécialisé
  • 17.
    Typologie et principesdes outils 17 • Agrégateurs et bases de données de presse – Accès à des sources spécifiques de presse ou à un ensemble de sources de presse agrégées sur des plateformes unifiées • Outils d’analyse de l’actualité – Fonctionnalités spécifiques de traitement de l’information d’actualité • Extraction, synthèse, cartographie, visualisation de tendances, de relations…
  • 18.
    Typologie et principesdes outils 18 • Outils et ressources du journalisme de données : – Journalisme centré sur la recherche, l’exploration, le traitement et la visualisation d’ensembles de données. – S’intègre dans le mouvement du big data,visant à mettre à disposition des collections diversifiées de données – Sites ressources proposant des corpus de données – Outils de traitement et de visualisation
  • 19.
    Typologie et principesdes outils 19 • Outils du web social – Moteurs de blogs : • Recherche de blogs via les moteurs généralistes du web • Outils spécialisés, permettant la recherche de blogs – Recherche sur les réseaux sociaux • Outils dédiés à la recherche sur Twitter, sur Facebook… • Moteurs de recherche temps réel sur les réseaux sociaux > métamoteurs
  • 20.
    Méthodologie de recherchesur un sujet d’actualité
  • 21.
    21 Démarche méthodologique • Défricher le sujet, trouver des mots-clés • Voir les derniers événements, l’actualité du sujet : • les moteurs de recherche d’actualités, les outils d’analyse (Google News, NewsBrief) • Trouver des journaux, des journalistes, des sites de presse : • Les annuaires et portails spécialisés de presse • Qui parle de quoi ? Recherches sur les médias, les sources : • Les moteurs de recherche d’actualités, les outils d’analyse (Google News, Pickanews) • Quels sont les acteurs concernés par le sujet ? • Les agrégateurs de presse (Europresse), les outils d’analyse de l’actualité (NewsExplorer) • Quelles données brutes relatives à un sujet ? • Les sites et outils de data journalism
  • 22.
    22 • Retrouverdes vidéos et des déclarations d’acteurs du sujet • Utiliser Voxalead News • Quel impact dans la blogosphère ? • Quel impact sur Twitter, les réseaux sociaux, les plateformes du web social ? • Les outils de recherche dans les réseaux sociaux (Twitter Search, Topsy) • Quelle évolution dans le traitement du sujet ? • Google Trends, News Explorer • Retrouver des archives sur le sujet • Archives Google News • Faire de la veille sur le sujet • Les alertes, les flux RSS, les pages personnalisables, les outils de curation Démarche méthodologique
  • 23.
    Cerner un sujetd’actualité sur le web : Quelle actualité du sujet ?
  • 24.
    24 Les moteursde recherche d’actualités • Modules ou services proposés par les outils de recherche • Agrégation de multiples sources d’actualité : • Presse, blogs, sites web… • Revues de presse automatisées • Services gratuits : alertes… • Nombreux moteurs d’actualité : • Précurseur : Google News • Modules spécialisés : Yahoo News, • Concurrence aiguë, enjeux économiques importants • Problèmes et conflits juridiques
  • 25.
    • Google News(Actualités) : - Créé à la suite du 11/09/01, en décembre 2001 (par Krishna Bharat) - Lancement officiel en 2003. Diffusion en continu d’infos sur l’actualité - Sélection de 55 000 sources indexées tous pays confondus • + de 500 sources sur la version française - Plus de 72 versions nationales en 30 langues différentes - Automatisation complète ; collecte et analyse de chaque source par un robot ; classement automatique des informations dans des rubriques prédéfinies - Visibilité des sites de presse dans Google News : étude 2012 de la société Resoneo, cf. Abondance, novembre 2012 - Google et l’édition de presse - Nombreuses controverses au cours des dernières années - Actions d’apaisement de Google en direction des acteurs de la 25 presse Les moteurs d’actualités : Google News
  • 26.
    26 Les moteursd’actualités : Google News • Google News (Actualités) : - Fonds pour l’innovation numérique de la presse de 100 millions d’euros 16 millions d’euros à 23 médias de la presse française en 2013 (près de 2 millions chacun) Source : Libération Ecrans
  • 27.
    27 Les moteursd’actualités : Google News • Google News (Actualités) (source Café référencement : Google Actualités : quoi de neuf en 2014 ? ) • Le public : • 1 Mrd d’utilisateurs voient des résultats News sur Google chaque semaine • 6 Mrds de clics envoyés vers les sites de news chaque mois • L’algorithme • Classement selon : sujet, cluster, période de l’année, de la journée, signaux sociaux • Utilisation du News sitemap • Respect du fichier Robots.txt • Trafic • Baisse de trafic en visiteurs uniques sur Google News • Augmentation du trafic news sur google.fr via les résultats d’actualité • Indexation par le spider Google (il n’y a plus de spider spécifique)
  • 28.
    28 Les moteursd’actualités : Google News • Google News (Actualités) : • Quoi de neuf pour 2014 ? (source : http://www.cafe-referencement.com/, rubrique Google Actualités) • Google News en version Web App Mobile, lancée en décembre 2013 • Une version pour tablette • Lancement aux USA d’une possibilité pour les éditeurs d’envoyer un flux Choix des rédactions pour des catégories spécifiques en plus du flux global • Nouvel outil pour les éditeurs : Media Tools • Autres fonctions récentes : « In-Depth Articles », blocs d’actualité extensibles
  • 29.
    29 Les moteursd’actualités : Google News • Google News : 10 critères principaux de pertinence – Source : Actualités du site Abondance ( + 10 critères négatifs) – 1. L'autorité d'un site sur un sujet précis. – 2. La présence des mots clés demandés dans le titre de la page. – 3. L'autorité du nom de domaine en termes SEO. – 4. Les partages sociaux. – 5. Le fait d'être parmi les premiers à publier un article sur le sujet. – 6. Le nombre de citations par d'autres sites. – 7. Le fait que l'article soit unique et original. – 8. Le taux de clics dans les résultats de Google News. – 9. La qualité du contenu. – 10. L'utilisation d'un Sitemap spécifique de Google News
  • 30.
    30 Les moteursd’actualités : Google News Google Actualités Onebox Actualités de Google web
  • 31.
    31 Les moteursd’actualités : Google News • Les fonctionnalités : – La personnalisation : • Choix dans l’affichage des rubriques • Création de rubriques personnelles • Recherches d’informations locales • Paramétrer la fréquence des sources – La veille : • Syndication de fils RSS • Abonnement gratuit aux alertes : – par thèmes...
  • 32.
    32 Les moteursd’actualités : Google News Menu déroulant pour la recherche avancée depuis la fenêtre de saisie de la recherche simple
  • 33.
    33 Les moteursd’actualités : Google News • Syntaxe de recherche : • intitle: et allintitle: : dans le titre des articles • intext: et allintext: : dans le texte des articles • inurl: : dans un site particulier • source: : sur une source précise • Source:Libération • location: : dans un pays précis • Location:Algérie • + date d’ajout dans Google Actualités • Option prédéfinie, archives ou intervalle personnalisé
  • 34.
    34 Les moteursd’actualités : Google News • Recherche d’articles sur le sujet de la transition énergétique – Requête sur la phrase « transition énergétique » – Personnalisation des rubriques Actualité (colonne de gauche) : sélectionne les contenus récents dans le domaine • Créer une alerte (en bas de la page) – Nécessite un compte Google
  • 35.
    35 Les moteursd’actualité : News Brief • NewsBrief : l’information en temps réel • Moteur développé par l’Union Européenne • Collecte sur + 4300 sources : • 1600 portails d’information, 20 flux d’actualités commerciales, sites spécialisés ; en 60 langues • Surveillance quotidienne : • Mises à jour toutes les 10 mns • Classement des informations • Graphique des 10 derniers événements marquants • Clustérisation : par thèmes, par Directions Générales de l’UE • Possibilité d’abonnements RSS, mais pas par rubriques • Index de > 20 millions d’articles
  • 36.
    36 News Brief: voir l’actualité du sujet • Sur NewsBrief : • Voir si la transition énergétique est à la une (Dépêches) • Vérifier si le sujet était présent à la une la veille (Dernières 24 heures) • Voir les Domaines de politiques européennes (EU Policy Areas) et les Thèmes dans lesquels le sujet de la transition énergétique est présent • Consulter la liste des sources (Sources list)
  • 37.
    37 News Brief: voir l’actualité du sujet • Sur NewsBrief : • Requête avancée • Retrouver les articles consacrés à la transition énergétique parus : • dans Le Monde, Libération, Alternatives économiques, Huffington Post • depuis le 1/10/14 • Intérêt principal de NewsBrief : – Les événements les plus récents, l’actualité « chaude »
  • 38.
    38 Europe MediaMonitor et NewsBrief • Europe Media Monitor : portails d’information du Joint Research Center (JRC) de la Commission Européenne • Collecte, analyse, cartographie… de très nombreuses sources d’information, en 60 langues • Trois portails complémentaires : • NewsBrief : actualité en temps réel • NewsExplorer : analyse de l’information • MediSys : information médicale • + EMM-Labs
  • 39.
    39 • QWANT: Les moteurs d’actualité : Qwant • Moteur généraliste frrançais lancé en janvier 2013 • JM Rozan, Société Pertimm, E. Leandri +entrée de Axel Springer en 2014 • Positionnement comme moteur de recherche de découverte • 500 millions de recherches en 2013 (1200 milliards pour Google), 1,2 milliard / estimations pour 2014 • Fondé sur plusieurs technologies big data • Politique annoncée de respect de la vie privée • Contenus : texte, photos, vidéos, actualité, presse • Présent dans 25 pays et accessible en 15 langues • Possibilité de géolocaliser une recherche • Prise en compte du contexte social des contenus : Twitter, (Voir JDN) Facebook, Google+ et LinkedIn ; utilisation de filtres
  • 40.
    40 • QWANT: Les moteurs d’actualité : Qwant • Originalité dans la présentation des résultats •Affichage sur une seule page en 5 colonnes : • Web, actualités, Qnowledge graph, social, shopping • Onglet Médias • Lancement du “carnet de notes” avec système de Follower
  • 41.
    41 Les moteursd’actualités : autres outils • Anglophones : • Yahoo News • Topix : 2004, agrégateur d’actualités localisées • Européens : • Eufeeds / European Journalism Centre • Francophones : – Yahoo France Actualités – Webplanete news : • 884 sources d’information francophones – Twikle : • Agrégateur d'actualités et de contenus lancé en octobre 2012 • Indexe les contenus les plus partagés sur les réseaux sociaux • Recherche dans les tweets
  • 42.
    42 Faire dela veille sur un sujet d’actualité : les alertes • Répétition automatique d’une requête à chaque mise à jour d’une source d’information • Résultats adressés périodiquement à l’utilisateur – par messagerie ou sous forme de flux RSS • L’alerte permet, sans avoir à réinterroger la source d’information, de surveiller : – L’évolution d’un thème – Les travaux d’un auteur ou d’une institution – Les nouveaux articles de la revue que l’on suit • Sur le sujet de la transition énergétique : – Créer une alerte sur Google Actualités
  • 43.
    Comment trouver desjournaux, des journalistes, des sites de presse ?
  • 44.
    44 Trouver desjournaux et sites de presse 3. Recherches d’actualités : Annuaires de la presse et des médias • Pour trouver des journaux dans le monde entier : – Newspapermap.com (http://newspapermap.com/FR.html) : • annuaire cartographique de la presse mondiale • Plus de 10 000 journaux géolocalisés • Option de traduction par Google Translate • Guide Presse : – annuaire de la presse francophone en ligne • Journaux et magazines • Giga-Presse : – Annuaire francophone de la presse en ligne • 612 journaux francophones sélectionnés • Giga Presse Internationale : 10 000 journaux et magazines internationaux dans la rubrique « Monde » (beaucoup sont extraits de l’ODP) > Exercice : rechercher des titres de magazines professionnels français sur l’environnement et l’énergie
  • 45.
    45 Trouver desjournaux et sites de presse 3. Recherches d’actualités : Annuaires de la presse et des médias Retrouver des « Unes » de journaux : • SPQR : – Les unes du jour des journaux régionaux français sur le site du Syndicat de la Presse quotidienne régionale • Newseum : – Plateforme américaine – Partenariat avec plus de 2000 journaux dans le monde – Tri par région, carte, « unes » archivées
  • 46.
    46 Trouver desjournalistes • Categorynet.com (portail de la presse et des médias) : – Créé en 1998 par Greg Manset ; entreprise de presse et réseau de journalistes • Comprend un annuaire de liens – Pour trouver des annuaires de journalistes • AnnuaireJournalistes Réseau de pigistes : – Annuaire de près de 8700 journalistes freelance – Possibilité de recherche par thématiques > Exercice : trouver des journalistes spécialisés sur les questions d’énergie et d’environnement
  • 47.
    47 Autres annuaireset portails de la presse et des médias 3. Recherches d’actualités : Annuaires de la presse et des médias • PQR : – Portail du Syndicat de la PQR – Toutes les informations sur la PQR • Info.presse.fr : – Portail commercial tous publics ; vente d’abonnements – Plus de 1000 titres de presse disponibles à l’abonnement
  • 48.
    Cerner un sujetd’actualité sur le Web : quels médias, quelles sources sur le sujet ?
  • 49.
    Recherche sur lessources avec Google Actualités 49 • Google News (Actualités) : – Filtrage possible sur la source > un titre particulier – Filtrage sur le lieu – Personnalisation relative aux sources (compte Google) • Personnalisation en augmentant la fréquence pour la catégorie choisie ou créée (énergie) • Ajuster la source / Ajuster la fréquence d’une source d’actualité, avec un compte Google • Paramètres : personnalisation sur les blogs / les communiqués de presse – Après connexion, création d’une rubrique personnalisée Energie par requête, filtrage sur le pays des sources, sur l’édition ou la langue Rubrique Energie sur les sources françaises
  • 50.
    50 • Pickanews: Un moteur d’actualités : Pickanews – Edité par Press Index, société spécialisée sur la veille et les médias • Lancé en mai 2010 – Moteur plurimédia sur + de 50 000 sources d’information en Europe : • Presse écrite : > 30 000 titres • Web : > 40 000 sites d'information et blogs • Radio et TV : > 200 chaînes de radio et télévision • Réseaux sociaux : 3 (Facebook, Twitter, YouTube) – Outil à la fois gratuit et payant : • Consultation gratuite des résumés • Abonnements payants pour texte intégral des articles, fonctions de veille...
  • 51.
    51 Un moteurd’actualités : Pickanews • Fonctionnalités gratuites intéressantes : • Filtrages possibles sur : • Les médias • La période (2 derniers mois) • Le sujet • Un titre de presse • Un pays • Graphiques sur : • L'évolution des citations • La ventilation des résultats par types de média • Le top des citations : • Le top des sources • Recherches sur un nom, une marque, une société Pour en savoir plus, voir Veille presse avec Pickanews
  • 52.
    52 Recherche surles médias et les sources • Sur Pickanews : • Faire une recherche sur la transition énergétique en France • Tester différentes requêtes • Identifier : • les médias • les sources sur internet • Les radios • Les télévisions • Les journaux • qui ont le plus parlé du sujet depuis deux mois • Repérer les périodes où l’on a le plus parlé du sujet • Retrouver des émissions de radios • Chercher les articles de la presse locale sur le sujet
  • 53.
    53 Recherche surles sources avec VoxEurop 3. Recherches d’actualités : Annuaires de la presse et des médias • VoxEurop : – Site d’information créé par un consortium de 4 magazines européens, spécialisés dans l’actualité internationale (dont « Courrier international ») – Créé en 2009 à Paris, sous le nom PressEurop – Soutien de la Commission européenne – Sélection d’articles dans plus de 200 titres de la presse internationale – Charte éditoriale : « participer au développement du débat démocratique informé au sein de l’UE » • TP sur VoxEurop : – Chercher des articles de la presse européenne sur la transition énergétique
  • 54.
    54 Les agrégateursde presse • Forte croissance des agrégateurs de presse et de veille médias depuis quelques années (Etude SerdaLab 2009/2010 L’information numérique professionnelle en France : Le marché et les tendances en 2009- 2010.) • Diversification des prestations proposées – Services d’agrégation et de recherche dans les contenus presse – Prestations de services autour de ces contenus – Secteur de la e-réputation • Extension du périmètre des sources – Presse, internet, télévision, radio • Personnalisation de l’offre • Quelques grands acteurs : – Europresse – Factiva
  • 55.
    55 Les agrégateursde presse : Europresse • Europresse: www.europresse.com – Agrégateur canadien (Cedrom-SNI) – 10231 sources reconnues – Plus de 3000 titres de presse de près de 100 pays (dominante : Etats-Unis, Canada, France ; langue anglaise 80%) – Plus de 25 ans d’archives – Actualité internationale, nationale, régionale, locale + BDD entreprises et profils biographiques – Presse généraliste / spécialisée, communiqués,blogs thématiques, sites web...  en accès gratuit : recherche de sources possible
  • 56.
    56 Les agrégateursde presse : Europresse
  • 57.
    57 • Recherchesur les sources dans Europresse : – Filtrage sur les types de sources – Filtrage par source spécifique – Filtrage sur les sources de régions spécifiques – Filtrage sur la date – Possibilité de tri des résultats par sources – Recherche de journaux sous format PDF • Faire une recherche sur la transition énergétique et identifier les sources qui en ont le plus parlé – Presse nationale, régionale, presse spécialisée – Titres Les agrégateurs de presse : Europresse
  • 58.
    58 Les agrégateursde presse : Factiva • FACTIVA / Dow Jones : http://www.factiva.com/ – “Factiva propose aux entreprises actualités et informations essentielles avec des outils et services de livraison de contenu. La base Factiva (...) inclut l’association exclusive Wall Street Journal, Financial Times®, DJ et Reuters, AFP, AP… » (Journal du Net) – 35 000 sources , 900 fils d’agences, 200 pays, 28 langues : presse papier et web, 35 ans d'archives – Accessible par abonnement
  • 59.
    59 Les agrégateursde presse : Factiva • Nombreuses possibilités : – requêtes complexes : – Filtrage sur la langue, les dates.. – Affinement sur type de sources, de documents, dates, sujets… – Alertes • Voir Guide Formadoct sur l’utilisation de Factiva (dernière mise à jour décembre 2012)
  • 60.
    Cerner un sujetd’actualité sur le Web : quels acteurs concernés par le sujet ?
  • 61.
    61 • Europresse,http:// www.europresse.com/ • Recherche biographique : • Par nom ou mot clé • Dans différentes sources • Possibilité de recherche avancée dans une source donnée Europresse
  • 62.
    62 Les outilsd’analyse de l’actualité : News Explorer • NewsExplorer : analyse multilingue • Produit également par Europe Media Monitor • Couplage avec NewsBrief • Analyse de l’information une fois par jour • Résumé des 20 faits marquants • 21 langues • Nombreuses fonctionnalités : • Carte des lieux de l’actualité • Analyse des actualités : tous les articles sur un sujet… • Chronologie des événements • Fiches sur personnalités • Visualisation des relations entre personnes • Recherche rétrospective sur les événements majeurs d’un pays
  • 63.
    • NewsExplorer : • Recherches sur le thème de la transition énergétique : • Nécessité de passer par les mots-clés de l’outil • Chercher le thème dans les sujets récemment traités, ou essayer différents mots-clés • Explorer les différents clusters 63 Les outils d’analyse de l’actualité : News Explorer
  • 64.
    64 Les outilsd’analyse de l’actualité : NewsExplorer Exemple de requête sur Edward Snowden Explore Relations : visualisation des personnes ou des organisations les plus fréquemment associées à la personne affichée Related People : personnes les plus fréquemment mentionnées dans les clusters sur le sujet, avec le nombre de mentions Associated People : personnes mentionnées en même temps que la personne affichée dans le cluster
  • 65.
    65 Les outilsd’analyse de l’actualité : NewsExplorer Other Names : noms d’organisations ou d’événements les plus mentionnés autour d’un événement, d’une date… Quotes from : citations de la personne, dans différentes langues Quotes about : citations à propos de la personne, dans différentes langues Related Stories : autres clusters d’actualités, dans lesquels la personne est le plus souvent citée
  • 66.
    66 Les outilsd’analyse de l’actualité : News Silobreaker • News Silobreaker : – Outil d’analyse en temps réel de l’actualité – Possibilité de requêtes avancées – Analyse des relations (Network) entre des entités nommées (personnes, pays, villes…) : • Cartographie des relations de co-occurrence entre entités • Analyse du volume de contenus – Analyse de tendances (Trends) : • Nombre d’articles sur un sujet, une entité… – Analyse des points chauds (Hot Spots) • Voir article de C. Deschamps
  • 67.
    Les outils d’analysede l’actualité : Les outils de visualisation de l’actualité : News Silobreaker Newsmap • Newsmap : – Application de visualisation de l’actualité – Développée par un ingénieur designer américain, Markos Wescamp – Représentation des actualités de 15 pays, sous forme de vignettes proportionnelles au nombre d’articles ; – Accès aux articles de presse
  • 68.
    Les outils decartographie de l’actualité : Infomous : Infomous – Permet de naviguer visuellement dans différentes sources – Détection des tendances de l’actualité •Fonctionnement : – Collecte des informations, à partir de différentes sources : • Fils RSS • Site web • Requête sur un mot-clé : sur Twitter, Facebook, Google… – Génération de cartes sémantiques à partir de ces sources : • Représentation des principaux mots-clés, des liens • Affichage de la source
  • 69.
    Infomous Les outilsde cartographie de l’actualité : Infomous
  • 70.
    Les outils decartographie de l’actualité : Infomous Infomous • Possibilité de créer soi-même des nuages de mots-clés :
  • 71.
    Quelles données brutessur un sujet ? Le journalisme de données
  • 72.
    72 • Définition: Chercher des données : le journalisme de données • « Le journalisme de données (data journalism en anglais), ou journalisme de bases de données (database journalism), est un mouvement visant à renouveler le journalisme par l'exploitation et la mise à la disposition du public de données statistiques » (Wikipedia) • Repères : • Des origines anciennes : • La carte du choléra à Londres en 1854, par John Snow. • Diagramme des causes de mortalité au sein de l'armée en Orient par Florence Nightingale. • Essor récent du journalisme de données, symptôme du « Big Data » • 2006 : 1ère apparition du terme, par Adrian Holovaty, créateur d’EveryBlock • Août 2010 : 1ère conférence internationale du datajournalism • 2010 : utilisation des données massives de Wikileaks, par les grands quotidiens internationaux (ex. du Guardian)
  • 73.
    73 Chercher desdonnées : le journalisme de données • Exemples de datajournalisme : • Très nombreux exemples, sur tous les sujets, dans tous les domaines, sur toutes les données • Voir dans le Guide du datajournalisme : • la base de données des salaires des fonctionnaires gouvernementaux développée par The Texas Tribune • De la visualisation : • Voir « La carte du déclin du communisme municipal dans les banlieues » sur Le Monde • Datajournalisme et visualisation de données : des exemples • Des analyses de corpus de textes : • L’analyse des discours de la campagne présidentielle de 2012
  • 74.
    74 Chercher desdonnées : le journalisme de données • Exemples de datajournalisme : • L’utilisation des données d’ameli.direct.fr (voir sur Guide du datajournalisme)
  • 75.
    75 Chercher desdonnées : le data journalisme • Guardian DataBlog : • Mise à disposition sur le blog : • de données brutes • d’outils de recherche et d’exploration des données • d’outils de visualisation des données • Exemples : • Elections US • Notes de frais des députés anglais • La révolution ukainienne avec 13 000 photos Instagram • Dépenses gouvernementales
  • 76.
    76 Chercher desdonnées : le data journalisme • OTMedia, Observatoire transmedia • Projet de recherche national (financement ANR) • Novembre 2010 – Novembre 2013 • Partenariats multiples : INA, INRIA, AFP, Sorbonne nouvelle… • Exploitation de données des médias • Objectifs : • « …mettre en place une plateforme d’analyse des différents flux médiatiques pour détecter, circonscrire, suivre, mesurer, analyser et étudier la propagation des évènements médiatiques et leurs dérivés » • Exemple : • « La crise syrienne, une vue de France au printemps 2012 »
  • 77.
    77 Chercher desdonnées : la visualisation de données mondiales Deux sites de visualisation de statistiques mondiales : •GapMinder : • Outil de visualisation de statistiques mondiales, sur la santé publique • Créé par Hans Rosling, professeur de santé publique • Consultation et utilisation interactive de statistiques mondiales • Exemple du graphique sur l’évolution de l’espérance de vie dans le monde, depuis 1800 • Nombreux usages pédagogiques • Ressources sur ThotCursus •WorldMapper : • Données démographiques • Cartes interactives
  • 78.
    78 • Ressources: Chercher des données : le data journalisme • Guide du datajournalisme • définition et repères sur le datajournalism • Exemples, études de cas, modes de fonctionnement • GlobalVoices, un manuel du journalisme de données • INA global : le journalisme de données • Géoconfluences : Datajournalisme et visualisation de données • Liste du Guardian Datablog
  • 79.
    Cerner un sujetd’actualité sur le Web : quelles interventions publiques filmées ?
  • 80.
    80 Les moteursd’actualités : recherches vidéos • Apport des outils de recherche vidéo pour retrouver de l’information d’actualité • Voxalead News, http://voxaleadnews.labs.exalead.com/ • Création en collaboration avec Vecsys et le CNRS-LIMSI dans le cadre du projet Quaero. • Recherche dans les vidéos et fichiers audios de chaînes d’information • Affichage possible de l’actualité récente par graphiques et tags • Chaînes : CNN, france 24, iTélé, LCI, BBC, BFM, Europe 1, etc. • Adaptation du moteur de recherche Exalead • Recherche dans un grand nombre de podcasts (plus de 150 000 mis à jour quotidiennement) • 9 langues : Français, Anglais, Mandarin, Arabe, Russe, Espagnol, Italien, Allemand et Hollandais.
  • 81.
    81 Les moteursd’actualités : recherches vidéos • Combine des technologies de reconnaissance de la parole et d’indexation texte • Transcription et séquençage : permet de sélectionner un passage précis de la vidéo • Affinement : chaînes spécifiques, termes associés, personnes, organisme, évènement, localisation • Différents types d’affichage et d’accès
  • 82.
    82 Les moteursd’actualités : recherches vidéos Recherche par mot dans la vidéo Voxalead Requête sur Keith Alexander Texte de la vidéo et séquençage : passages cliquables amènent directement à l’endroit choisi dans la vidéo (déficiences possibles dans la transcription)
  • 83.
    Les moteurs d’actualités: recherches vidéos TexMix • Projet INRIA, IRISA, CNRS, INSA, Quaero, Université Rennes 1 • Structuration, navigation dans une collection de journaux TV 83 • Le principe de l’application • Segmentation thématique à partir de transcription de la parole • Caractérisation des segments obtenus • Extraction de mots clés • Enrichissement des séquences par des informations sur les personnes ou les locutions citées
  • 84.
    84 Les moteursd’actualités : recherches vidéos • Les modules de recherche de vidéos des moteurs généralistes • Exalead Vidéo • Google Vidéo • Yahoo Vidéo • Les plateformes spécialisées • Youtube • Blinkx
  • 85.
    Cerner un sujetd’actualité sur le Web : quel impact dans la blogosphère et les réseaux sociaux?
  • 86.
    86 • Tendances: Outils de recherche de blogs – Baisse d’intérêt des grands moteurs de recherche pour les blogs : • Exemples de Google Blog Search ou de Technorati : plus de recherche vraiment spécifique sur les blogs • Sur Google, intégration récente de l’onglet Blog dans Google Actualités – Un métamoteur intéressant : IceRocket – Quelques petits moteurs de recherche : • Un moteur personnalisable : Keyblog • Les annuaires de blogs : – Une liste d’annuaires de blogs : LesAnnuaires, section Blogs – Quelques annuaires francophones, tous publics : • Annuaire de Blogs ADB : – 50 000 blogs recensés • Tout le monde en blogue – Des outils propres aux plateformes de blogs : • L’annuaire des blogs sur OverBlog • Pour les blogs scientifiques : – Hypothèses : en SHS
  • 87.
    87 Moteurs derecherche de blogs : IceRocket • Module spécialisé du métamoteur IceRocket IceRocket, outil de veille : recherche dans les blogs, les actualités, Twitter, Facebook • Pour la recherche sur les blogs – Recherche avancée : auteur, recherche de posts, sur le titre du post, sur le tag du post, filtrage sur blog spécifique, sur lien du post, sur la date – Présentation des résultats de la recherche par dates – + résultats des posts publiés dans un intervalle de dates – Tri des résultats par langue – Fil RSS de la recherche – Fonction Trends > graphique de la popularité des mots clés utilisés
  • 88.
    88 Recherche surTwitter • Méthodes de recherche des tweets : – Moteur de Twitter : Twitter Search • >1000 tweets reçus par seconde (2010) • Traitement de 12 000 requêtes par seconde – Moteurs de recherche spécialisés, en temps réel : Topsy, SnapBird, twXplorer – Moteurs de recherche généralistes : Google… • Intégration des tweets dans les résultats – Applications autour de Twitter
  • 89.
    89 Recherche surTwitter : Twitter Search • Moteur de Twitter, racheté en 2008 • Nombreuses fonctionnalités : • Interface de recherche booléenne • Recherche sur les hashtags • Recherche sur un utilisateur • Recherche géographique • Recherche sur les smileys
  • 90.
    90 Recherche surTwitter • Recherche sur Twitter Search : – Termes de requêtes : • Hashtag : #transitionenergetique • Mot clé : transition energetique • Observer les réactions sur Twitter • Chercher un compte Twitter spécialisé • Comparer les résultats avec Topsy
  • 91.
    91 Recherches booléennes Recherche sur un site, un utilisateur Recherche sur Twitter : Topsy Classement par pertinence, par date Recherche sur anciens tweets
  • 92.
    92 Recherche surTwitter : Topsy • Plusieurs possibilités de filtrage des résultats : • Par périodes de publication • Par types de supports • Par « Experts » : utilisateurs ayant le plus cité le mot-clé
  • 93.
    93 • twXplorer: Recherche sur Twitter : twXplorer – Nouvel outil spécialisé sur Twitter, lancé en 2013 – Développé par le Knight Lab, de la Northwestern University of Illinois – Outil puissant, toujours en phase beta – 13 langues proposées – Nécessité de se connecter avec son compte Twitter – Requête sur un mot-clé ou un hashtag : • Sélection des 500 derniers tweets sur le sujet • Exclusion des doublons • Affichage des 100 premiers tweets – Tableau de bord avec des possibilités d’affinement : • Sur des termes, des hashtags – Affichage des liens contenus dans les tweets – Voir “twXplorer nouveau moteur de recherche pour Twitter” et “twXplorer, la recherche intelligente sur Twitter”
  • 94.
    94 Recherche surTwitter : twXplorer • Le tableau de bord de twXplorer :
  • 95.
    Moteurs de rechercheen temps réel • Information de dernière minute, rapidité d’indexation • Essor des moteurs en temps réel, avec : 95 – Syndication de contenus, News des médias, Réseaux sociaux, Twitter et micro-blogging • Nombreux moteurs autonomes, intervention des géants Google, Yahoo, Bing • Demande d’instantanéité : – Mais effets pervers du temps réel
  • 96.
    Moteurs de rechercheen temps réel • Principaux critères, selon Comparatif de 14 moteurs, de C. Deschamps : 96 – Nombre et type de sources collectées (« multimoteurs ») – Représentation graphique des données : • Graphiques de tendances… – Possibilité d’abonnement aux flux RSS par requêtes – Défilement de l’information en temps réel
  • 97.
    97 Moteurs derecherche en temps réel • Suivi de l’actualité en temps réel : – Exemple sur SocialMention, Samepoint, 48ers… • Suivi d’un thème sur Twitter, les réseaux sociaux… • Outils de veille sur un sujet, une personne… • Analyse, représentation de l’information
  • 98.
    98 Moteurs derecherche en temps réel : Social Mention Search • Social Mention, moteur social de recherche en temps réel, veille sur les réseaux sociaux – Diversité et nombre de sources indexées : • Blogs • Microblogging • Commentaires de blogs • Plateformes de partage de signets • Sites de news généralistes • Sites d’événements • Images / Vidéos / Audio • Questions-réponses • Réseaux sociaux
  • 99.
    99 • Interfacede recherche Moteurs de recherche en temps réel : Social Mention Search – Interface de recherche simple • Filtrage possible par les catégories de sources • Filtrage par les sources elles-mêmes
  • 100.
    110000 Moteurs derecherche en temps réel : Social Mention Search • Interface de recherche – Interface de recherche avancée • Affichée à la suite d’une première requête
  • 101.
    Cerner un sujetd’actualité sur le Web : Quelle évolution dans le traitement ?
  • 102.
    102 Repérer lestendances : Google Trends • Google Trends – Permet de voir l’évolution de la fréquence des termes de recherche – Exemple sur la transition énergétique :
  • 103.
    103 Repérer lestendances : Google Trends • Google Trends : fonctionnalités – Chiffres indiqués : • Pas le nombre exact de requêtes • mais le rapport entre la quantité de recherches pour un terme donné, par rapport au nombre total de recherches effectuées sur Google au cours de la même période – Filtrages possibles sur : • Les modules de Google (Web, Actualités, Images…) • Les dates • Les pays • Les catégories • Les mots-clés associés
  • 104.
    104 Repérer lestendances : Google Trends Exemple sur « energy transition »
  • 105.
    105 Suivre uneépidémie : Google Flu • Google Flu Trends : – Suivi en temps réel de deux épidémies mondiales : la grippe et la dengue – Application de Big Data développée par Google : • Analyse des millions de requêtes des internautes sur la grippe et la dengue • Localisation, détection des tendances • Application reconnue par les épidémiologistes
  • 106.
    Recherche d’archives avecGoogle News Archive 106 • La recherche sur les archives : • Sur Google News : – Archives de presse : http://news.google.com/newspapers – Lancé en 2006, généralisé en 2008 – Recherche dans 200 ans d’archives de journaux – Mais en 2011 : arrêt du projet de numérisation des archives – Actuellement, restent disponibles : 3,5 millions de publications issus de plus de 2000 journaux dans le monde, remontant jusqu’à 1752
  • 107.
    • European Library: • Données des bibliothèques nationales européennes • Accès à leurs ressources numériques et bibliographiques • Rubrique “Historic Newspapers” pour les archives de journaux 107 Recherche d’archives : European LIbrary
  • 108.
    Ressources • Pourretrouver les ressources explorées : – Liste Diigo « Veille Actualités »