Support du stage "Outils de recherche et de veille sur l'actualité", organisé par l'URFIST de Rennes, le 14 octobre 2014 (enrichissement et mise à jour du support précédent : datajournalisme, twitter, texmix...)
3. 3
SOMMAIRE PLAN
• Quelques repères
– 1/ Introduction : données,
enjeux… sur la recherche
d’information d’actualités
– 2/ Les outils : périmètre,
typologies, principes
• Comment cerner et
surveiller un sujet
d’actualité sur le Web ?
– 3/ Méthodologie de recherche
– 4/ Quelle actualité du sujet
– 5/ Comment trouver des
journaux, des journalistes,
des sites de presse ?
– 6/ Quels médias, quelles sources
sur le sujet ?
– 7/ Quels acteurs concernés ?
– 8/ Quelles données factuelles ?
– 9/ Quelles interventions
publiques filmées ?
– 10/ Quel impact dans la
blogosphère et les réseaux
sociaux ?
– 11/ Quelle évolution dans le
traitement du sujet sur le web ?
5. INTRODUCTION : repères sur les pratiques
médiatiques en France
Source : Baromètre TNS-SOFRES 2013 5
6. 6
INTRODUCTION : repères sur les pratiques
médiatiques en France
• Un intérêt important pour
l’actualité, mais en légère
baisse : 69 % des Français
• Médias utilisés pour « avoir
des nouvelles » : (en 2013)
• La télévision : 69 %
• La radio : 33 %
• Internet : 27 % (+ 20%
depuis 2004)
• La presse écrite : 24 % ;
• Forte progression d’Internet :
• pour approfondir un sujet (+25%)
• avoir plusieurs points de vue
Source :
Baromètre des médias 2014, TNS-SOFRES
(+24%)
• Quelle confiance
envers les médias ?
• Crédibilité globale
moyenne
• La radio : média jugé le
plus crédible (58 %)
• Confiance en légère
hausse envers Internet :
• Confiance : 37 % (35 en
2013)
7. 7
INTRODUCTION : données sur les sites
d’information
• Sites de presse et d’information parmi les
plus visités :
• le Figaro et le Monde, en octobre 2014
• 14ème et 15ème sites les plus consultés en France, selon Alexa
• 5ème et 6ème (sur les sites français) ,selon l’OJD
• Près de la moitié des internautes européens consultent les
sites d’information (voir l’étude de Comscore, janvier 2012) :
• Novembre 2011 : sur les 379 millions d’Européens ayant
consulté internet, + de 181 millions de visiteurs uniques
sur les sites d’information
• Internet premier média d’information pour une
part croissante de la population
8. 8
INTRODUCTION : quelles sources de trafic
vers les sites d’actualité ?
• En France, en 2012:
• Etude d’AT Internet,
en août 2012, sur 19
sites d’actualité
français
• Google : 39,7 % !
• Facebook et Twitter
à l’origine de < 4 % du trafic
9. En France, janvier 2014 :
• Google : 39 %
• Facebook : 7,1%
INTRODUCTION :
quelles sources de trafic vers les sites d’actualité ?
Source :
JournalduNet
10. 10
INTRODUCTION : les outils de recherche
comme sources de trafic
• « Effet Saint-
Matthieu » :
• Renforcement de la visibilité
des principaux sites
d’information français (Le
Monde, le Figaro, Nouvel
Obs…) sur Google News
• Selon une étude (octobre
2012) de Résonéo
12. 12
Cartographie des producteurs Périmètre
d’information médiatique en ligne
http://www.ardepmp.com/IMG/pdf/
producteurs_d-info_en_ligne.pdf
13. 13
Périmètre
Diversification des portes d’entrée
d’un article >
Article de Marco Bertolini : Ecrire
pour la presse web
14. 14
• 2 champs principaux :
– Les outils de recherche sur les médias d’actualité
• Les articles de presse
• les dépêches d’agence, les communiqués
• les ressources audio-visuelles
– Les outils de recherche sur les ressources du
web social > « l’information en temps réel »
• blogs
• Twitter
• …
Périmètre
15. 15
• Prise en compte et mixage éventuel de 4
types de spécialisations :
– Le contenu :
• Recherche sur l’information d’actualité
– Le type de ressource internet :
• Portails de presse, moteurs d’actualités, moteurs de blogs,
de tweets, plateformes de curation…
– Le média :
• Texte, images, podcasts, vidéos…
– La fonction :
• Indexation, filtrage de l’information
• Analyse de l’information
Périmètre
16. Typologie et principes des outils
16
• Annuaires, répertoires, portails
– Annuaires de presse
– Portails spécialisés
– Navigation et recherche dans une sélection de
ressources
• Moteurs de recherche d’actualités
– Modules spécialisés des moteurs de recherche du
web
– Outils ciblés
– Indexation automatique d’un corpus spécialisé
17. Typologie et principes des outils
17
• Agrégateurs et bases de données de
presse
– Accès à des sources spécifiques de presse ou
à un ensemble de sources de presse agrégées
sur des plateformes unifiées
• Outils d’analyse de l’actualité
– Fonctionnalités spécifiques de traitement de
l’information d’actualité
• Extraction, synthèse, cartographie, visualisation de
tendances, de relations…
18. Typologie et principes des outils
18
• Outils et ressources du journalisme de
données :
– Journalisme centré sur la recherche, l’exploration,
le traitement et la visualisation d’ensembles de
données.
– S’intègre dans le mouvement du big data,visant à
mettre à disposition des collections diversifiées de
données
– Sites ressources proposant des corpus de
données
– Outils de traitement et de visualisation
19. Typologie et principes des outils
19
• Outils du web social
– Moteurs de blogs :
• Recherche de blogs via les moteurs généralistes du
web
• Outils spécialisés, permettant la recherche de blogs
– Recherche sur les réseaux sociaux
• Outils dédiés à la recherche sur Twitter, sur Facebook…
• Moteurs de recherche temps réel sur les réseaux sociaux
> métamoteurs
21. 21
Démarche méthodologique
• Défricher le sujet, trouver des mots-clés
• Voir les derniers événements, l’actualité du sujet :
• les moteurs de recherche d’actualités, les outils d’analyse (Google
News, NewsBrief)
• Trouver des journaux, des journalistes, des sites de presse :
• Les annuaires et portails spécialisés de presse
• Qui parle de quoi ? Recherches sur les médias, les sources :
• Les moteurs de recherche d’actualités, les outils d’analyse (Google
News, Pickanews)
• Quels sont les acteurs concernés par le sujet ?
• Les agrégateurs de presse (Europresse), les outils d’analyse de
l’actualité (NewsExplorer)
• Quelles données brutes relatives à un sujet ?
• Les sites et outils de data journalism
22. 22
• Retrouver des vidéos et des déclarations d’acteurs du sujet
• Utiliser Voxalead News
• Quel impact dans la blogosphère ?
• Quel impact sur Twitter, les réseaux sociaux, les plateformes
du web social ?
• Les outils de recherche dans les réseaux sociaux (Twitter Search,
Topsy)
• Quelle évolution dans le traitement du sujet ?
• Google Trends, News Explorer
• Retrouver des archives sur le sujet
• Archives Google News
• Faire de la veille sur le sujet
• Les alertes, les flux RSS, les pages personnalisables, les outils de
curation
Démarche méthodologique
23. Cerner un sujet d’actualité sur le web :
Quelle actualité du sujet ?
24. 24
Les moteurs de recherche d’actualités
• Modules ou services proposés par les
outils de recherche
• Agrégation de multiples sources
d’actualité :
• Presse, blogs, sites web…
• Revues de presse automatisées
• Services gratuits : alertes…
• Nombreux moteurs d’actualité :
• Précurseur : Google News
• Modules spécialisés : Yahoo News,
• Concurrence aiguë, enjeux économiques
importants
• Problèmes et conflits juridiques
25. • Google News (Actualités) :
- Créé à la suite du 11/09/01, en décembre 2001 (par Krishna Bharat)
- Lancement officiel en 2003. Diffusion en continu d’infos sur l’actualité
- Sélection de 55 000 sources indexées tous pays confondus
• + de 500 sources sur la version française
- Plus de 72 versions nationales en 30 langues différentes
- Automatisation complète ; collecte et analyse de chaque source par
un robot ; classement automatique des informations dans des
rubriques prédéfinies
- Visibilité des sites de presse dans Google News : étude 2012 de la
société Resoneo, cf. Abondance, novembre 2012
- Google et l’édition de presse
- Nombreuses controverses au cours des dernières années
- Actions d’apaisement de Google en direction des acteurs de la
25
presse
Les moteurs d’actualités : Google News
26. 26
Les moteurs d’actualités : Google News
• Google News (Actualités) :
- Fonds pour l’innovation numérique de la presse de
100 millions d’euros
16 millions d’euros à
23 médias de la presse
française en 2013
(près de 2 millions
chacun)
Source : Libération Ecrans
27. 27
Les moteurs d’actualités : Google News
• Google News (Actualités) (source Café référencement :
Google Actualités : quoi de neuf en 2014 ? )
• Le public :
• 1 Mrd d’utilisateurs voient des résultats News sur Google chaque
semaine
• 6 Mrds de clics envoyés vers les sites de news chaque mois
• L’algorithme
• Classement selon : sujet, cluster, période de l’année, de la journée,
signaux sociaux
• Utilisation du News sitemap
• Respect du fichier Robots.txt
• Trafic
• Baisse de trafic en visiteurs uniques sur Google News
• Augmentation du trafic news sur google.fr via les résultats d’actualité
• Indexation par le spider Google (il n’y a plus de spider spécifique)
28. 28
Les moteurs d’actualités : Google News
• Google News (Actualités) :
• Quoi de neuf pour 2014 ? (source :
http://www.cafe-referencement.com/, rubrique Google
Actualités)
• Google News en version Web App Mobile, lancée en décembre
2013
• Une version pour tablette
• Lancement aux USA d’une possibilité pour les éditeurs d’envoyer
un flux Choix des rédactions pour des catégories spécifiques en
plus du flux global
• Nouvel outil pour les éditeurs : Media Tools
• Autres fonctions récentes : « In-Depth Articles », blocs d’actualité
extensibles
29. 29
Les moteurs d’actualités : Google News
• Google News : 10 critères principaux de pertinence
– Source : Actualités du site Abondance ( + 10 critères négatifs)
– 1. L'autorité d'un site sur un sujet précis.
– 2. La présence des mots clés demandés dans le titre de la page.
– 3. L'autorité du nom de domaine en termes SEO.
– 4. Les partages sociaux.
– 5. Le fait d'être parmi les premiers à publier un article sur le
sujet.
– 6. Le nombre de citations par d'autres sites.
– 7. Le fait que l'article soit unique et original.
– 8. Le taux de clics dans les résultats de Google News.
– 9. La qualité du contenu.
– 10. L'utilisation d'un Sitemap spécifique de Google News
30. 30
Les moteurs d’actualités : Google News
Google Actualités Onebox Actualités de Google web
31. 31
Les moteurs d’actualités : Google News
• Les fonctionnalités :
– La personnalisation :
• Choix dans l’affichage des
rubriques
• Création de rubriques
personnelles
• Recherches d’informations
locales
• Paramétrer la fréquence
des sources
– La veille :
• Syndication de fils RSS
• Abonnement gratuit aux
alertes :
– par thèmes...
32. 32
Les moteurs d’actualités : Google News
Menu déroulant pour
la recherche avancée
depuis la fenêtre de saisie
de la recherche simple
33. 33
Les moteurs d’actualités : Google News
• Syntaxe de recherche :
• intitle: et allintitle: : dans le titre des articles
• intext: et allintext: : dans le texte des articles
• inurl: : dans un site particulier
• source: : sur une source précise
• Source:Libération
• location: : dans un pays précis
• Location:Algérie
• + date d’ajout dans Google Actualités
• Option prédéfinie, archives ou intervalle personnalisé
34. 34
Les moteurs d’actualités : Google News
• Recherche d’articles sur le
sujet de la transition
énergétique
– Requête sur la phrase
« transition énergétique »
– Personnalisation des
rubriques Actualité (colonne
de gauche) : sélectionne les
contenus récents dans le
domaine
• Créer une alerte (en bas de la
page)
– Nécessite un compte Google
35. 35
Les moteurs d’actualité : News Brief
• NewsBrief : l’information en temps réel
• Moteur développé par l’Union Européenne
• Collecte sur + 4300 sources :
• 1600 portails d’information, 20 flux d’actualités commerciales,
sites spécialisés ; en 60 langues
• Surveillance quotidienne :
• Mises à jour toutes les 10 mns
• Classement des informations
• Graphique des 10 derniers événements marquants
• Clustérisation : par thèmes, par Directions Générales de
l’UE
• Possibilité d’abonnements RSS, mais pas par rubriques
• Index de > 20 millions d’articles
36. 36
News Brief : voir l’actualité du sujet
• Sur NewsBrief :
• Voir si la transition énergétique
est à la une (Dépêches)
• Vérifier si le sujet était présent à
la une la veille (Dernières 24
heures)
• Voir les Domaines de politiques
européennes (EU Policy Areas) et
les Thèmes dans lesquels le sujet
de la transition énergétique est
présent
• Consulter la liste des sources
(Sources list)
37. 37
News Brief : voir l’actualité du sujet
• Sur NewsBrief :
• Requête avancée
• Retrouver les articles
consacrés à la transition
énergétique parus :
• dans Le Monde, Libération,
Alternatives économiques,
Huffington Post
• depuis le 1/10/14
• Intérêt principal de
NewsBrief :
– Les événements les plus
récents, l’actualité
« chaude »
38. 38
Europe Media Monitor et NewsBrief
• Europe Media Monitor : portails d’information du Joint
Research Center (JRC) de la Commission Européenne
• Collecte, analyse, cartographie… de très nombreuses
sources d’information, en 60 langues
• Trois portails complémentaires :
• NewsBrief : actualité en temps réel
• NewsExplorer : analyse de l’information
• MediSys : information médicale
• + EMM-Labs
39. 39
• QWANT :
Les moteurs d’actualité : Qwant
• Moteur généraliste frrançais lancé en janvier 2013
• JM Rozan, Société Pertimm, E. Leandri +entrée de Axel Springer
en 2014
• Positionnement comme moteur de recherche de découverte
• 500 millions de recherches en 2013 (1200 milliards pour
Google), 1,2 milliard / estimations pour 2014
• Fondé sur plusieurs technologies big data
• Politique annoncée de respect de la vie privée
• Contenus : texte, photos, vidéos, actualité, presse
• Présent dans 25 pays et accessible en 15 langues
• Possibilité de géolocaliser une recherche
• Prise en compte du contexte social des contenus : Twitter,
(Voir JDN)
Facebook, Google+ et LinkedIn ; utilisation de filtres
40. 40
• QWANT :
Les moteurs d’actualité : Qwant
• Originalité dans la présentation des résultats
•Affichage sur une seule page en 5 colonnes :
• Web, actualités, Qnowledge graph, social, shopping
• Onglet Médias
• Lancement du “carnet de notes” avec système de Follower
41. 41
Les moteurs d’actualités : autres outils
• Anglophones :
• Yahoo News
• Topix : 2004, agrégateur
d’actualités localisées
• Européens :
• Eufeeds / European
Journalism Centre
• Francophones :
– Yahoo France Actualités
– Webplanete news :
• 884 sources d’information
francophones
– Twikle :
• Agrégateur d'actualités et de
contenus lancé en octobre
2012
• Indexe les contenus les plus
partagés sur les réseaux
sociaux
• Recherche dans les tweets
42. 42
Faire de la veille sur un sujet d’actualité :
les alertes
• Répétition automatique d’une requête à chaque mise
à jour d’une source d’information
• Résultats adressés périodiquement à l’utilisateur
– par messagerie ou sous forme de flux RSS
• L’alerte permet, sans avoir à réinterroger la source
d’information, de surveiller :
– L’évolution d’un thème
– Les travaux d’un auteur ou d’une institution
– Les nouveaux articles de la revue que l’on suit
• Sur le sujet de la transition énergétique :
– Créer une alerte sur Google Actualités
44. 44
Trouver des journaux et sites de presse
3. Recherches d’actualités : Annuaires de la presse et des médias
• Pour trouver des journaux dans le monde entier :
– Newspapermap.com (http://newspapermap.com/FR.html) :
• annuaire cartographique de la presse mondiale
• Plus de 10 000 journaux géolocalisés
• Option de traduction par Google Translate
• Guide Presse :
– annuaire de la presse francophone en ligne
• Journaux et magazines
• Giga-Presse :
– Annuaire francophone de la presse en ligne
• 612 journaux francophones sélectionnés
• Giga Presse Internationale :
10 000 journaux et magazines internationaux dans la rubrique
« Monde » (beaucoup sont extraits de l’ODP)
> Exercice : rechercher des titres de magazines professionnels français sur
l’environnement et l’énergie
45. 45
Trouver des journaux et sites de presse
3. Recherches d’actualités : Annuaires de la presse et des médias
Retrouver des « Unes » de journaux :
• SPQR :
– Les unes du jour des journaux régionaux français sur
le site du Syndicat de la Presse quotidienne
régionale
• Newseum :
– Plateforme américaine
– Partenariat avec plus de 2000 journaux dans le
monde
– Tri par région, carte, « unes » archivées
46. 46
Trouver des journalistes
• Categorynet.com (portail de la presse et des médias) :
– Créé en 1998 par Greg Manset ; entreprise de presse et
réseau de journalistes
• Comprend un annuaire de liens
– Pour trouver des annuaires de journalistes
• AnnuaireJournalistes Réseau de pigistes :
– Annuaire de près de 8700 journalistes freelance
– Possibilité de recherche par thématiques
> Exercice : trouver des journalistes spécialisés
sur les questions d’énergie et
d’environnement
47. 47
Autres annuaires et portails de la presse et
des médias
3. Recherches d’actualités : Annuaires de la presse et des médias
• PQR :
– Portail du Syndicat de la PQR
– Toutes les informations sur la PQR
• Info.presse.fr :
– Portail commercial tous publics ; vente d’abonnements
– Plus de 1000 titres de presse disponibles à l’abonnement
48. Cerner un sujet d’actualité sur le Web :
quels médias, quelles sources sur le
sujet ?
49. Recherche sur les sources avec Google Actualités
49
• Google News (Actualités) :
– Filtrage possible sur la source > un
titre particulier
– Filtrage sur le lieu
– Personnalisation relative aux
sources (compte Google)
• Personnalisation en augmentant la
fréquence pour la catégorie choisie ou
créée (énergie)
• Ajuster la source / Ajuster la
fréquence d’une source d’actualité,
avec un compte Google
• Paramètres : personnalisation sur les
blogs / les communiqués de presse
– Après connexion, création d’une
rubrique personnalisée Energie par
requête, filtrage sur le pays des
sources, sur l’édition ou la langue
Rubrique Energie sur
les sources françaises
50. 50
• Pickanews :
Un moteur d’actualités : Pickanews
– Edité par Press Index, société spécialisée sur la veille et les
médias
• Lancé en mai 2010
– Moteur plurimédia sur + de 50 000 sources d’information en
Europe :
• Presse écrite : > 30 000 titres
• Web : > 40 000 sites d'information et blogs
• Radio et TV : > 200 chaînes de radio et télévision
• Réseaux sociaux : 3 (Facebook, Twitter, YouTube)
– Outil à la fois gratuit et payant :
• Consultation gratuite des résumés
• Abonnements payants pour texte intégral des articles,
fonctions de veille...
51. 51
Un moteur d’actualités : Pickanews
• Fonctionnalités gratuites intéressantes :
• Filtrages possibles sur :
• Les médias
• La période (2 derniers mois)
• Le sujet
• Un titre de presse
• Un pays
• Graphiques sur :
• L'évolution des citations
• La ventilation des résultats par types de média
• Le top des citations :
• Le top des sources
• Recherches sur un nom, une marque, une société
Pour en savoir plus, voir Veille presse avec Pickanews
52. 52
Recherche sur les médias et les sources
• Sur Pickanews :
• Faire une recherche sur la transition énergétique en France
• Tester différentes requêtes
• Identifier :
• les médias
• les sources sur internet
• Les radios
• Les télévisions
• Les journaux
• qui ont le plus parlé du sujet depuis deux mois
• Repérer les périodes où l’on a le plus parlé du sujet
• Retrouver des émissions de radios
• Chercher les articles de la presse locale sur le sujet
53. 53
Recherche sur les sources avec VoxEurop
3. Recherches d’actualités : Annuaires de la presse et des médias
• VoxEurop :
– Site d’information créé par un consortium de 4 magazines
européens, spécialisés dans l’actualité internationale (dont
« Courrier international »)
– Créé en 2009 à Paris, sous le nom PressEurop
– Soutien de la Commission européenne
– Sélection d’articles dans plus de 200 titres de la presse
internationale
– Charte éditoriale : « participer au développement du débat
démocratique informé au sein de l’UE »
• TP sur VoxEurop :
– Chercher des articles de la presse européenne sur la
transition énergétique
54. 54
Les agrégateurs de presse
• Forte croissance des
agrégateurs de presse et
de veille médias depuis
quelques années
(Etude SerdaLab 2009/2010
L’information numérique
professionnelle en France : Le
marché et les tendances en 2009-
2010.)
• Diversification des
prestations proposées
– Services d’agrégation et de
recherche dans les contenus
presse
– Prestations de services autour
de ces contenus
– Secteur de la e-réputation
• Extension du périmètre
des sources
– Presse, internet, télévision,
radio
• Personnalisation de
l’offre
• Quelques grands
acteurs :
– Europresse
– Factiva
55. 55
Les agrégateurs de presse : Europresse
• Europresse: www.europresse.com
– Agrégateur canadien (Cedrom-SNI)
– 10231 sources reconnues
– Plus de 3000 titres de presse de près de
100 pays (dominante : Etats-Unis,
Canada, France ; langue anglaise 80%)
– Plus de 25 ans d’archives
– Actualité internationale, nationale,
régionale, locale + BDD entreprises et
profils biographiques
– Presse généraliste / spécialisée,
communiqués,blogs thématiques, sites
web...
en accès gratuit : recherche de sources
possible
57. 57
• Recherche sur les sources dans
Europresse :
– Filtrage sur les types de sources
– Filtrage par source spécifique
– Filtrage sur les sources de régions
spécifiques
– Filtrage sur la date
– Possibilité de tri des résultats par
sources
– Recherche de journaux sous
format PDF
• Faire une recherche sur la
transition énergétique et
identifier les sources qui en ont
le plus parlé
– Presse nationale, régionale, presse
spécialisée
– Titres
Les agrégateurs de presse : Europresse
58. 58
Les agrégateurs de presse : Factiva
• FACTIVA / Dow Jones : http://www.factiva.com/
– “Factiva propose aux entreprises actualités et
informations essentielles avec des outils et services de
livraison de contenu. La base Factiva (...) inclut
l’association exclusive Wall Street Journal, Financial
Times®, DJ et Reuters, AFP, AP… » (Journal du Net)
– 35 000 sources , 900 fils d’agences, 200 pays, 28
langues : presse papier et web, 35 ans d'archives
– Accessible par abonnement
59. 59
Les agrégateurs de presse : Factiva
• Nombreuses possibilités :
– requêtes complexes :
– Filtrage sur la langue, les dates..
– Affinement sur type de sources, de documents, dates,
sujets…
– Alertes
• Voir Guide Formadoct sur l’utilisation de Factiva
(dernière mise à jour décembre 2012)
60. Cerner un sujet d’actualité sur le Web :
quels acteurs concernés par le sujet ?
61. 61
• Europresse, http://
www.europresse.com/
• Recherche biographique :
• Par nom ou mot clé
• Dans différentes sources
• Possibilité de recherche
avancée dans une source
donnée
Europresse
62. 62
Les outils d’analyse de l’actualité : News
Explorer
• NewsExplorer : analyse multilingue
• Produit également par Europe Media Monitor
• Couplage avec NewsBrief
• Analyse de l’information une fois par jour
• Résumé des 20 faits marquants
• 21 langues
• Nombreuses fonctionnalités :
• Carte des lieux de l’actualité
• Analyse des actualités : tous les articles sur un sujet…
• Chronologie des événements
• Fiches sur personnalités
• Visualisation des relations entre personnes
• Recherche rétrospective sur les événements majeurs d’un pays
63. • NewsExplorer :
• Recherches sur le thème de la transition
énergétique :
• Nécessité de passer par les mots-clés
de l’outil
• Chercher le thème dans les sujets
récemment traités, ou essayer
différents mots-clés
• Explorer les différents clusters
63
Les outils d’analyse de l’actualité :
News Explorer
64. 64
Les outils d’analyse de l’actualité :
NewsExplorer
Exemple de requête sur Edward Snowden
Explore Relations :
visualisation des
personnes ou des
organisations les
plus fréquemment
associées à la
personne affichée
Related People :
personnes les plus
fréquemment
mentionnées
dans les clusters sur
le sujet,
avec le nombre de
mentions
Associated
People :
personnes
mentionnées
en même temps que
la personne affichée
dans le cluster
65. 65
Les outils d’analyse de l’actualité :
NewsExplorer
Other Names :
noms d’organisations ou d’événements
les plus mentionnés autour d’un
événement, d’une date…
Quotes from :
citations de la personne,
dans différentes langues
Quotes about :
citations à propos de la personne,
dans différentes langues
Related
Stories :
autres clusters
d’actualités,
dans lesquels la
personne est le
plus souvent
citée
66. 66
Les outils d’analyse de l’actualité :
News Silobreaker
• News Silobreaker :
– Outil d’analyse en temps réel de l’actualité
– Possibilité de requêtes avancées
– Analyse des relations (Network) entre des entités
nommées (personnes, pays, villes…) :
• Cartographie des relations de co-occurrence entre
entités
• Analyse du volume de contenus
– Analyse de tendances (Trends) :
• Nombre d’articles sur un sujet, une entité…
– Analyse des points chauds (Hot Spots)
• Voir article de C. Deschamps
67. Les outils d’analyse de l’actualité :
Les outils de visualisation de l’actualité :
News Silobreaker
Newsmap
• Newsmap :
– Application de visualisation de l’actualité
– Développée par un ingénieur designer
américain, Markos Wescamp
– Représentation des actualités de 15 pays,
sous forme de vignettes proportionnelles au
nombre d’articles ;
– Accès aux articles de presse
68. Les outils de cartographie de l’actualité :
Infomous :
Infomous
– Permet de naviguer visuellement dans différentes sources
– Détection des tendances de l’actualité
•Fonctionnement :
– Collecte des informations, à partir de différentes sources :
• Fils RSS
• Site web
• Requête sur un mot-clé : sur Twitter, Facebook, Google…
– Génération de cartes sémantiques à partir de ces sources :
• Représentation des principaux mots-clés, des liens
• Affichage de la source
72. 72
• Définition :
Chercher des données :
le journalisme de données
• « Le journalisme de données (data journalism en anglais), ou
journalisme de bases de données (database journalism), est un
mouvement visant à renouveler le journalisme par l'exploitation et la mise
à la disposition du public de données statistiques » (Wikipedia)
• Repères :
• Des origines anciennes :
• La carte du choléra à Londres en 1854, par John Snow.
• Diagramme des causes de mortalité au sein de l'armée en Orient par
Florence Nightingale.
• Essor récent du journalisme de données, symptôme du « Big Data »
• 2006 : 1ère apparition du terme, par Adrian Holovaty, créateur
d’EveryBlock
• Août 2010 : 1ère conférence internationale du datajournalism
• 2010 : utilisation des données massives de Wikileaks, par les grands
quotidiens internationaux (ex. du Guardian)
73. 73
Chercher des données :
le journalisme de données
• Exemples de datajournalisme :
• Très nombreux exemples, sur tous les sujets, dans tous
les domaines, sur toutes les données
• Voir dans le Guide du datajournalisme :
• la base de données des salaires des fonctionnaires
gouvernementaux développée par The Texas
Tribune
• De la visualisation :
• Voir «
La carte du déclin du communisme municipal dans les banlieues
» sur Le Monde
• Datajournalisme
et visualisation de données : des exemples
• Des analyses de corpus de textes :
• L’analyse des discours de la campagne présidentielle de 2012
74. 74
Chercher des données :
le journalisme de données
• Exemples de datajournalisme :
• L’utilisation des données d’ameli.direct.fr (voir sur Guide du
datajournalisme)
75. 75
Chercher des données :
le data journalisme
• Guardian DataBlog :
• Mise à disposition sur le blog :
• de données brutes
• d’outils de recherche et
d’exploration des données
• d’outils de visualisation des
données
• Exemples :
• Elections US
• Notes de frais des députés
anglais
• La révolution ukainienne avec
13 000 photos Instagram
• Dépenses gouvernementales
76. 76
Chercher des données :
le data journalisme
• OTMedia, Observatoire transmedia
• Projet de recherche national (financement ANR)
• Novembre 2010 – Novembre 2013
• Partenariats multiples : INA, INRIA, AFP, Sorbonne nouvelle…
• Exploitation de données des médias
• Objectifs :
• « …mettre en place une plateforme d’analyse des différents flux
médiatiques pour détecter, circonscrire, suivre, mesurer, analyser
et étudier la propagation des évènements médiatiques et leurs
dérivés »
• Exemple :
• « La crise syrienne, une vue de France au printemps 2012 »
77. 77
Chercher des données :
la visualisation de données mondiales
Deux sites de visualisation de statistiques
mondiales :
•GapMinder :
• Outil de visualisation de statistiques mondiales, sur la
santé publique
• Créé par Hans Rosling, professeur de santé publique
• Consultation et utilisation interactive de statistiques
mondiales
• Exemple du graphique sur
l’évolution de l’espérance de vie dans le monde, depuis 1800
• Nombreux usages pédagogiques
• Ressources sur ThotCursus
•WorldMapper :
• Données démographiques
• Cartes interactives
78. 78
• Ressources :
Chercher des données :
le data journalisme
• Guide du datajournalisme
• définition et repères sur le datajournalism
• Exemples, études de cas, modes de
fonctionnement
• GlobalVoices,
un manuel du journalisme de données
• INA global : le journalisme de données
• Géoconfluences : Datajournalisme
et visualisation de données
• Liste du Guardian Datablog
79. Cerner un sujet d’actualité sur le Web :
quelles interventions publiques filmées ?
80. 80
Les moteurs d’actualités : recherches vidéos
• Apport des outils de recherche vidéo pour
retrouver de l’information d’actualité
• Voxalead News, http://voxaleadnews.labs.exalead.com/
• Création en collaboration avec Vecsys et le CNRS-LIMSI dans
le cadre du projet Quaero.
• Recherche dans les vidéos et fichiers audios de chaînes
d’information
• Affichage possible de l’actualité récente par graphiques et tags
• Chaînes : CNN, france 24, iTélé, LCI, BBC, BFM, Europe 1, etc.
• Adaptation du moteur de recherche Exalead
• Recherche dans un grand nombre de podcasts (plus de 150 000
mis à jour quotidiennement)
• 9 langues : Français, Anglais, Mandarin, Arabe, Russe, Espagnol,
Italien, Allemand et Hollandais.
81. 81
Les moteurs d’actualités : recherches vidéos
• Combine des technologies de
reconnaissance de la parole et
d’indexation texte
• Transcription et séquençage :
permet de sélectionner un
passage précis de la vidéo
• Affinement : chaînes spécifiques,
termes associés, personnes,
organisme, évènement,
localisation
• Différents types d’affichage et
d’accès
82. 82
Les moteurs d’actualités : recherches vidéos
Recherche
par mot
dans la
vidéo
Voxalead
Requête sur Keith Alexander
Texte de la vidéo et séquençage
: passages cliquables amènent
directement à l’endroit choisi
dans la vidéo (déficiences
possibles dans la transcription)
83. Les moteurs d’actualités : recherches vidéos
TexMix
• Projet INRIA, IRISA, CNRS, INSA, Quaero, Université
Rennes 1
• Structuration, navigation dans une collection de
journaux TV
83
• Le principe de l’application
• Segmentation thématique à partir de transcription de la parole
• Caractérisation des segments obtenus
• Extraction de mots clés
• Enrichissement des séquences par des informations sur les
personnes ou les locutions citées
84. 84
Les moteurs d’actualités : recherches vidéos
• Les modules de recherche de vidéos des moteurs
généralistes
• Exalead Vidéo
• Google Vidéo
• Yahoo Vidéo
• Les plateformes spécialisées
• Youtube
• Blinkx
85. Cerner un sujet d’actualité sur le Web :
quel impact dans la blogosphère et les
réseaux sociaux?
86. 86
• Tendances :
Outils de recherche de blogs
– Baisse d’intérêt des grands moteurs de recherche pour les blogs :
• Exemples de Google Blog Search ou de Technorati : plus de recherche
vraiment spécifique sur les blogs
• Sur Google, intégration récente de l’onglet Blog dans Google Actualités
– Un métamoteur intéressant : IceRocket
– Quelques petits moteurs de recherche :
• Un moteur personnalisable : Keyblog
• Les annuaires de blogs :
– Une liste d’annuaires de blogs : LesAnnuaires, section
Blogs
– Quelques annuaires francophones, tous publics :
• Annuaire de Blogs ADB :
– 50 000 blogs recensés
• Tout le monde en blogue
– Des outils propres aux plateformes de blogs :
• L’annuaire des blogs sur OverBlog
• Pour les blogs scientifiques :
– Hypothèses : en SHS
87. 87
Moteurs de recherche de blogs : IceRocket
• Module spécialisé du métamoteur IceRocket
IceRocket, outil de veille : recherche dans les blogs, les actualités,
Twitter, Facebook
• Pour la recherche sur les blogs
– Recherche avancée : auteur, recherche de posts, sur le titre du post,
sur le tag du post, filtrage sur blog spécifique, sur lien du post, sur la
date
– Présentation des résultats de la recherche par dates
– + résultats des posts publiés dans un intervalle de dates
– Tri des résultats par langue
– Fil RSS de la recherche
– Fonction Trends > graphique de la popularité des mots clés utilisés
88. 88
Recherche sur Twitter
• Méthodes de recherche des tweets :
– Moteur de Twitter : Twitter Search
• >1000 tweets reçus par seconde (2010)
• Traitement de 12 000 requêtes par seconde
– Moteurs de recherche spécialisés, en temps
réel : Topsy, SnapBird, twXplorer
– Moteurs de recherche généralistes : Google…
• Intégration des tweets dans les résultats
– Applications autour de Twitter
89. 89
Recherche sur Twitter : Twitter Search
• Moteur de Twitter,
racheté en 2008
• Nombreuses
fonctionnalités :
• Interface de recherche
booléenne
• Recherche sur les
hashtags
• Recherche sur un
utilisateur
• Recherche géographique
• Recherche sur les
smileys
90. 90
Recherche sur Twitter
• Recherche sur Twitter Search :
– Termes de requêtes :
• Hashtag : #transitionenergetique
• Mot clé : transition energetique
• Observer les réactions sur Twitter
• Chercher un compte Twitter spécialisé
• Comparer les résultats avec Topsy
91. 91
Recherches booléennes
Recherche
sur un
site, un
utilisateur
Recherche sur Twitter : Topsy
Classement
par
pertinence,
par date
Recherche sur
anciens tweets
92. 92
Recherche sur Twitter : Topsy
• Plusieurs possibilités
de filtrage des
résultats :
• Par périodes de
publication
• Par types de supports
• Par « Experts » :
utilisateurs ayant le
plus cité le mot-clé
93. 93
• twXplorer :
Recherche sur Twitter : twXplorer
– Nouvel outil spécialisé sur Twitter, lancé en 2013
– Développé par le Knight Lab, de la Northwestern University of Illinois
– Outil puissant, toujours en phase beta
– 13 langues proposées
– Nécessité de se connecter avec son compte Twitter
– Requête sur un mot-clé ou un hashtag :
• Sélection des 500 derniers tweets sur le sujet
• Exclusion des doublons
• Affichage des 100 premiers tweets
– Tableau de bord avec des possibilités d’affinement :
• Sur des termes, des hashtags
– Affichage des liens contenus dans les tweets
– Voir “twXplorer nouveau moteur de recherche pour Twitter” et “twXplorer,
la recherche intelligente sur Twitter”
94. 94
Recherche sur Twitter : twXplorer
• Le tableau de bord de twXplorer :
95. Moteurs de recherche en temps réel
• Information de dernière minute, rapidité d’indexation
• Essor des moteurs en temps réel, avec :
95
– Syndication de contenus, News des médias, Réseaux sociaux,
Twitter et micro-blogging
• Nombreux moteurs autonomes, intervention des
géants Google, Yahoo, Bing
• Demande d’instantanéité :
– Mais effets pervers du temps réel
96. Moteurs de recherche en temps réel
• Principaux critères, selon Comparatif de 14
moteurs, de C. Deschamps :
96
– Nombre et type de sources collectées (« multimoteurs »)
– Représentation graphique des données :
• Graphiques de tendances…
– Possibilité d’abonnement aux flux RSS par requêtes
– Défilement de l’information en temps réel
97. 97
Moteurs de recherche en temps réel
• Suivi de l’actualité en temps réel :
– Exemple sur SocialMention, Samepoint, 48ers…
• Suivi d’un thème sur Twitter, les réseaux sociaux…
• Outils de veille sur un sujet, une personne…
• Analyse, représentation de l’information
98. 98
Moteurs de recherche en temps réel :
Social Mention Search
• Social Mention, moteur social de recherche en
temps réel, veille sur les réseaux sociaux
– Diversité et nombre de sources indexées :
• Blogs
• Microblogging
• Commentaires de blogs
• Plateformes de partage de signets
• Sites de news généralistes
• Sites d’événements
• Images / Vidéos / Audio
• Questions-réponses
• Réseaux sociaux
99. 99
• Interface de
recherche
Moteurs de recherche en temps réel :
Social Mention Search
– Interface de recherche
simple
• Filtrage possible par les
catégories de sources
• Filtrage par les sources
elles-mêmes
100. 110000
Moteurs de recherche en temps réel :
Social Mention Search
• Interface de recherche
– Interface de recherche avancée
• Affichée à la suite d’une première requête
101. Cerner un sujet d’actualité sur le Web :
Quelle évolution dans le traitement ?
102. 102
Repérer les tendances : Google Trends
• Google Trends
– Permet de voir l’évolution de la fréquence des termes de recherche
– Exemple sur la transition énergétique :
103. 103
Repérer les tendances : Google Trends
• Google Trends : fonctionnalités
– Chiffres indiqués :
• Pas le nombre exact de requêtes
• mais le rapport entre la quantité de recherches pour un terme
donné, par rapport au nombre total de recherches effectuées
sur Google au cours de la même période
– Filtrages possibles sur :
• Les modules de Google (Web, Actualités, Images…)
• Les dates
• Les pays
• Les catégories
• Les mots-clés associés
104. 104
Repérer les tendances : Google Trends
Exemple sur « energy transition »
105. 105
Suivre une épidémie : Google Flu
• Google Flu Trends :
– Suivi en temps réel de deux épidémies
mondiales : la grippe et la dengue
– Application de Big Data développée par
Google :
• Analyse des millions de requêtes des internautes
sur la grippe et la dengue
• Localisation, détection des tendances
• Application reconnue par les épidémiologistes
106. Recherche d’archives avec Google News Archive
106
• La recherche sur les archives :
• Sur Google News :
– Archives de presse : http://news.google.com/newspapers
– Lancé en 2006, généralisé en 2008
– Recherche dans 200 ans d’archives de journaux
– Mais en 2011 : arrêt du projet de numérisation des archives
– Actuellement, restent disponibles : 3,5 millions de
publications issus de plus de 2000 journaux dans le monde,
remontant jusqu’à 1752
107. • European Library :
• Données des bibliothèques nationales européennes
• Accès à leurs ressources numériques et bibliographiques
• Rubrique “Historic Newspapers” pour les archives de journaux
107
Recherche d’archives : European LIbrary
108. Ressources
• Pour retrouver les ressources explorées :
– Liste Diigo « Veille Actualités »