1. UNIVERSITE DE PARIS IV – SORBONNE
CELSA
Ecole des hautes études en sciences de l’information et de la communication
MASTER 2ème année
Mention : Information et Communication
Spécialité : Médias et Communication
« Data-Hari » : le journalisme sacrifié sur l’autel des données ?
Préparé sous la direction du Professeur Véronique RICHARD
Nom, Prénom : Alexis Chailloux
Promotion : 2011-2012
Option : MISC (Médias Informatisés et
Stratégies de Communication)
Soutenu le : 22 octobre 2012
Note du mémoire :
Mention :
3. Remerciements
Je voudrais remercier avant toute chose mon rapporteur universitaire, Étienne Candel,
ainsi que mon rapporteur professionnel, Anthony Hamelle, pour les nombreuses pistes ouvertes et
l’intérêt consacré à mon travail.
Je remercie les personnes ayant pris de leur temps personnel pour s’entretenir avec moi :
Caroline Goulard, à la passion contagieuse, Pierre Romera, un « ami pour la vie » grâce à
Twitter, et Jean-Christophe Féraud, pour sa ferveur du journalisme « avec un grand J ». J’espère
les recroiser très vite et poursuivre nos discussions.
J’adresse un immense merci à ma grand-mère, ange-gardienne bienveillante et
attentionnée durant toute la période de rédaction, sans qui ce mémoire n’aurait jamais pu voir le
jour dans les délais impartis. À l’heure d’écrire ces lignes, j’ai une pensée particulière pour elle.
Je n’oublie pas mes deux parents, relecteurs d’une rare réactivité, pour leurs
commentaires parfois fantasques, souvent rigoureux, toujours utiles. Leur investissement
quotidien à mes côtés fut d’une aide précieuse.
Merci encore à Marion, Claire et Alix, qui ont participé à la fastidieuse mais nécessaire
tâche de relecture.
Merci enfin à toute la promotion des MISC 2012, pour les rires, les pleurs, les joies, les
déprimes et les encouragements au moment, si redouté, de rédiger le mémoire. Sans ce salutaire
espace de décompression, la tâche aurait été plus périlleuse encore.
2
4. Introduction
En 1989, Bill Dedman reçoit le prix Pulitzer du journalisme d’investigation pour son
enquête « The Color of Money », publiée dans The Atlanta Journal1. En croisant des bases de
données ethno-démographiques et bancaires, il démontre, cartes à l’appui, que l’appartenance
ethnique est, toutes choses égales par ailleurs, un facteur de discrimination au moment d’attribuer
un prêt immobilier.
En 2012, Michal J. Berens et Ken Amstrong reçoivent le prix Pulitzer du journalisme
d’investigation pour leur enquête « Methadone and the politics of pain », publiée dans The Seattle
Times2. En croisant des bases de données de certificats de décès, d’hospitalisations et de pauvreté,
ils démontrent, cartes à l’appui, que la méthadone, analgésique réputé pour sa dangerosité, est
systématiquement prescrite par Medicaid, l’assurance-santé publique destinée aux plus démunis,
à des fins d’économie budgétaire3.
La première enquête relève simplement du journalisme d’investigation, quand la seconde
est considérée comme une récompense pour le « journalisme de données »4. Comment expliquer
une telle différence de traitement ?
1
FANEN, Sophian, « Les Américains défricheurs du déchiffrage », Ecrans, [disponible en ligne], 4 janvier 2012
(lorsqu’un article a été consulté en ligne, la mention « disponible en ligne » sera faite, l’URL complète et la date de
consultation étant indiquées en bibliographie).
2
« Seattle Times methadone investigation wins Pulitzer Prize », The Seattle Times, [disponible en ligne], 16 avril
2012.
3
BERENS, Michael. J., « How we linked methadone to powerty », The Seattle Times, [disponible en ligne], 10
décembre 2011.
4
« Le journalisme de données récompensé », Courrier International, [disponible en ligne], 28 juin 2012.
3
5. Contextualisation
Une première réponse est apportée par le concept d’ « intermédialité », défini par André
Gauderault et Philippe Marion pour décrire la genèse du cinéma. Dans ce cadre théorique, un
« média naît toujours deux fois5» : une « naissance intégrative » (ou « fausse naissance »), puis
une « naissance différentielle » (ou « autonomisation identitaire »). La « naissance intégrative »
correspond au moment où une nouvelle technique de traitement de l’information apparaît. À ce
moment, le média est encore dépendant d’autres formes médiatiques : « dépourvu de réelle
épaisseur paradigmatique (…) son identité lui échappe encore6 ». La « naissance différentielle »
intervient lorsque le média s’affirme dans sa singularité, en développant des spécificités
identitaires (mode de communication, esthétique, champ sémantique, etc.). Elle coïncide
généralement avec une reconnaissance institutionnelle, et se traduit par une augmentation
sensible des ressources économiques qui lui sont allouées.
À croire Sylvain Parasie, sociologue à l’Université Paris-Est Marne-la-Vallée, la
« naissance intégrative » du data-journalisme7 daterait de la fin des années 1960, lorsque « l’idée
d’utiliser des bases de données comme support à la production d’information apparaît en
Amérique du nord8 ». Philip Meyer révèle ainsi en 1967 dans le Detroit Free Press, que les
jeunes étudiants Noirs ont autant participé aux émeutes de la ville que les jeunes Noirs sans
qualification, contrairement à une théorie « populaire chez les éditorialistes9 ». Mû par l’idée
d’exploiter les outils statistiques des sciences sociales à des fins d’investigation, et séduit par les
promesses du développement de l’informatique, il rédige même un manuel, The New Precision
Journalism 10 . Cette technique, qui prend finalement le nom de CAR - Computer Assisted
5
GAUDERAULT, André, MARION, Philippe, « Un média naît toujours deux fois ... », Sociétés et représentations,
n° 9, 2000, pp. 21-36.
6
Ibid., p. 21. Appliqué à l’objet de leur recherche, deux auteurs montrent ainsi que le cinéma des premiers temps
n’était pas considéré comme tel – le début d’un nouveau genre médiatique - mais comme un moyen parmi d’autres
de réaliser des disciplines bien établis (fééries, mystères, etc.).
7
Tout au long de ce mémoire, les terminologies « data-journalisme » et « journalisme de données » seront utilisées
sans guillemets et indifféremment pour désigner l’objet de recherche. Lorsqu’il s’agira de souligner une orthographe
particulière, des guillemets seront systématiquement ajoutés.
8
Cité dans : INIZAN, Maël, « Chicago : de la prohibition au data-journalisme », Sillicon Maniacs, [disponible en
ligne], 24 mars 2011.
9
[« Popular with editorial writers »] in MEYER, Philip, The New Precision Journalism, 4e Éd (1973), Rowman &
Littlefield Publishers, 2002, p. 14.
10
Ibid., 304 p.
4
6. Reporting11 -, fait quelques émules dans les années 1980 où plusieurs prix Pulitzer sont récoltés.
Elle ne jouira cependant jamais d’une reconnaissance institutionnelle propre, les journalistes qui
l’utilisent étant systématiquement rattachés au journalisme d’investigation, genre déjà bien établi.
La « naissance différentielle » intervient dans les années 2000, lorsque des acteurs issus
du mouvement du logiciel libre, intéressés par les problématiques d’information, investissement
le champ journalistique à la faveur du mouvement d’ « open data »12. La figure emblématique de
ce phénomène est Adrian Holovaty. Développeur et journaliste, il se fait connaître au Washington
Post en lançant en 2005 Chicagocrime.org, carte localisant les crimes et délits à partir des fichiers
de police. Il écrit l’année suivante un court texte13, présenté aujourd’hui par les commentateurs
comme le « manifeste du data journalisme14 ». Le succès rencontré par ces acteurs amène les
grands titres de presse américains – New York Times, Washington Post, Chicago Tribune, Los
Angeles Times - à constituer des équipes dédiées et à les intégrer dans les rédactions, établissant
ainsi le data-journalisme comme une pratique légitime, dotée d’une reconnaissance
institutionnelle.
Construction de l’objet de recherche
Le « journalisme de données » mobilise deux termes polysémiques : « journalisme » et
« données ». Il convient de définir quelles significations de chacun de ces deux mots sont
mobilisées lorsque l’expression est employée.
11
« Journalisme Assisté par Ordinateur »
12
Aussi dénommé « mouvement de libération des données publiques », ce mouvement enjoint les administrations
publiques à mettre à disposition des données librement réutilisables.
13
HOLOVATY, Adrian, « A fundamental way newspapers need to change », [disponible en ligne], 6 septembre
2006.
14
GUILLAUD, Hubert, « Les données pour comprendre le monde », InternetActu, [disponible en ligne], 19 juillet
2011.
5
7. La donnée comme production humaine
Le Trésor de la Langue Française Informatisé (TLFI) apporte, à l’entrée « donnée », au
moins deux significations intéressantes dans le cadre de ce travail. (i) « Quantité connue dans
l’énoncé d’un problème », la donnée est avant tout un élément quantifiable, que l’on peut
mesurer, manipuler, calculer. (ii) « Ensemble des indications enregistrées en machine pour
permettre l’analyse et/ou la recherche automatique d’informations », la donnée se veut
également manipulable par les outils informatiques. L’entrée « statistiques » - « recueil de
données numériques concernant des faits économiques et sociaux », - permet de discerner une
troisième acception du terme « donnée » : une production humaine ayant pour objectif
d’appréhender le social. Dans ce sens, la donnée est le fruit d’un processus, d’une médiation, elle
n’est donc paradoxalement pas « donnée ». En résumé, la donnée est quantifiable, informatisée,
mais également le fruit d’un processus du recueil. Cette dernière approche est développée par le
sociologue Olivier Martin.
Dans un débat sur « la vérité des chiffres15 », il présente les trois éléments qui, selon lui,
composent un chiffre. C’est d’abord une notion, c’est-à-dire ce que l’on veut mesurer, plus ou
moins latente selon les cas : si le statut matrimonial d’un individu est objectivable, ne serait-ce
que par le droit, il semble plus périlleux d'exprimer l’intelligence. C’est ensuite un process, soit le
dispositif humain d’enregistrement et les méthodes statistiques appliquées aux résultats ; la
donnée est bien le résultat d’une médiation humaine. C’est enfin une institution, qui réalise la
mesure dans un objectif défini : la recherche (laboratoire universitaire), le pilotage de l’action
publique (Etat), l’information (média), le commerce (institut de sondage), la dénonciation
(association), etc. Autrement dit, le chiffre statistique n’est pas simplement un nombre, mais la
représentation d’un dispositif de mesure conçu par des humains, et commandité par une
institution dans un but précis.
Lorsqu’il est utilisé dans le cadre des médias informatisés, le terme de « donnée » a
cependant tendance « à “avaler” [son] environnement, à jeter dans l’ombre des concepts
15
MARTIN, Olivier, « La vérité des chiffres : une illusion ? Débat entre entre Alain Blum, démographe, et Olivier
Martin, sociologue. », La Vie des idées, [disponible en ligne], 12 novembre 2009.
6
8. connexes16 ». Selon Valérie Peugeot, il est utilisé à la fois pour désigner les métadonnées - les
éléments qui qualifient et donnent un sens à un document -, les données – au sens de chiffres
statistiques – et les documents numérisés – simples photographies de documents papier. La
majorité des réalisations estampillées « data-journalisme » concernent le second sens, mais il
existe des cas utilisant des métadonnées – une cartographie des auteurs de Wikipédia par
exemple17 -, ou se servant de documents numérisés – l’enquête sur les notes de frais des députés
britanniques notamment18. Au détour d’une phrase, Pierre Romera utilise ainsi clairement le mot
« donnée » pour signifier un document papier : « tu sais quand on parle de Wikileaks comme
révolution c’est complètement faux. Depuis toujours les journalistes utilisent des données, ou
qu’ils ont volées ou alors qu’ils ont trouvées, oubliées sur une photocopieuse.19 ».
Pour une dé-ontologie du journalisme
Tenter de donner une définition transnationale et atemporelle du journalisme serait, pour
reprendre les mots d’Erik Neveu, retomber dans « l’illusion essentialiste20 ». En premier lieu,
parce que le journalisme est ancré dans des histoires nationales propres, où les rapports aux
champs littéraires, économiques et politiques ne sont pas les mêmes. Jean Chalaby a ainsi pointé
les différences entre un modèle anglo-américain, devenu la norme internationale par son souci
d’indépendance, et un modèle français, marqué par sa plus lente autonomisation vis-à-vis du
pouvoir politique et du monde littéraire21. Ces deux pôles sont complétés par toute une série de
modèles intermédiaires, à l’instar du journalisme brésilien22. En second lieu, même au sein d’un
pays donné, les frontières de la profession de journaliste se révèlent « flou[es]23 ». Dans ces
16
PEUGEOT, Valérie, « Web des données, données ouvertes », France Telecom R&D, [disponible en ligne], Janvier
2010, p. 25.
17
http://wikiproject.oii.ox.ac.uk/mapping_wikipedia/ (consulté le 31 août 2012), cité in: « Les data en forme »,
OWNI, [disponible en ligne], 17 avril 2012.
18
LEON, Yann et ORMAN, Évelyne, « La ronde des chiffres du journalisme de données », La Croix, [disponible en
ligne], 22 octobre 2010.
19
Entretien avec Pierre Romera (annexe 2)
20
NEVEU, Erik, « News without journalists : real threat or horror show », Brazilian Journalism Research, Vol. 6/1,
2010, p. 31.
21
CHALABY, Jean, The invention of journalism, Palgrave Mc Millan, 1998, 224 p.
22
MARQUES de MELO (José), 2009, « Journalistic Thinking. Brasil’s Modern Tradition », Journalism, Vol 10/1,
pp. 9-27.
23
RUELLAN, Denis, Le professionnalisme du flou, Presses Universitaires de Grenoble, 1993, 232 p.
7
9. conditions, il semble nécessaire de réaliser une « dé-ontologie24 » du journalisme, et accepter que
le terme ne renvoie pas à une réalité univoque. Ce qui ne doit pas nous empêcher pour autant de
définir les grands registres de sens mobilisés lorsque le terme est employé.
À l’entrée « journalisme », le Trésor de la Langue Française Informatisé en indique au
moins trois. C’est avant tout la « profession de ceux ou celles qui exercent le métier de
journaliste », une corporation avec ses rivalités, son éthique, ses contraintes économiques. C’est
également « une manière de présenter les faits et les événements sous un éclairage propre », une
technique permettant le recueil, l’assemblage, la vérification d’informations afin de les rendre
intelligibles à un public. « Ensemble des journaux », le journalisme représente enfin une force
« comme moyen d’action ou de pression » : c’est un pouvoir, une autorité, une respectabilité.
Yves Jeanneret et Emmanuel Souchier proposent un triptyque comparable pour appréhender le
métier de journaliste. Il se composerait de trois éléments : « un marché », « une écriture », « une
responsabilité »25.
Erik Neveu décrit lui quatre « repères ou imaginaires professionnels26 » permettant de lier
les différentes pratiques du journalisme. Premièrement, un certain « ordre du discours » au sens
foucaldien 27 , entendu comme ce qui est pensable et dicible en société. Le journalisme se
caractérise par une manière de s’exprimer identifiée comme journalistique, qui se distingue des
paroles politiques, littéraires ou publicitaires. Deuxièmement, une pratique de recueil et de
transformation de l’information qui lui permet de ne pas répéter docilement celle produite par les
sources, en particulier les plus puissantes, le pouvoir économique et politique. Troisièmement,
une autorité : par la prétention à une certaine fidélité aux faits, le journaliste acquiert une parole
respectée, et une réputation de confiance. Enfin, la prégnance d’un certain nombre de mythes
fondateurs de la profession28 : la noblesse du métier, le service rendu au public ou l’idée de
bouclier de protection de la démocratie. C’est cette approche en termes d’imaginaires
professionnels qui sera utilisée ici.
24
RASTIER, François, « Ontologie(s) », Revue des sciences et technologies de l’information, Vol. 18/1, 2004, pp.
15-40.
25
JEANNERET, Yves et SOUCHIER, Emmanuel, « Introduction. Internet vu du journalisme », Communication et
langages, n° 129, 3e trimestre 2001, p. 36.
26
NEVEU, Art. cit., p. 32.
27
FOUCAULT, Michel, L’ordre du discours, Gallimard, 1971, 81 p.
28
LE BOHEC, Jacques, 2000, Les mythes professionnels des journalistes, L’Harmattan, 395 p.
8
10. Problématique
Le développement du data-journalisme est porteur d’une promesse forte de transparence.
« Faculté de mettre en lumière29 » selon Thierry Libaert, le terme prend ici deux significations30.
Il peut s’agir de révéler des « vérités » masquées dans les chiffres par le croisement avisé de jeux
statistiques, comme l’enquête de Philippe Meyer sur les émeutes de Détroit en 1967. Dans ce cas,
la « libération » de données publiques à l’œuvre depuis quelques années n’est-elle pas une
aubaine pour ce type de travail journalistique ? La transparence peut également s’entendre
comme la prétention à « dévoiler » les coulisses du pouvoir, ses secrets inavouables et
comportements amoraux. C’est la figure installée du journaliste d’investigation, qui pose ses
yeux là où les puissants ne veulent pas. Ce dernier n’a-t-il pas tout à gagner de la numérisation
des documents politiques, rendant leur accessibilité et leur transmission bien plus aisées31 ? Tim
Berners-Lee, l’inventeur du web, et Eric Mettout, rédacteur en chef de Lexpress.fr, ne s’y
trompent pas : pour le premier, « data journalism is the future32 », pour le second c’est « l’avenir
en marche33 ».
Pourtant, force est de constater que le data-journalisme est encore peu présent dans les
organisations médiatiques « traditionnelles ». Confiné à l’étranger dans des grands titres de
presse, autour de figures tutélaires – Simon Rogers au Guardian, Aaron Pilhofer au New York
Times, Brian Boyer au Chicago Tribune -, le journalisme de données est même absent des
principaux titres français. Et lorsqu’un grand quotidien comme Le Monde lance un blog sur le
29
LIBAERT, Thierry, La transparence en trompe-l’œil, Descartes & Cie, coll. « Gouvernance et démocratie », 2003,
p. 13.
30
CARDON, Dominique, « Zoomer ou dézoomer ? Les enjeux politiques des données ouvertes », OWNI, [disponible
en ligne], 21 février 2011.
31
Olivier Tesquet, ancien d’OWNI passé chez Télérama, explique ainsi le péhnomène Wikileaks par cette relative
facilité pour obtenir de l’information confidentielle : « C’est beaucoup plus facile de pirater des données
confidentielles comme des mémos diplomatiques aujourd’hui qu’il y a 20 ans. 850 000 personnes ont accès à des
documents top secret sur Intellipédia, (un wiki classifié des renseignements américain) », voir INIZAN, Maël,
« L’open data appliqué au journalisme », Sillicon Maniacs, [disponible en ligne], 23 octobre 2011.
32
ARTHUR, Charles, « Analysing data is the future, says Time Berners-Lee », The Guardian, [disponible en ligne],
22 novembre 2010.
33
METTOUT, Eric, « Pourquoi le data-journalisme c’est l’avenir en marche », L’Express, [disponible en ligne], 7
avril 2010.
9
11. modèle du Guardian 34 , celui-ci ferme au bout de deux articles. Les seules expériences
revendiquées en France se trouvent à OWNI 35 , autrement dit à la marge des rédactions 36 .
Comment dès lors expliquer ce paradoxe entre des promesses faramineuses et une
institutionnalisation encore faible dans le secteur du journalisme ? Au-delà des arguments
économiques - une presse en crise -, ou historiques – une tradition inégale de CAR, « Computer
Assisted Reporting -, n’y a-t-il pas des raisons « communicationnelles » qui justifient cet écart ?
Un deuxième type de promesses du data-journalisme, que l’on nommera « objectivistes »,
pourrait abonder dans ce sens. Dans un des premiers articles sur le sujet en France, Nicolas
Vambremeersch utilise à plusieurs reprises l’expression de « données objectives37 » pour justifier
son propos. Pourtant, selon Jean-Christophe Féraud, journaliste « technologies » à Libération,
« la subjectivité ne se met pas en données, or le journalisme est un genre subjectif38 ». Il pointe
ainsi ce qu’il perçoit comme « une tendance à vouloir objectiviser à outrance la réalité39 ». Il
ajoute un second grief, estimant que le data-journalisme porte le risque d’une automatisation
néfaste du métier de journaliste : « à tous les zélotes du “data journalism”, qui sont [les] mêmes
que les partisans du “robot-journalisme”, je dis : “nous ne sommes pas des numéros !”. » Il
défend au contraire une « Information avec un grand “I”, de la chair, du sang et de l’histoire
dedans40 », où le journaliste se renseigne en profondeur sur un terrain, et restitue au lecteur
l’information mise en perspective grâce à la « puissance narrative de l’écrit41 ».
Cette opinion tranchée permet de distinguer des points de tension entre la perception du
data-journalisme et certains imaginaires du journalisme, tels que définis plus haut. Ainsi, à
écouter Jean-Christophe Féraud, « l’ordre du discours » journalistique est sérieusement remis en
34
Le blog « Données moi ! », avait ainsi pour signature « le blog data d’un data journaliste du Monde », et comme
URL http://datablog.blog.lemonde.fr/ (consulté le 31 août 2012), clin d’œil explicite au datablog du Guardian, qui
recueille toutes les réalisation du journal en matière de data-journalisme.
35
OWNI se présente comme « un média d’enquête, de reportage et de data-journalism, dédié aux cultures
numériques ainsi qu’aux nouveaux enjeux de société ».
36
Pour preuve, ce n’est que très récemment qu’un journaliste de formation - Guillaume Dasquié - a remplacé
Nicolas Voisin, entrepreneur, comme directeur de la publication. Voir : RICHÉ, Pascal, « OWNI se déchire (en
deux) pour mieux redémarrer », Rue89, [disponible en ligne], 25 mai 2012.
37
VAMBREMEERSH, Nicolas, « Pour un journalisme de données », Slate, [disponible en ligne], 30 juillet 2009.
38
Entretien avec Jean-Christophe Féraud (Annexe 3)
39
FERAUD, Jean-Christophe, « Le “data journalism” contre Albert Londres », Sur mon écran radar, [disponible en
ligne], 9 février 2010.
40
Entretien avec Jean-Christophe Féraud (Annexe 3)
41
Ibid.
10
12. cause par le journalisme de données : « le métier de journaliste c'est d'abord raconter les ressorts
d'une actualité en répondant le mieux possible aux fameux "5W42" (…). Or les chiffres à eux seuls
sont bien incapables de répondre à ce questionnement43 ».
Alors que le terme de « data-journalisme » suggère une inscription naturelle dans le
champ journalistique, cette citation pose la question de l’effectivité de ces liens : le data-
journalisme est-il « du journalisme » ? L’existence de deux signifiants suggère le contraire.
Avons-nous plutôt affaire à un genre journalistique, au même titre que l’enquête, le reportage ou
l’interview ? Si tel est le cas, pourquoi certains journalistes se revendiquent-ils du data-
journalisme, tandis que d’autres le rejettent ? Par quels mécanismes ?
Finalement, et ce sera le fil directeur de ce mémoire, il s’agira de se demander comment
les promesses du data-journalisme s’articulent avec les repères et imaginaires du
journalisme professionnel.
Méthodologie
Le choix d’une méthodologie suit logiquement la phase de problématisation, entendu que
toutes les méthodes ne conviennent pas à tous les questionnements. Une telle affirmation s’inscrit
en porte-à-faux avec des remises en cause récentes de la valeur scientifique de l’entretien semi-
directif, en particulier dans le cadre de mémoires étudiants44. Or, comme le notent Gilles Pinson
et Valérie Sala Pala, en réponse à l’article précité, « les spécificités de chaque recherche devront
être prises en compte pour déterminer quelle combinaison méthodologique saura le mieux rendre
compte de l’objet de recherche 45 ». En ce sens, ce mémoire proposera trois approches
complémentaires : l’analyse de discours, l’analyse sémiotique, ainsi que des entretiens semi-
directifs, qui permettent une approche compréhensive des discours des acteurs.
42
Les cinq « W » correspondent aux adverbes interrogatifs anglais « Who », « What », « When », « Where »,
« Why », auxquels une production journalistique se devrait de répondre.
43
FERAUD, Art. cit.
44
BONGRAND, Philippe et LABORIER, Pascale, « L’entretien dans l’analyse des politiques publiques : un impensé
méthodologique ? », Revue française de science politique, Vol. 55, 2005, pp. 73-111.
45
PINSON, Gilles et SALA PALA, Valérie. « Peut-on vraiment se passer de l'entretien en sociologie de l'action
publique ? », Revue française de science politique, Vol. 57, 2007, p. 596.
11
13. L’analyse de discours
L’ « analyse de discours » est à distinguer de l’ « analyse de contenus ». Cette dernière
permet d’analyser un corpus extrêmement large de textes, d’y repérer des occurrences et sortir
des statistiques. La première préfère une approche qualitative, se fondant davantage sur l’analyse
de la rhétorique employée (champs lexicaux, syntaxe, etc.), à une approche quantitative. Nous
nous intéresserons dans ce cadre aux discours des promoteurs du data-journalisme, ainsi qu’à
ceux portés par les médias. Le corpus principal a été constitué de manière partiellement
automatisée, par la mise en place d’alertes mails quotidiennes sur les termes « journalisme +
données », ainsi que « data + journalisme », faisant remonter les articles en français. Des
recherches régulières sur le web ont permis de compléter le corpus, en ciblant les articles français
utilisant une orthographe distincte (« datajournalism » par exemple), ainsi que les articles en
anglais particulièrement cités.
Une sémiologie graphique et linguistique
Pour Ferdinand de Saussure, la sémiologie est la « science qui étudie la vie des signes au
sein de la vie sociale46 ». En linguistique, un signe se compose d’un signifié (le sens, abstrait,
mental) et d’un signifiant (la forme, concrète, visible). Nous utiliserons l’analyse sémiologique
dans cette dimension linguistique, à travers l’étude des connotations des signifiants, tel le préfixe
« data » dans l’expression « datajournalisme ». Elle sera également mobilisée pour analyser les
connotations des signes graphiques, qu’ils soient plastiques – pouvant être examinés du point de
vue de la forme, des couleurs, de la texture, etc. -, ou iconiques – qui renvoient aux objets du
monde. Nous appliquerons cette « rhétorique de l’image47 » aux logos de certaines institutions,
ainsi qu’aux dispositifs se revendiquant du data-journalisme, dans une approche plus techno-
sémiotique. Ces deux dimensions - linguistique et graphique – sont cependant intimement liées,
et seront donc articulées dans l’analyse.
46
SAUSSURE (DE), Ferdinand, Cours de linguistique générale, Payot, édition 1973 (1916), p. 33.
47
BARTHES, Roland, « Rhétorique de l’image », Communications, Vol. 4/4, pp. 40-51.
12
14. Des entretiens semi-directifs dans une démarche compréhensive
Enfin, des entretiens semi-directifs se révèlent ici intéressants en raison de l’approche
compréhensive de ce travail. Or comme le notent Gilles Pinson et Valérie Sala Pala :
Dans la démarche compréhensive, l’objectif du chercheur n’est pas – tout du moins dans une
première phase de l’enquête – de rechercher la vérité des pratiques et représentations, de chercher à savoir
si les acteurs disent la vérité ou pas, mais de comprendre pourquoi ce qu’ils disent est vérité48.
En effet, selon Jean-Claude Kaufmann, « la compréhension de la personne n’est qu’un
instrument : le but est l’explication compréhensive du social49 ». C’est bien dans cette approche
que s’inscrit notre recherche : comprendre la vérité des principaux promoteurs du data-
journalisme afin d’en discerner les promesses. Mais il s’agit aussi de reconnaître les limites d’une
telle méthode, en particulier le caractère un peu artificiel de l’information recueillie,
nécessairement « provoquée » par l’enquêteur. La stratégie adoptée a été de reprendre dès que
possible le vocabulaire des acteurs dans la formulation des questions, afin de limiter le
« conditionnement » des réponses. Une certaine honnêteté intellectuelle force cependant à
confesser que l’exercice n’est pas aisé : il est souvent tentant de faire dire à l’enquêté ce que l’on
souhaite qu’il dise, que cela soit - parfois - conscient, ou – souvent - inconscient. C’est la raison
pour laquelle, la méthode de l’entretien semi-directif a été articulée avec les précédentes.
Trois entretiens ont été réalisés par nos soins. Le premier avec Caroline Goulard, 25 ans,
diplômée en management des médias (IEP Rennes), formée au management des nouvelles
technologies (HEC / Telecom), co-fondatrice de la start-up de « visualisation interactive de
données » Dataveyes, et figure clé du data-journalisme en France50. Le deuxième avec Pierre
Romera, 23 ans, développeur, hacker, passé au pôle data-journalisme d’OWNI, fondateur de la
start-up Journalism++ avec son collègue Nicolas Kayser-Bril, et intervenant dans les écoles de
journalisme (ESJ Lille, CFPJ, IEP Paris). Le troisième, téléphonique, avec Jean-Christophe
48
PINSON, SALA PALA, Art. cit.
49
KAUFMANN, Jean-Claude, L’entretien compréhensif, Paris, Nathan, 1996, p. 16.
50
« LA spécialiste française » même, aux dires d’Eric Mettout. Voir : METTOUT, Art. cit.
13
15. Féraud, journaliste économique et technologique, passé par La Tribune, l’Expansion et les Echos,
aujourd’hui à Libération. « Journaliste gonzo, Twitter Addict, blogueur erratique, digitalien,
Punk avec un futur51 » selon ses propres termes, il s’est fait remarquer par un billet remonté à
l’encontre du data-journalisme52.
Trois autres entretiens ont été mobilisés occasionnellement afin de dresser un tableau
complet du data-journalisme en France. Deux sont tirés du mémoire de 4e année de Marlène
Quintard53, étudiante en journalisme au CELSA. Il s’agit de Karen Bastien, ancienne journaliste à
Libération, fondatrice de la start-up de visualisation de données We Do Data ; ainsi que Johan
Hufnagel, journaliste web à Libération, Marianne et 20 Minutes, aujourd’hui co-fondateur et
rédacteur en chef de Slate.fr. Enfin, un dernier réalisé par Yannick Estienne, chercheur en SIC à
l’ESJ Lille, en la personne de Jean-Marc Manach54. Hacker, journaliste d’investigation passé au
Monde Diplomatique, au Canard Enchaîné, à France Inter, France 5 et Internet Actu, il est
aujourd’hui blogueur pour Le Monde et journaliste à OWNI, intervenant dans les écoles de
journalisme (ESJ Lille, CFPJ, IEP Paris).
Manque à ce panel un entretien avec Nicolas Kayser-Bril. Âgé de 25 ans, formé en
économie des médias (IEP Lille), directeur du « pôle datajournalisme » à OWNI avant de fonder
Journalism++, c’est la deuxième figure clé du data-journalisme en France55. Deux explications à
ce manque : le fait qu’il réside désormais à Berlin, et le risque de faire redondance avec son
collègue Pierre Romera, avec qui il travaille depuis plus de deux ans. À défaut d’entretien
compréhensif, nous nous contenterons donc de ses nombreuses prises de parole dans les médias.
51
Présentation de Jean-Christophe Féraud sur : http://monecranradar.blogspot.fr/ (consulté le 31 août 2012)
52
FERAUD, Opcit.
53
QUINTARD, Marlène, Le datajournalisme, un nouveau genre journalistique. Ou comment rendre accessible une
base de données complexe, Mémoire de master 1 en Journalisme, CELSA, 2012.
54
ESTIENNE, Yannick, « Evolution des pratiques journalistiques sur Internet : journalisme “augmenté”, data
journalism et journalisme hacker (entretien avec Jean-Marc Manach) », Les Cahiers du journalisme, Vol. 22/23,
Automne 2011, pp. 134-143.
55
« un des grands spécialistes » pour Flavien Chantrel, fondateur du Blog du Modérateur. Voir : CHANTREL,
Flavien, « Le data-journalisme, enjeux et perspectives : interview de Nicolas Kayser-Bril », Le blog du modérateur,
[disponible en ligne], 18 mars 2011.
14
16. Hypothèses et annonce du plan
Rappelons notre problématique : comment les promesses du data-journalisme s’articulent-
elles avec les repères et imaginaires du journalisme professionnel ? La réponse se fera en trois
mouvements.
Le premier tente de caractériser le data-journalisme. Il s’inscrit pour cela sous l’égide de la
catégorie descriptive de « trivialité56 », développée par Yves Jeanneret. L’hypothèse est que
l’expression a été principalement « réquisitionnée57 » par des acteurs extérieurs au journalisme
(hackers, acteurs économiques). Si les pratiques journalistiques auxquelles ils se réfèrent
(traitement automatisé de données, visualisation de statistiques, récit non linéaire) ne sont pas
nouvelles, le choix des signifiants – en particulier le terme « data » - leur confèrent une forte
connotation, autour de l’idée de richesse des données (métaphore du gisement) et d’une nécessité
à agir (une bannière « data » à rejoindre). Ce caractère injonctif est confirmé par l’analyse des
discours de ces mêmes acteurs. À ce stade de la réflexion, l’origine des principaux acteurs du
data-journalisme soulève un premier point de tension entre data-journalisme et imaginaires du
journalisme professionnel.
Le deuxième mouvement poursuit cette idée, en s’efforçant d’évaluer l’effectivité des
critiques adressées par certains journalistes à un journalisme centré sur le traitement de données
chiffrées (prétention objectiviste, robotisation de la profession). Il y est démontré que malgré
certaines tentations objectivistes indéniables, véhiculées par un amalgame fait / donnée, les
promoteurs du data-journalisme sont conscients de la subjectivité de l’élaboration des données,
La médiation humaine est revendiquée, afin que le traitement et la narration des données soient
faits par un professionnel maîtrisant la statistique et le récit journalistique : le data-journaliste.
Les imaginaires liés à « l’ordre du discours » et aux pratiques journalistiques sont donc réalisés
dans ces discours d’escorte. La conclusion de ce mouvement porterait à considérer le data-
journalisme se renforce d’une proximité avec les imaginaires du journalisme professionnel.
56
JEANNERET, Yves, Penser la trivialité. Volume 1 : La vie triviale des êtres culturels, Hermès-Lavoisier, coll.
« Communication, médiation et construits sociaux », 2008, 266 p.
57
LABELLE, Sarah, « “La société de l’information” : Formule, récit et réquisition », in CHOUTEAU, Marianne et
NGUYEN, Céline (dir.), Mises en récit de la technique, Éditions des Archives Contemporaines, 2011, pp. 33-44
15
17. Le troisième temps, centré sur le projet politique de « rénovation » du journalisme porté par
les tenants du data-journalisme, mettra en exergue les altérités entre ces deux blocs théoriques. Si
certaines convergences se font autour de l’actualisation de la figure démocratique du « journaliste
justicier58 », les autres propositions mettent à mal les repères du journalisme professionnel. Dans
le rôle social du journalisme d’abord : par l’individualisation de l’interprétation des réalisations
journalistiques, les dispositifs de data-journalisme favorisent la figure de l’ « individu rationnel »,
maximisant ses intérêts au détriment du reste de la collectivité. Dans l’autorité de la figure du
journaliste ensuite : en militant pour une mythique organisation horizontale de la société, les
promoteurs du data-journalisme veulent faire du journaliste un chef de projet, maillon parmi
d’autres, et comme les autres, dans la production de l’information.
58
LEMIEUX, Cyril, « Les formats de l’égalitarisme : transformations et limites de la figure du journalisme justicier
dans la France contemporaine », Quaderni, n° 45, 2001, pp. 53-68.
16
18. I. Le data-journalisme comme action collective
« The only new thing in the world is the history you don’t know59. »
Harry S. Truman
La « trivialité » selon Yves Jeanneret ne doit pas s’entendre au sens courant –
« commun », « rebattu », « facile » -, mais au sens étymologique, du latin trivium, « carrefour de
quatre voies60 ». C’est un endroit de circulation, où l’on choisit le chemin à suivre. Appliqué à
l’étude du social, le terme devient concept, et désigne un monde en mouvement, où « les objets
culturels circulent et sont réinvestis en permanence par les acteurs qui les utilisent61 ».
Lorsque l’on veut caractériser le data-journalisme, l’idée de trivialité éclaire les limites
d’une approche essentialiste (A), qui décrit des objets stables, universels, atemporels. Le concept
est également d’une aide précieuse pour se concentrer sur les acteurs – non journalistes la plupart
- qui utilisent l’expression « data-journalisme » et l’investissent de sens (B). Enfin, il permet
d’étudier les connotations du signifiant « data », faux synonyme de « donnée » aux riches
promesses, utilisé comme bannière par des acteurs économiques émergents (C).
59
MILLER, Merle, Plain speaking : an oral biography of Harry S. Truman, Berkeley Publishing Corporation, 1974,
p. 26.
60
JEANNERET, Yves, « Figures politiques de la trivialité : le symbolique, le populaire, et le public », in Économie
politique de la trivialité, organisé par CELSA, Département « Médias et Communication », Neuilly-sur-Seine, 11
octobre 2011.
61
JEANNERET, Yves, Penser la trivialité, Op. cit., p. 16.
17
19. A. Des signifiés multiples : l’impossible approche essentialiste
Les entretiens conduits et l’analyse de discours ont permis de recueillir une grande variété
de définitions du data-journalisme. Nous les avons regroupées en deux catégories : les approches
« disciplinaires » (1) et les approches « culinaires » (2). Devant cette diversité de définitions,
parfois contradictoires, il semble impossible de trouver un référent au data-journalisme. Tout
juste peut-on construire un idéal-type, par définition insatisfaisant (3).
1. Les approches « disciplinaires »
Ces approches situent le journalisme en relation – d’assimilation, d’inclusion ou
d’exclusion – avec des disciplines supposées clairement identifiées, insistant ainsi sur la
continuité avec des pratiques antérieures. Selon Pierre Romera, le data-journalisme recouvre
« toutes les manières de faire du journalisme innovant62 » ; définition confirmée lorsqu’il évoque
sa « start-up » : « j’ai fondé Journalism++, société spécialisée dans le data-journalisme (…)
mais au sens large. On parle vraiment d’aider les médias à innover63 ». Pour son collègue
Nicolas Kayser-Bril, ce serait plutôt un synonyme de « journalisme digital64 », soit toutes les
possibilités pour faire du journalisme en ligne :
C’est la réponse technologique à [l’arrivée d’internet] en disant : on a un nouveau canal, des
nouveaux outils, des nouveaux métiers qui apparaissent, on va les utiliser pour faire du journalisme
aussi. (…). On peut faire ça avec de la donnée, la dimension masse de données est extrêmement
importante, mais on peut faire ça aussi avec d’autres moyens65.
D’autres vont définir le terme par le regroupement de plusieurs disciplines. Les « data
journalism awards »66 présentent ainsi trois catégories de prix : « data-driven investigations »,
« data visualisation and storytelling », « data driven applications », signifiant par là qu’il s’agit
62
Entretien avec Pierre Romera (annexe 2)
63
Ibid.
64
C’est d’ailleurs le reproche que fait Caroline Goulard à cette définition quelques minutes plus tard.
65
Intervention dans : PORTE (DE LA), Xavier, « Le “data-journalisme” ou comment faire du journalisme avec les
données », France Culture, Place de la Toile, [disponible en ligne], diffusée le 14 novembre 2010.
66
Lancés cette année par le GEN (Global Editor Network), en partenariat avec l’EJC (European Journalism Center)
et Google, ils récompensent les réalisations de data-journalisme les plus réussies. Voir :
http://datajournalismawards.org/ (consulté le 31 août 2012)
18
20. de sous-catégories du data-journalisme. Dans un commentaire à son propre article, Caroline
Goulard le situe « dans des courants comme le web sémantique, l’ouverture des données
publiques, la visualisation de la complexité, la structuration de données67 ». Pierre Romera a un
raisonnement similaire lorsque, plus tard dans l’entretien, il affine sa définition :
Si tu veux, moi j’ai tendance à prendre le data-journalisme, et à mettre dedans : “journalisme
hacker”, qui est une discipline à part entière ; “visualisation de données”, parce que c’est aussi quelque
chose qui a ses codes, ses règles, avec des méthodos très particulières ; “crowdsourcing68”, c’est l’exemple
que je t’ai donné avec le Guardian et les notes de frais ; et il y en a un quatrième… (silence) Oui voilà
c’est tout ce dont je te parle, tout ce qui a trait à la “sécurité”, à la maîtrise de l’outil informatique69.
Enfin, certains vont avoir des définitions restrictives, situant le data-journalisme au
croisement de plusieurs pratiques. Aux dires de Sylvain Parasie, le data-journaliste serait ainsi un
profil hybride entre journaliste et développeur. C’est le sens de ses articles sur la construction de
la figure du « journaliste-programmeur » ou « journaliste “hacker” »70. Pour Caroline Goulard et
Benoît Vidal, instigateurs du projet étudiant ActuVisu sur le data-journalisme, puis de la « start-
up » Dataveyes, l’essence de data-journalisme serait plutôt à trouver au croisement de trois
disciplines - le développement, le journalisme et le design -, comme en témoigne ce visuel.
Figure 1 : Image tirée de la
présentation d’ActuVisu le 1 e
juillet 2010, lors du « Café Data »
organisé par le Social Media Club
France à la Cantine, sur le thème
du « Datajournalism ».
67
En commentaire de : GOULARD, Caroline, « Ce qu’aurait pu être le Sarkomètre du Nouvel Obs », OWNI,
[disponible en ligne], 10 février 2010.
68
Le « crowdsourcing », « approvisionnement par la foule » en français, désigne le phénomène d’externalisation
d’une tâche à un grand nombre de personnes.
69
Entretien avec Pierre Romera (annexe 2)
70
DAGIRAL, Eric et PARASIE, Sylvain, « Portrait du journaliste en programmeur : l’émergence d’une figure de
journaliste “hacker” », Les Cahiers du Journalisme, n° 22/23, 2011, pp. 144-155.
19
21. 2. Les approches « culinaires »
Ces approches ont été nommées ainsi car, pour filer la métaphore culinaire, elles
définissent le data-journalisme à partir de sa « cuisine », c’est-à-dire le travail de transformation
d’une matière première – « les ingrédients » – en un produit fini – « le mets » - , après avoir suivi
un processus de traitement– « la cuisine ». En décrivant un processus singulier, ces approches
insistent sur la nouveauté du data-journalisme.
Beaucoup d’acteurs partent ainsi de « l’ingrédient principal », en l’occurrence la donnée,
pour caractériser le data-journalisme. Selon Karen Bastien, co-fondatrice de la « start-up » de
visualisation de données We do data, « [la] matière première, au lieu d’être des heures de rushs
de bandes son, des interviews ou du reportage terrain, va être de la “data”71 ». Et Jean-Marc
Manach de confirmer : « au lieu de faire de l’investigation avec des témoins, des sources, des
“gorges profondes”, on va faire de l’investigation avec les données 72 ». Pour pouvoir être
traitées, ces données doivent être structurées et permettre une lecture automatisée 73 . Elles
nécessitent même, de l’avis de Caroline Goulard, une certaine complexité pour « mériter »
l’appellation « data-journalisme » :
Quand OWNI fait une carte interactive où tu peux cliquer sur les régions et il y a une petite info-
bulle, avec un texte, une photo et une mini vidéo, ok… La base de données derrière elle doit faire vingt
lignes à tout casser : c’est pas vraiment ce que j’appelle du data-journalisme74.
Certains prennent la position opposée et définissent le journalisme de données à partir du
« mets ». Olivier Tredan, doctorant en SIC, estime ainsi que le data-journalisme « se singularise
avant tout par la médiation d’une interface web75 ». Karen Bastien ajoute que la réalisation de
data-journalisme répond d’une esthétique propre : « il faut mettre une couche de design et
d’interface qui vont faire que l’objet chiffré va devenir intéressant, ludique. C’est
71
Entretien avec Karen Bastien (annexe 4)
72
Entretien avec Jean-Marc Manach (annexe 6), in ESTIENNE, Art. cit., p. 135
73
KAYSER-BRIL, Nicolas, « On l’a pas en format ordinateur », ActuVisu, [disponible en ligne], 15 décembre 2009.
74
Entretien avec Caroline Goulard (annexe 1)
75
C’est peut-être là la principale différence entre les deux exemples introductifs de ce mémoire. Voir : TREDAN,
Olivier, « Quand le journalisme se saisit du web : l’exemple du datajournalism », in 1e colloque international – Les
Mutations structurelles du journalisme, [disponible en ligne], Organisé par l’Université de Brasilia, Brasilia, 25-28
avril 2011, p. 2.
20
22. indispensable.76 ». On perçoit dans cette approche l’idée d’ « interactivité » : pour Alain Joannès
« une visualisation labellisée data journalism doit être interactive77 ». Ce terme est entendu
comme récit non-linéaire, faisant croire à l’utilisateur que c’est lui qui suscite les contenus78. Pour
Johan Hufnagel, une telle personnalisation de la navigation serait parée de vertus pédagogiques :
En bâtissant des interfaces graphiques pour accéder aux bases de données, le journalisme de
données (...) offre aussi à l’usager la possibilité d’interroger n’importe quelle partie de cette base de
données, de la rendre accessible et compréhensible instantanément : choix du zoom, délimitation de la
zone géographique, sélection des dimensions comparées, personnalisation des critères de visualisation.79
Finalement, d’autres acteurs préfèrent une approche par la « cuisine », le processus de
transformation en quelque sorte. Aux dires du même Johan Hufnagel, le data-journalisme se
caractériserait par « du recueil et de la vérification de données, du récit, de la mise en forme80 » ;
et de poursuivre « tout cela fait partie du travail journalistique81 ». Le propre de ce genre serait à
trouver entre « l’ingrédient » et « le mets », dans l’angle donné au sujet : « on n’est pas dans la
production d’objet où l’on ferait juste des interfaces pour des bases de données, on raconte autre
chose82 ». Dans cette approche, comme dans celle par l’« ingrédient », le « mets » importe peu :
Le journalisme hacker, ce sont des processus plus ou moins automatisés et du bricolage, pour aller
récupérer de la donnée. Après ce [que Jean-Marc Manach] en fait ça ne va pas forcément être un
graphique interactif, ça pas forcément être une “app”, ça va être tout simplement un article, où il exploite
ces données, et ça il peut le faire aussi bien sur papier que sur le web. Et pourtant ça c’est du data-
journalisme83.
On se trouve dans une situation marquée par une multiplicité de définitions, certaines
étant même contradictoires, sur l’importance du rendu final notamment. Cela rend difficile
l’établissement d’un idéal-type satisfaisant.
76
Entretien avec Karen Bastien (annexe 4)
77
JOANNÈS, Alain, Data journalism. Bases de données et visualisation de l’information, Éditions du CFPJ,
Décembre 2010, p. 90.
78
MITROPOULOU, Eléni, Médias, multimédia et interactivité : jeux de rôle et enjeux sémiotiques. Thèse de
doctorat en sémiotique, Université de Limoges, 2007.
79
GOULARD, Caroline, « Journalisme de données », Art. cit.
80
Entretien avec Johan Hufnagel (annexe 5)
81
Ibid.
82
Entretien avec Karen Bastien (annexe 4)
83
Entretien avec Pierre Romera (annexe 2)
21
23. 3. Des idéaux-types insatisfaisants
Ces deux grands types d’approche résultent d’un travail de typologie, mais on pourrait
encore multiplier les définitions. Dans une démarche de transparence, le blog militant Uppecult
définit « le data-journalisme [comme] le fait de contredire (ou d’approuver) les croyances ou les
discours en s’appuyant sur des faits chiffrés.84 ». Dans une approche plus managériale, Caroline
Goulard estime que « le journalisme de données, c’est avant tout une transformation de
l’organisation85 ». Finalement, il semble impossible d’arriver à une définition satisfaisante dans
le « système référentiel » (ce à quoi réfère un terme) de l’approche ontologique. La confession de
Pierre Romera est sur ce point éclairante :
Nicolas c’est mon associé aujourd’hui et toutes les trois semaines on essaie de trouver la bonne
“baseline” pour notre boîte. En gros on cherche une nouvelle définition au data-journalisme, un truc qui
corresponde vraiment à ce qu’on fait, et qui soit pérenne, qui survive un peu au “buzzword”86.
Une solution consiste cependant à rechercher un idéal-type, au sens wébérien. Se fondant
sur le hiatus irrationalis, ou postulat d’incomplétude, Weber affirme que « la réalité est
irréductible au concept 87 », qu’elle est si complexe qu’aucune théorie ne peut l’épuiser.
Cependant, cela n’empêche pas de définir des concepts hypothétiques – des idéaux-types –, à
comparer avec la réalité du phénomène social étudié. Transporté à la linguistique, ce concept
s’avère fécond : si aucun terme ne peut englober l’intégralité d’une idée, il est possible construire
des modèles, relativement exhaustifs, se rapprochant de la vision que les acteurs s’en font.
Trois travaux de recherche, entendue au sens large, peuvent être mobilisés en ce sens.
Celui d’ActuVisu d’abord, projet étudiant au long-cours, dont les conclusions sont symbolisées
par l’image présentée plus haut : une discipline au croisement du journalisme, du développement
et du design. En entretien, Caroline Goulard précise que la « data visualisation » implique de
« mobiliser de l’infographie interactive88 ». Celui de Marlène Quintard ensuite, qui, dans son
mémoire, donne cinq éléments de définition : « un travail journalistique », « un travail
84
BADOUARD, Thibault, « Introduction au data-journalisme », Uppercult, [disponible en ligne], 27 février 2012.
85
Entretien avec Caroline Goulard (annexe 1)
86
Entretien avec Pierre Romera (annexe 2)
87
GONTHIER, Frédéric, « Weber et la notion de « compréhension », Cahiers internationaux de sociologie, n°116,
2004, pp. 35-54.
88
Entretien avec Caroline Goulard (annexe 1)
22
24. collectif », « des références », « la donnée comme matière première », « la visualisation et
l’interactivité »89. Enfin, celui d’Olivier Tredan, qui caractérise le journalisme de données comme
« une pratique fondée sur le recueil, l'analyse statistique, la visualisation de données sur Internet
et leur traitement journalistique90 ». Dans chacune de ces définitions, les trois éléments des
« approches culinaires » reviennent en filigrane : les bases des données comme matières
premières (« l’ingrédient principal »), une pratique journalistique (« la cuisine ») et une interface
web de visualisation des données, non linéaire (« le mets »), formant ainsi un idéal-type du data-
journalisme.
Cette multiplicité de définitions du data-journalisme, et la difficulté à élaborer un idéal-
type satisfaisant montrent bien les limites d’une approche essentialiste. Comme le suggère le
cadre descriptif de la trivialité, il semble plus pertinent de tenir une démarche socio-historique, et
s’intéresser au type d’acteurs qui investissent l’expression de sens.
B. Une expression investie et promue par des acteurs extérieurs au journalisme
Il est marquant d’observer qu’à quelques exceptions près – Simon Rogers en Grande-
Bretagne ou Aaron Pilhofer aux Etats-Unis - les principaux promoteurs du journalisme de
données n’ont pas reçu de formation en journalisme. Effectivement, la « naissance différentielle »
du data-journalisme s’est faite aux Etats-Unis sous l’impulsion de « programmeurs autodidactes,
entrepreneurs du web, gestionnaires de projets web, programmeurs engagés dans les
communautés du logiciel libre ou militants de l’open data 91 », mais rarement journalistes
professionnels.
Dans le cas français, le constat est comparable, mais les acteurs diffèrent : le terme a été
« réquisitionné » principalement par des entrepreneurs du web, et non des développeurs (1). Ce
concept de « réquisition » permet d’ailleurs d’observer deux traits caractéristiques du data-
journalisme : une prétention abusive à la nouveauté (2) ainsi qu’une injonction à agir (3).
89
QUINTARD, Marlène, Op. cit., pp. 14-15.
90
TREDAN, Olivier, Art. cit., p. 1.
91
PARASIE, Art. cit., p. 3.
23
25. 1. En France, une « réquisition » par des entrepreneurs web
Sur le web français, le tout premier article92 traitant du journalisme de données est
pourtant le fait d’un journaliste professionnel : Fabrice Gonthier - formé à l’IJBA, journaliste
local, et intervenant « multimédia » en écoles de journalisme (ESJ Lille puis CFPJ) -, qui
s’entretient sur son blog 93 avec Nicolas Kayser-Bril. Les terminologies utilisées sont alors
« database journalism » et sa traduction française littérale « journalisme de base de données ». Le
post est repris dans l’article de veille hebdomadaire du site InternetActu94, sous la catégorie
« données publiques », signe que le data-journalisme ne jouit pas encore d’une existence propre
en France. Deux autres exemples soutiennent cette thèse. En mars 2008, Jean-Marc Manach
évoque la campagne « free our data » lancée par le Guardian, sans évoquer aucun des signifiants
utilisés pour caractériser le data-journalisme. Dans son mémoire de recherche de master 1, rédigé
durant l’été 2009, Caroline Goulard n’utilise aucune des terminologies non plus, alors qu’un
passage fait explicitement référence aux bases de données :
Internet abolit les longueurs imposées par les maquettes de la presse papier, incite à écrire des
articles plus courts mais autorise en revanche la publication des textes intégraux d’interviews,
d’infographies interactives, de bases de données ou de documents de travail.95.
En juillet 2009 toujours, un second article – intitulé « Pour un journalisme de données » -,
est publié sur le tout jeune magazine en ligne, Slate96. Il est l’œuvre de Nicolas Vambremeersh,
ancien blogueur politique, et dirigeant d’une agence de communication digitale, Spintank.
Jusqu’en mars 2010 pourtant, la terminologie est hésitante entre « database journalism » et « data
journalism » ; en témoignent le blog lancé par Caroline Goulard97 ou l’utilisation des mots-clés
92
Pour déterminer les premiers articles traitant du sujet, il a été utilisé la requête « daterange: » du moteur de
recherche Google, qui permet de chercher des contenus publiés entre deux dates précises. Il est néanmoins possible
que des articles antérieurs aient été dé-publiés ou soient inaccessibles, comme le blog de Nicolas Kayser-Bril,
« Window on the Media ».
93
GONTIER, Fabrice, « Database journalism : “un renversement de perspective” (itw) », Esprit Blog, [disponible en
ligne], 4 juillet 2009.
94
« A lire ailleurs du 22 juin au 9 juillet », InternetActu, [disponible en ligne], 10 juillet 2009.
95
GOULARD, Caroline. Mutations des entreprises de presse liées au développement de leurs activités numériques.
Mémoire de master 1 en Management des organisations, Sciences Po Rennes, 2009, p. 49.
96
VAMBREMEERSH, Art. cit.
97
http://databasejournalism.wordpress.com/, lancé le 1 novembre 2009, consulté le 31 août 2012.
24
26. dans les articles d’OWNI98. Le mouvement se développe alors autour de deux pôles : ActuVisu,
projet de visualisation de l’information porté par des étudiants de l’IEP de Rennes et de l’HETIC,
lancé en avril 2010, et représenté par Caroline Goulard ; et OWNI, qui commence à publier des
articles sur le sujet. Une convergence se fait même au sein d’OWNI entre mars et août 2010, à la
faveur du lancement du « pôle datajournalisme », dirigé par Nicolas Kayser-Brill 99 ; avant
qu’ActuVisu ne quitte définitivement OWNI - non sans quelques frictions - au moment du
lancement de Dataveyes,. Nicolas Kayser-Brill partira lui aussi en octobre 2011, pour fonder
Journalism++ avec Pierre Romera. Il semblerait que ce soit durant ce court moment de
convergence que la terminologie se stabilise sur « data journalism » - malgré quelques hésitations
orthographiques persistantes (cf. infra) -, et son pendant français de « journalisme de données ».
Ce sont en tout cas ces deux expressions reprises par les médias pour décrire le phénomène100.
Les recherches de Sarah Labelle sur « la société de l’information » sont éclairantes pour
comprendre le processus d’autonomisation du data-journalisme. Comme « société de
l’information », « fracture numérique » ou « développement durable101 », un terme émerge, puis
s’impose, sans avoir de signification précise. Le terme est alors « réquisitionné » par un certain
nombre d’acteurs – dans le cas du data-journalisme : des hackers aux Etats-Unis, des
entrepreneurs du web en France -, utilisé massivement, le rendant ainsi, « incontournable ».
À l’instar de « la société de l’information » (Labelle, 2001), plus qu’un matériau idéologique
ordinaire, c’est un signe écrit global qui s’apparente, comme la marque, à un nom de baptême pour tout un
univers (Peninou, 1971) Nous sommes dans le régime de l’“incontournable”. L’inscription est
omniprésente (…) Dans cet univers de réquisition (Labelle, 2007), il est moins coûteux pour tous, militant
qui défend une cause ou équipe qui engage une recherche, de prétendre œuvrer pour
un réel développement durable et pour la vraie société de l’information, que de remettre en cause ces
catégories102.
La mobilisation de ce concept aide à penser deux caractéristiques du data-journalisme : la
prétention, abusive, à une nouveauté radicale dans les pratiques journalistiques, ainsi qu’une
injonction à l’action, qui masque en réalité ce flou sémantique.
98
De septembre 2009 à mars 2010, sont utilisés indifféremment les mots clés « database journalism » et « data
journalism » pour qualifier les articles, avant que ce dernier ne devienne la norme.
99
GOULARD, Caroline, « La fabrique du data-journalisme », OWNI, [disponible en ligne], 20 mars 2010 ; ou
KAYSER-BRIL, Nicolas, « La fabrique du data #2 », OWNI, [disponible en ligne], 25 mai 2010.
100
FANEN, Sophian, « Les journalistes à data sur les données », Libération, [disponible en ligne], 3 janvier 2012.
101
JEANNERET, Yves, « L’optique du sustainable : territoires médiatisés et savoirs visibles », Questions de
communication, n°17, 2010, pp. 59-80.
102
Ibid. p. 60.
25
27. 2. Une prétention abusive à la nouveauté
C’est le propre d’une expression « réquisitionnée » : pour justifier son utilisation courante,
il faut considérer que tout ce qui se faisait auparavant était peut-être proche, mais d’une nature
différente. Selon Philippe Breton il ne s’agit pas d’un phénomène conscient, mais de
« cryptomnésie » : « nous identifions comme nouveau quelque-chose que nous connaissons déjà
mais que nous avons oublié comme tel103 ». Pourtant si l’on se réfère à l’idéal-type complet du
data-journalisme, défini plus haut, aucun des éléments ne semble particulièrement novateur : le
travail journalistique (la « cuisine »), n’est évidemment pas inédit, mais les deux autres éléments
non plus. Ainsi, le traitement de bases de données à des fins journalistiques (« l’ingrédient ») était
déjà à l’œuvre dans les années 1960 aux Etats-Unis, avec le CAR (cf. supra). La filiation est
104
d’ailleurs clairement assumée . En revanche, concernant l’interface de visualisation
« interactive » (le « mets »), la tentation à faire « table rase » du passé est plus prégnante.
Si nul ne prétend avoir « inventé » la visualisation de statistiques, il est intéressant à ce
propos de noter l’apparition du terme « dataviz », diminutif de l’anglais « data visualization »,
qui caractériserait « l’art d’organiser les données sous forme graphique 105 ». Signifiant
intimement lié au data-journalisme par son préfixe commun, il suggère, par sa seule nouveauté,
des réalisations graphiques inédites, sans doute plus créatives, plus esthétiques, plus pertinentes,
en un mot plus abouties. Pourtant, les imaginaires créatifs – cartes de métro, lecture par flèches,
nuages de mots – peuvent être assez redondants, et les formes graphiques – histogramme
circulaire, cartogramme, cosmographe – inventées il y a parfois plusieurs siècles. Deux
illustrations étayent ce propos. Premièrement, la tentative – humoristique mais signifiante - de
mise en abîme de la notion de « dataviz », par la « start-up » We Do Data (annexe 7)106.
Deuxièmement, l’affiche de présentation d’un concours de « dataviz » organisé par Google à
l’occasion des élections présidentielles françaises de 2012 (annexe 8)107.
103
BRETON, Philippe, L’utopie de la communication : le mythe du « village planétaire », La Découverte, 2004,
p.103.
104
Entretiens avec Caroline Goulard (annexe 1) et Pierre Romera (annexe 2)
105
GEVAUDAN, Camille, « Zoom sur 50 classiques de la “dataviz” », Ecrans, [disponible en ligne], 26 juin 2012.
106
« La dataviz de la dataviz », réalisée à l’occasion de l’événement « Expoviz » (annexe 7)
107
« Concours Google de dataviz » (annexe 8)
26
28. Michaël Friendly, psychologue et statisticien à l’Université de York au Canada, remet la
représentation statistique dans une perspective historique de long terme108. Il montre que la
plupart des inventions se sont faîtes au XIXe siècle, en particulier pendant sa seconde moitié,
dans ce qu’il nomme un « âge doré109 » de la statistique graphique. Les figures clés de ce
mouvement sont Charles Minard (graphique à plusieurs variables, annexe 9 110 ), Florence
Nightingale (histogramme circulaire), Emile Levasseur (cartogramme), Emile Cheysson (carte en
anamorphose) ou Francis Galton (concept de corrélation). Beaucoup de représentations
contemporaines répandues s’inspirent ainsi de ces inventions, parfois de manière frappante
(annexes 10 et 11)111.
Enfin, en ce qui concerne l’ « interactivité », les promesses de personnalisation de la
navigation ne sont pas si neuves non plus. Dans les années 1980, autour de l’ « invention » du
lien hypertexte par Ted Nelson, l’image qui dominait était celle d’un « lecteur actif112 ». À la
différence des livres traditionnels au récit linéaire, l’époque encensait le nœud, le lien,
l’arborescence, le fragment ; autant de figures qui furent à la base du web tel qu’inventé par Tim
Berners-Lee en 1989. La promesse était celle d’un lecteur « libre », construisant son propre
parcours à l’aide de grandes arborescences. Le succès des « romans dont vous êtes le héros »
dans les années 1980 et 1990 en est emblématique113. Au sujet des sites d’information en ligne,
John Knox observe cette « représentation idéologique » voulant que « l’internaute [puisse] se
constituer son propre chemin114 ». Il remarque pourtant que ce sont les éditeurs du site qui
« déterminent le paradigme idéologique et le positionnement de chaque information à l’intérieur
108
Voir son projet « Milestrones in the history of thematic cartography, statistical graphics, and data visualization »,
accessible sur http://www.datavis.ca/milestones/ (consulté le 31 août 2012)
109
FRIENDLY, Michael, « The golden age of statistical graphics », Statistical Science, Vol. 23, 2008, pp. 502-535.
110
Voir notamment sa célèbre carte figurative des pertes de l’armée napoléonienne durant la campagne de Russie
(annexe 9)
111
A titre d’exemple, nous comparons en annexe 10 les représentations graphiques de Charles de Fourcroy (1782) et
de Guardian (2011), et en annexe 11 les histogrammes circulaires de Florence Nightingale (1857) et d’ActuVisu
(2010)
112
JEANNERET, Yves, « Entre héritages et ruptures, la dynamique de l’obsolescence», in Économie politique de la
trivialité, organisé par CELSA, Département « Médias et Communication », Neuilly-sur-Seine, 8 novembre 2011.
113
GANTIER, BOLKA, « L’expérience immersive du web documentaire : études de cas et pistes de réflexion », Les
Cahiers du journalisme, n° 22/23 – automne 2011, p. 127.
114
DAGIRAL, Eric et PARASIE, Sylvain, « Presse en ligne : où en est la recherche ? », Réseaux, n° 160-161,
2010/2, p. 23.
27
29. de celui-ci115 ». Encadré par les dispositifs techno-sémiotiques, le lecteur n’est donc pas si
« libre » qu’il y paraît.
En somme, aucun des éléments de l’idéal-type ne relève d’un changement de nature par
rapport à des pratiques antérieures. Même en combinant les trois – donnée comme matière
première, travail journalistique, interface web de visualisation non-linéaire -, il existe des
exemples antérieurs à l’apparition du terme « data-journalisme », les représentations
d’assemblées par groupes politiques après une élection par exemple, où l’utilisateur pouvait
naviguer entre différents scrutins.
3. Une injonction à agir
Si les discours d’escorte des termes « réquisitionnés » réactualisent des promesses
anciennes, ils sont également caractérisés par le mode de l’injonction : à l’instar du phénomène
d’ « open data »116, on ne sait pas très bien ce que c’est, mais « il faut y aller ». Dans l’incapacité
de définir précisément l’objet, la rhétorique se fait impérative, et impose le terme en soulignant sa
nécessité. « Pour un journalisme de données117 », « Assez d’articles, on veut des contenus ! 118 » :
les titres utilisant ce registre sont courants au moment où l’expression « data journalisme » fait
son apparition en France. Le tableau ne serait pas complet sans mentionner le texte d’Adrian
Holovaty « A fundamental way newspapers need to change119 », écrit en 2006, et considéré par
beaucoup de commentateurs comme le « manifeste » du data-journalisme, soit le texte fondateur
d’un mouvement.
115
KNOX, John, « Visual-verbal communication on online newspaper home pages », Visual communication, vol.
6(1), 2007, p. 47. Cité et traduit in : DAGIRAL, PARASIE, Ibid.
116
L’injonction est même plus forte encore dans le cas de l’open data, le signifiant « open » étant conjugué impératif.
Voir GOETA, Samuel, Open data : qu’ouvre-t-on avec les données publiques ?, Mémoire de master 2 en Sciences de
l’Information et de la Communication, CELSA, 2011, pp. 10-11.
117
VAMBREMEERSCH, Art. cit.
118
GOULARD, Caroline, « Assez d’articles, on veut des contenus ! », OWNI, [disponible en ligne], 17 novembre
2009 ; reproduction de l’article originel GOULARD, Caroline, « Le database journalism pour nous sauver du
“frogboiling” », Database journalism, [disponible en ligne], 10 novembre 2009.
119
HOLOVATY, Adrian, Art. cit.
28
30. La filiation suggérée par le terme est pertinente ici : tout comme le mouvement du logiciel
libre, regroupé autour de la « figure emblématique120 » de Richard Stallman et du projet GNU, on
peut dire que le mouvement du data-journalisme s’est organisé autour d’une personne - Adrian
Holovaty – et de son texte de 2006. L’article de Caroline Goulard, renommé par OWNI « assez
d’articles, on veut des contenus ! », paraphrasant ainsi la dernière phrase, était initialement
intitulé « le database journalism pour nous sauver du frogboiling 121 ». Or ce titre, en plus
d’utiliser le registre de la salvation, fait explicitement référence à l’argumentaire d’Adrian
Holovaty dans son « manifeste ». Par cette répétition de l’argumentaire, les militants français se
font « apôtres122 », diffusant la « parole122 » du data-journalisme. La métaphore religieuse est
d’ailleurs très présente dans les discours d’accompagnement : on ne compte plus les « pape123 »,
« bible124 » ou « voies125 » en matière de data-journalisme.
Le rapport sacré au data-journalisme est doublé d’une prétention d’inéluctabilité. Dans
cette vision, rien de sert de lutter : le journalisme de données représente « l’avenir en marche126 ».
La question n’est plus de discuter l’opportunité pour les rédactions de lancer des projets dans
cette direction, mais de se demander « pourquoi les médias français se s’y mettent pas127 », alors
que « quelques grands exemples anglo-saxons ont clairement montré la voie 128 ». Beaucoup
d’articles sur le sujet dissertent ainsi autour du supposé « retard129 » de la France par rapport à ces
pays. Ce type de discours d’accompagnement a été mis en perspective par les travaux de Julie
120
PROULX, Serge, « Les militants du code : la construction d’une culture technique alternative », in Le logiciel
libre en tant que modèle d’innovation socio-technique. Pratique et développement de coopération dans les
communautés, [disponible en ligne], Congrès de l’ACFAS, Université Mc Gill, Montréal, 16 mai 2006, p. 3.
121
Le « frogboiling » correspond à une légende selon laquelle si une grenouille entre dans une casserole d’eau
bouillante, elle en sort immédiatement, consciente du danger. En revanche, si cette même grenouille rentre dans une
casserole d’eau froide chauffée progressivement, elle ne sortira jamais et mourra de chaleur. Par analogie, on
comprend que le journalisme traditionnel ne s’intéresserait qu’aux événements extraordinaires – un incendie mortel
par exemple -, alors que le journalisme de données mettrait en perspective sur du long terme – disons les coupures
budgétaires chez les pompiers -, jouant le rôle de lanceur d’alerte en cas de dégradation avancée d’une situation.
122
ROMERA, Pierre, « Le data-journalism notre religion », OWNI, [disponible en ligne], 30 août 2011.
123
FANEN, « Le journalisme à data sur les données », Art. cit.
124
LEDUC, Caroline, « Le data journalisme a désormais sa bible », Journalismes, [disponible en ligne], 5 décembre
2010.
125
GOULARD, Caroline, « Les quatre voies du datajournalism », OWNI, [disponible en ligne], 7 avril 2010.
126
METTOUT, Art. cit.
127
GOULARD, Caroline, « Data journalism : pourquoi les médias français ne s’y mettent pas ? », OWNI, [disponible
en ligne], 8 mars 2010.
128
Entretien avec Caroline Goulard (annexe 1)
129
CASTELLI, Elodie, « Le data-journalisme peine à se développer en France », Journalismes, [disponible en
ligne], le 24 janvier 2010.
29
31. Bouchard sur « le retard français130 ». Elle montre que ces discours sont fondés sur l’angoisse et
qu’ils ne peuvent être remis en cause : lorsque l’on est dans l’urgence il est trop tard pour
réfléchir. Derrière, on perçoit un discours de type consultant, qui essaie de vendre un produit à un
dirigeant, pour « ne pas être à la traîne ». Une mise en perspective stimulante dès lors que les
principaux promoteurs français sont aujourd’hui dirigeants de « start-up ».
La mobilisation du concept de « réquisition » a permis de porter notre attention sur les
acteurs de ce que l’on peut désormais appeler le « mouvement » du data-journalisme, dans une
dimension socio-historique et communicationnelle. Dans une approche en termes de trivialité, il
convient désormais de s’attacher plus en détail les des connotations signifiants choisis pour
évoquer le data-journalisme.
C. Une dé-ontologie du data-journalisme : les riches connotations du mot « data »
Peut être encore plus que pour le « journalisme » (cf. supra), réaliser une « dé-
ontologie 131 » du « data-journalisme », et donc se concentrer sur les signifiants, s’avère
indispensable à l’analyse. En étudiant les médias informatisés, Yves Jeanneret remarque ainsi que
« le discours (…) est présent d’emblée dans la désignation des objets qu’il est censé
accompagner », dans la mesure où « l'imaginaire contenu dans les mots et les images fait
davantage qu'accompagner les objets, il les constitue132 ».
En partant de ce postulat, on remarque que les terminologies utilisées en France pour
désigner le data-journalisme sont fortement connotées. A l’inverse des expressions utilisées
outre-Atlantique, elles orientent le regard sur les données (1), et suggèrent dans le même temps
un sentiment de multitude, de foisonnement (2) ainsi que l’appartenance à un mouvement plus
large, regroupé sous une bannière « data » (3).
130
BOUCHARD, Julie, Comment le retard vient aux Français. Analyse d’un discours sur la recherche, l’innovation
et la compétitivité 1940-1970, Septentrion, 2008, 328 p.
131
RASTIER, Art. cit.
132
JEANNERET, Yves, « Autre chose qu’un discours, davantage qu’un accompagnement, mieux qu’une
résistance », in La communication entre libéralisme et démocratie, Terminal, n° 75, été 2011, L’Harmattan, pp. 107-
117.
30
32. 1. La « data » au cœur de la terminologie française
Les expressions employées pour qualifier le data-journalisme sont extrêmement
nombreuses : « data journalism », bien sûr, mais également « database journalism », « hacker
133
journalism » et leurs déclinaisons françaises respectives , ainsi que « data-driven
journalism134 », « computational journalism 135 », ou encore « programmer-journalism 136». Ces
différentes terminologies partagent beaucoup de références et de pratiques mais « ne mettent pas
exactement l’accent sur les mêmes éléments137 ». Certaines mettent ainsi l’accent sur les outils
utilisés. C’est le cas de « computational journalism », qui insiste le rôle de l’informatique, mais
également « data-driven journalism » par une référence aux logiciels de traitement de données :
"Data driven” était plus intéressant par rapport aux technos notamment. Par exemple en
visualisation de données, on utilise beaucoup une librairie en Javascript qui s’appelle D3js pour “data
driven documents”, donc “data driven documents”, “data driven journalism” : je pense que ce n’est pas
anodin138.
Mais le plus marquant est l’opposition entre les terminologies utilisées uniquement dans
le monde anglo-saxon – « programmer journalism » et « hacker journalism » -, et celles
plébiscitées en France – « database journalism » puis « data journalism », ainsi que leurs
traductions littérales. Les premières insistent sur « une figure d’acteurs étrangère aux salles de
rédactions139 », mettant en exergue le brouillage des identités professionnelles du métier de
journaliste. Les secondes mettent au contraire l’accent sur les données, faisant miroiter les
perspectives journalistiques – entendu ici au sens de pratiques propres - d’un champ encore
relativement vierge.
133
PARASIE, Art. cit.
134
DAGIRAL, Eric et PARASIE, Sylvain, « Data-driven journalism and the public good : “Computer Assisted
Reporters and “programmer-journalists” in Chicago », à paraître.
135
COHEN, Sarah, HAMILTON, James et TURNER, Fred, « Computational journalism », Communication of the
ACM, Vol. 54, n° 10, pp. 66-71.
136
BETANCOURT, Leah, « How Programmer-Journalists are changing the news », Mashable, [disponible en ligne],
11 décembre 2009.
137
DAGIRAL, PARASIE, « Portrait du journaliste en programmeur : l’émergence d’une figure de journaliste
“hacker” », Art. cit., p. 144.
138
Entretien avec Caroline Goulard (annexe 1)
139
DAGIRAL, PARASIE, « Portrait du journaliste en programmeur : l’émergence d’une figure de journaliste
“hacker” », Art. cit., p. 144.
31
33. La connotation est plus fine encore : ce ne sont pas tant les « données » que ces
terminologies évoquent mais plus précisément la « data ». Il est ainsi significatif de voir que les
promoteurs français du data-journalisme, non contents de choisir les expressions relatives aux
données, ont parfois préféré franciser la terminologie anglaise plutôt que de la traduire
littéralement. Ainsi, à côté des « datajournalism » et « data journalism », coexistent aujourd’hui
les orthographes « datajournalisme », « data journalisme » et « data-journalisme ». Par la
terminaison « -isme », et l’ajout d’un tiret, l’expression prend une tonalité toute autre, plus
française, et naturalise ainsi son existence : il est à l’oreille moins perturbant d’entendre
« data-journalisme » que « datajournalism140 ». La nuance peut paraître marginale au premier
regard ; elle devient très signifiante au second. Un détour par l’étymologie permet de l’expliciter.
2. Un sentiment de multitude
Dans un article de 2005141, traduit récemment en français142, Norman Gray, astronome de
l’université de Glasgow, propose de relire le sens du mot « data » à la faveur des usages de la
langue. L’origine étymologique du terme est latine : « datum » est le participe passé neutre
singulier du verbe « dare », « donner », également utilisé comme nom commun – « une chose
donnée ». « Data » correspondant au pluriel. Il est employé en anglais dans ce sens mais, à
l’instar de « media » ou « agenda », s’impose à l’usage comme un singulier, jusqu’à ce que
« datum » disparaisse purement et simplement. Dans cet usage, « data » ne peut désormais plus
être simplement le pluriel de « datum » :
Privé d'ancrage, il s'est éloigné de ce simple sens dérivé pour un sens en soi distinct et indépendant.
Il a alors construit des règles d'usage pour lui-même, sans être entravé par son passé latin. (…) Data ne
signifie plus juste une (foutu) [sic] datum après une autre. (…) Cette acception universelle de data comme
mesurable plutôt que comptable met sans ambiguïté le mot dans la même catégorie grammaticale que le
"charbon", le "blé" ou le "minerai", qui est celle des noms de masse ou d'agrégat143.
La distinction anglaise entre « how much » (« quelle quantité de ») et « how many »
(« quel nombre de »), rend bien compte de cette distinction. Cette subtilité syntaxique est
140
À prononcer avec une terminaison anglaise.
141
GRAY, Norman, « Data is a singular noun », [disponible en ligne], 2 janvier 2005.
142
SALAUN, Jean-Michel, « Singulière data », [disponible en ligne], 10 avril 2012.
143
Ibid. Traduction de GRAY, Art. cit.
32
34. masquée par l’adverbe interrogatif « combien », traduisant indifféremment la quantité et le
nombre en français. Or la traduction en « données » reproduit l'emploi originel du terme : il est
tout à fait possible en français d’additionner, compter, dénombrer des données ; on ne les
considère pas comme un bloc indivisible.
On comprend dès lors la nuance à la réquisition du terme « data » plutôt que « données ».
Alors que « la donnée » se représente facilement au singulier, - la donnée d’un problème, la
donnée du jour -, cela semble inconcevable, grammaticalement incorrect, pour « la data » :
lorsque l’on parle de « la data », on évoque un agrégat d’éléments insécables. En utilisant ainsi un
nom singulier figurant pour un tout, on signifie automatiquement la multitude, la profusion, la
masse. Johan Hufnagel, non sans quelques hésitations syntaxiques, abonde dans ce sens : « pour
moi le data c’est le recueil et le traitement de données massives (…) quand je parle de data, je
fais la différence entre le data et l’infographie, les datas c’est vraiment des données massives.
C’est un traitement de plusieurs centaines voire milliers de données144 ».
Figure 3 : Capture d’une présentation de
Figure 2 : Couverture de The Economist, Dataveyes intitulée « transformation de notre
semaine du 27 février au 5 mars 2010 paysage informationnel & journalisme de
données »
144
Entretien avec Johan Hufnagel (annexe 5), in QUINTARD, Op. cit.
33
35. Le
sentiment
est
renforcé
par
la
métaphore
–
très
présente
-‐,
du
«
déluge
»145
:
pour
Karen
Bastien
«
la
data,
qui
était
en
petite
quantité
jusqu’ici,
arrive
par
flux,
par
trombe
d’eau146
».
Elle
suggère
la
surabondance,
l’envahissement
de
l’espace
personnel
par
un
amas
de
données,
mais
également,
par
le
choix
d’un
terme
apocalyptique,
un
univers
menaçant,
incontrôlable,
confirmant
ainsi
la
manipulation
du
registre
de
l’angoisse147 .
Mais
plus
encore
que
le
data-‐journalisme,
cet
imaginaire
sied
au
«
Big
Data148
»,
signe
que
toutes
les
expressions
composées
par
le
«
data
»
se
répondent,
dans
un
univers
sémantique
commun.
3. Le rattachement à une bannière « data »
Saussure, fondamentalement opposé à l’approche classique de la grammaire, selon
laquelle un mot correspond à une chose du monde, avait posé l’idée que les mots n’ont de sens
que de manière négative, par opposition les uns avec les autres. Ils signifient « par ce qu’ils ne
sont pas », dans la mesure où chaque mot a au moins un élément de différence avec un autre.
François Rastier pousse la réflexion à son terme, et affirme que le langage se caractérise par un
« système différentiel d’oppositions et non un codage d’identités référentielles149 ». Dès lors,
« data-journalisme », à la différence du « journalisme de données », s’enrichit du sens des autres
expressions francisées partageant le terme « data » : « le Big Data », « l’open data », « la
dataviz », « le data mining ». Passons en revue leurs différentes connotations.
Par l'adjonction d’un adjectif représentant la grandeur – alors que « data » le suggère déjà
-, et le choix de majuscules, « Big Data » se place dans un registre pléonastique, signifiant plus
fortement encore ce sentiment de multitude. Le terme « open data » évoque lui une triple
signification : une transparence politique, un mouvement social et une injonction150. « Dataviz »
figure plutôt les réalisations, le « mets », en mettant l’accent sur la mobilisation d’une « narration
145
BAYET, Antoine et DUCHAMP, Agathe, « Les nouveaux habits du journalisme dans le monde du déluge des
données », Regards Sur Le Numérique, [disponible en ligne], 10 mars 2011.
146
Entretien avec Karen Bastien (annexe 4)
147
BOUCHARD, Opcit.
148
GUILLAUD, Hubert, « Big data : les progrès de l’analyse de données », Internet Actu, [disponible en ligne], 3
octobre 2011.
149
RASTIER, François, « Le silence de Saussure ou l’ontologie refusée », in BOUQUET, Simon, Saussure, L’Herne,
2003, p. 26.
150
GOETA, Opcit., pp. 10-11.
34
36. visuelle151 », plutôt qu’une « narration verbale151 », assimilée au journalisme traditionnel. Quant à
« data mining », il procède sans équivoque de la métaphore du gisement, d’une richesse enfouie à
aller déterrer. Le « data-journalisme », bien plus que le « journalisme de données » se renforce de
toutes ces connotations. En témoigne cette très longue citation de Caroline Goulard :
En fait ça a un sens parce que le mot “data” ce n’est pas uniquement la version anglaise de
“donnée”. Quand on utilise le mot data en Français, de plus en plus c’est pour parler des données un peu
“nouvelle génération”, parce tu as “Big Data”, “open data”, “data-vizualization”, “data-journalisme”.
Parfois les gens en Français, ils vont dire “on a de la data”, pourquoi il ne disent pas “on a de la donnée” ?
Le sous entendu pour moi là-dedans, c’est que quand tu parles de la data, tu as des données riches,
volumineuses, en temps réel, profondes, tu es au dessus de la donnée. La donnée, c’est la « business
intelligence » à l’ancienne, c’est les données pas valorisées, considérées comme des résidus de l’activité
de l’entreprise. Aujourd’hui quand tu parles de data, c’est du volume, de la profondeur, de la richesse, de
l’intelligence, du “Big Data”… C’est marrant d’ailleurs, parce qu’un truc comme le “data Tuesday” c’est
un rassemblement tous les 1e mardi du mois. Tu as des gens qui viennent du “Big Data”, de “l’open data”,
et de la visualisation, data-journalisme, et tu retrouves pas du tout les gens de la BI [Business
Intelligence]. Eux ils ont un groupe dont j’ai oublié le nom. Et là c’est des vieux de la BI qui se disent
comment on va mieux faire nos camemberts, c’est un peu la “BI à la papa” qu’il faut quand même
renouveler un peu, mais dans une approche radicalement différente de ceux qui travaillent sur la data. Eux
ils travaillent sur la donnée, ça va être des grands relecteurs de Tukey. Mais ça incarne des approches
différentes (…) Je dirai qu’il y une différence générationnelle, pas forcément au niveau des personnes,
mais au niveau des boîtes derrière152.
L’idée centrale ici est celle de « données nouvelle génération », affublées de toute une
séries de qualités - « volume », « profondeur », « intelligence », « richesse » -, qui, par négation,
permettent de caractériser les données « ancienne génération ». Entre les lignes, on lit ainsi une
volonté de se défaire des représentations statistiques classiques, représentées par l’image du
« camembert » et la figure du statisticien John Tukey 153 . Mais on comprend que le
renouvellement « générationnel » se fait surtout au niveau des personnes et institutions qui
promeuvent la « data ». Comme le suggérait Samuel Goëta dans son analyse de l’ « open data »,
on se trouve face à un « mouvement social », entendu ici au sens d’ « action collective » ou
« action commune ayant pour fin d’atteindre des fins partagées154 ». Ce mouvement dispose de
ses lieux de rencontre – les « data Tuesday » organisées par les « start-up » Data Publica, Captain
151
THIBAUT, Nirina, « Datajournalism : les chiffres nous parlent, écoutons les ! », YCAW, [disponible en ligne], 6
juillet 2010.
152
Entretien avec Caroline Goulard (annexe 1)
153
Grand statisticien du XXe siècle, John Tukey est renommé pour ses découvertes en mathématiques algorithmiques
(transformée de Fourier rapide, etc.) et en représentations graphiques de statistiques (diagramme en boîte ou « boîte à
moustache, etc.)
154
MANN, Patrice, L’action collective. Mobilisation et organisation des minorités actives, Armand Colin, 1991,
coll. « U Sociologie », p. 20.
35
37. Dash et MFG Labs155 ou les éphémères « cafés data » du Social Media Club France (cf. supra) -,
et de ses références propres, à l’esthétique plus « sexy156 » – David Mc Candless, Manuel Lima,
Hans Rosling ou Nathan Yau 157 . Il est principalement porté par des acteurs économiques
émergents, qui, pour différencier leur offre d’autres entreprises déjà implantées, manipulent un
double registre d’angoisse – le déluge, l’absence de contrôle -, et d’espoir – la richesse,
l’intelligence, la créativité. C’est sous l’angle de cette action collective, de cette
bannière identitaire « data » que doit aussi se comprendre le data-journalisme.
Sous l’égide de la catégorie descriptive de trivialité, ce premier mouvement a permis de se
détacher d’une approche ontologique, rendue de toute manière impossible par la variété des
définitions récoltées. Par une analyse successive du discours des acteurs ayant installé
l’expression dans le paysage français, puis des connotations du terme « data-journalisme », il a
été possible de rattacher l’objet de recherche à une bannière plus large de la « data », décrivant
une situation, prétendument neuve, marquée les métaphores contradictoires de l’agrégat
(multitude, indivisibilité, danger) et de gisement (rareté, granularité, richesse). Ce double
discours d’angoisse et d’espoir, mobilisé autour d’une bannière commune, permet à ces acteurs
de pousser les rédactions à l’action.
Il apporte ainsi des premiers éléments de réponse à la question de la compatibilité entre
promesses du data-journalisme et imaginaires du journalisme, par la nature des promoteurs - non-
journalistes -, et des discours tenus, parfois plus commerciaux que journalistiques. Il convient
cependant de poursuivre la réflexion en examinant la critique « subjectiviste » adressée au data-
journalisme. Si l’idéal-type défini plus haut encourage à penser qu’une médiation journalistique
est nécessaire, la prétention de certains à un journalisme « objectif » invite à étudier cette
question en profondeur.
155
DESAUTEZ, Ludovic, « “Data Tuesday”, c’est parti », Les Echos, [disponible en ligne], 6 novembre 2011.
156
DESAUTEZ, Ludovic, « Avec le 1e “data Tuesday”, la data se fait plus “sexy” », Les Echos, [disponible en ligne],
17 novembre 2011.
157
SCHERER, Eric, « Données publiques et journalisme : une mine de richesses ! », OWNI, [disponible en ligne], 7
juillet 2010.
36