Ce diaporama a bien été signalé.

Mémoire Data-journalisme

6

Partager

1 sur 116
1 sur 116

Plus De Contenu Connexe

Les utilisateurs ont également aimé

Mémoire Data-journalisme

  1. 1. UNIVERSITE DE PARIS IV – SORBONNE CELSA Ecole des hautes études en sciences de l’information et de la communication MASTER 2ème année Mention : Information et Communication Spécialité : Médias et Communication « Data-Hari » : le journalisme sacrifié sur l’autel des données ? Préparé sous la direction du Professeur Véronique RICHARD Nom, Prénom : Alexis Chailloux Promotion : 2011-2012 Option : MISC (Médias Informatisés et Stratégies de Communication) Soutenu le : 22 octobre 2012 Note du mémoire : Mention :
  2. 2. Remerciements Je voudrais remercier avant toute chose mon rapporteur universitaire, Étienne Candel, ainsi que mon rapporteur professionnel, Anthony Hamelle, pour les nombreuses pistes ouvertes et l’intérêt consacré à mon travail. Je remercie les personnes ayant pris de leur temps personnel pour s’entretenir avec moi : Caroline Goulard, à la passion contagieuse, Pierre Romera, un « ami pour la vie » grâce à Twitter, et Jean-Christophe Féraud, pour sa ferveur du journalisme « avec un grand J ». J’espère les recroiser très vite et poursuivre nos discussions. J’adresse un immense merci à ma grand-mère, ange-gardienne bienveillante et attentionnée durant toute la période de rédaction, sans qui ce mémoire n’aurait jamais pu voir le jour dans les délais impartis. À l’heure d’écrire ces lignes, j’ai une pensée particulière pour elle. Je n’oublie pas mes deux parents, relecteurs d’une rare réactivité, pour leurs commentaires parfois fantasques, souvent rigoureux, toujours utiles. Leur investissement quotidien à mes côtés fut d’une aide précieuse. Merci encore à Marion, Claire et Alix, qui ont participé à la fastidieuse mais nécessaire tâche de relecture. Merci enfin à toute la promotion des MISC 2012, pour les rires, les pleurs, les joies, les déprimes et les encouragements au moment, si redouté, de rédiger le mémoire. Sans ce salutaire espace de décompression, la tâche aurait été plus périlleuse encore. 2
  3. 3. Introduction En 1989, Bill Dedman reçoit le prix Pulitzer du journalisme d’investigation pour son enquête « The Color of Money », publiée dans The Atlanta Journal1. En croisant des bases de données ethno-démographiques et bancaires, il démontre, cartes à l’appui, que l’appartenance ethnique est, toutes choses égales par ailleurs, un facteur de discrimination au moment d’attribuer un prêt immobilier. En 2012, Michal J. Berens et Ken Amstrong reçoivent le prix Pulitzer du journalisme d’investigation pour leur enquête « Methadone and the politics of pain », publiée dans The Seattle Times2. En croisant des bases de données de certificats de décès, d’hospitalisations et de pauvreté, ils démontrent, cartes à l’appui, que la méthadone, analgésique réputé pour sa dangerosité, est systématiquement prescrite par Medicaid, l’assurance-santé publique destinée aux plus démunis, à des fins d’économie budgétaire3. La première enquête relève simplement du journalisme d’investigation, quand la seconde est considérée comme une récompense pour le « journalisme de données »4. Comment expliquer une telle différence de traitement ? 1 FANEN, Sophian, « Les Américains défricheurs du déchiffrage », Ecrans, [disponible en ligne], 4 janvier 2012 (lorsqu’un article a été consulté en ligne, la mention « disponible en ligne » sera faite, l’URL complète et la date de consultation étant indiquées en bibliographie). 2 « Seattle Times methadone investigation wins Pulitzer Prize », The Seattle Times, [disponible en ligne], 16 avril 2012. 3 BERENS, Michael. J., « How we linked methadone to powerty », The Seattle Times, [disponible en ligne], 10 décembre 2011. 4 « Le journalisme de données récompensé », Courrier International, [disponible en ligne], 28 juin 2012. 3
  4. 4. Contextualisation Une première réponse est apportée par le concept d’ « intermédialité », défini par André Gauderault et Philippe Marion pour décrire la genèse du cinéma. Dans ce cadre théorique, un « média naît toujours deux fois5» : une « naissance intégrative » (ou « fausse naissance »), puis une « naissance différentielle » (ou « autonomisation identitaire »). La « naissance intégrative » correspond au moment où une nouvelle technique de traitement de l’information apparaît. À ce moment, le média est encore dépendant d’autres formes médiatiques : « dépourvu de réelle épaisseur paradigmatique (…) son identité lui échappe encore6 ». La « naissance différentielle » intervient lorsque le média s’affirme dans sa singularité, en développant des spécificités identitaires (mode de communication, esthétique, champ sémantique, etc.). Elle coïncide généralement avec une reconnaissance institutionnelle, et se traduit par une augmentation sensible des ressources économiques qui lui sont allouées. À croire Sylvain Parasie, sociologue à l’Université Paris-Est Marne-la-Vallée, la « naissance intégrative » du data-journalisme7 daterait de la fin des années 1960, lorsque « l’idée d’utiliser des bases de données comme support à la production d’information apparaît en Amérique du nord8 ». Philip Meyer révèle ainsi en 1967 dans le Detroit Free Press, que les jeunes étudiants Noirs ont autant participé aux émeutes de la ville que les jeunes Noirs sans qualification, contrairement à une théorie « populaire chez les éditorialistes9 ». Mû par l’idée d’exploiter les outils statistiques des sciences sociales à des fins d’investigation, et séduit par les promesses du développement de l’informatique, il rédige même un manuel, The New Precision Journalism 10 . Cette technique, qui prend finalement le nom de CAR - Computer Assisted 5 GAUDERAULT, André, MARION, Philippe, « Un média naît toujours deux fois ... », Sociétés et représentations, n° 9, 2000, pp. 21-36. 6 Ibid., p. 21. Appliqué à l’objet de leur recherche, deux auteurs montrent ainsi que le cinéma des premiers temps n’était pas considéré comme tel – le début d’un nouveau genre médiatique - mais comme un moyen parmi d’autres de réaliser des disciplines bien établis (fééries, mystères, etc.). 7 Tout au long de ce mémoire, les terminologies « data-journalisme » et « journalisme de données » seront utilisées sans guillemets et indifféremment pour désigner l’objet de recherche. Lorsqu’il s’agira de souligner une orthographe particulière, des guillemets seront systématiquement ajoutés. 8 Cité dans : INIZAN, Maël, « Chicago : de la prohibition au data-journalisme », Sillicon Maniacs, [disponible en ligne], 24 mars 2011. 9 [« Popular with editorial writers »] in MEYER, Philip, The New Precision Journalism, 4e Éd (1973), Rowman & Littlefield Publishers, 2002, p. 14. 10 Ibid., 304 p. 4
  5. 5. Reporting11 -, fait quelques émules dans les années 1980 où plusieurs prix Pulitzer sont récoltés. Elle ne jouira cependant jamais d’une reconnaissance institutionnelle propre, les journalistes qui l’utilisent étant systématiquement rattachés au journalisme d’investigation, genre déjà bien établi. La « naissance différentielle » intervient dans les années 2000, lorsque des acteurs issus du mouvement du logiciel libre, intéressés par les problématiques d’information, investissement le champ journalistique à la faveur du mouvement d’ « open data »12. La figure emblématique de ce phénomène est Adrian Holovaty. Développeur et journaliste, il se fait connaître au Washington Post en lançant en 2005 Chicagocrime.org, carte localisant les crimes et délits à partir des fichiers de police. Il écrit l’année suivante un court texte13, présenté aujourd’hui par les commentateurs comme le « manifeste du data journalisme14 ». Le succès rencontré par ces acteurs amène les grands titres de presse américains – New York Times, Washington Post, Chicago Tribune, Los Angeles Times - à constituer des équipes dédiées et à les intégrer dans les rédactions, établissant ainsi le data-journalisme comme une pratique légitime, dotée d’une reconnaissance institutionnelle. Construction de l’objet de recherche Le « journalisme de données » mobilise deux termes polysémiques : « journalisme » et « données ». Il convient de définir quelles significations de chacun de ces deux mots sont mobilisées lorsque l’expression est employée. 11 « Journalisme Assisté par Ordinateur » 12 Aussi dénommé « mouvement de libération des données publiques », ce mouvement enjoint les administrations publiques à mettre à disposition des données librement réutilisables. 13 HOLOVATY, Adrian, « A fundamental way newspapers need to change », [disponible en ligne], 6 septembre 2006. 14 GUILLAUD, Hubert, « Les données pour comprendre le monde », InternetActu, [disponible en ligne], 19 juillet 2011. 5
  6. 6. La donnée comme production humaine Le Trésor de la Langue Française Informatisé (TLFI) apporte, à l’entrée « donnée », au moins deux significations intéressantes dans le cadre de ce travail. (i) « Quantité connue dans l’énoncé d’un problème », la donnée est avant tout un élément quantifiable, que l’on peut mesurer, manipuler, calculer. (ii) « Ensemble des indications enregistrées en machine pour permettre l’analyse et/ou la recherche automatique d’informations », la donnée se veut également manipulable par les outils informatiques. L’entrée « statistiques » - « recueil de données numériques concernant des faits économiques et sociaux », - permet de discerner une troisième acception du terme « donnée » : une production humaine ayant pour objectif d’appréhender le social. Dans ce sens, la donnée est le fruit d’un processus, d’une médiation, elle n’est donc paradoxalement pas « donnée ». En résumé, la donnée est quantifiable, informatisée, mais également le fruit d’un processus du recueil. Cette dernière approche est développée par le sociologue Olivier Martin. Dans un débat sur « la vérité des chiffres15 », il présente les trois éléments qui, selon lui, composent un chiffre. C’est d’abord une notion, c’est-à-dire ce que l’on veut mesurer, plus ou moins latente selon les cas : si le statut matrimonial d’un individu est objectivable, ne serait-ce que par le droit, il semble plus périlleux d'exprimer l’intelligence. C’est ensuite un process, soit le dispositif humain d’enregistrement et les méthodes statistiques appliquées aux résultats ; la donnée est bien le résultat d’une médiation humaine. C’est enfin une institution, qui réalise la mesure dans un objectif défini : la recherche (laboratoire universitaire), le pilotage de l’action publique (Etat), l’information (média), le commerce (institut de sondage), la dénonciation (association), etc. Autrement dit, le chiffre statistique n’est pas simplement un nombre, mais la représentation d’un dispositif de mesure conçu par des humains, et commandité par une institution dans un but précis. Lorsqu’il est utilisé dans le cadre des médias informatisés, le terme de « donnée » a cependant tendance « à “avaler” [son] environnement, à jeter dans l’ombre des concepts 15 MARTIN, Olivier, « La vérité des chiffres : une illusion ? Débat entre entre Alain Blum, démographe, et Olivier Martin, sociologue. », La Vie des idées, [disponible en ligne], 12 novembre 2009. 6
  7. 7. connexes16 ». Selon Valérie Peugeot, il est utilisé à la fois pour désigner les métadonnées - les éléments qui qualifient et donnent un sens à un document -, les données – au sens de chiffres statistiques – et les documents numérisés – simples photographies de documents papier. La majorité des réalisations estampillées « data-journalisme » concernent le second sens, mais il existe des cas utilisant des métadonnées – une cartographie des auteurs de Wikipédia par exemple17 -, ou se servant de documents numérisés – l’enquête sur les notes de frais des députés britanniques notamment18. Au détour d’une phrase, Pierre Romera utilise ainsi clairement le mot « donnée » pour signifier un document papier : « tu sais quand on parle de Wikileaks comme révolution c’est complètement faux. Depuis toujours les journalistes utilisent des données, ou qu’ils ont volées ou alors qu’ils ont trouvées, oubliées sur une photocopieuse.19 ». Pour une dé-ontologie du journalisme Tenter de donner une définition transnationale et atemporelle du journalisme serait, pour reprendre les mots d’Erik Neveu, retomber dans « l’illusion essentialiste20 ». En premier lieu, parce que le journalisme est ancré dans des histoires nationales propres, où les rapports aux champs littéraires, économiques et politiques ne sont pas les mêmes. Jean Chalaby a ainsi pointé les différences entre un modèle anglo-américain, devenu la norme internationale par son souci d’indépendance, et un modèle français, marqué par sa plus lente autonomisation vis-à-vis du pouvoir politique et du monde littéraire21. Ces deux pôles sont complétés par toute une série de modèles intermédiaires, à l’instar du journalisme brésilien22. En second lieu, même au sein d’un pays donné, les frontières de la profession de journaliste se révèlent « flou[es]23 ». Dans ces 16 PEUGEOT, Valérie, « Web des données, données ouvertes », France Telecom R&D, [disponible en ligne], Janvier 2010, p. 25. 17 http://wikiproject.oii.ox.ac.uk/mapping_wikipedia/ (consulté le 31 août 2012), cité in: « Les data en forme », OWNI, [disponible en ligne], 17 avril 2012. 18 LEON, Yann et ORMAN, Évelyne, « La ronde des chiffres du journalisme de données », La Croix, [disponible en ligne], 22 octobre 2010. 19 Entretien avec Pierre Romera (annexe 2) 20 NEVEU, Erik, « News without journalists : real threat or horror show », Brazilian Journalism Research, Vol. 6/1, 2010, p. 31. 21 CHALABY, Jean, The invention of journalism, Palgrave Mc Millan, 1998, 224 p. 22 MARQUES de MELO (José), 2009, « Journalistic Thinking. Brasil’s Modern Tradition », Journalism, Vol 10/1, pp. 9-27. 23 RUELLAN, Denis, Le professionnalisme du flou, Presses Universitaires de Grenoble, 1993, 232 p. 7
  8. 8. conditions, il semble nécessaire de réaliser une « dé-ontologie24 » du journalisme, et accepter que le terme ne renvoie pas à une réalité univoque. Ce qui ne doit pas nous empêcher pour autant de définir les grands registres de sens mobilisés lorsque le terme est employé. À l’entrée « journalisme », le Trésor de la Langue Française Informatisé en indique au moins trois. C’est avant tout la « profession de ceux ou celles qui exercent le métier de journaliste », une corporation avec ses rivalités, son éthique, ses contraintes économiques. C’est également « une manière de présenter les faits et les événements sous un éclairage propre », une technique permettant le recueil, l’assemblage, la vérification d’informations afin de les rendre intelligibles à un public. « Ensemble des journaux », le journalisme représente enfin une force « comme moyen d’action ou de pression » : c’est un pouvoir, une autorité, une respectabilité. Yves Jeanneret et Emmanuel Souchier proposent un triptyque comparable pour appréhender le métier de journaliste. Il se composerait de trois éléments : « un marché », « une écriture », « une responsabilité »25. Erik Neveu décrit lui quatre « repères ou imaginaires professionnels26 » permettant de lier les différentes pratiques du journalisme. Premièrement, un certain « ordre du discours » au sens foucaldien 27 , entendu comme ce qui est pensable et dicible en société. Le journalisme se caractérise par une manière de s’exprimer identifiée comme journalistique, qui se distingue des paroles politiques, littéraires ou publicitaires. Deuxièmement, une pratique de recueil et de transformation de l’information qui lui permet de ne pas répéter docilement celle produite par les sources, en particulier les plus puissantes, le pouvoir économique et politique. Troisièmement, une autorité : par la prétention à une certaine fidélité aux faits, le journaliste acquiert une parole respectée, et une réputation de confiance. Enfin, la prégnance d’un certain nombre de mythes fondateurs de la profession28 : la noblesse du métier, le service rendu au public ou l’idée de bouclier de protection de la démocratie. C’est cette approche en termes d’imaginaires professionnels qui sera utilisée ici. 24 RASTIER, François, « Ontologie(s) », Revue des sciences et technologies de l’information, Vol. 18/1, 2004, pp. 15-40. 25 JEANNERET, Yves et SOUCHIER, Emmanuel, « Introduction. Internet vu du journalisme », Communication et langages, n° 129, 3e trimestre 2001, p. 36. 26 NEVEU, Art. cit., p. 32. 27 FOUCAULT, Michel, L’ordre du discours, Gallimard, 1971, 81 p. 28 LE BOHEC, Jacques, 2000, Les mythes professionnels des journalistes, L’Harmattan, 395 p. 8
  9. 9. Problématique Le développement du data-journalisme est porteur d’une promesse forte de transparence. « Faculté de mettre en lumière29 » selon Thierry Libaert, le terme prend ici deux significations30. Il peut s’agir de révéler des « vérités » masquées dans les chiffres par le croisement avisé de jeux statistiques, comme l’enquête de Philippe Meyer sur les émeutes de Détroit en 1967. Dans ce cas, la « libération » de données publiques à l’œuvre depuis quelques années n’est-elle pas une aubaine pour ce type de travail journalistique ? La transparence peut également s’entendre comme la prétention à « dévoiler » les coulisses du pouvoir, ses secrets inavouables et comportements amoraux. C’est la figure installée du journaliste d’investigation, qui pose ses yeux là où les puissants ne veulent pas. Ce dernier n’a-t-il pas tout à gagner de la numérisation des documents politiques, rendant leur accessibilité et leur transmission bien plus aisées31 ? Tim Berners-Lee, l’inventeur du web, et Eric Mettout, rédacteur en chef de Lexpress.fr, ne s’y trompent pas : pour le premier, « data journalism is the future32 », pour le second c’est « l’avenir en marche33 ». Pourtant, force est de constater que le data-journalisme est encore peu présent dans les organisations médiatiques « traditionnelles ». Confiné à l’étranger dans des grands titres de presse, autour de figures tutélaires – Simon Rogers au Guardian, Aaron Pilhofer au New York Times, Brian Boyer au Chicago Tribune -, le journalisme de données est même absent des principaux titres français. Et lorsqu’un grand quotidien comme Le Monde lance un blog sur le 29 LIBAERT, Thierry, La transparence en trompe-l’œil, Descartes & Cie, coll. « Gouvernance et démocratie », 2003, p. 13. 30 CARDON, Dominique, « Zoomer ou dézoomer ? Les enjeux politiques des données ouvertes », OWNI, [disponible en ligne], 21 février 2011. 31 Olivier Tesquet, ancien d’OWNI passé chez Télérama, explique ainsi le péhnomène Wikileaks par cette relative facilité pour obtenir de l’information confidentielle : « C’est beaucoup plus facile de pirater des données confidentielles comme des mémos diplomatiques aujourd’hui qu’il y a 20 ans. 850 000 personnes ont accès à des documents top secret sur Intellipédia, (un wiki classifié des renseignements américain) », voir INIZAN, Maël, « L’open data appliqué au journalisme », Sillicon Maniacs, [disponible en ligne], 23 octobre 2011. 32 ARTHUR, Charles, « Analysing data is the future, says Time Berners-Lee », The Guardian, [disponible en ligne], 22 novembre 2010. 33 METTOUT, Eric, « Pourquoi le data-journalisme c’est l’avenir en marche », L’Express, [disponible en ligne], 7 avril 2010. 9
  10. 10. modèle du Guardian 34 , celui-ci ferme au bout de deux articles. Les seules expériences revendiquées en France se trouvent à OWNI 35 , autrement dit à la marge des rédactions 36 . Comment dès lors expliquer ce paradoxe entre des promesses faramineuses et une institutionnalisation encore faible dans le secteur du journalisme ? Au-delà des arguments économiques - une presse en crise -, ou historiques – une tradition inégale de CAR, « Computer Assisted Reporting -, n’y a-t-il pas des raisons « communicationnelles » qui justifient cet écart ? Un deuxième type de promesses du data-journalisme, que l’on nommera « objectivistes », pourrait abonder dans ce sens. Dans un des premiers articles sur le sujet en France, Nicolas Vambremeersch utilise à plusieurs reprises l’expression de « données objectives37 » pour justifier son propos. Pourtant, selon Jean-Christophe Féraud, journaliste « technologies » à Libération, « la subjectivité ne se met pas en données, or le journalisme est un genre subjectif38 ». Il pointe ainsi ce qu’il perçoit comme « une tendance à vouloir objectiviser à outrance la réalité39 ». Il ajoute un second grief, estimant que le data-journalisme porte le risque d’une automatisation néfaste du métier de journaliste : « à tous les zélotes du “data journalism”, qui sont [les] mêmes que les partisans du “robot-journalisme”, je dis : “nous ne sommes pas des numéros !”. » Il défend au contraire une « Information avec un grand “I”, de la chair, du sang et de l’histoire dedans40 », où le journaliste se renseigne en profondeur sur un terrain, et restitue au lecteur l’information mise en perspective grâce à la « puissance narrative de l’écrit41 ». Cette opinion tranchée permet de distinguer des points de tension entre la perception du data-journalisme et certains imaginaires du journalisme, tels que définis plus haut. Ainsi, à écouter Jean-Christophe Féraud, « l’ordre du discours » journalistique est sérieusement remis en 34 Le blog « Données moi ! », avait ainsi pour signature « le blog data d’un data journaliste du Monde », et comme URL http://datablog.blog.lemonde.fr/ (consulté le 31 août 2012), clin d’œil explicite au datablog du Guardian, qui recueille toutes les réalisation du journal en matière de data-journalisme. 35 OWNI se présente comme « un média d’enquête, de reportage et de data-journalism, dédié aux cultures numériques ainsi qu’aux nouveaux enjeux de société ». 36 Pour preuve, ce n’est que très récemment qu’un journaliste de formation - Guillaume Dasquié - a remplacé Nicolas Voisin, entrepreneur, comme directeur de la publication. Voir : RICHÉ, Pascal, « OWNI se déchire (en deux) pour mieux redémarrer », Rue89, [disponible en ligne], 25 mai 2012. 37 VAMBREMEERSH, Nicolas, « Pour un journalisme de données », Slate, [disponible en ligne], 30 juillet 2009. 38 Entretien avec Jean-Christophe Féraud (Annexe 3) 39 FERAUD, Jean-Christophe, « Le “data journalism” contre Albert Londres », Sur mon écran radar, [disponible en ligne], 9 février 2010. 40 Entretien avec Jean-Christophe Féraud (Annexe 3) 41 Ibid. 10
  11. 11. cause par le journalisme de données : « le métier de journaliste c'est d'abord raconter les ressorts d'une actualité en répondant le mieux possible aux fameux "5W42" (…). Or les chiffres à eux seuls sont bien incapables de répondre à ce questionnement43 ». Alors que le terme de « data-journalisme » suggère une inscription naturelle dans le champ journalistique, cette citation pose la question de l’effectivité de ces liens : le data- journalisme est-il « du journalisme » ? L’existence de deux signifiants suggère le contraire. Avons-nous plutôt affaire à un genre journalistique, au même titre que l’enquête, le reportage ou l’interview ? Si tel est le cas, pourquoi certains journalistes se revendiquent-ils du data- journalisme, tandis que d’autres le rejettent ? Par quels mécanismes ? Finalement, et ce sera le fil directeur de ce mémoire, il s’agira de se demander comment les promesses du data-journalisme s’articulent avec les repères et imaginaires du journalisme professionnel. Méthodologie Le choix d’une méthodologie suit logiquement la phase de problématisation, entendu que toutes les méthodes ne conviennent pas à tous les questionnements. Une telle affirmation s’inscrit en porte-à-faux avec des remises en cause récentes de la valeur scientifique de l’entretien semi- directif, en particulier dans le cadre de mémoires étudiants44. Or, comme le notent Gilles Pinson et Valérie Sala Pala, en réponse à l’article précité, « les spécificités de chaque recherche devront être prises en compte pour déterminer quelle combinaison méthodologique saura le mieux rendre compte de l’objet de recherche 45 ». En ce sens, ce mémoire proposera trois approches complémentaires : l’analyse de discours, l’analyse sémiotique, ainsi que des entretiens semi- directifs, qui permettent une approche compréhensive des discours des acteurs. 42 Les cinq « W » correspondent aux adverbes interrogatifs anglais « Who », « What », « When », « Where », « Why », auxquels une production journalistique se devrait de répondre. 43 FERAUD, Art. cit. 44 BONGRAND, Philippe et LABORIER, Pascale, « L’entretien dans l’analyse des politiques publiques : un impensé méthodologique ? », Revue française de science politique, Vol. 55, 2005, pp. 73-111. 45 PINSON, Gilles et SALA PALA, Valérie. « Peut-on vraiment se passer de l'entretien en sociologie de l'action publique ? », Revue française de science politique, Vol. 57, 2007, p. 596. 11
  12. 12. L’analyse de discours L’ « analyse de discours » est à distinguer de l’ « analyse de contenus ». Cette dernière permet d’analyser un corpus extrêmement large de textes, d’y repérer des occurrences et sortir des statistiques. La première préfère une approche qualitative, se fondant davantage sur l’analyse de la rhétorique employée (champs lexicaux, syntaxe, etc.), à une approche quantitative. Nous nous intéresserons dans ce cadre aux discours des promoteurs du data-journalisme, ainsi qu’à ceux portés par les médias. Le corpus principal a été constitué de manière partiellement automatisée, par la mise en place d’alertes mails quotidiennes sur les termes « journalisme + données », ainsi que « data + journalisme », faisant remonter les articles en français. Des recherches régulières sur le web ont permis de compléter le corpus, en ciblant les articles français utilisant une orthographe distincte (« datajournalism » par exemple), ainsi que les articles en anglais particulièrement cités. Une sémiologie graphique et linguistique Pour Ferdinand de Saussure, la sémiologie est la « science qui étudie la vie des signes au sein de la vie sociale46 ». En linguistique, un signe se compose d’un signifié (le sens, abstrait, mental) et d’un signifiant (la forme, concrète, visible). Nous utiliserons l’analyse sémiologique dans cette dimension linguistique, à travers l’étude des connotations des signifiants, tel le préfixe « data » dans l’expression « datajournalisme ». Elle sera également mobilisée pour analyser les connotations des signes graphiques, qu’ils soient plastiques – pouvant être examinés du point de vue de la forme, des couleurs, de la texture, etc. -, ou iconiques – qui renvoient aux objets du monde. Nous appliquerons cette « rhétorique de l’image47 » aux logos de certaines institutions, ainsi qu’aux dispositifs se revendiquant du data-journalisme, dans une approche plus techno- sémiotique. Ces deux dimensions - linguistique et graphique – sont cependant intimement liées, et seront donc articulées dans l’analyse. 46 SAUSSURE (DE), Ferdinand, Cours de linguistique générale, Payot, édition 1973 (1916), p. 33. 47 BARTHES, Roland, « Rhétorique de l’image », Communications, Vol. 4/4, pp. 40-51. 12
  13. 13. Des entretiens semi-directifs dans une démarche compréhensive Enfin, des entretiens semi-directifs se révèlent ici intéressants en raison de l’approche compréhensive de ce travail. Or comme le notent Gilles Pinson et Valérie Sala Pala : Dans la démarche compréhensive, l’objectif du chercheur n’est pas – tout du moins dans une première phase de l’enquête – de rechercher la vérité des pratiques et représentations, de chercher à savoir si les acteurs disent la vérité ou pas, mais de comprendre pourquoi ce qu’ils disent est vérité48. En effet, selon Jean-Claude Kaufmann, « la compréhension de la personne n’est qu’un instrument : le but est l’explication compréhensive du social49 ». C’est bien dans cette approche que s’inscrit notre recherche : comprendre la vérité des principaux promoteurs du data- journalisme afin d’en discerner les promesses. Mais il s’agit aussi de reconnaître les limites d’une telle méthode, en particulier le caractère un peu artificiel de l’information recueillie, nécessairement « provoquée » par l’enquêteur. La stratégie adoptée a été de reprendre dès que possible le vocabulaire des acteurs dans la formulation des questions, afin de limiter le « conditionnement » des réponses. Une certaine honnêteté intellectuelle force cependant à confesser que l’exercice n’est pas aisé : il est souvent tentant de faire dire à l’enquêté ce que l’on souhaite qu’il dise, que cela soit - parfois - conscient, ou – souvent - inconscient. C’est la raison pour laquelle, la méthode de l’entretien semi-directif a été articulée avec les précédentes. Trois entretiens ont été réalisés par nos soins. Le premier avec Caroline Goulard, 25 ans, diplômée en management des médias (IEP Rennes), formée au management des nouvelles technologies (HEC / Telecom), co-fondatrice de la start-up de « visualisation interactive de données » Dataveyes, et figure clé du data-journalisme en France50. Le deuxième avec Pierre Romera, 23 ans, développeur, hacker, passé au pôle data-journalisme d’OWNI, fondateur de la start-up Journalism++ avec son collègue Nicolas Kayser-Bril, et intervenant dans les écoles de journalisme (ESJ Lille, CFPJ, IEP Paris). Le troisième, téléphonique, avec Jean-Christophe 48 PINSON, SALA PALA, Art. cit. 49 KAUFMANN, Jean-Claude, L’entretien compréhensif, Paris, Nathan, 1996, p. 16. 50 « LA spécialiste française » même, aux dires d’Eric Mettout. Voir : METTOUT, Art. cit. 13
  14. 14. Féraud, journaliste économique et technologique, passé par La Tribune, l’Expansion et les Echos, aujourd’hui à Libération. « Journaliste gonzo, Twitter Addict, blogueur erratique, digitalien, Punk avec un futur51 » selon ses propres termes, il s’est fait remarquer par un billet remonté à l’encontre du data-journalisme52. Trois autres entretiens ont été mobilisés occasionnellement afin de dresser un tableau complet du data-journalisme en France. Deux sont tirés du mémoire de 4e année de Marlène Quintard53, étudiante en journalisme au CELSA. Il s’agit de Karen Bastien, ancienne journaliste à Libération, fondatrice de la start-up de visualisation de données We Do Data ; ainsi que Johan Hufnagel, journaliste web à Libération, Marianne et 20 Minutes, aujourd’hui co-fondateur et rédacteur en chef de Slate.fr. Enfin, un dernier réalisé par Yannick Estienne, chercheur en SIC à l’ESJ Lille, en la personne de Jean-Marc Manach54. Hacker, journaliste d’investigation passé au Monde Diplomatique, au Canard Enchaîné, à France Inter, France 5 et Internet Actu, il est aujourd’hui blogueur pour Le Monde et journaliste à OWNI, intervenant dans les écoles de journalisme (ESJ Lille, CFPJ, IEP Paris). Manque à ce panel un entretien avec Nicolas Kayser-Bril. Âgé de 25 ans, formé en économie des médias (IEP Lille), directeur du « pôle datajournalisme » à OWNI avant de fonder Journalism++, c’est la deuxième figure clé du data-journalisme en France55. Deux explications à ce manque : le fait qu’il réside désormais à Berlin, et le risque de faire redondance avec son collègue Pierre Romera, avec qui il travaille depuis plus de deux ans. À défaut d’entretien compréhensif, nous nous contenterons donc de ses nombreuses prises de parole dans les médias. 51 Présentation de Jean-Christophe Féraud sur : http://monecranradar.blogspot.fr/ (consulté le 31 août 2012) 52 FERAUD, Opcit. 53 QUINTARD, Marlène, Le datajournalisme, un nouveau genre journalistique. Ou comment rendre accessible une base de données complexe, Mémoire de master 1 en Journalisme, CELSA, 2012. 54 ESTIENNE, Yannick, « Evolution des pratiques journalistiques sur Internet : journalisme “augmenté”, data journalism et journalisme hacker (entretien avec Jean-Marc Manach) », Les Cahiers du journalisme, Vol. 22/23, Automne 2011, pp. 134-143. 55 « un des grands spécialistes » pour Flavien Chantrel, fondateur du Blog du Modérateur. Voir : CHANTREL, Flavien, « Le data-journalisme, enjeux et perspectives : interview de Nicolas Kayser-Bril », Le blog du modérateur, [disponible en ligne], 18 mars 2011. 14
  15. 15. Hypothèses et annonce du plan Rappelons notre problématique : comment les promesses du data-journalisme s’articulent- elles avec les repères et imaginaires du journalisme professionnel ? La réponse se fera en trois mouvements. Le premier tente de caractériser le data-journalisme. Il s’inscrit pour cela sous l’égide de la catégorie descriptive de « trivialité56 », développée par Yves Jeanneret. L’hypothèse est que l’expression a été principalement « réquisitionnée57 » par des acteurs extérieurs au journalisme (hackers, acteurs économiques). Si les pratiques journalistiques auxquelles ils se réfèrent (traitement automatisé de données, visualisation de statistiques, récit non linéaire) ne sont pas nouvelles, le choix des signifiants – en particulier le terme « data » - leur confèrent une forte connotation, autour de l’idée de richesse des données (métaphore du gisement) et d’une nécessité à agir (une bannière « data » à rejoindre). Ce caractère injonctif est confirmé par l’analyse des discours de ces mêmes acteurs. À ce stade de la réflexion, l’origine des principaux acteurs du data-journalisme soulève un premier point de tension entre data-journalisme et imaginaires du journalisme professionnel. Le deuxième mouvement poursuit cette idée, en s’efforçant d’évaluer l’effectivité des critiques adressées par certains journalistes à un journalisme centré sur le traitement de données chiffrées (prétention objectiviste, robotisation de la profession). Il y est démontré que malgré certaines tentations objectivistes indéniables, véhiculées par un amalgame fait / donnée, les promoteurs du data-journalisme sont conscients de la subjectivité de l’élaboration des données, La médiation humaine est revendiquée, afin que le traitement et la narration des données soient faits par un professionnel maîtrisant la statistique et le récit journalistique : le data-journaliste. Les imaginaires liés à « l’ordre du discours » et aux pratiques journalistiques sont donc réalisés dans ces discours d’escorte. La conclusion de ce mouvement porterait à considérer le data- journalisme se renforce d’une proximité avec les imaginaires du journalisme professionnel. 56 JEANNERET, Yves, Penser la trivialité. Volume 1 : La vie triviale des êtres culturels, Hermès-Lavoisier, coll. « Communication, médiation et construits sociaux », 2008, 266 p. 57 LABELLE, Sarah, « “La société de l’information” : Formule, récit et réquisition », in CHOUTEAU, Marianne et NGUYEN, Céline (dir.), Mises en récit de la technique, Éditions des Archives Contemporaines, 2011, pp. 33-44 15
  16. 16. Le troisième temps, centré sur le projet politique de « rénovation » du journalisme porté par les tenants du data-journalisme, mettra en exergue les altérités entre ces deux blocs théoriques. Si certaines convergences se font autour de l’actualisation de la figure démocratique du « journaliste justicier58 », les autres propositions mettent à mal les repères du journalisme professionnel. Dans le rôle social du journalisme d’abord : par l’individualisation de l’interprétation des réalisations journalistiques, les dispositifs de data-journalisme favorisent la figure de l’ « individu rationnel », maximisant ses intérêts au détriment du reste de la collectivité. Dans l’autorité de la figure du journaliste ensuite : en militant pour une mythique organisation horizontale de la société, les promoteurs du data-journalisme veulent faire du journaliste un chef de projet, maillon parmi d’autres, et comme les autres, dans la production de l’information. 58 LEMIEUX, Cyril, « Les formats de l’égalitarisme : transformations et limites de la figure du journalisme justicier dans la France contemporaine », Quaderni, n° 45, 2001, pp. 53-68. 16
  17. 17. I. Le data-journalisme comme action collective « The only new thing in the world is the history you don’t know59. » Harry S. Truman La « trivialité » selon Yves Jeanneret ne doit pas s’entendre au sens courant – « commun », « rebattu », « facile » -, mais au sens étymologique, du latin trivium, « carrefour de quatre voies60 ». C’est un endroit de circulation, où l’on choisit le chemin à suivre. Appliqué à l’étude du social, le terme devient concept, et désigne un monde en mouvement, où « les objets culturels circulent et sont réinvestis en permanence par les acteurs qui les utilisent61 ». Lorsque l’on veut caractériser le data-journalisme, l’idée de trivialité éclaire les limites d’une approche essentialiste (A), qui décrit des objets stables, universels, atemporels. Le concept est également d’une aide précieuse pour se concentrer sur les acteurs – non journalistes la plupart - qui utilisent l’expression « data-journalisme » et l’investissent de sens (B). Enfin, il permet d’étudier les connotations du signifiant « data », faux synonyme de « donnée » aux riches promesses, utilisé comme bannière par des acteurs économiques émergents (C). 59 MILLER, Merle, Plain speaking : an oral biography of Harry S. Truman, Berkeley Publishing Corporation, 1974, p. 26. 60 JEANNERET, Yves, « Figures politiques de la trivialité : le symbolique, le populaire, et le public », in Économie politique de la trivialité, organisé par CELSA, Département « Médias et Communication », Neuilly-sur-Seine, 11 octobre 2011. 61 JEANNERET, Yves, Penser la trivialité, Op. cit., p. 16. 17
  18. 18. A. Des signifiés multiples : l’impossible approche essentialiste Les entretiens conduits et l’analyse de discours ont permis de recueillir une grande variété de définitions du data-journalisme. Nous les avons regroupées en deux catégories : les approches « disciplinaires » (1) et les approches « culinaires » (2). Devant cette diversité de définitions, parfois contradictoires, il semble impossible de trouver un référent au data-journalisme. Tout juste peut-on construire un idéal-type, par définition insatisfaisant (3). 1. Les approches « disciplinaires » Ces approches situent le journalisme en relation – d’assimilation, d’inclusion ou d’exclusion – avec des disciplines supposées clairement identifiées, insistant ainsi sur la continuité avec des pratiques antérieures. Selon Pierre Romera, le data-journalisme recouvre « toutes les manières de faire du journalisme innovant62 » ; définition confirmée lorsqu’il évoque sa « start-up » : « j’ai fondé Journalism++, société spécialisée dans le data-journalisme (…) mais au sens large. On parle vraiment d’aider les médias à innover63 ». Pour son collègue Nicolas Kayser-Bril, ce serait plutôt un synonyme de « journalisme digital64 », soit toutes les possibilités pour faire du journalisme en ligne : C’est la réponse technologique à [l’arrivée d’internet] en disant : on a un nouveau canal, des nouveaux outils, des nouveaux métiers qui apparaissent, on va les utiliser pour faire du journalisme aussi. (…). On peut faire ça avec de la donnée, la dimension masse de données est extrêmement importante, mais on peut faire ça aussi avec d’autres moyens65. D’autres vont définir le terme par le regroupement de plusieurs disciplines. Les « data journalism awards »66 présentent ainsi trois catégories de prix : « data-driven investigations », « data visualisation and storytelling », « data driven applications », signifiant par là qu’il s’agit 62 Entretien avec Pierre Romera (annexe 2) 63 Ibid. 64 C’est d’ailleurs le reproche que fait Caroline Goulard à cette définition quelques minutes plus tard. 65 Intervention dans : PORTE (DE LA), Xavier, « Le “data-journalisme” ou comment faire du journalisme avec les données », France Culture, Place de la Toile, [disponible en ligne], diffusée le 14 novembre 2010. 66 Lancés cette année par le GEN (Global Editor Network), en partenariat avec l’EJC (European Journalism Center) et Google, ils récompensent les réalisations de data-journalisme les plus réussies. Voir : http://datajournalismawards.org/ (consulté le 31 août 2012) 18
  19. 19. de sous-catégories du data-journalisme. Dans un commentaire à son propre article, Caroline Goulard le situe « dans des courants comme le web sémantique, l’ouverture des données publiques, la visualisation de la complexité, la structuration de données67 ». Pierre Romera a un raisonnement similaire lorsque, plus tard dans l’entretien, il affine sa définition : Si tu veux, moi j’ai tendance à prendre le data-journalisme, et à mettre dedans : “journalisme hacker”, qui est une discipline à part entière ; “visualisation de données”, parce que c’est aussi quelque chose qui a ses codes, ses règles, avec des méthodos très particulières ; “crowdsourcing68”, c’est l’exemple que je t’ai donné avec le Guardian et les notes de frais ; et il y en a un quatrième… (silence) Oui voilà c’est tout ce dont je te parle, tout ce qui a trait à la “sécurité”, à la maîtrise de l’outil informatique69. Enfin, certains vont avoir des définitions restrictives, situant le data-journalisme au croisement de plusieurs pratiques. Aux dires de Sylvain Parasie, le data-journaliste serait ainsi un profil hybride entre journaliste et développeur. C’est le sens de ses articles sur la construction de la figure du « journaliste-programmeur » ou « journaliste “hacker” »70. Pour Caroline Goulard et Benoît Vidal, instigateurs du projet étudiant ActuVisu sur le data-journalisme, puis de la « start- up » Dataveyes, l’essence de data-journalisme serait plutôt à trouver au croisement de trois disciplines - le développement, le journalisme et le design -, comme en témoigne ce visuel. Figure 1 : Image tirée de la présentation d’ActuVisu le 1 e juillet 2010, lors du « Café Data » organisé par le Social Media Club France à la Cantine, sur le thème du « Datajournalism ». 67 En commentaire de : GOULARD, Caroline, « Ce qu’aurait pu être le Sarkomètre du Nouvel Obs », OWNI, [disponible en ligne], 10 février 2010. 68 Le « crowdsourcing », « approvisionnement par la foule » en français, désigne le phénomène d’externalisation d’une tâche à un grand nombre de personnes. 69 Entretien avec Pierre Romera (annexe 2) 70 DAGIRAL, Eric et PARASIE, Sylvain, « Portrait du journaliste en programmeur : l’émergence d’une figure de journaliste “hacker” », Les Cahiers du Journalisme, n° 22/23, 2011, pp. 144-155. 19
  20. 20. 2. Les approches « culinaires » Ces approches ont été nommées ainsi car, pour filer la métaphore culinaire, elles définissent le data-journalisme à partir de sa « cuisine », c’est-à-dire le travail de transformation d’une matière première – « les ingrédients » – en un produit fini – « le mets » - , après avoir suivi un processus de traitement– « la cuisine ». En décrivant un processus singulier, ces approches insistent sur la nouveauté du data-journalisme. Beaucoup d’acteurs partent ainsi de « l’ingrédient principal », en l’occurrence la donnée, pour caractériser le data-journalisme. Selon Karen Bastien, co-fondatrice de la « start-up » de visualisation de données We do data, « [la] matière première, au lieu d’être des heures de rushs de bandes son, des interviews ou du reportage terrain, va être de la “data”71 ». Et Jean-Marc Manach de confirmer : « au lieu de faire de l’investigation avec des témoins, des sources, des “gorges profondes”, on va faire de l’investigation avec les données 72 ». Pour pouvoir être traitées, ces données doivent être structurées et permettre une lecture automatisée 73 . Elles nécessitent même, de l’avis de Caroline Goulard, une certaine complexité pour « mériter » l’appellation « data-journalisme » : Quand OWNI fait une carte interactive où tu peux cliquer sur les régions et il y a une petite info- bulle, avec un texte, une photo et une mini vidéo, ok… La base de données derrière elle doit faire vingt lignes à tout casser : c’est pas vraiment ce que j’appelle du data-journalisme74. Certains prennent la position opposée et définissent le journalisme de données à partir du « mets ». Olivier Tredan, doctorant en SIC, estime ainsi que le data-journalisme « se singularise avant tout par la médiation d’une interface web75 ». Karen Bastien ajoute que la réalisation de data-journalisme répond d’une esthétique propre : « il faut mettre une couche de design et d’interface qui vont faire que l’objet chiffré va devenir intéressant, ludique. C’est 71 Entretien avec Karen Bastien (annexe 4) 72 Entretien avec Jean-Marc Manach (annexe 6), in ESTIENNE, Art. cit., p. 135 73 KAYSER-BRIL, Nicolas, « On l’a pas en format ordinateur », ActuVisu, [disponible en ligne], 15 décembre 2009. 74 Entretien avec Caroline Goulard (annexe 1) 75 C’est peut-être là la principale différence entre les deux exemples introductifs de ce mémoire. Voir : TREDAN, Olivier, « Quand le journalisme se saisit du web : l’exemple du datajournalism », in 1e colloque international – Les Mutations structurelles du journalisme, [disponible en ligne], Organisé par l’Université de Brasilia, Brasilia, 25-28 avril 2011, p. 2. 20
  21. 21. indispensable.76 ». On perçoit dans cette approche l’idée d’ « interactivité » : pour Alain Joannès « une visualisation labellisée data journalism doit être interactive77 ». Ce terme est entendu comme récit non-linéaire, faisant croire à l’utilisateur que c’est lui qui suscite les contenus78. Pour Johan Hufnagel, une telle personnalisation de la navigation serait parée de vertus pédagogiques : En bâtissant des interfaces graphiques pour accéder aux bases de données, le journalisme de données (...) offre aussi à l’usager la possibilité d’interroger n’importe quelle partie de cette base de données, de la rendre accessible et compréhensible instantanément : choix du zoom, délimitation de la zone géographique, sélection des dimensions comparées, personnalisation des critères de visualisation.79 Finalement, d’autres acteurs préfèrent une approche par la « cuisine », le processus de transformation en quelque sorte. Aux dires du même Johan Hufnagel, le data-journalisme se caractériserait par « du recueil et de la vérification de données, du récit, de la mise en forme80 » ; et de poursuivre « tout cela fait partie du travail journalistique81 ». Le propre de ce genre serait à trouver entre « l’ingrédient » et « le mets », dans l’angle donné au sujet : « on n’est pas dans la production d’objet où l’on ferait juste des interfaces pour des bases de données, on raconte autre chose82 ». Dans cette approche, comme dans celle par l’« ingrédient », le « mets » importe peu : Le journalisme hacker, ce sont des processus plus ou moins automatisés et du bricolage, pour aller récupérer de la donnée. Après ce [que Jean-Marc Manach] en fait ça ne va pas forcément être un graphique interactif, ça pas forcément être une “app”, ça va être tout simplement un article, où il exploite ces données, et ça il peut le faire aussi bien sur papier que sur le web. Et pourtant ça c’est du data- journalisme83. On se trouve dans une situation marquée par une multiplicité de définitions, certaines étant même contradictoires, sur l’importance du rendu final notamment. Cela rend difficile l’établissement d’un idéal-type satisfaisant. 76 Entretien avec Karen Bastien (annexe 4) 77 JOANNÈS, Alain, Data journalism. Bases de données et visualisation de l’information, Éditions du CFPJ, Décembre 2010, p. 90. 78 MITROPOULOU, Eléni, Médias, multimédia et interactivité : jeux de rôle et enjeux sémiotiques. Thèse de doctorat en sémiotique, Université de Limoges, 2007. 79 GOULARD, Caroline, « Journalisme de données », Art. cit. 80 Entretien avec Johan Hufnagel (annexe 5) 81 Ibid. 82 Entretien avec Karen Bastien (annexe 4) 83 Entretien avec Pierre Romera (annexe 2) 21
  22. 22. 3. Des idéaux-types insatisfaisants Ces deux grands types d’approche résultent d’un travail de typologie, mais on pourrait encore multiplier les définitions. Dans une démarche de transparence, le blog militant Uppecult définit « le data-journalisme [comme] le fait de contredire (ou d’approuver) les croyances ou les discours en s’appuyant sur des faits chiffrés.84 ». Dans une approche plus managériale, Caroline Goulard estime que « le journalisme de données, c’est avant tout une transformation de l’organisation85 ». Finalement, il semble impossible d’arriver à une définition satisfaisante dans le « système référentiel » (ce à quoi réfère un terme) de l’approche ontologique. La confession de Pierre Romera est sur ce point éclairante : Nicolas c’est mon associé aujourd’hui et toutes les trois semaines on essaie de trouver la bonne “baseline” pour notre boîte. En gros on cherche une nouvelle définition au data-journalisme, un truc qui corresponde vraiment à ce qu’on fait, et qui soit pérenne, qui survive un peu au “buzzword”86. Une solution consiste cependant à rechercher un idéal-type, au sens wébérien. Se fondant sur le hiatus irrationalis, ou postulat d’incomplétude, Weber affirme que « la réalité est irréductible au concept 87 », qu’elle est si complexe qu’aucune théorie ne peut l’épuiser. Cependant, cela n’empêche pas de définir des concepts hypothétiques – des idéaux-types –, à comparer avec la réalité du phénomène social étudié. Transporté à la linguistique, ce concept s’avère fécond : si aucun terme ne peut englober l’intégralité d’une idée, il est possible construire des modèles, relativement exhaustifs, se rapprochant de la vision que les acteurs s’en font. Trois travaux de recherche, entendue au sens large, peuvent être mobilisés en ce sens. Celui d’ActuVisu d’abord, projet étudiant au long-cours, dont les conclusions sont symbolisées par l’image présentée plus haut : une discipline au croisement du journalisme, du développement et du design. En entretien, Caroline Goulard précise que la « data visualisation » implique de « mobiliser de l’infographie interactive88 ». Celui de Marlène Quintard ensuite, qui, dans son mémoire, donne cinq éléments de définition : « un travail journalistique », « un travail 84 BADOUARD, Thibault, « Introduction au data-journalisme », Uppercult, [disponible en ligne], 27 février 2012. 85 Entretien avec Caroline Goulard (annexe 1) 86 Entretien avec Pierre Romera (annexe 2) 87 GONTHIER, Frédéric, « Weber et la notion de « compréhension », Cahiers internationaux de sociologie, n°116, 2004, pp. 35-54. 88 Entretien avec Caroline Goulard (annexe 1) 22
  23. 23. collectif », « des références », « la donnée comme matière première », « la visualisation et l’interactivité »89. Enfin, celui d’Olivier Tredan, qui caractérise le journalisme de données comme « une pratique fondée sur le recueil, l'analyse statistique, la visualisation de données sur Internet et leur traitement journalistique90 ». Dans chacune de ces définitions, les trois éléments des « approches culinaires » reviennent en filigrane : les bases des données comme matières premières (« l’ingrédient principal »), une pratique journalistique (« la cuisine ») et une interface web de visualisation des données, non linéaire (« le mets »), formant ainsi un idéal-type du data- journalisme. Cette multiplicité de définitions du data-journalisme, et la difficulté à élaborer un idéal- type satisfaisant montrent bien les limites d’une approche essentialiste. Comme le suggère le cadre descriptif de la trivialité, il semble plus pertinent de tenir une démarche socio-historique, et s’intéresser au type d’acteurs qui investissent l’expression de sens. B. Une expression investie et promue par des acteurs extérieurs au journalisme Il est marquant d’observer qu’à quelques exceptions près – Simon Rogers en Grande- Bretagne ou Aaron Pilhofer aux Etats-Unis - les principaux promoteurs du journalisme de données n’ont pas reçu de formation en journalisme. Effectivement, la « naissance différentielle » du data-journalisme s’est faite aux Etats-Unis sous l’impulsion de « programmeurs autodidactes, entrepreneurs du web, gestionnaires de projets web, programmeurs engagés dans les communautés du logiciel libre ou militants de l’open data 91 », mais rarement journalistes professionnels. Dans le cas français, le constat est comparable, mais les acteurs diffèrent : le terme a été « réquisitionné » principalement par des entrepreneurs du web, et non des développeurs (1). Ce concept de « réquisition » permet d’ailleurs d’observer deux traits caractéristiques du data- journalisme : une prétention abusive à la nouveauté (2) ainsi qu’une injonction à agir (3). 89 QUINTARD, Marlène, Op. cit., pp. 14-15. 90 TREDAN, Olivier, Art. cit., p. 1. 91 PARASIE, Art. cit., p. 3. 23
  24. 24. 1. En France, une « réquisition » par des entrepreneurs web Sur le web français, le tout premier article92 traitant du journalisme de données est pourtant le fait d’un journaliste professionnel : Fabrice Gonthier - formé à l’IJBA, journaliste local, et intervenant « multimédia » en écoles de journalisme (ESJ Lille puis CFPJ) -, qui s’entretient sur son blog 93 avec Nicolas Kayser-Bril. Les terminologies utilisées sont alors « database journalism » et sa traduction française littérale « journalisme de base de données ». Le post est repris dans l’article de veille hebdomadaire du site InternetActu94, sous la catégorie « données publiques », signe que le data-journalisme ne jouit pas encore d’une existence propre en France. Deux autres exemples soutiennent cette thèse. En mars 2008, Jean-Marc Manach évoque la campagne « free our data » lancée par le Guardian, sans évoquer aucun des signifiants utilisés pour caractériser le data-journalisme. Dans son mémoire de recherche de master 1, rédigé durant l’été 2009, Caroline Goulard n’utilise aucune des terminologies non plus, alors qu’un passage fait explicitement référence aux bases de données : Internet abolit les longueurs imposées par les maquettes de la presse papier, incite à écrire des articles plus courts mais autorise en revanche la publication des textes intégraux d’interviews, d’infographies interactives, de bases de données ou de documents de travail.95. En juillet 2009 toujours, un second article – intitulé « Pour un journalisme de données » -, est publié sur le tout jeune magazine en ligne, Slate96. Il est l’œuvre de Nicolas Vambremeersh, ancien blogueur politique, et dirigeant d’une agence de communication digitale, Spintank. Jusqu’en mars 2010 pourtant, la terminologie est hésitante entre « database journalism » et « data journalism » ; en témoignent le blog lancé par Caroline Goulard97 ou l’utilisation des mots-clés 92 Pour déterminer les premiers articles traitant du sujet, il a été utilisé la requête « daterange: » du moteur de recherche Google, qui permet de chercher des contenus publiés entre deux dates précises. Il est néanmoins possible que des articles antérieurs aient été dé-publiés ou soient inaccessibles, comme le blog de Nicolas Kayser-Bril, « Window on the Media ». 93 GONTIER, Fabrice, « Database journalism : “un renversement de perspective” (itw) », Esprit Blog, [disponible en ligne], 4 juillet 2009. 94 « A lire ailleurs du 22 juin au 9 juillet », InternetActu, [disponible en ligne], 10 juillet 2009. 95 GOULARD, Caroline. Mutations des entreprises de presse liées au développement de leurs activités numériques. Mémoire de master 1 en Management des organisations, Sciences Po Rennes, 2009, p. 49. 96 VAMBREMEERSH, Art. cit. 97 http://databasejournalism.wordpress.com/, lancé le 1 novembre 2009, consulté le 31 août 2012. 24
  25. 25. dans les articles d’OWNI98. Le mouvement se développe alors autour de deux pôles : ActuVisu, projet de visualisation de l’information porté par des étudiants de l’IEP de Rennes et de l’HETIC, lancé en avril 2010, et représenté par Caroline Goulard ; et OWNI, qui commence à publier des articles sur le sujet. Une convergence se fait même au sein d’OWNI entre mars et août 2010, à la faveur du lancement du « pôle datajournalisme », dirigé par Nicolas Kayser-Brill 99 ; avant qu’ActuVisu ne quitte définitivement OWNI - non sans quelques frictions - au moment du lancement de Dataveyes,. Nicolas Kayser-Brill partira lui aussi en octobre 2011, pour fonder Journalism++ avec Pierre Romera. Il semblerait que ce soit durant ce court moment de convergence que la terminologie se stabilise sur « data journalism » - malgré quelques hésitations orthographiques persistantes (cf. infra) -, et son pendant français de « journalisme de données ». Ce sont en tout cas ces deux expressions reprises par les médias pour décrire le phénomène100. Les recherches de Sarah Labelle sur « la société de l’information » sont éclairantes pour comprendre le processus d’autonomisation du data-journalisme. Comme « société de l’information », « fracture numérique » ou « développement durable101 », un terme émerge, puis s’impose, sans avoir de signification précise. Le terme est alors « réquisitionné » par un certain nombre d’acteurs – dans le cas du data-journalisme : des hackers aux Etats-Unis, des entrepreneurs du web en France -, utilisé massivement, le rendant ainsi, « incontournable ». À l’instar de « la société de l’information » (Labelle, 2001), plus qu’un matériau idéologique ordinaire, c’est un signe écrit global qui s’apparente, comme la marque, à un nom de baptême pour tout un univers (Peninou, 1971) Nous sommes dans le régime de l’“incontournable”. L’inscription est omniprésente (…) Dans cet univers de réquisition (Labelle, 2007), il est moins coûteux pour tous, militant qui défend une cause ou équipe qui engage une recherche, de prétendre œuvrer pour un réel développement durable et pour la vraie société de l’information, que de remettre en cause ces catégories102. La mobilisation de ce concept aide à penser deux caractéristiques du data-journalisme : la prétention, abusive, à une nouveauté radicale dans les pratiques journalistiques, ainsi qu’une injonction à l’action, qui masque en réalité ce flou sémantique. 98 De septembre 2009 à mars 2010, sont utilisés indifféremment les mots clés « database journalism » et « data journalism » pour qualifier les articles, avant que ce dernier ne devienne la norme. 99 GOULARD, Caroline, « La fabrique du data-journalisme », OWNI, [disponible en ligne], 20 mars 2010 ; ou KAYSER-BRIL, Nicolas, « La fabrique du data #2 », OWNI, [disponible en ligne], 25 mai 2010. 100 FANEN, Sophian, « Les journalistes à data sur les données », Libération, [disponible en ligne], 3 janvier 2012. 101 JEANNERET, Yves, « L’optique du sustainable : territoires médiatisés et savoirs visibles », Questions de communication, n°17, 2010, pp. 59-80. 102 Ibid. p. 60. 25
  26. 26. 2. Une prétention abusive à la nouveauté C’est le propre d’une expression « réquisitionnée » : pour justifier son utilisation courante, il faut considérer que tout ce qui se faisait auparavant était peut-être proche, mais d’une nature différente. Selon Philippe Breton il ne s’agit pas d’un phénomène conscient, mais de « cryptomnésie » : « nous identifions comme nouveau quelque-chose que nous connaissons déjà mais que nous avons oublié comme tel103 ». Pourtant si l’on se réfère à l’idéal-type complet du data-journalisme, défini plus haut, aucun des éléments ne semble particulièrement novateur : le travail journalistique (la « cuisine »), n’est évidemment pas inédit, mais les deux autres éléments non plus. Ainsi, le traitement de bases de données à des fins journalistiques (« l’ingrédient ») était déjà à l’œuvre dans les années 1960 aux Etats-Unis, avec le CAR (cf. supra). La filiation est 104 d’ailleurs clairement assumée . En revanche, concernant l’interface de visualisation « interactive » (le « mets »), la tentation à faire « table rase » du passé est plus prégnante. Si nul ne prétend avoir « inventé » la visualisation de statistiques, il est intéressant à ce propos de noter l’apparition du terme « dataviz », diminutif de l’anglais « data visualization », qui caractériserait « l’art d’organiser les données sous forme graphique 105 ». Signifiant intimement lié au data-journalisme par son préfixe commun, il suggère, par sa seule nouveauté, des réalisations graphiques inédites, sans doute plus créatives, plus esthétiques, plus pertinentes, en un mot plus abouties. Pourtant, les imaginaires créatifs – cartes de métro, lecture par flèches, nuages de mots – peuvent être assez redondants, et les formes graphiques – histogramme circulaire, cartogramme, cosmographe – inventées il y a parfois plusieurs siècles. Deux illustrations étayent ce propos. Premièrement, la tentative – humoristique mais signifiante - de mise en abîme de la notion de « dataviz », par la « start-up » We Do Data (annexe 7)106. Deuxièmement, l’affiche de présentation d’un concours de « dataviz » organisé par Google à l’occasion des élections présidentielles françaises de 2012 (annexe 8)107. 103 BRETON, Philippe, L’utopie de la communication : le mythe du « village planétaire », La Découverte, 2004, p.103. 104 Entretiens avec Caroline Goulard (annexe 1) et Pierre Romera (annexe 2) 105 GEVAUDAN, Camille, « Zoom sur 50 classiques de la “dataviz” », Ecrans, [disponible en ligne], 26 juin 2012. 106 « La dataviz de la dataviz », réalisée à l’occasion de l’événement « Expoviz » (annexe 7) 107 « Concours Google de dataviz » (annexe 8) 26
  27. 27. Michaël Friendly, psychologue et statisticien à l’Université de York au Canada, remet la représentation statistique dans une perspective historique de long terme108. Il montre que la plupart des inventions se sont faîtes au XIXe siècle, en particulier pendant sa seconde moitié, dans ce qu’il nomme un « âge doré109 » de la statistique graphique. Les figures clés de ce mouvement sont Charles Minard (graphique à plusieurs variables, annexe 9 110 ), Florence Nightingale (histogramme circulaire), Emile Levasseur (cartogramme), Emile Cheysson (carte en anamorphose) ou Francis Galton (concept de corrélation). Beaucoup de représentations contemporaines répandues s’inspirent ainsi de ces inventions, parfois de manière frappante (annexes 10 et 11)111. Enfin, en ce qui concerne l’ « interactivité », les promesses de personnalisation de la navigation ne sont pas si neuves non plus. Dans les années 1980, autour de l’ « invention » du lien hypertexte par Ted Nelson, l’image qui dominait était celle d’un « lecteur actif112 ». À la différence des livres traditionnels au récit linéaire, l’époque encensait le nœud, le lien, l’arborescence, le fragment ; autant de figures qui furent à la base du web tel qu’inventé par Tim Berners-Lee en 1989. La promesse était celle d’un lecteur « libre », construisant son propre parcours à l’aide de grandes arborescences. Le succès des « romans dont vous êtes le héros » dans les années 1980 et 1990 en est emblématique113. Au sujet des sites d’information en ligne, John Knox observe cette « représentation idéologique » voulant que « l’internaute [puisse] se constituer son propre chemin114 ». Il remarque pourtant que ce sont les éditeurs du site qui « déterminent le paradigme idéologique et le positionnement de chaque information à l’intérieur 108 Voir son projet « Milestrones in the history of thematic cartography, statistical graphics, and data visualization », accessible sur http://www.datavis.ca/milestones/ (consulté le 31 août 2012) 109 FRIENDLY, Michael, « The golden age of statistical graphics », Statistical Science, Vol. 23, 2008, pp. 502-535. 110 Voir notamment sa célèbre carte figurative des pertes de l’armée napoléonienne durant la campagne de Russie (annexe 9) 111 A titre d’exemple, nous comparons en annexe 10 les représentations graphiques de Charles de Fourcroy (1782) et de Guardian (2011), et en annexe 11 les histogrammes circulaires de Florence Nightingale (1857) et d’ActuVisu (2010) 112 JEANNERET, Yves, « Entre héritages et ruptures, la dynamique de l’obsolescence», in Économie politique de la trivialité, organisé par CELSA, Département « Médias et Communication », Neuilly-sur-Seine, 8 novembre 2011. 113 GANTIER, BOLKA, « L’expérience immersive du web documentaire : études de cas et pistes de réflexion », Les Cahiers du journalisme, n° 22/23 – automne 2011, p. 127. 114 DAGIRAL, Eric et PARASIE, Sylvain, « Presse en ligne : où en est la recherche ? », Réseaux, n° 160-161, 2010/2, p. 23. 27
  28. 28. de celui-ci115 ». Encadré par les dispositifs techno-sémiotiques, le lecteur n’est donc pas si « libre » qu’il y paraît. En somme, aucun des éléments de l’idéal-type ne relève d’un changement de nature par rapport à des pratiques antérieures. Même en combinant les trois – donnée comme matière première, travail journalistique, interface web de visualisation non-linéaire -, il existe des exemples antérieurs à l’apparition du terme « data-journalisme », les représentations d’assemblées par groupes politiques après une élection par exemple, où l’utilisateur pouvait naviguer entre différents scrutins. 3. Une injonction à agir Si les discours d’escorte des termes « réquisitionnés » réactualisent des promesses anciennes, ils sont également caractérisés par le mode de l’injonction : à l’instar du phénomène d’ « open data »116, on ne sait pas très bien ce que c’est, mais « il faut y aller ». Dans l’incapacité de définir précisément l’objet, la rhétorique se fait impérative, et impose le terme en soulignant sa nécessité. « Pour un journalisme de données117 », « Assez d’articles, on veut des contenus ! 118 » : les titres utilisant ce registre sont courants au moment où l’expression « data journalisme » fait son apparition en France. Le tableau ne serait pas complet sans mentionner le texte d’Adrian Holovaty « A fundamental way newspapers need to change119 », écrit en 2006, et considéré par beaucoup de commentateurs comme le « manifeste » du data-journalisme, soit le texte fondateur d’un mouvement. 115 KNOX, John, « Visual-verbal communication on online newspaper home pages », Visual communication, vol. 6(1), 2007, p. 47. Cité et traduit in : DAGIRAL, PARASIE, Ibid. 116 L’injonction est même plus forte encore dans le cas de l’open data, le signifiant « open » étant conjugué impératif. Voir GOETA, Samuel, Open data : qu’ouvre-t-on avec les données publiques ?, Mémoire de master 2 en Sciences de l’Information et de la Communication, CELSA, 2011, pp. 10-11. 117 VAMBREMEERSCH, Art. cit. 118 GOULARD, Caroline, « Assez d’articles, on veut des contenus ! », OWNI, [disponible en ligne], 17 novembre 2009 ; reproduction de l’article originel GOULARD, Caroline, « Le database journalism pour nous sauver du “frogboiling” », Database journalism, [disponible en ligne], 10 novembre 2009. 119 HOLOVATY, Adrian, Art. cit. 28
  29. 29. La filiation suggérée par le terme est pertinente ici : tout comme le mouvement du logiciel libre, regroupé autour de la « figure emblématique120 » de Richard Stallman et du projet GNU, on peut dire que le mouvement du data-journalisme s’est organisé autour d’une personne - Adrian Holovaty – et de son texte de 2006. L’article de Caroline Goulard, renommé par OWNI « assez d’articles, on veut des contenus ! », paraphrasant ainsi la dernière phrase, était initialement intitulé « le database journalism pour nous sauver du frogboiling 121 ». Or ce titre, en plus d’utiliser le registre de la salvation, fait explicitement référence à l’argumentaire d’Adrian Holovaty dans son « manifeste ». Par cette répétition de l’argumentaire, les militants français se font « apôtres122 », diffusant la « parole122 » du data-journalisme. La métaphore religieuse est d’ailleurs très présente dans les discours d’accompagnement : on ne compte plus les « pape123 », « bible124 » ou « voies125 » en matière de data-journalisme. Le rapport sacré au data-journalisme est doublé d’une prétention d’inéluctabilité. Dans cette vision, rien de sert de lutter : le journalisme de données représente « l’avenir en marche126 ». La question n’est plus de discuter l’opportunité pour les rédactions de lancer des projets dans cette direction, mais de se demander « pourquoi les médias français se s’y mettent pas127 », alors que « quelques grands exemples anglo-saxons ont clairement montré la voie 128 ». Beaucoup d’articles sur le sujet dissertent ainsi autour du supposé « retard129 » de la France par rapport à ces pays. Ce type de discours d’accompagnement a été mis en perspective par les travaux de Julie 120 PROULX, Serge, « Les militants du code : la construction d’une culture technique alternative », in Le logiciel libre en tant que modèle d’innovation socio-technique. Pratique et développement de coopération dans les communautés, [disponible en ligne], Congrès de l’ACFAS, Université Mc Gill, Montréal, 16 mai 2006, p. 3. 121 Le « frogboiling » correspond à une légende selon laquelle si une grenouille entre dans une casserole d’eau bouillante, elle en sort immédiatement, consciente du danger. En revanche, si cette même grenouille rentre dans une casserole d’eau froide chauffée progressivement, elle ne sortira jamais et mourra de chaleur. Par analogie, on comprend que le journalisme traditionnel ne s’intéresserait qu’aux événements extraordinaires – un incendie mortel par exemple -, alors que le journalisme de données mettrait en perspective sur du long terme – disons les coupures budgétaires chez les pompiers -, jouant le rôle de lanceur d’alerte en cas de dégradation avancée d’une situation. 122 ROMERA, Pierre, « Le data-journalism notre religion », OWNI, [disponible en ligne], 30 août 2011. 123 FANEN, « Le journalisme à data sur les données », Art. cit. 124 LEDUC, Caroline, « Le data journalisme a désormais sa bible », Journalismes, [disponible en ligne], 5 décembre 2010. 125 GOULARD, Caroline, « Les quatre voies du datajournalism », OWNI, [disponible en ligne], 7 avril 2010. 126 METTOUT, Art. cit. 127 GOULARD, Caroline, « Data journalism : pourquoi les médias français ne s’y mettent pas ? », OWNI, [disponible en ligne], 8 mars 2010. 128 Entretien avec Caroline Goulard (annexe 1) 129 CASTELLI, Elodie, « Le data-journalisme peine à se développer en France », Journalismes, [disponible en ligne], le 24 janvier 2010. 29
  30. 30. Bouchard sur « le retard français130 ». Elle montre que ces discours sont fondés sur l’angoisse et qu’ils ne peuvent être remis en cause : lorsque l’on est dans l’urgence il est trop tard pour réfléchir. Derrière, on perçoit un discours de type consultant, qui essaie de vendre un produit à un dirigeant, pour « ne pas être à la traîne ». Une mise en perspective stimulante dès lors que les principaux promoteurs français sont aujourd’hui dirigeants de « start-up ». La mobilisation du concept de « réquisition » a permis de porter notre attention sur les acteurs de ce que l’on peut désormais appeler le « mouvement » du data-journalisme, dans une dimension socio-historique et communicationnelle. Dans une approche en termes de trivialité, il convient désormais de s’attacher plus en détail les des connotations signifiants choisis pour évoquer le data-journalisme. C. Une dé-ontologie du data-journalisme : les riches connotations du mot « data » Peut être encore plus que pour le « journalisme » (cf. supra), réaliser une « dé- ontologie 131 » du « data-journalisme », et donc se concentrer sur les signifiants, s’avère indispensable à l’analyse. En étudiant les médias informatisés, Yves Jeanneret remarque ainsi que « le discours (…) est présent d’emblée dans la désignation des objets qu’il est censé accompagner », dans la mesure où « l'imaginaire contenu dans les mots et les images fait davantage qu'accompagner les objets, il les constitue132 ». En partant de ce postulat, on remarque que les terminologies utilisées en France pour désigner le data-journalisme sont fortement connotées. A l’inverse des expressions utilisées outre-Atlantique, elles orientent le regard sur les données (1), et suggèrent dans le même temps un sentiment de multitude, de foisonnement (2) ainsi que l’appartenance à un mouvement plus large, regroupé sous une bannière « data » (3). 130 BOUCHARD, Julie, Comment le retard vient aux Français. Analyse d’un discours sur la recherche, l’innovation et la compétitivité 1940-1970, Septentrion, 2008, 328 p. 131 RASTIER, Art. cit. 132 JEANNERET, Yves, « Autre chose qu’un discours, davantage qu’un accompagnement, mieux qu’une résistance », in La communication entre libéralisme et démocratie, Terminal, n° 75, été 2011, L’Harmattan, pp. 107- 117. 30
  31. 31. 1. La « data » au cœur de la terminologie française Les expressions employées pour qualifier le data-journalisme sont extrêmement nombreuses : « data journalism », bien sûr, mais également « database journalism », « hacker 133 journalism » et leurs déclinaisons françaises respectives , ainsi que « data-driven journalism134 », « computational journalism 135 », ou encore « programmer-journalism 136». Ces différentes terminologies partagent beaucoup de références et de pratiques mais « ne mettent pas exactement l’accent sur les mêmes éléments137 ». Certaines mettent ainsi l’accent sur les outils utilisés. C’est le cas de « computational journalism », qui insiste le rôle de l’informatique, mais également « data-driven journalism » par une référence aux logiciels de traitement de données : "Data driven” était plus intéressant par rapport aux technos notamment. Par exemple en visualisation de données, on utilise beaucoup une librairie en Javascript qui s’appelle D3js pour “data driven documents”, donc “data driven documents”, “data driven journalism” : je pense que ce n’est pas anodin138. Mais le plus marquant est l’opposition entre les terminologies utilisées uniquement dans le monde anglo-saxon – « programmer journalism » et « hacker journalism » -, et celles plébiscitées en France – « database journalism » puis « data journalism », ainsi que leurs traductions littérales. Les premières insistent sur « une figure d’acteurs étrangère aux salles de rédactions139 », mettant en exergue le brouillage des identités professionnelles du métier de journaliste. Les secondes mettent au contraire l’accent sur les données, faisant miroiter les perspectives journalistiques – entendu ici au sens de pratiques propres - d’un champ encore relativement vierge. 133 PARASIE, Art. cit. 134 DAGIRAL, Eric et PARASIE, Sylvain, « Data-driven journalism and the public good : “Computer Assisted Reporters and “programmer-journalists” in Chicago », à paraître. 135 COHEN, Sarah, HAMILTON, James et TURNER, Fred, « Computational journalism », Communication of the ACM, Vol. 54, n° 10, pp. 66-71. 136 BETANCOURT, Leah, « How Programmer-Journalists are changing the news », Mashable, [disponible en ligne], 11 décembre 2009. 137 DAGIRAL, PARASIE, « Portrait du journaliste en programmeur : l’émergence d’une figure de journaliste “hacker” », Art. cit., p. 144. 138 Entretien avec Caroline Goulard (annexe 1) 139 DAGIRAL, PARASIE, « Portrait du journaliste en programmeur : l’émergence d’une figure de journaliste “hacker” », Art. cit., p. 144. 31
  32. 32. La connotation est plus fine encore : ce ne sont pas tant les « données » que ces terminologies évoquent mais plus précisément la « data ». Il est ainsi significatif de voir que les promoteurs français du data-journalisme, non contents de choisir les expressions relatives aux données, ont parfois préféré franciser la terminologie anglaise plutôt que de la traduire littéralement. Ainsi, à côté des « datajournalism » et « data journalism », coexistent aujourd’hui les orthographes « datajournalisme », « data journalisme » et « data-journalisme ». Par la terminaison « -isme », et l’ajout d’un tiret, l’expression prend une tonalité toute autre, plus française, et naturalise ainsi son existence : il est à l’oreille moins perturbant d’entendre « data-journalisme » que « datajournalism140 ». La nuance peut paraître marginale au premier regard ; elle devient très signifiante au second. Un détour par l’étymologie permet de l’expliciter. 2. Un sentiment de multitude Dans un article de 2005141, traduit récemment en français142, Norman Gray, astronome de l’université de Glasgow, propose de relire le sens du mot « data » à la faveur des usages de la langue. L’origine étymologique du terme est latine : « datum » est le participe passé neutre singulier du verbe « dare », « donner », également utilisé comme nom commun – « une chose donnée ». « Data » correspondant au pluriel. Il est employé en anglais dans ce sens mais, à l’instar de « media » ou « agenda », s’impose à l’usage comme un singulier, jusqu’à ce que « datum » disparaisse purement et simplement. Dans cet usage, « data » ne peut désormais plus être simplement le pluriel de « datum » : Privé d'ancrage, il s'est éloigné de ce simple sens dérivé pour un sens en soi distinct et indépendant. Il a alors construit des règles d'usage pour lui-même, sans être entravé par son passé latin. (…) Data ne signifie plus juste une (foutu) [sic] datum après une autre. (…) Cette acception universelle de data comme mesurable plutôt que comptable met sans ambiguïté le mot dans la même catégorie grammaticale que le "charbon", le "blé" ou le "minerai", qui est celle des noms de masse ou d'agrégat143. La distinction anglaise entre « how much » (« quelle quantité de ») et « how many » (« quel nombre de »), rend bien compte de cette distinction. Cette subtilité syntaxique est 140 À prononcer avec une terminaison anglaise. 141 GRAY, Norman, « Data is a singular noun », [disponible en ligne], 2 janvier 2005. 142 SALAUN, Jean-Michel, « Singulière data », [disponible en ligne], 10 avril 2012. 143 Ibid. Traduction de GRAY, Art. cit. 32
  33. 33. masquée par l’adverbe interrogatif « combien », traduisant indifféremment la quantité et le nombre en français. Or la traduction en « données » reproduit l'emploi originel du terme : il est tout à fait possible en français d’additionner, compter, dénombrer des données ; on ne les considère pas comme un bloc indivisible. On comprend dès lors la nuance à la réquisition du terme « data » plutôt que « données ». Alors que « la donnée » se représente facilement au singulier, - la donnée d’un problème, la donnée du jour -, cela semble inconcevable, grammaticalement incorrect, pour « la data » : lorsque l’on parle de « la data », on évoque un agrégat d’éléments insécables. En utilisant ainsi un nom singulier figurant pour un tout, on signifie automatiquement la multitude, la profusion, la masse. Johan Hufnagel, non sans quelques hésitations syntaxiques, abonde dans ce sens : « pour moi le data c’est le recueil et le traitement de données massives (…) quand je parle de data, je fais la différence entre le data et l’infographie, les datas c’est vraiment des données massives. C’est un traitement de plusieurs centaines voire milliers de données144 ».   Figure 3 : Capture d’une présentation de Figure 2 : Couverture de The Economist, Dataveyes intitulée « transformation de notre semaine du 27 février au 5 mars 2010 paysage informationnel & journalisme de données » 144 Entretien avec Johan Hufnagel (annexe 5), in QUINTARD, Op. cit. 33
  34. 34. Le  sentiment  est  renforcé  par  la  métaphore  –  très  présente  -­‐,  du  «  déluge  »145  :  pour   Karen   Bastien   «  la   data,   qui   était   en   petite   quantité   jusqu’ici,   arrive   par   flux,   par   trombe   d’eau146  ».  Elle  suggère  la  surabondance,  l’envahissement  de  l’espace  personnel  par  un  amas   de  données,  mais  également,  par  le  choix  d’un  terme  apocalyptique,  un  univers  menaçant,   incontrôlable,   confirmant   ainsi   la   manipulation   du   registre   de   l’angoisse147 .   Mais   plus   encore  que  le  data-­‐journalisme,  cet  imaginaire  sied  au  «  Big  Data148  »,  signe  que  toutes  les   expressions  composées  par  le  «  data  »  se  répondent,  dans  un  univers  sémantique  commun.   3. Le rattachement à une bannière « data » Saussure, fondamentalement opposé à l’approche classique de la grammaire, selon laquelle un mot correspond à une chose du monde, avait posé l’idée que les mots n’ont de sens que de manière négative, par opposition les uns avec les autres. Ils signifient « par ce qu’ils ne sont pas », dans la mesure où chaque mot a au moins un élément de différence avec un autre. François Rastier pousse la réflexion à son terme, et affirme que le langage se caractérise par un « système différentiel d’oppositions et non un codage d’identités référentielles149 ». Dès lors, « data-journalisme », à la différence du « journalisme de données », s’enrichit du sens des autres expressions francisées partageant le terme « data » : « le Big Data », « l’open data », « la dataviz », « le data mining ». Passons en revue leurs différentes connotations. Par l'adjonction d’un adjectif représentant la grandeur – alors que « data » le suggère déjà -, et le choix de majuscules, « Big Data » se place dans un registre pléonastique, signifiant plus fortement encore ce sentiment de multitude. Le terme « open data » évoque lui une triple signification : une transparence politique, un mouvement social et une injonction150. « Dataviz » figure plutôt les réalisations, le « mets », en mettant l’accent sur la mobilisation d’une « narration 145 BAYET, Antoine et DUCHAMP, Agathe, « Les nouveaux habits du journalisme dans le monde du déluge des données », Regards Sur Le Numérique, [disponible en ligne], 10 mars 2011. 146 Entretien avec Karen Bastien (annexe 4) 147 BOUCHARD, Opcit. 148 GUILLAUD, Hubert, « Big data : les progrès de l’analyse de données », Internet Actu, [disponible en ligne], 3 octobre 2011. 149 RASTIER, François, « Le silence de Saussure ou l’ontologie refusée », in BOUQUET, Simon, Saussure, L’Herne, 2003, p. 26. 150 GOETA, Opcit., pp. 10-11. 34
  35. 35. visuelle151 », plutôt qu’une « narration verbale151 », assimilée au journalisme traditionnel. Quant à « data mining », il procède sans équivoque de la métaphore du gisement, d’une richesse enfouie à aller déterrer. Le « data-journalisme », bien plus que le « journalisme de données » se renforce de toutes ces connotations. En témoigne cette très longue citation de Caroline Goulard : En fait ça a un sens parce que le mot “data” ce n’est pas uniquement la version anglaise de “donnée”. Quand on utilise le mot data en Français, de plus en plus c’est pour parler des données un peu “nouvelle génération”, parce tu as “Big Data”, “open data”, “data-vizualization”, “data-journalisme”. Parfois les gens en Français, ils vont dire “on a de la data”, pourquoi il ne disent pas “on a de la donnée” ? Le sous entendu pour moi là-dedans, c’est que quand tu parles de la data, tu as des données riches, volumineuses, en temps réel, profondes, tu es au dessus de la donnée. La donnée, c’est la « business intelligence » à l’ancienne, c’est les données pas valorisées, considérées comme des résidus de l’activité de l’entreprise. Aujourd’hui quand tu parles de data, c’est du volume, de la profondeur, de la richesse, de l’intelligence, du “Big Data”… C’est marrant d’ailleurs, parce qu’un truc comme le “data Tuesday” c’est un rassemblement tous les 1e mardi du mois. Tu as des gens qui viennent du “Big Data”, de “l’open data”, et de la visualisation, data-journalisme, et tu retrouves pas du tout les gens de la BI [Business Intelligence]. Eux ils ont un groupe dont j’ai oublié le nom. Et là c’est des vieux de la BI qui se disent comment on va mieux faire nos camemberts, c’est un peu la “BI à la papa” qu’il faut quand même renouveler un peu, mais dans une approche radicalement différente de ceux qui travaillent sur la data. Eux ils travaillent sur la donnée, ça va être des grands relecteurs de Tukey. Mais ça incarne des approches différentes (…) Je dirai qu’il y une différence générationnelle, pas forcément au niveau des personnes, mais au niveau des boîtes derrière152. L’idée centrale ici est celle de « données nouvelle génération », affublées de toute une séries de qualités - « volume », « profondeur », « intelligence », « richesse » -, qui, par négation, permettent de caractériser les données « ancienne génération ». Entre les lignes, on lit ainsi une volonté de se défaire des représentations statistiques classiques, représentées par l’image du « camembert » et la figure du statisticien John Tukey 153 . Mais on comprend que le renouvellement « générationnel » se fait surtout au niveau des personnes et institutions qui promeuvent la « data ». Comme le suggérait Samuel Goëta dans son analyse de l’ « open data », on se trouve face à un « mouvement social », entendu ici au sens d’ « action collective » ou « action commune ayant pour fin d’atteindre des fins partagées154 ». Ce mouvement dispose de ses lieux de rencontre – les « data Tuesday » organisées par les « start-up » Data Publica, Captain 151 THIBAUT, Nirina, « Datajournalism : les chiffres nous parlent, écoutons les ! », YCAW, [disponible en ligne], 6 juillet 2010. 152 Entretien avec Caroline Goulard (annexe 1) 153 Grand statisticien du XXe siècle, John Tukey est renommé pour ses découvertes en mathématiques algorithmiques (transformée de Fourier rapide, etc.) et en représentations graphiques de statistiques (diagramme en boîte ou « boîte à moustache, etc.) 154 MANN, Patrice, L’action collective. Mobilisation et organisation des minorités actives, Armand Colin, 1991, coll. « U Sociologie », p. 20. 35
  36. 36. Dash et MFG Labs155 ou les éphémères « cafés data » du Social Media Club France (cf. supra) -, et de ses références propres, à l’esthétique plus « sexy156 » – David Mc Candless, Manuel Lima, Hans Rosling ou Nathan Yau 157 . Il est principalement porté par des acteurs économiques émergents, qui, pour différencier leur offre d’autres entreprises déjà implantées, manipulent un double registre d’angoisse – le déluge, l’absence de contrôle -, et d’espoir – la richesse, l’intelligence, la créativité. C’est sous l’angle de cette action collective, de cette bannière identitaire « data » que doit aussi se comprendre le data-journalisme. Sous l’égide de la catégorie descriptive de trivialité, ce premier mouvement a permis de se détacher d’une approche ontologique, rendue de toute manière impossible par la variété des définitions récoltées. Par une analyse successive du discours des acteurs ayant installé l’expression dans le paysage français, puis des connotations du terme « data-journalisme », il a été possible de rattacher l’objet de recherche à une bannière plus large de la « data », décrivant une situation, prétendument neuve, marquée les métaphores contradictoires de l’agrégat (multitude, indivisibilité, danger) et de gisement (rareté, granularité, richesse). Ce double discours d’angoisse et d’espoir, mobilisé autour d’une bannière commune, permet à ces acteurs de pousser les rédactions à l’action. Il apporte ainsi des premiers éléments de réponse à la question de la compatibilité entre promesses du data-journalisme et imaginaires du journalisme, par la nature des promoteurs - non- journalistes -, et des discours tenus, parfois plus commerciaux que journalistiques. Il convient cependant de poursuivre la réflexion en examinant la critique « subjectiviste » adressée au data- journalisme. Si l’idéal-type défini plus haut encourage à penser qu’une médiation journalistique est nécessaire, la prétention de certains à un journalisme « objectif » invite à étudier cette question en profondeur. 155 DESAUTEZ, Ludovic, « “Data Tuesday”, c’est parti », Les Echos, [disponible en ligne], 6 novembre 2011. 156 DESAUTEZ, Ludovic, « Avec le 1e “data Tuesday”, la data se fait plus “sexy” », Les Echos, [disponible en ligne], 17 novembre 2011. 157 SCHERER, Eric, « Données publiques et journalisme : une mine de richesses ! », OWNI, [disponible en ligne], 7 juillet 2010. 36

×