La base de données
du journalisme de données
Le site projetjourdain.org

mercredi 16 octobre 13
Prologue

mercredi 16 octobre 13
Une optique communicationelle
Social

Technique

Sémiotique

« les sciences de l’information et de la communication n’étud...
Une double articulation
Analyser le journalisme de données avec et par
les outils du journalisme de données :

mercredi 16...
Une double articulation
Analyser le journalisme de données avec et par
les outils du journalisme de données :

• Le journa...
Une double articulation
Analyser le journalisme de données avec et par
les outils du journalisme de données :

• Le journa...
Structure de la
représentation
I. Le théâtre
II. Les coulisses
III. La mise en scène

mercredi 16 octobre 13
Le Théâtre

mercredi 16 octobre 13
Data ♥ Journalism
A Love Story

Cours van Negotie, publié à
Amsterdam depuis 1609
mercredi 16 octobre 13

Exemple d’une fe...
Data ♥ Journalism
A Love Story

La presse occidentale succombe
à une fièvre statistique (tipsterism) à partir de 1830.
merc...
Data ♥ Journalism
A Love Story

Le Computer Assisted Reporting apparaît
dès le début des années 1950 aux États-Unis.
mercr...
Des apports inédits

L’extension de la frontière professionnelle

C’est important que nous soyons assis dans la salle de
r...
Des apports inédits
Une démocratisation des outils

Les journalistes peuvent aisément accéder à des outils
jusqu’alors rés...
Des apports inédits
Un nouveau regard critique

J’ai pris conscience, avec mes modestes moyens, de ce que les chercheurs
e...
Les Coulisses

mercredi 16 octobre 13
Construire la donnée

≠
Une donnée « brute » ?
mercredi 16 octobre 13

Une donnée « construite »
Rechercher les données
La phase la plus journalistique :

Recherche

mercredi 16 octobre 13
Rechercher les données
La phase la plus journalistique :

• Utilisation des procédés classiques du
journalisme d’investiga...
Rechercher les données
La phase la plus journalistique :

• Utilisation des procédés classiques du
journalisme d’investiga...
En quête d’un critère…

À ce jour, il n’existe aucun diplôme de datajournaliste.
mercredi 16 octobre 13
Recourir à des détours

mercredi 16 octobre 13
Le Data Journalism Handbook

Publié en 2012, The Data Journalism Handbook constitue
la principale référence sur le data jo...
Le Data Journalism Handbook

Publié en 2012, The Data Journalism Handbook constitue
la principale référence sur le data jo...
Le Data Journalism Handbook

Publié en 2012, The Data Journalism Handbook constitue
la principale référence sur le data jo...
Le Data Journalism Handbook

Publié en 2012, The Data Journalism Handbook constitue
la principale référence sur le data jo...
Recueillir des données
Trois types de recueil :

Recueil

mercredi 16 octobre 13
Recueillir des données
Trois types de recueil :

• Réutilisation de jeux de données déjà
formatés.

Recueil

mercredi 16 o...
Recueillir des données
Trois types de recueil :

• Réutilisation de jeux de données déjà
formatés.
• Recueil manuel.

Recu...
Recueillir des données
Trois types de recueil :

• Réutilisation de jeux de données déjà
formatés.
• Recueil manuel.
• Rec...
Le scraping

Exploiter l’architecture des pages web
mercredi 16 octobre 13
Utiliser un code d’extraction

Exemple de la bibliothèque BeautifulSoup de Python
mercredi 16 octobre 13
Le résultat final

mercredi 16 octobre 13
Classer les données
Phase très complexe :

Classement

mercredi 16 octobre 13
Classer les données
Phase très complexe :

• Définition d’un système de rangement
adapté.

Classement

mercredi 16 octobre ...
Classer les données
Phase très complexe :

• Définition d’un système de rangement
adapté.
• Prise en compte des relations
é...
Des relations élaborées
Le datajournalisme constitue un objet d’étude complexe :
•Une organisation peut employer plusieurs...
Une architecture
en trois dimensions

x

mercredi 16 octobre 13
Une architecture
en trois dimensions

x

mercredi 16 octobre 13
Une architecture
en trois dimensions

x

mercredi 16 octobre 13
Une architecture
en trois dimensions
y

x

mercredi 16 octobre 13
Une architecture
en trois dimensions
y

x

mercredi 16 octobre 13
Une architecture
en trois dimensions
y

x

mercredi 16 octobre 13
Une architecture
en trois dimensions
y

x

mercredi 16 octobre 13

z
Lier les bases

mercredi 16 octobre 13
Lier les bases

Table
Noms

mercredi 16 octobre 13

Table
Organisations
Analyser la donnée
Un tout autre regard : la pensée statistique
Analyse

mercredi 16 octobre 13
Analyser la donnée
Un tout autre regard : la pensée statistique

• Transformation des données en
connaissances.

mercredi ...
Analyser la donnée
Un tout autre regard : la pensée statistique

• Transformation des données en
connaissances.

• Croisem...
Visualiser
À quoi sert une visualisation ?

mercredi 16 octobre 13

Visualiser
Visualiser
À quoi sert une visualisation ?

• Création d’une représentation simple
et circulante des résultats obtenus.

m...
Visualiser
À quoi sert une visualisation ?

• Création d’une représentation simple
et circulante des résultats obtenus.

•...
Simplicité

Les outils

D3.JS
Flexibilité
mercredi 16 octobre 13
Une polyphonie énonciative

Données
(format JSON)

Bibliothèque
Infovis

Formatage CSS
mercredi 16 octobre 13

Configuratio...
Un exemple
Les datajournalistes français

mercredi 16 octobre 13
Publier
Les problématiques de la publication

mercredi 16 octobre 13

Publier
Publier
Les problématiques de la publication

• Réinscription des résultats dans une
nouvelle structure informationnelle

...
Publier
Les problématiques de la publication

• Réinscription des résultats dans une
nouvelle structure informationnelle

...
La Scène

mercredi 16 octobre 13
Un projet de recherche

mercredi 16 octobre 13
Un projet de recherche

mercredi 16 octobre 13
Un projet de recherche

mercredi 16 octobre 13
Des jeux de données

mercredi 16 octobre 13
Des jeux de données

mercredi 16 octobre 13
Des jeux de données

mercredi 16 octobre 13
Des analyses composites

Croiser du texte, des jeux de données…
mercredi 16 octobre 13
Des analyses composites

…des cartes…
mercredi 16 octobre 13
Des analyses composites

et des schémas.
mercredi 16 octobre 13
Épilogue

mercredi 16 octobre 13
Prochain SlideShare
Chargement dans…5
×

projetjourdain.org — A Database of Data Journalism

540 vues

Publié le

Presentation of the website projetjourdain.org, that hosts the database of the jourdain project.

Publié dans : Formation
0 commentaire
1 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
540
Sur SlideShare
0
Issues des intégrations
0
Intégrations
12
Actions
Partages
0
Téléchargements
9
Commentaires
0
J’aime
1
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

projetjourdain.org — A Database of Data Journalism

  1. 1. La base de données du journalisme de données Le site projetjourdain.org mercredi 16 octobre 13
  2. 2. Prologue mercredi 16 octobre 13
  3. 3. Une optique communicationelle Social Technique Sémiotique « les sciences de l’information et de la communication n’étudient jamais la communication et l’information en elles-mêmes ou pour elles-mêmes, c’est-à-dire comme des êtres abstraits (elles seraient alors une idéologie), mais bien en tant qu’elles sont matérialisées, institutionnalisées et opérationalisées dans la société. » — Jean Davallon mercredi 16 octobre 13
  4. 4. Une double articulation Analyser le journalisme de données avec et par les outils du journalisme de données : mercredi 16 octobre 13
  5. 5. Une double articulation Analyser le journalisme de données avec et par les outils du journalisme de données : • Le journalisme de données comme phénomène : l’émergence d’une nouvelle conception de la profession journalistique ? mercredi 16 octobre 13
  6. 6. Une double articulation Analyser le journalisme de données avec et par les outils du journalisme de données : • Le journalisme de données comme phénomène : l’émergence d’une nouvelle conception de la profession journalistique ? • Le journalisme de données comme processus : un système inédit de production de l’information journalistique ? mercredi 16 octobre 13
  7. 7. Structure de la représentation I. Le théâtre II. Les coulisses III. La mise en scène mercredi 16 octobre 13
  8. 8. Le Théâtre mercredi 16 octobre 13
  9. 9. Data ♥ Journalism A Love Story Cours van Negotie, publié à Amsterdam depuis 1609 mercredi 16 octobre 13 Exemple d’une feuille d’avis publiée en 1757
  10. 10. Data ♥ Journalism A Love Story La presse occidentale succombe à une fièvre statistique (tipsterism) à partir de 1830. mercredi 16 octobre 13
  11. 11. Data ♥ Journalism A Love Story Le Computer Assisted Reporting apparaît dès le début des années 1950 aux États-Unis. mercredi 16 octobre 13
  12. 12. Des apports inédits L’extension de la frontière professionnelle C’est important que nous soyons assis dans la salle de rédaction. Le contenu de notre travail dépend habituellement de conversations en face-à-face avec les reporters. — Brian Boyer, The Data Journalism Handbook mercredi 16 octobre 13
  13. 13. Des apports inédits Une démocratisation des outils Les journalistes peuvent aisément accéder à des outils jusqu’alors réservés aux professionnels : bases de données relationnelles, langages d’analyse statistique… mercredi 16 octobre 13
  14. 14. Des apports inédits Un nouveau regard critique J’ai pris conscience, avec mes modestes moyens, de ce que les chercheurs en sciences sociales savent depuis fort longtemps : il n’y a pas plus de fait brut que de données brutes. — Simon Chignard mercredi 16 octobre 13
  15. 15. Les Coulisses mercredi 16 octobre 13
  16. 16. Construire la donnée ≠ Une donnée « brute » ? mercredi 16 octobre 13 Une donnée « construite »
  17. 17. Rechercher les données La phase la plus journalistique : Recherche mercredi 16 octobre 13
  18. 18. Rechercher les données La phase la plus journalistique : • Utilisation des procédés classiques du journalisme d’investigation Recherche mercredi 16 octobre 13
  19. 19. Rechercher les données La phase la plus journalistique : • Utilisation des procédés classiques du journalisme d’investigation • Recours au croisement des sources existantes. Recherche mercredi 16 octobre 13
  20. 20. En quête d’un critère… À ce jour, il n’existe aucun diplôme de datajournaliste. mercredi 16 octobre 13
  21. 21. Recourir à des détours mercredi 16 octobre 13
  22. 22. Le Data Journalism Handbook Publié en 2012, The Data Journalism Handbook constitue la principale référence sur le data journalisme. mercredi 16 octobre 13
  23. 23. Le Data Journalism Handbook Publié en 2012, The Data Journalism Handbook constitue la principale référence sur le data journalisme. mercredi 16 octobre 13
  24. 24. Le Data Journalism Handbook Publié en 2012, The Data Journalism Handbook constitue la principale référence sur le data journalisme. mercredi 16 octobre 13
  25. 25. Le Data Journalism Handbook Publié en 2012, The Data Journalism Handbook constitue la principale référence sur le data journalisme. mercredi 16 octobre 13
  26. 26. Recueillir des données Trois types de recueil : Recueil mercredi 16 octobre 13
  27. 27. Recueillir des données Trois types de recueil : • Réutilisation de jeux de données déjà formatés. Recueil mercredi 16 octobre 13
  28. 28. Recueillir des données Trois types de recueil : • Réutilisation de jeux de données déjà formatés. • Recueil manuel. Recueil mercredi 16 octobre 13
  29. 29. Recueillir des données Trois types de recueil : • Réutilisation de jeux de données déjà formatés. • Recueil manuel. • Recueil automatisé (ou scraping) Recueil mercredi 16 octobre 13
  30. 30. Le scraping Exploiter l’architecture des pages web mercredi 16 octobre 13
  31. 31. Utiliser un code d’extraction Exemple de la bibliothèque BeautifulSoup de Python mercredi 16 octobre 13
  32. 32. Le résultat final mercredi 16 octobre 13
  33. 33. Classer les données Phase très complexe : Classement mercredi 16 octobre 13
  34. 34. Classer les données Phase très complexe : • Définition d’un système de rangement adapté. Classement mercredi 16 octobre 13
  35. 35. Classer les données Phase très complexe : • Définition d’un système de rangement adapté. • Prise en compte des relations élaborées entre les différents items mercredi 16 octobre 13 Classement
  36. 36. Des relations élaborées Le datajournalisme constitue un objet d’étude complexe : •Une organisation peut employer plusieurs datajournalistes •Un datajournaliste peut être (ou avoir été) employé par plusieurs institutions. Many-to-many relationships mercredi 16 octobre 13
  37. 37. Une architecture en trois dimensions x mercredi 16 octobre 13
  38. 38. Une architecture en trois dimensions x mercredi 16 octobre 13
  39. 39. Une architecture en trois dimensions x mercredi 16 octobre 13
  40. 40. Une architecture en trois dimensions y x mercredi 16 octobre 13
  41. 41. Une architecture en trois dimensions y x mercredi 16 octobre 13
  42. 42. Une architecture en trois dimensions y x mercredi 16 octobre 13
  43. 43. Une architecture en trois dimensions y x mercredi 16 octobre 13 z
  44. 44. Lier les bases mercredi 16 octobre 13
  45. 45. Lier les bases Table Noms mercredi 16 octobre 13 Table Organisations
  46. 46. Analyser la donnée Un tout autre regard : la pensée statistique Analyse mercredi 16 octobre 13
  47. 47. Analyser la donnée Un tout autre regard : la pensée statistique • Transformation des données en connaissances. mercredi 16 octobre 13 Analyse
  48. 48. Analyser la donnée Un tout autre regard : la pensée statistique • Transformation des données en connaissances. • Croisement d’outils mathématiques et de préceptes méthodologique. mercredi 16 octobre 13 Analyse
  49. 49. Visualiser À quoi sert une visualisation ? mercredi 16 octobre 13 Visualiser
  50. 50. Visualiser À quoi sert une visualisation ? • Création d’une représentation simple et circulante des résultats obtenus. mercredi 16 octobre 13 Visualiser
  51. 51. Visualiser À quoi sert une visualisation ? • Création d’une représentation simple et circulante des résultats obtenus. • Percevoir des liaisons et relations passées inaperçues. La visualisation a une portée maïeutique. mercredi 16 octobre 13 Visualiser
  52. 52. Simplicité Les outils D3.JS Flexibilité mercredi 16 octobre 13
  53. 53. Une polyphonie énonciative Données (format JSON) Bibliothèque Infovis Formatage CSS mercredi 16 octobre 13 Configuration infovis Formatage HTML
  54. 54. Un exemple Les datajournalistes français mercredi 16 octobre 13
  55. 55. Publier Les problématiques de la publication mercredi 16 octobre 13 Publier
  56. 56. Publier Les problématiques de la publication • Réinscription des résultats dans une nouvelle structure informationnelle mercredi 16 octobre 13 Publier
  57. 57. Publier Les problématiques de la publication • Réinscription des résultats dans une nouvelle structure informationnelle • Retranscription vers un format lisible pour le site. mercredi 16 octobre 13 Publier
  58. 58. La Scène mercredi 16 octobre 13
  59. 59. Un projet de recherche mercredi 16 octobre 13
  60. 60. Un projet de recherche mercredi 16 octobre 13
  61. 61. Un projet de recherche mercredi 16 octobre 13
  62. 62. Des jeux de données mercredi 16 octobre 13
  63. 63. Des jeux de données mercredi 16 octobre 13
  64. 64. Des jeux de données mercredi 16 octobre 13
  65. 65. Des analyses composites Croiser du texte, des jeux de données… mercredi 16 octobre 13
  66. 66. Des analyses composites …des cartes… mercredi 16 octobre 13
  67. 67. Des analyses composites et des schémas. mercredi 16 octobre 13
  68. 68. Épilogue mercredi 16 octobre 13

×