Du document à la donnée       et retour     La fourmilière ou les Lumières   Jean-Michel Salaün     Séminaire INRIA – IST ...
Epistemic infrastructure                                                                                              © Ni...
Cyberinfrastructure                                                                      © Nicolas Taffin                 ...
Google                                                                   © Nicolas Taffin   Il s’agit de cartographier le ...
La documentarisation  (à la Bibliothèque du Congrès début 20ème                     siècle)                  © Nicolas Taf...
De la manufacture à l’industrie                                          © Nicolas Taffin                  INRIA-IST-Carna...
Les trois dimensions du                   document                 (Roger T. Pédauque)              © Nicolas Taffin1. Ant...
Du document à la donnée                                                                © Nicolas Taffin• 19e-20e : Documen...
La documentarisation                        (vue par P. Otlet)                                                            ...
Le Web des données                 (vue par le W3C)                                                                © Nicol...
L’inversion de la logique    de documentarisation                                                      © Nicolas Taffin   ...
Le rapport au savoir              change                                                          © Nicolas Taffin        ...
Transparence et              accélération                                                    © Nicolas TaffinLe dialogue d...
Wikipédia, au centre       du web de données                 © Nicolas Taffin                 INRIA-IST-Carnac-2012       ...
Wikipédia + Google        = le sens commun                 © Nicolas Taffin• Carnac• François Hollande• Barak Obama• Maril...
Web de données + traces   = Knowledge Graph                                                       © Nicolas Taffin   Avant...
Pour une histoire   des (bases de) données                                       © Nicolas Taffin• Les cartes perforées au...
Le « big data »            Publication vs transparence                                                                    ...
Le risque : la fourmilière                                          © Nicolas Taffin• Selon Thomas Bern, la transparence  ...
Analyser            l’histoire de la statistique                                                                          ...
Analyser            La théorie du document                                               © Nicolas Taffin• Mieux comprendr...
Réinventer       un contrat de lecture                                                  © Nicolas Taffin La constitution d...
Agir        Vers de nouvelles Lumières                                             © Nicolas Taffin• Participer au mouveme...
En résumé                                               © Nicolas Taffin• Le web des données est une étape  supplémentaire...
Prochain SlideShare
Chargement dans…5
×

Du document à la donnée et retour : la fourmilière ou les Lumières

573 vues

Publié le

Présentation de Jean-Michel Salaün au séminaire Ist Inria 2012

Publié dans : Technologie
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
573
Sur SlideShare
0
Issues des intégrations
0
Intégrations
1
Actions
Partages
0
Téléchargements
2
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Du document à la donnée et retour : la fourmilière ou les Lumières

  1. 1. Du document à la donnée et retour La fourmilière ou les Lumières Jean-Michel Salaün Séminaire INRIA – IST « Le document numérique à lheure du web de données » 30 septembre 2012 © Nicolas Taffin
  2. 2. Epistemic infrastructure © Nicolas Taffin L’infrastructure épistémique de l’économie de la connaissance repose sur les bibliothèques, les archives, les musées, les galeries, les zoos, les aquariums et d’autres collections systématiques encore qui permettent aux individus de savoir ce qu’ils savent et de faire ce qu’ils font. Le rassemblement, la conservation, l’organisation, la représentation et la diffusion des documents d’archives, des plantes et des animaux, des objets rares ou communs, des œuvres d’art, etc. est au cœur de la production de connaissances, de l’enseignement, de la prise de décision et du commerce. Margaret Hedstrom et John Leslie King, « Epistemic infrastructure in the rise of the knowledge economy », in Brian Kahin et Dominique Foray, Advancing Knowledge and the Knowledge Economy, MIT Press, Cambridge (Mass.), USA, 2006, p. 113-134. INRIA-IST-Carnac-2012 2JM Salaun
  3. 3. Cyberinfrastructure © Nicolas Taffin L’arrivée de l’internet a transformé les pratiques dans les sciences sociales et humaines (SHS), plus lentement que certains l’avaient espéré mais plus profondément que d’autres auraient attendu. Les ressources du patrimoine culturel numérique forment un ensemble de données essentielles pour les SHS : ces ressources, traitées grâce aux réseaux et aux logiciels, organisent aujourd’hui la façon dont les scientifiques découvrent et donnent du sens aux traces humaines tout en organisant la manière dont leurs résultats sont transmis à leurs étudiants, leurs collègues et au public en général Our Cultural Commonwealth. The report of the American Council of Learned Societies Commission on Cyberinfrastructure for the Humanities and Social Sciences, 2006, 51p. INRIA-IST-Carnac-2012 3JM Salaun
  4. 4. Google © Nicolas Taffin Il s’agit de cartographier le monde réel d’une façon que les ordinateurs puissent comprendre. Il s’agit de prendre des objets du monde réel, de comprendre ce que sont ces choses et quelles sont les choses importantes à leur sujet ainsi que leurs relations à d’autres choses. C’est la partie que je trouve la plus fascinante : quelle est la relation entre toutes ces choses différentes ? Entretien avec la responsable du Knowledge Graph de Google, RWW, 26 juillet 2012. INRIA-IST-Carnac-2012 4JM Salaun
  5. 5. La documentarisation (à la Bibliothèque du Congrès début 20ème siècle) © Nicolas Taffin Wikipédia INRIA-IST-Carnac-2012 5JM Salaun
  6. 6. De la manufacture à l’industrie © Nicolas Taffin INRIA-IST-Carnac-2012 6JM Salaun
  7. 7. Les trois dimensions du document (Roger T. Pédauque) © Nicolas Taffin1. Anthropologique : Forme Vu Document = Support + Inscription Contrat2. Intellectuelle :Texte Lu de lecture Document = Code + représentation3. Sociale : Médium Su Document = Mémoire + transaction INRIA-IST-Carnac-2012 7JM Salaun
  8. 8. Du document à la donnée © Nicolas Taffin• 19e-20e : Document scientifique = article de revue et livre » Transmettre et prouver• 21e : Document scientifique = – Documents numériques (hyper-) (Web 1 modifie le vu) • ArXive, ScienceDirect… • Gallica, Europeana, Google-Book… – Néodocuments (Web 2 modifie le su) • Blogues • Wikipédia • Réseaux sociaux • Sites dynamiques, etc. – Données (Web 3 modifie le lu) » Partager et reconstruire ? INRIA-IST-Carnac-2012 8JM Salaun
  9. 9. La documentarisation (vue par P. Otlet) © Nicolas Taffin Première modernité (première et deuxième révolution industrielle) P.Otlet, Traité de documentation, 1934, p.41 INRIA-IST-Carnac-2012 9JM Salaun
  10. 10. Le Web des données (vue par le W3C) © Nicolas Taffin Seconde modernité ou modernité tardive (troisième révolution industrielle) 2007 : web des données W3C INRIA-IST-Carnac-2012 10JM Salaun
  11. 11. L’inversion de la logique de documentarisation © Nicolas Taffin On construit le savoir à partir On reconstruit le savoir de l’observation de la nature à partir des ressources disponibles INRIA-IST-Carnac-2012 11JM Salaun
  12. 12. Le rapport au savoir change © Nicolas Taffin Bienvenue sur Wikipédia Le projet d’encyclopédie libre que vous pouvez améliorerLes articles de Wikipédia devraient reposer principalement sur dessources secondaires fiables. Toute utilisation de sources primaires devraitsappuyer sur des sources secondaires, et ne pas être une sélection,analyse, synthèse ou interprétation inédite réalisée par un contributeur deWikipédia. Les sources primaires seules sont acceptées si ellesconsistent en des assertions factuelles et non sujettes à interprétation oupolémique. Wkp INRIA-IST-Carnac-2012 12JM Salaun
  13. 13. Transparence et accélération © Nicolas TaffinLe dialogue de sourds entre Ph. Roth et Wikipédia :• 20 août première correction : jai retiré la référence à Anatole Broyard sur linsistance de Philip Roth, je suis son biographe.• Une minute après, un éditeur de wkp remet le texte initial : Pouvez-vous le vérifier ?.• Vingt minutes plus tard, correction renouvelée : Une nouvelle fois, jai enlevé la référence à Anatole Broyard. Cest tout à fait inexact et donc sans objet. Je suis le biographe de Roth et jai fait cette correction à sa demande.• Six minutes après, un autre éditeur de wkp remet de nouveau le texte initial et ajoute de nouveaux détails pour confirmer linspiration du roman par le personnage dA. Broyard. Cet éditeur prendra deux heures de son temps pour cette rédaction. Comme lindique le wikipédien qui relate lhistoire : cet éditeur a du se prendre pour un vrai détective !• 7 septembre Ph Roth publie une Lettre ouverte à Wikipédia sur The New Yorker, très largement commentée dans la presse et sur le web.• 18h54 correction réalisée par un membre de la Wikimedia Foundation. INRIA-IST-Carnac-2012 13JM Salaun
  14. 14. Wikipédia, au centre du web de données © Nicolas Taffin INRIA-IST-Carnac-2012 14JM Salaun
  15. 15. Wikipédia + Google = le sens commun © Nicolas Taffin• Carnac• François Hollande• Barak Obama• Marilyn Monroe• Jean-Michel Salaün INRIA-IST-Carnac-2012 15JM Salaun
  16. 16. Web de données + traces = Knowledge Graph © Nicolas Taffin Avant, Metaweb était un référentiel dentités et de faits et les employés de la société utilisaient beaucoup leur intuition pour trouver ce qui importait pour les usagers et quelle information chercher. Depuis quils ont été rachetés par Google, Google dispose de tous ces usagers cherchant de linformation, et de là nous savons quelles choses du monde sont importantes (...) Google sait que les gens qui cherchent une chose en cherchent aussi dautres. Ainsi on peut trouver des relations intéressantes en regardant les sessions agrégées des usagers. Une des prochaines étapes est en effet dexpliquer ces relations fortuites. Entretien avec la responsable du Knowledge Graph de Google, RWW, 26 juillet 2012. INRIA-IST-Carnac-2012 16JM Salaun
  17. 17. Pour une histoire des (bases de) données © Nicolas Taffin• Les cartes perforées au service du contrôle• La classification au service du partage du savoir• Les hobbyistes au service de l’autonomie• Le « big data » et le retour du contrôle ? Driscoll, Kevin. « From Punched Cards to “Big Data”: A Social History of Database Populism ». communication 1 1, no. 1 (août 29, 2012). INRIA-IST-Carnac-2012 17JM Salaun
  18. 18. Le « big data » Publication vs transparence © Nicolas Taffin Ce sont les petites miettes de données que vous laissez derrière vous quand vous vous déplacez sur terre. Ce que ces miettes racontent, cest lhistoire de votre vie. Elles disent ce que vous avez choisi de faire. Cest très différent de ce que vous mettez sur Facebook. Ce que vous mettez sur Facebook, cest ce que vous voudriez dire aux gens, rédigé selon les normes daujourdhui. (...) Si je peux connaitre certains de vos comportements, je peux inférer le reste juste en vous comparant avec la foule de ceux qui vous ressemblent. (…) Ce qui compte vraiment, cest comment les gens sont reliés les uns aux autres par les machines et comment ils créent un marché financier, un gouvernement, une entreprise et dautres structures sociales. Alex Pentland in Reinventing Society In The Wake Of Big Data. Edge, août 30, 2012. INRIA-IST-Carnac-2012 18JM Salaun
  19. 19. Le risque : la fourmilière © Nicolas Taffin• Selon Thomas Bern, la transparence conduit à un gouvernement « inoffensif » où les décisions politiques ne sont plus discutées et sont diluées dans le social.• Selon Harmut Rosa, accélération rime avec aliénation. INRIA-IST-Carnac-2012 19JM Salaun
  20. 20. Analyser l’histoire de la statistique © Nicolas Taffin Dans son architecture actuelle, la statistique se présente comme la combinaison de deux types d’outillages distincts (…). Le premier est politico-administratif : peu à peu se sont mis en place, depuis le 18e siècle, des systèmes d’enregistrement, de codage, de tabulation et de publications de « statistiques » au sens de description chiffrée de divers aspects du monde social. Le second est cognitif, et implique la mise en forme de schèmes scientifiques (moyenne, dispersion, corrélation, échantillonnage probabiliste), destinés à résumer, notamment par des outils mathématiques une diversité supposée non maîtrisable. (A. Desrosières) Dans son architecture actuelle, le web de données se présente comme la combinaison de deux types d’outillages distincts. Le premier est politico- administratif : peu à peu se sont mis en place, à partir de la fin du 19e siècle des systèmes d’enregistrement, de codage, de classification et de publication de « bases de données » au sens de description factuelles de divers aspects du monde social. Le second est cognitif et implique la constitution de schémas logiques destinés à résumer grâce à des algorithmes une diversité supposée non maîtrisable. INRIA-IST-Carnac-2012 20JM Salaun
  21. 21. Analyser La théorie du document © Nicolas Taffin• Mieux comprendre le passage du « transmettre et prouver » au « partager et reconstruire ».• Suivre les stratégies commerciales et non commerciales sur le vu, le lu et le su.• Observer et comprendre le nouveau contrat de lecture dans les formes ordinaires de consultations documentaires numériques. INRIA-IST-Carnac-2012 21JM Salaun
  22. 22. Réinventer un contrat de lecture © Nicolas Taffin La constitution d’un espace rendant possible le débat contradictoire sur les options de la cité suppose l’existence d’un minimum d’éléments de référence communs aux divers acteurs : langage pour mettre en forme les choses, pour dire les fins et les moyens de l’action, pour en discuter les résultats. Ce langage ne préexiste pas au débat : il est négocié, stabilisé, inscrit, puis déformé et défait peu à peu, au fil des interactions propres à un espace et une période historique données. Alain Desrosières, La politique des grands nombres : histoire de la raison statistique. Paris : La Découverte, 2000, INRIA-IST-Carnac-2012 22JM Salaun
  23. 23. Agir Vers de nouvelles Lumières © Nicolas Taffin• Participer au mouvement : ouverture et agilité.• Gérer l’hybride sans sectarisme.• Vers une « architecture de l’information ». INRIA-IST-Carnac-2012 23JM Salaun
  24. 24. En résumé © Nicolas Taffin• Le web des données est une étape supplémentaire dans une longue histoire des systèmes documentaires.• L’évolution du web favorise une modification de la notion de document vers « partager et reconstruire ».• Transparence et accélération marquent cette étape, non sans risque.• Nous avons une responsabilité à tenir dans cette dynamique. INRIA-IST-Carnac-2012 24JM Salaun

×