L’historien et l’algorithme
!
FREDERIC	
  KAPLAN	
  
DIGITAL	
  HUMANITIES	
  LABORATORY

1

!1
Pourquoi s’intéresser aux
sciences historiques ?
!

1

!2
Parce qu’elles sont sur le point de
subir un profond bouleversement.
1

!3
Parce que leur importance est
capitale, alors que les nouvelles
technologies nous donnent
l’impression de vivre dans un
“g...
La conquête du passé est la
nouvelle frontière.

1

!5
Cette reflexion commence par
une visite aux archives d’Etats de
Venise.

1

!6
1

!7
80 km d’archives
couvrant 1000 ans d’histoire
!

1

!8
La mémoire du “Google” du
moyen-âge.
!

1

!9
Nous sommes face à des “Big data”
du passé.
!

!10

1
Comment transformer cette
archive en un système
d’information ?

!11

1
Les archives constituent un objet
trop gros pour être étudié par des
équipes isolées de chercheurs.

!12

1
Comme le système génomique
!13

1
Comme le système cérébral
!14

1
Comme le système planétaire
!15

1
Comme	
  pour	
  le	
  Genome,	
  le	
  Cerveau	
  
ou	
  la	
  Terre,	
  nous	
  avons	
  besoin	
  de	
  
l’ac$on	
  coo...
Comme	
  pour	
  le	
  Genome,	
  le	
  Cerveau	
  
ou	
  la	
  Terre,	
  les	
  algorithmes	
  joueront	
  
sans	
  doute...
«[...] l'historien de demain sera
programmeur ou il ne sera plus ».
!
Emmanuel	
  Leroy	
  Ladurie	
  
Le	
  Nouvel	
  Obs...
Les relations houleuses qu’histoire et
informatique entretiennent ne sont pas
nouvelles.

!19
Déjà,	
  des	
  la	
  fin	
  des	
  années	
  1960,	
  la	
  plupart	
  
des	
  grandes	
  conférences	
  d’Histoire	
  inc...
Les	
  «	
  nouveaux	
  »	
  vantaient	
  les	
  mérites	
  de	
  
gros	
  ordinateurs	
  pour	
  réaliser	
  des	
  calcu...
Le	
  camp	
  des	
  «	
  tradiKonnels	
  »	
  
accueillait	
  ce	
  type	
  d’approches	
  avec	
  un	
  
profond	
  scep...
« Toutes les questions
importantes sont importantes
précisément parce qu’elles ne
peuvent recevoir de réponse
quantitative...
« Ce sont toujours les projets qui ont été financés
avec le plus d’ampleur, ceux qui ont rassemblé des
ambitieuses armées ...
Des	
  décennies	
  ont	
  passé,	
  les	
  mêmes	
  
débats	
  se	
  perpétuent.	
  Les	
  méthodes	
  
quanKtaKves	
  on...
Il	
  y	
  a	
  dix	
  ans,	
  pourtant,	
  dans	
  un	
  arKcle	
  
de	
  2004,	
  William	
  Thomas	
  III	
  notait	
  ...
« Les historiens sont en train de construire des
systèmes à grande échelle pour reconstituer les
données historiques sous ...
« Ces modèles en quatre dimensions pourraient
reconstituer les immeubles, les routes et les ruines
des territoires histori...
« Le rôle pour l’historien qui travaillera dans ce
média numérique sera de rendre ces technologies
informatiques transpare...
En	
  dix	
  ans,	
  ce	
  tournant	
  
cartographique	
  a	
  effecKvement	
  eu	
  
lieu	
  avec	
  le	
  développement	
...
Mon	
  hypothèse	
  :	
  	
  (1)	
  Ce	
  tournant	
  
spa$al	
  est	
  en	
  fait	
  un	
  tournant	
  
algorithmique	
  ...
Mon	
  hypothèse	
  :	
  	
  (2)	
  Une	
  nouvelle	
  
généra$on	
  d’étudiants	
  sera	
  à	
  la	
  base	
  
ceNe	
  gr...
Parce	
  que	
  nous	
  parlons	
  d’une	
  
transformaKon	
  technique	
  et	
  
généraKonnelle,	
  il	
  faut	
  replace...
!34
!35
!36
Avec les interfaces d’exploration de l’espace, tout se
passe comme si nous vivions dans un grand maintenant.
Le temps a di...
Peut-­‐on	
  construire	
  des	
  
“Google	
  maps”	
  du	
  passé	
  ?	
  

!38
Peut-­‐on	
  construire	
  des	
  
“Facebooks”	
  du	
  passé	
  ?	
  

!39
Peut-­‐on	
  reconstruire	
  
numériquement	
  un	
  passé	
  
aussi	
  dense	
  que	
  notre	
  
présent	
  ?	
  
!40
!41
!42
!43
L’EPFL et l’université Ca’Foscari ont lancé cette année un
projet intitulé la “Venice Time Machine” construit selon
cette ...
Cette initiative regroupe aujourd’hui quelques dizaines
de chercheurs et d’étudiants qui collaborent pour
construire un mo...
L’enjeu est de constituer une grande base de données,
open access, dont chacun pourrait se sentir co-auteur.
Faire de ce m...
La stratégie de développement consiste à faire
converger recherche et éducation en créant un
programme de cours associé à ...
Nous expérimentions ce programme cette année avec
60 étudiants. L’objectif pour l’an prochain est d’ouvrir un
cours en lig...
Comment numériser
efficacement des
archives aussi
anciennes ?
!49
Pourrait-on numériser
ces documents sans
les ouvrir ?
!50
Comment transcrire
les documents
numérisés ?
!51
Comment adapter les
techniques générales
aux cas particuliers ?
!52
Comment extraire et
coder les
informations qu’ils
contiennent ?
!53
Pourrait-on utiliser
les techniques du
“web sémantique” ?
!54
Connectées les unes aux
autres, ces données
forment un grand graphe.
!55
Ce graphe permet de poser
des questions inédites.
Quel est le salaire moyen d’un apprenti en 1622 ? Combien de
fils de pei...
Ce graphe peut aussi se
deployer dans le temps et
l’espace.
!57
1500

Les cartes du passé sont riches de détails.
!58
1550

!59
1572

!60
1576

!61
1765

!62
1829

Au XIXe siècle, les cartes changent.

!63
1859

!64
1910

!65
Reconstruire les Venise(s) du
passé est comme résoudre
un “Sudoku” géant

!66
Quand l’espace de solutions
de ce Sudoku est trop grand,
les algorithmes sont d’une
grande aide.

!67
Ces reconstructions disparates sont
intégrées dans des modèles
spatiotemporels unifiés.

!68
!69
!70
!71
!72
!73
!74
!75
!76
!77
!78
900

La même logique est déployée à l’échelle
des échanges méditerranéens.

!79
1000

!80
1100

!81
1200

!82
1300

!83
1400

!84
1500

!85
Le trafic mois par mois peut être simulé

!86
En juin 1322, quel est le prochain bateau
de Constantinople à Corfou ? Combien
de temps prendra le voyage ? Quels sont
les...
Pour tracer les routes, il faut
transformer les hypothèses en
algorithmes.

!88
La	
  quesKon	
  centrale	
  de	
  ce	
  
programme	
  de	
  recherche	
  est	
  
la	
  gesKon	
  et	
  la	
  représentaKo...
Trois	
  processus	
  renforcent	
  le	
  
rôle	
  de	
  la	
  formalisaKon	
  et	
  les	
  
algorithmes	
  dans	
  ce	
  ...
(1)	
  Ce	
  type	
  de	
  projets	
  demande	
  une	
  
éthique	
  de	
  la	
  représenta$on	
  et	
  ceci	
  
impose	
  ...
(2)	
  Le	
  besoin	
  d’interopérabilité	
  nécessaire	
  
pour	
  la	
  consKtuKon	
  des	
  grandes	
  bases	
  de	
  
...
(3)	
  Les	
  cartographies	
  historiques	
  et	
  la	
  
simulaKon	
  invitent	
  à	
  transformer	
  les	
  
hypothèses...
Ces	
  trois	
  évoluKons	
  tendent	
  à	
  
introduire	
  les	
  algorithmes	
  comme	
  
nouveaux	
  médiateurs	
  des	...
Près	
  de	
  cinquante	
  ans	
  après	
  la	
  prédicKon	
  
d’Emmanuel	
  Leroy	
  Ladurie,	
  il	
  faut	
  sans	
  
d...
En	
  rapprochant	
  recherche	
  et	
  
éducaKon,	
  ceNe	
  nouvelle	
  généra$on	
  
d’étudiants	
  va	
  non	
  seulem...
Il	
  s’agit	
  “simplement”	
  d’organiser,	
  
chaque	
  année,	
  la	
  rencontre	
  entre	
  
des	
  dizaines	
  de	
 ...
Les	
  algorithmes	
  seront	
  
les	
  médiateurs	
  de	
  
ceNe	
  rencontre.	
  
!98
dhlab.epfl.ch
!
frederic.kaplan@epfl.ch	
  
@frederickaplan

!99

125
Prochain SlideShare
Chargement dans... 5
×

L'historien et l'algorithme : Présentation aux Entretiens du Nouveau Monde Industriel 2013 (ENMI13)

9,474

Published on

Présentation au ENMI 2013 : Entretiens du Nouveau Monde Industriel - Centre Pompidou.

Published in: Éducation
1 Comment
9 mentions J'aime
Statistiques
Remarques
Aucun téléchargement
Vues
Total des vues
9,474
Sur Slideshare
0
À partir des ajouts
0
Nombre d'ajouts
93
Actions
Partages
0
Téléchargements
50
Commentaires
1
J'aime
9
Ajouts 0
No embeds

No notes for slide

L'historien et l'algorithme : Présentation aux Entretiens du Nouveau Monde Industriel 2013 (ENMI13)

  1. 1. L’historien et l’algorithme ! FREDERIC  KAPLAN   DIGITAL  HUMANITIES  LABORATORY 1 !1
  2. 2. Pourquoi s’intéresser aux sciences historiques ? ! 1 !2
  3. 3. Parce qu’elles sont sur le point de subir un profond bouleversement. 1 !3
  4. 4. Parce que leur importance est capitale, alors que les nouvelles technologies nous donnent l’impression de vivre dans un “grand maintenant”, sans passé, ni futur. 1 !4
  5. 5. La conquête du passé est la nouvelle frontière. 1 !5
  6. 6. Cette reflexion commence par une visite aux archives d’Etats de Venise. 1 !6
  7. 7. 1 !7
  8. 8. 80 km d’archives couvrant 1000 ans d’histoire ! 1 !8
  9. 9. La mémoire du “Google” du moyen-âge. ! 1 !9
  10. 10. Nous sommes face à des “Big data” du passé. ! !10 1
  11. 11. Comment transformer cette archive en un système d’information ? !11 1
  12. 12. Les archives constituent un objet trop gros pour être étudié par des équipes isolées de chercheurs. !12 1
  13. 13. Comme le système génomique !13 1
  14. 14. Comme le système cérébral !14 1
  15. 15. Comme le système planétaire !15 1
  16. 16. Comme  pour  le  Genome,  le  Cerveau   ou  la  Terre,  nous  avons  besoin  de   l’ac$on  coordonnée  d’un  grand   groupe  de  chercheurs  et  d’étudiants   pour  espérer  transformer  ce  mega-­‐ objet  en  un  système  informaKonnel.   !16
  17. 17. Comme  pour  le  Genome,  le  Cerveau   ou  la  Terre,  les  algorithmes  joueront   sans  doute  un  rôle  central  dans  ceNe   entreprise  collecKve.   !17
  18. 18. «[...] l'historien de demain sera programmeur ou il ne sera plus ». ! Emmanuel  Leroy  Ladurie   Le  Nouvel  Observateur,  1968 !18
  19. 19. Les relations houleuses qu’histoire et informatique entretiennent ne sont pas nouvelles. !19
  20. 20. Déjà,  des  la  fin  des  années  1960,  la  plupart   des  grandes  conférences  d’Histoire  incluaient   dans  leur  programme  des  tables  rondes   conflictuelles  opposant  les  «  nouveaux  »   historiens  aux  historiens  «  tradiKonnels  ». Thomas  2004  “CompuKng  and  Historical  ImaginaKon”  in  A  companion  to  Digital  HumaniKes,  Blackwell !20
  21. 21. Les  «  nouveaux  »  vantaient  les  mérites  de   gros  ordinateurs  pour  réaliser  des  calculs  à   grande  échelle.  Ils  défendaient  une  histoire   moins  narraKve,  appuyée  par  des  méthodes   quanKtaKves.  Le  terme  «  cliométrique  »  fut   forgé  durant  ceNe  période  pour  nommer   ceNe  nouvelle  manière  de  faire  l’histoire  avec   l’aide  des  grands  nombres. !21
  22. 22. Le  camp  des  «  tradiKonnels  »   accueillait  ce  type  d’approches  avec  un   profond  scepKcisme.   !22
  23. 23. « Toutes les questions importantes sont importantes précisément parce qu’elles ne peuvent recevoir de réponse quantitative ». ! Robert  Swierenga,  1970   Quantification  in  American  History,  Atheneum. !23
  24. 24. « Ce sont toujours les projets qui ont été financés avec le plus d’ampleur, ceux qui ont rassemblé des ambitieuses armées de chercheurs payés, ceux dont la science était la plus liée aux dernières technologies informatiques, ceux qui impliquaient les présentations mathématiques les plus sophistiquées, qui, au final, se sont révélées les plus décevantes » ! Lawrence  Stone,  cité  par  Thomas  2004 !24
  25. 25. Des  décennies  ont  passé,  les  mêmes   débats  se  perpétuent.  Les  méthodes   quanKtaKves  ont  montré  leur  force   pour  certains  domaines  et  leur   manque  de  perKnence  pour  d’autres.  Il   n’y  a  pas  vraiment  eu  de  révoluKon. !25
  26. 26. Il  y  a  dix  ans,  pourtant,  dans  un  arKcle   de  2004,  William  Thomas  III  notait  déjà   que  quelque  chose  de  plus  excitant  et   de  plus  dérangeant  que  les  premiers   projets  «cliométriques  »  était  en  train   de  se  consKtuer.   !26
  27. 27. « Les historiens sont en train de construire des systèmes à grande échelle pour reconstituer les données historiques sous des formes géographiques pour divers lieux dans le monde (…). Considérés dans leur ensemble ces efforts ouvrent des possibilités remarquables pour reconstituer des ensembles intégrés et organisés en réseau » ! William  Thomas,   Computing  and  Historical  Imagination,  2004 !27
  28. 28. « Ces modèles en quatre dimensions pourraient reconstituer les immeubles, les routes et les ruines des territoires historiques autant que les géographies légales, économiques, sociales ou religieuses qui leur sont associées. Les réseaux informationnels, financiers, commerciaux et culturels pourraient également trouver leur place dans ces modèles » ! William  Thomas,   Computing  and  Historical  Imagination,  2004 !28
  29. 29. « Le rôle pour l’historien qui travaillera dans ce média numérique sera de rendre ces technologies informatiques transparentes » ! William  Thomas,   Computing  and  Historical  Imagination,  2004 !29
  30. 30. En  dix  ans,  ce  tournant   cartographique  a  effecKvement  eu   lieu  avec  le  développement  des   systèmes  d’informaKon   géohistorique  (Historical   Geographical  InformaKon  Systems).   !30
  31. 31. Mon  hypothèse  :    (1)  Ce  tournant   spa$al  est  en  fait  un  tournant   algorithmique  dans  la  mesure  où  il   impose  les  algorithmes  comme   nouveaux  médiateurs  des  sciences   historiques.     !31
  32. 32. Mon  hypothèse  :    (2)  Une  nouvelle   généra$on  d’étudiants  sera  à  la  base   ceNe  grande  transformaKon.       !32
  33. 33. Parce  que  nous  parlons  d’une   transformaKon  technique  et   généraKonnelle,  il  faut  replacer  ce   tournant  cartographique  propre  aux   sciences  historiques  dans  le  contexte   plus  large  de  nouvelles  interfaces  pour   l’explora$on  de  l’espace.   !33
  34. 34. !34
  35. 35. !35
  36. 36. !36
  37. 37. Avec les interfaces d’exploration de l’espace, tout se passe comme si nous vivions dans un grand maintenant. Le temps a disparu. !37
  38. 38. Peut-­‐on  construire  des   “Google  maps”  du  passé  ?   !38
  39. 39. Peut-­‐on  construire  des   “Facebooks”  du  passé  ?   !39
  40. 40. Peut-­‐on  reconstruire   numériquement  un  passé   aussi  dense  que  notre   présent  ?   !40
  41. 41. !41
  42. 42. !42
  43. 43. !43
  44. 44. L’EPFL et l’université Ca’Foscari ont lancé cette année un projet intitulé la “Venice Time Machine” construit selon cette approche. !44
  45. 45. Cette initiative regroupe aujourd’hui quelques dizaines de chercheurs et d’étudiants qui collaborent pour construire un modèle multidimensionnel de Venise. !45
  46. 46. L’enjeu est de constituer une grande base de données, open access, dont chacun pourrait se sentir co-auteur. Faire de ce modèle de Venise un bien commun, collectivement construit. !46
  47. 47. La stratégie de développement consiste à faire converger recherche et éducation en créant un programme de cours associé à ce programme de recherche. !47
  48. 48. Nous expérimentions ce programme cette année avec 60 étudiants. L’objectif pour l’an prochain est d’ouvrir un cours en ligne pouvant être suivi par plusieurs dizaines de milliers d’étudiants simultanément. !48
  49. 49. Comment numériser efficacement des archives aussi anciennes ? !49
  50. 50. Pourrait-on numériser ces documents sans les ouvrir ? !50
  51. 51. Comment transcrire les documents numérisés ? !51
  52. 52. Comment adapter les techniques générales aux cas particuliers ? !52
  53. 53. Comment extraire et coder les informations qu’ils contiennent ? !53
  54. 54. Pourrait-on utiliser les techniques du “web sémantique” ? !54
  55. 55. Connectées les unes aux autres, ces données forment un grand graphe. !55
  56. 56. Ce graphe permet de poser des questions inédites. Quel est le salaire moyen d’un apprenti en 1622 ? Combien de fils de peintres sont eux-mêmes peintres ? Quels sont les procès qui ont impliqué des travailleurs du verre à Murano au XVIIe siècle ? !56
  57. 57. Ce graphe peut aussi se deployer dans le temps et l’espace. !57
  58. 58. 1500 Les cartes du passé sont riches de détails. !58
  59. 59. 1550 !59
  60. 60. 1572 !60
  61. 61. 1576 !61
  62. 62. 1765 !62
  63. 63. 1829 Au XIXe siècle, les cartes changent. !63
  64. 64. 1859 !64
  65. 65. 1910 !65
  66. 66. Reconstruire les Venise(s) du passé est comme résoudre un “Sudoku” géant !66
  67. 67. Quand l’espace de solutions de ce Sudoku est trop grand, les algorithmes sont d’une grande aide. !67
  68. 68. Ces reconstructions disparates sont intégrées dans des modèles spatiotemporels unifiés. !68
  69. 69. !69
  70. 70. !70
  71. 71. !71
  72. 72. !72
  73. 73. !73
  74. 74. !74
  75. 75. !75
  76. 76. !76
  77. 77. !77
  78. 78. !78
  79. 79. 900 La même logique est déployée à l’échelle des échanges méditerranéens. !79
  80. 80. 1000 !80
  81. 81. 1100 !81
  82. 82. 1200 !82
  83. 83. 1300 !83
  84. 84. 1400 !84
  85. 85. 1500 !85
  86. 86. Le trafic mois par mois peut être simulé !86
  87. 87. En juin 1322, quel est le prochain bateau de Constantinople à Corfou ? Combien de temps prendra le voyage ? Quels sont les chances de rencontrer des pirates ? !87
  88. 88. Pour tracer les routes, il faut transformer les hypothèses en algorithmes. !88
  89. 89. La  quesKon  centrale  de  ce   programme  de  recherche  est   la  gesKon  et  la  représentaKon   des  incer$tudes  et  des   inconsistances. !89
  90. 90. Trois  processus  renforcent  le   rôle  de  la  formalisaKon  et  les   algorithmes  dans  ce  contexte.       !90
  91. 91. (1)  Ce  type  de  projets  demande  une   éthique  de  la  représenta$on  et  ceci   impose  un  certain  niveau  de   formalisa$on.  Il  faut  documenter  les   différents  regimes  d’incer$tude  qui   sous-­‐tendent  les  données   visualisées.     !91
  92. 92. (2)  Le  besoin  d’interopérabilité  nécessaire   pour  la  consKtuKon  des  grandes  bases  de   données  conduit  à  définir  un  formalisme   permeNant  de  coder  non  seulement   l’informaKon  historique,  mais  la  meta-­‐ informa$on  historique  (les  processus   intellectuels  et  techniques  qui  ont  conduit   aux  données). !92
  93. 93. (3)  Les  cartographies  historiques  et  la   simulaKon  invitent  à  transformer  les   hypothèses  en  algorithmes.  Les  chercheurs   peuvent  aller  au  delà  du  débat  d’arguments,   en  opposant  dans  le  domaine  cartographique   leurs  hypothèses  appareillées  sous  la  forme   d’algorithmiques. !93
  94. 94. Ces  trois  évoluKons  tendent  à   introduire  les  algorithmes  comme   nouveaux  médiateurs  des  sciences   historiques.     ! !94
  95. 95. Près  de  cinquante  ans  après  la  prédicKon   d’Emmanuel  Leroy  Ladurie,  il  faut  sans   doute  former  une  nouvelle  généra$on   d’étudiants  capables  de  maîtriser  les   algorithmes  comme  ouKls  de  connaissance   et  de  débats  mais  aussi  de  s’interroger  sur   ces  changements. !95
  96. 96. En  rapprochant  recherche  et   éducaKon,  ceNe  nouvelle  généra$on   d’étudiants  va  non  seulement   bénéficier  de  ces  projets  de  grande   ampleur,  mais  jouer  un  rôle  crucial   dans  leur  succès  ou  leur  échec.   !96
  97. 97. Il  s’agit  “simplement”  d’organiser,   chaque  année,  la  rencontre  entre   des  dizaines  de  milliers   d’étudiants  et  des  dizaines  de   milliers  de  documents.   !97
  98. 98. Les  algorithmes  seront   les  médiateurs  de   ceNe  rencontre.   !98
  99. 99. dhlab.epfl.ch ! frederic.kaplan@epfl.ch   @frederickaplan !99 125
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×