data sprint
des archives
Forum des Archivistes, Troyes, 30, 31 mars, 1er avril 2016
Réunion d’information sur le data sprint des archives
1. “data sprint des archives” ?
où, quoi, qui, comment, pourquoi
planning, licences de réutilisation
1. exemples de visualisation de données
2.focus sur les données collectées
exemples
critères (structuration des données)
1. questions
Tour de table
Source : BanQ, Conrad Poirier [Public domain or Public domain], via Wikimedia Commons
“Data sprint des archives” ?
1. “Data sprint des
archives” ?
2. Exemples de
visualisation de données
3. Focus sur les données
collectées
4. Questions
● Pourquoi ?
Souhait du comité scientifique d’organiser un
événement participatif
● Quoi ?
Choix du format de l’événement : un data sprint
étalé dans le temps
Collecte de données > réutilisation et développement de
dispositifs et dataviz par des équipes > restitution
“Data sprint des archives” ?
1. “Data sprint des
archives” ?
2. Exemples de
visualisation de données
3. Focus sur les données
collectées
4. Questions
● Planning
● Comment
Des équipes, à distance voire locales // des outils collaboratifs en ligne
> Place des archivistes ? expliquer les données, nettoyer/normaliser les fichiers,
découvrir, apprendre et échanger
mars 2015 :
début de la
réflexion
juin 2015 :
choix du format, appel à
participation (archives)
mars 2016 :
FORUM
après ?
SAV et
débrief
juillet-déc. 2015 :
collecte des données
janvier-mars 2016 :
conception et dév.
des dispositifs
nov. 2015 :
réunion d’information
déc. 2015 :
appel à participation
(non archives)
“Data sprint des archives” ?
1. “Data sprint des
archives” ?
2. Exemples de
visualisation de données
3. Focus sur les données
collectées
4. Questions
● Les licences des données collectées
Au choix :
- durée du forum (mais les dispositifs ne seront pas pérennes)
- ouverture des données (dispositifs pérennes et ouverts après le forum,
contenu open data / licences CC / ouvertes), avec accompagnement de
l’équipe data sprint (y compris après le forum)
Sur l’ouverture des données :
- impact très important en matière de communication très important
(visibilité, relais Etalab, etc.)
- tutoriel : L’open data culturel (MCC, 2013) : http://dai.ly/xyqrun
- tutoriel : Les licences Creative Commons (MCC, 2013) :
http://dai.ly/x1tg4gv
Exemples d’ouverture de données : AD71, AD78, AM Toulouse, téléversements
d’images sur Commons des AN, de la BAnQ, NARA, musées européens, etc.
1. “Data sprint des
archives” ?
2. Exemples de
visualisation de données
3. Focus sur les données
collectées
4. Questions
Exemples de visualisation de données
ou comment obtenir, à partir d’un “simple” fichier XLS ou XML, toute sorte de chose...
Exemples de visualisation de données
Archives de la Manche (Pinterest)
Gallica (Pinterest)
Archives de Boulogne-Billancourt
Exemples de visualisation de données
Archives des Yvelines, liste des machines à
vapeur (données non exhaustives et non corrigées)
Voir carte de chaleur animée (heatmap)
Fichier XLS
CartoDB
Statistiques sur la structuration de fichiers XML et l’utilisation
des balises EAD
> les données comme aide à la décision
Exemples de visualisation de données
Avant-Après avec juxtapose.js http://goo.gl/yh0i00
Lieu de naissance et de mort à partir de fichiers XML-EAC
Visualisation des traités & accords de la France de 1500-1900 par lieux de signature conservés aux
#archives du Ministère des Affaires étrangères et européennes
Exemples de visualisation de données
Visualisation des expositions dans les musées français (1900-1950)
Fichier TXT initial
Exposition Fragonard au Petit
Palais, paris, du 21/02/1902 au
12/05/1902
“Plaisirs d’ornements”, Musée
des Beaux-Art de Lille, Lille,
janvier 1904
Fichier CSV_1
Titre_expo Lieu_musee Lieu_Ville Date_debut Date_fin
Exposition
Fragonard
Petit Palais paris 21/02/1902 12/05/1902
“Plaisirs
d’ornements
”
Musée des
Beaux-Art
de Lille
Lille janvier 1904
SPLIT + REGEX
OpenRefine
Titre_expo Lieu_musee Lieu_Ville Année Geoloc
Exposition
Fragonard
Petit Palais Paris 1902 51.45643;-
124789
Plaisirs
d’ornemen
ts
Musée des
Beaux-Art
de Lille
Lille 1904 31.45643;-
024789
OpenRefine
Nettoyage +
REGEX + API
Dataviz des relations autour de la #Galerie Bonnier grâce à
<cpfRelation> des notices XML-EAC
Réseaux des élèves-architectes (en bleu) par ateliers (en rouge) lors de l’enseignement aux
Beaux-Arts de Paris
Exemples de visualisation de données
Focus sur les données collectées
données structurées : fichier XML,
fichier Excel normalisé, etc.
vs
données non structurées
(beaucoup plus difficilement
utilisables) : fichier Word,
listes non normalisées
1. “Data sprint des
archives” ?
2. Exemples de
visualisation de données
3. Focus sur les données
collectées
4. Questions
Fichier Sénateurs Second Empire
Focus sur les données collectées
On recherche encore : des statistiques (de type Google Analytics), des
données XML EAC, des images libres de droit, etc.
1. “Data sprint des
archives” ?
2. Exemples de
visualisation de données
3. Focus sur les données
collectées
4. Questions
Participants actuels Thèmes
AD10, AD26, AD31, AD35, AD50,
AD51, AD62, AD71, AD78, AD89,
AD95, AM Toulouse, AM Dijon, AM
Beaune, AM Orléans, AM Rennes,
Sénat, Inserm, Mémoire des Hommes,
La Parisienne de Photographie, INHA,
…
+ données disponibles sur les
portails open data
guerre et vie militaire, économie et
travail (machines à vapeur, syndicats,
grèves, factures), personnes (cartes
postales, bases nominatives),
monuments (MH, architectes), lieux
(cartes postales, plans,
monographies), héraldique,
associations, surveillance
Données de gestion (stats de service),
statistiques sites Internet)
1. “Data sprint des
archives” ?
2. Exemples de
visualisation de données
3. Focus sur les données
collectées
4. Questions
A vos questions !
Question Mark Graffiti (Flickr) , CC BY 2.0
contact : forumdesarchivistes@archivistes.org
Maïwenn Bourdic - Antoine Courtin

Data sprint des archives

  • 1.
    data sprint des archives Forumdes Archivistes, Troyes, 30, 31 mars, 1er avril 2016
  • 2.
    Réunion d’information surle data sprint des archives 1. “data sprint des archives” ? où, quoi, qui, comment, pourquoi planning, licences de réutilisation 1. exemples de visualisation de données 2.focus sur les données collectées exemples critères (structuration des données) 1. questions
  • 3.
    Tour de table Source: BanQ, Conrad Poirier [Public domain or Public domain], via Wikimedia Commons
  • 4.
    “Data sprint desarchives” ? 1. “Data sprint des archives” ? 2. Exemples de visualisation de données 3. Focus sur les données collectées 4. Questions ● Pourquoi ? Souhait du comité scientifique d’organiser un événement participatif ● Quoi ? Choix du format de l’événement : un data sprint étalé dans le temps Collecte de données > réutilisation et développement de dispositifs et dataviz par des équipes > restitution
  • 5.
    “Data sprint desarchives” ? 1. “Data sprint des archives” ? 2. Exemples de visualisation de données 3. Focus sur les données collectées 4. Questions ● Planning ● Comment Des équipes, à distance voire locales // des outils collaboratifs en ligne > Place des archivistes ? expliquer les données, nettoyer/normaliser les fichiers, découvrir, apprendre et échanger mars 2015 : début de la réflexion juin 2015 : choix du format, appel à participation (archives) mars 2016 : FORUM après ? SAV et débrief juillet-déc. 2015 : collecte des données janvier-mars 2016 : conception et dév. des dispositifs nov. 2015 : réunion d’information déc. 2015 : appel à participation (non archives)
  • 6.
    “Data sprint desarchives” ? 1. “Data sprint des archives” ? 2. Exemples de visualisation de données 3. Focus sur les données collectées 4. Questions ● Les licences des données collectées Au choix : - durée du forum (mais les dispositifs ne seront pas pérennes) - ouverture des données (dispositifs pérennes et ouverts après le forum, contenu open data / licences CC / ouvertes), avec accompagnement de l’équipe data sprint (y compris après le forum) Sur l’ouverture des données : - impact très important en matière de communication très important (visibilité, relais Etalab, etc.) - tutoriel : L’open data culturel (MCC, 2013) : http://dai.ly/xyqrun - tutoriel : Les licences Creative Commons (MCC, 2013) : http://dai.ly/x1tg4gv Exemples d’ouverture de données : AD71, AD78, AM Toulouse, téléversements d’images sur Commons des AN, de la BAnQ, NARA, musées européens, etc.
  • 7.
    1. “Data sprintdes archives” ? 2. Exemples de visualisation de données 3. Focus sur les données collectées 4. Questions Exemples de visualisation de données ou comment obtenir, à partir d’un “simple” fichier XLS ou XML, toute sorte de chose...
  • 8.
    Exemples de visualisationde données Archives de la Manche (Pinterest) Gallica (Pinterest) Archives de Boulogne-Billancourt
  • 9.
    Exemples de visualisationde données Archives des Yvelines, liste des machines à vapeur (données non exhaustives et non corrigées) Voir carte de chaleur animée (heatmap) Fichier XLS CartoDB
  • 10.
    Statistiques sur lastructuration de fichiers XML et l’utilisation des balises EAD > les données comme aide à la décision Exemples de visualisation de données
  • 11.
    Avant-Après avec juxtapose.jshttp://goo.gl/yh0i00 Lieu de naissance et de mort à partir de fichiers XML-EAC Visualisation des traités & accords de la France de 1500-1900 par lieux de signature conservés aux #archives du Ministère des Affaires étrangères et européennes Exemples de visualisation de données
  • 12.
    Visualisation des expositionsdans les musées français (1900-1950) Fichier TXT initial Exposition Fragonard au Petit Palais, paris, du 21/02/1902 au 12/05/1902 “Plaisirs d’ornements”, Musée des Beaux-Art de Lille, Lille, janvier 1904 Fichier CSV_1 Titre_expo Lieu_musee Lieu_Ville Date_debut Date_fin Exposition Fragonard Petit Palais paris 21/02/1902 12/05/1902 “Plaisirs d’ornements ” Musée des Beaux-Art de Lille Lille janvier 1904 SPLIT + REGEX OpenRefine Titre_expo Lieu_musee Lieu_Ville Année Geoloc Exposition Fragonard Petit Palais Paris 1902 51.45643;- 124789 Plaisirs d’ornemen ts Musée des Beaux-Art de Lille Lille 1904 31.45643;- 024789 OpenRefine Nettoyage + REGEX + API
  • 13.
    Dataviz des relationsautour de la #Galerie Bonnier grâce à <cpfRelation> des notices XML-EAC Réseaux des élèves-architectes (en bleu) par ateliers (en rouge) lors de l’enseignement aux Beaux-Arts de Paris Exemples de visualisation de données
  • 14.
    Focus sur lesdonnées collectées données structurées : fichier XML, fichier Excel normalisé, etc. vs données non structurées (beaucoup plus difficilement utilisables) : fichier Word, listes non normalisées 1. “Data sprint des archives” ? 2. Exemples de visualisation de données 3. Focus sur les données collectées 4. Questions Fichier Sénateurs Second Empire
  • 15.
    Focus sur lesdonnées collectées On recherche encore : des statistiques (de type Google Analytics), des données XML EAC, des images libres de droit, etc. 1. “Data sprint des archives” ? 2. Exemples de visualisation de données 3. Focus sur les données collectées 4. Questions Participants actuels Thèmes AD10, AD26, AD31, AD35, AD50, AD51, AD62, AD71, AD78, AD89, AD95, AM Toulouse, AM Dijon, AM Beaune, AM Orléans, AM Rennes, Sénat, Inserm, Mémoire des Hommes, La Parisienne de Photographie, INHA, … + données disponibles sur les portails open data guerre et vie militaire, économie et travail (machines à vapeur, syndicats, grèves, factures), personnes (cartes postales, bases nominatives), monuments (MH, architectes), lieux (cartes postales, plans, monographies), héraldique, associations, surveillance Données de gestion (stats de service), statistiques sites Internet)
  • 16.
    1. “Data sprintdes archives” ? 2. Exemples de visualisation de données 3. Focus sur les données collectées 4. Questions A vos questions ! Question Mark Graffiti (Flickr) , CC BY 2.0 contact : forumdesarchivistes@archivistes.org Maïwenn Bourdic - Antoine Courtin