Data sprint des archives

3 976 vues

Publié le

réunion 27 11_2015

Publié dans : Données & analyses
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
3 976
Sur SlideShare
0
Issues des intégrations
0
Intégrations
2 355
Actions
Partages
0
Téléchargements
1
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Data sprint des archives

  1. 1. data sprint des archives Forum des Archivistes, Troyes, 30, 31 mars, 1er avril 2016
  2. 2. Réunion d’information sur le data sprint des archives 1. “data sprint des archives” ? où, quoi, qui, comment, pourquoi planning, licences de réutilisation 1. exemples de visualisation de données 2.focus sur les données collectées exemples critères (structuration des données) 1. questions
  3. 3. Tour de table Source : BanQ, Conrad Poirier [Public domain or Public domain], via Wikimedia Commons
  4. 4. “Data sprint des archives” ? 1. “Data sprint des archives” ? 2. Exemples de visualisation de données 3. Focus sur les données collectées 4. Questions ● Pourquoi ? Souhait du comité scientifique d’organiser un événement participatif ● Quoi ? Choix du format de l’événement : un data sprint étalé dans le temps Collecte de données > réutilisation et développement de dispositifs et dataviz par des équipes > restitution
  5. 5. “Data sprint des archives” ? 1. “Data sprint des archives” ? 2. Exemples de visualisation de données 3. Focus sur les données collectées 4. Questions ● Planning ● Comment Des équipes, à distance voire locales // des outils collaboratifs en ligne > Place des archivistes ? expliquer les données, nettoyer/normaliser les fichiers, découvrir, apprendre et échanger mars 2015 : début de la réflexion juin 2015 : choix du format, appel à participation (archives) mars 2016 : FORUM après ? SAV et débrief juillet-déc. 2015 : collecte des données janvier-mars 2016 : conception et dév. des dispositifs nov. 2015 : réunion d’information déc. 2015 : appel à participation (non archives)
  6. 6. “Data sprint des archives” ? 1. “Data sprint des archives” ? 2. Exemples de visualisation de données 3. Focus sur les données collectées 4. Questions ● Les licences des données collectées Au choix : - durée du forum (mais les dispositifs ne seront pas pérennes) - ouverture des données (dispositifs pérennes et ouverts après le forum, contenu open data / licences CC / ouvertes), avec accompagnement de l’équipe data sprint (y compris après le forum) Sur l’ouverture des données : - impact très important en matière de communication très important (visibilité, relais Etalab, etc.) - tutoriel : L’open data culturel (MCC, 2013) : http://dai.ly/xyqrun - tutoriel : Les licences Creative Commons (MCC, 2013) : http://dai.ly/x1tg4gv Exemples d’ouverture de données : AD71, AD78, AM Toulouse, téléversements d’images sur Commons des AN, de la BAnQ, NARA, musées européens, etc.
  7. 7. 1. “Data sprint des archives” ? 2. Exemples de visualisation de données 3. Focus sur les données collectées 4. Questions Exemples de visualisation de données ou comment obtenir, à partir d’un “simple” fichier XLS ou XML, toute sorte de chose...
  8. 8. Exemples de visualisation de données Archives de la Manche (Pinterest) Gallica (Pinterest) Archives de Boulogne-Billancourt
  9. 9. Exemples de visualisation de données Archives des Yvelines, liste des machines à vapeur (données non exhaustives et non corrigées) Voir carte de chaleur animée (heatmap) Fichier XLS CartoDB
  10. 10. Statistiques sur la structuration de fichiers XML et l’utilisation des balises EAD > les données comme aide à la décision Exemples de visualisation de données
  11. 11. Avant-Après avec juxtapose.js http://goo.gl/yh0i00 Lieu de naissance et de mort à partir de fichiers XML-EAC Visualisation des traités & accords de la France de 1500-1900 par lieux de signature conservés aux #archives du Ministère des Affaires étrangères et européennes Exemples de visualisation de données
  12. 12. Visualisation des expositions dans les musées français (1900-1950) Fichier TXT initial Exposition Fragonard au Petit Palais, paris, du 21/02/1902 au 12/05/1902 “Plaisirs d’ornements”, Musée des Beaux-Art de Lille, Lille, janvier 1904 Fichier CSV_1 Titre_expo Lieu_musee Lieu_Ville Date_debut Date_fin Exposition Fragonard Petit Palais paris 21/02/1902 12/05/1902 “Plaisirs d’ornements ” Musée des Beaux-Art de Lille Lille janvier 1904 SPLIT + REGEX OpenRefine Titre_expo Lieu_musee Lieu_Ville Année Geoloc Exposition Fragonard Petit Palais Paris 1902 51.45643;- 124789 Plaisirs d’ornemen ts Musée des Beaux-Art de Lille Lille 1904 31.45643;- 024789 OpenRefine Nettoyage + REGEX + API
  13. 13. Dataviz des relations autour de la #Galerie Bonnier grâce à <cpfRelation> des notices XML-EAC Réseaux des élèves-architectes (en bleu) par ateliers (en rouge) lors de l’enseignement aux Beaux-Arts de Paris Exemples de visualisation de données
  14. 14. Focus sur les données collectées données structurées : fichier XML, fichier Excel normalisé, etc. vs données non structurées (beaucoup plus difficilement utilisables) : fichier Word, listes non normalisées 1. “Data sprint des archives” ? 2. Exemples de visualisation de données 3. Focus sur les données collectées 4. Questions Fichier Sénateurs Second Empire
  15. 15. Focus sur les données collectées On recherche encore : des statistiques (de type Google Analytics), des données XML EAC, des images libres de droit, etc. 1. “Data sprint des archives” ? 2. Exemples de visualisation de données 3. Focus sur les données collectées 4. Questions Participants actuels Thèmes AD10, AD26, AD31, AD35, AD50, AD51, AD62, AD71, AD78, AD89, AD95, AM Toulouse, AM Dijon, AM Beaune, AM Orléans, AM Rennes, Sénat, Inserm, Mémoire des Hommes, La Parisienne de Photographie, INHA, … + données disponibles sur les portails open data guerre et vie militaire, économie et travail (machines à vapeur, syndicats, grèves, factures), personnes (cartes postales, bases nominatives), monuments (MH, architectes), lieux (cartes postales, plans, monographies), héraldique, associations, surveillance Données de gestion (stats de service), statistiques sites Internet)
  16. 16. 1. “Data sprint des archives” ? 2. Exemples de visualisation de données 3. Focus sur les données collectées 4. Questions A vos questions ! Question Mark Graffiti (Flickr) , CC BY 2.0 contact : forumdesarchivistes@archivistes.org Maïwenn Bourdic - Antoine Courtin

×