Grand Prix DataCulture du MCC: le projet Laderdesders
Archiver le web social: Quelles méthodes pour quels objectif ?
1. Archiver le web social
Quelles méthodes pour quels
objectifs ?
Session « Nouveaux objets archivistiques identifiés »
Antoine Courtin - Institut national d’histoire de l’art
#AAFTroyes2016 mercredi 30 mars 2016
2. Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
*Abstract*
Nous évoquerons le web social sous le prisme des réseaux sociaux pour
lequel, la question des archives, est devenu au fil du temps un enjeux, à la fois
pour les sociétés éditrices mais aussi pour les collectivités qui les utilisent.
Ainsi de la TimeCapsule réalisée par Twitter pour archiver les tweets de la
#MuseumWeek au grand projet de la LOC (Library of Congress) ou
d’InternetArchives, cette brève intervention évoquera les initiatives à différentes
échelles en abordant les enjeux techniques, épistémologiques et éthiques afin
de voir dans ces archives, un nouveau cas d’école pour les archivistes mais
également un nouvel object de recherche dans de multiples disciplines.
*Mots-clés/orientations*
Réseaux sociaux numériques
Outils de collecte
Twitter
Recherche
Etat de l’art
Projets en cours
4. Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
5. Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
6. Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
7. Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
Elaborer des stratégies pour la collecte de contenu (communication
officielle de l’institution + communication crowdsourcée des
communautés d’intérêt)
Connaitre les autres projets de collecte pour les autres organismes
(cohérence/coopération)
Evaluer les implications juridiques et éthique de l’archivage de contenu
des médias sociaux
Développer une compréhension de l’utilisation actuelle et des potentiels
du contenu des réseaux sociaux
Développer les modes de communications/rendus et les techniques
d’enrichissements et de description
Connaître les enjeux et les implications techniques de ce type de collecte
8. Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
Le web 2.0 offrent cette possibilité de trouver,
organiser, partager ou créer de l’information d’une
manière à la fois personnelle, mais globalement
accessible.
Coutant Alexandre, Stenger Thomas, « Processus identitaire et ordre de l'interaction sur les réseaux
socionumériques. », Les Enjeux de l'information et de la communication 1/2010 (Volume 2010) , p. 45-64
Lorsque vous utilisez un de nos services, vous consentez à la
récupération, le transfert, la manipulation, le stockage, la
divulgation entre autres utilisations de vos informations
comme décrit dans cette politique de confidentialité
Twitter, Politique de confidentialité, (2011)
9. Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
accroissement du volume des informations
apparition/disparition constante des plateformes de RSN
diversité des formats et mode d’accès aux données
mise à jour et agrégation continues des informations
Fréquence des captures, méthode et traitement des contenus +
accessibilité des corpus et valorisation
*Challenges*
10. Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
juillet 2006
Lancement de Twitter
Octobre 2009
Partenariat avec Google pour
un flux en temps réel (jusqu’en
juillet 2011)
Août 2015
Nouveau partenariat avec
Google (intégration temps réel
dans les SERP sur mobile et
postes fixes)
Ventes d’accès (et
de ses données) via
la société Datasift et
GNIP
Septembre 2015
juillet 2014
L a n c e m e n t d e
analytics.twitter.com
Avril 2012
Possibilité de télécharger
une « archive » de ses
tweets
Twitter devient le seul
interlocuteur pour accéder
à son FireHose
*Twitter et ses data*
Février 2013
Twitter donne accès à la totalité
de son archives par son
interface de recherche
14 avril 2010
Twitter reverse à
la Library of
Congress, 5 TO
Fév. 2012
Restriction de l’API
Avril 2014
Rachat de la société Gnip
1er tests des
@UkNatArchives
pour l’archivage des
tweets de comptes
gouvernementaux
2008
mai. 2009
Première version de l’API
2013
Depuis 2006, le volume de
tweets archivés par la LOC est
estimé à 170 milliards
Sept. 2012
11. Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
https://goo.gl/wyIdxt
12. Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
Elections Européennes - Collecte du web électoral par la #BnF
0
125
250
375
500
2009 2014
Compte Twitter Pages Facebook Nombre URL Total
Elections régionales - Collecte du web électoral par la #BnF
0
750
1500
2250
3000
2010 2015
13. Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
http://goo.gl/qMNcbA
14. Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
*Archives-it*
15. Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
https://dash.harvard.edu/bitstream/handle/1/25658314/HL_web_archiving_env_scan_2006.pdf?sequence=1
*L’exemple du Smithsonian*
16. Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
https://goo.gl/VlfUzL
17. Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
18. Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
19. Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
20. Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
21. Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
https://archive.org/details/twitterstream&tab=collection
22. Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
http://data.issy.com/explore/dataset/flux-rss-
du-twitter-issylesmoul/export/?
sort=published&disjunctive.published&disju
nctive.author
23. Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
http://politwoops.sunlightfoundation.com/
24. Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
*Implications juridiques et éthiques*
[…] the ethical challenge concentrate on a larger question: juste because
we can archive social media, does that mean we should ? […]
Twitter permet aux utilisateurs de déposer des demandes de retraits pour
les personnes utilisants du contenu sans attribution
Droits des utilisateurs / droits de propriété intellectuelle
La question de la vie privée et/ou du consentement des utilisateurs
Nécessité pour l’archiviste de documenter l’ensemble de leurs actions et
de décision.
Rivers CM and Lewis BL (2014) Ethical research standards in a world of big data [v1; ref status: approved with
reservations 1, http://f1000r.es/2wq] F1000Research 2014, 3:38 (doi: 10.12688/f1000research.3-38.v1)
25. Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
*Tools*
https://github.com/edsu/twarc
http://140dev.com/free-twitter-api-source-code-library/
https://github.com/digitalmethodsinitiative/dmi-tcat
https://tags.hawksey.info/get-tags/
26. Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
A pre-configured
collection of tools
including Social Feed
Manager and Lentil for
easily building Twitter and
Instagram social media
archives on your own
computer.
https://github.com/NCSU-Libraries/Social-Media-Combine
SocialMedia- Archives -ToolKit
Environmental Scan
https://www.lib.ncsu.edu/social-media-archives-toolkit/collecting/social-media-harvesting-tools
http://social-feed-manager.readthedocs.org/en/m5_004/
27. Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
http://digital.wustl.edu/ferguson/
http://goo.gl/M33QOs
28. Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
"Documenting the Now: Supporting Scholarly
Use and Preservation of Social Media Content"
project.
http://goo.gl/Z9fc2p
• Projet lancé en janvier 2016
• 3 institutions partenaires
• Université du Maryland
• Université Saint-Louis de Washingtion
• Université Riverside de Californie
• Financé par la Fondation Andrew W. Mellon
(à hauteur de 517000$ pour 2 ans)
• Développement d’un outil DocNow
29. Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
http://histnum.hypotheses.org/category/ww1
https://goo.gl/3va0rC
*Objet de recherche*
30. Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
http://goo.gl/G6tC0Y
31. Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
• Bibliographie sélective sur le dépôt légal de l’internet, Bibliothèque national de France (http://
www.bnf.fr/documents/bibliographie_dl_web.pdf)
• Web90 – Patrimoine, Mémoires et Histoire du Web dans les années 1990 (https://
web90.hypotheses.org/693)
• Web Archiving Environmental Scan, Harvard Library Report, January 2016 (https://goo.gl/
es2NDO)
• National Archives and Records Administration (White Paper on Best Practices for the Capture of
Social Media Records) http://goo.gl/d0sjSw
• @IanMiligan
• @ruebot
• @edsu
*Ressources*
• @valerie_schafer
• @inadlweb
• @HistWebArchives
IIPC Web Archiving Conference 2016, Reykjavík, Iceland 13-15 April, 2016
Sans oublier, la séance « Social Media Archiving »
• @DLWebBnF
• @AndreaGoethals
• @was3210
32. Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
Merci !
#AAFTroyes2016@seeksanusername