SlideShare une entreprise Scribd logo
Archiver les réseaux sociaux
Panorama des pratiques et des enjeux : entre approches théoriques et
retours d’expériences
Formation INA - le 3 décembre 2018
responsable de la cellule d’ingénierie documentaire, département des étude et de la recherche (INHA)
maitre de conférence associé à l’Université Paris Nanterre, laboratoire DICEN
Antoine Courtin
Avoir des «  billes  » pour élaborer des stratégies pour la collecte de
contenu (communication officielle de l’institution + communication
crowdsourcée des communautés d’intérêt).
Connaitre les autres projets de collecte par d’autres organismes
(cohérence/coopération, etc.) en France et à l’étranger.
Evaluer les implications juridiques et éthique de l’archivage de contenu
des médias sociaux
Connaître les enjeux et les implications techniques de ce type de collecte
Enjeux de l’intervention
La question des archives de Museomix varie selon la manière dont
on regarde l'initiative Museomix :
» Museomix comme un événement de 3 jours organisé sur une
année par des organisateurs.
» Museomix comme une communauté

» Museomix comme une performance
Les ateliers méthodologiques du dépôt légal
du web à l’Ina Vendredi 10 janvier 2014
- Article L211-1 du Code du patrimoine [en ligne], modifié par la loi n°
2008-696 du 15 juillet 2008, disponible sur http://www.legifrance.gouv.fr/
« l'ensemble des documents, quels que soient leur date,
leur lieu de conservation, leur 

forme et leur support, produits ou reçus par toute
personne physique ou morale et par tout service 

ou organisme public ou privé dans l'exercice de leur
activité. »
5 verbes pour définir les actions entourant une politique
d’archive du web social
Collecter
Stocker
Analyser
Publier
Préserver
• que peut-on collecter (limite des CGU)
• que faut-il collecter ?
• avec quels outils ?
• comment ?
• la question du format ?
• quels objectifs
• quali/quanti ?
• les biais à prendre en compte
• quelles modalités
• respect des CGU
• comment ? Et quels acteurs aujourd’hui
• à quel terme ? Pour quels usages futurs ?
Médias sociaux :
« les différentes activités qui intègrent la technologie, l’interaction
sociale, et la création de contenu »



Réseaux sociaux :
« point de rassemblement sur internet d’un groupe d’individus, et qui
met à leur disposition des outils favorisant les échanges entre eux »
http://www.blogdumoderateur.com/chiffres-internet/ http://www.internetlivestats.com/
Quels activités sur les RSN ?
Source : Blog Books are social
Une histoire (déjà) longue ?
On n’est pas maître des algorithmes de visibilité et des évolutions des business plan
Centralisation/captation des réseaux et donc des données
(alternative à Twitter : Mastodon)
Digital Labor
• accroissement du volume des informations
• apparition/disparition constante des plateformes de RSN
• diversité des formats et mode d’accès aux données
• mise à jour et agrégation continues des informations
• Fréquence des captures, méthode et traitement des contenus +
accessibilité des corpus et valorisation
*Challenges*
Zoom sur Twitter
• Pourquoi ?
• Quels biais ?
juillet 2006
Lancement de Twitter
Octobre 2009
Partenariat avec Google pour
un flux en temps réel (jusqu’en
juillet 2011)
Août 2015
Nouveau partenariat avec
Google (intégration temps réel
dans les SERP sur mobile et
postes fixes)
Ventes d’accès (et
de ses données) via
la société Datasift et
GNIP
Septembre 2015
juillet 2014
L a n c e m e n t d e
analytics.twitter.com
Avril 2012
Possibilité de télécharger
une «  archive  » de ses
tweets
Twitter devient le seul
interlocuteur pour accéder
à son FireHose
*Twitter et ses data*
Février 2013
Twitter donne accès à la totalité
de son archives par son
interface de recherche
14 avril 2010
Twitter reverse à
la Library of
Congress, 5 TO
Fév. 2012
Restriction de l’API
Avril 2014
Rachat de la société Gnip
1er tests des
@UkNatArchives
pour l’archivage des
tweets de comptes
gouvernementaux
2008
mai. 2009
Première version de l’API
2013
Depuis 2006, le volume de
tweets archivés par la LOC est
estimé à 170 milliards
Sept. 2012
La LOC annonce quà partir du 1er janvier 2018, réaliser l’archivage des tweets par des sélections
janvier 2018
La collecte
les
tweets de
« compte »
les
tweets
d’évènements
les
tweets
de
conversations
Les
informations
de comptes
Les
statistiques
de tweets
@seeksanusername #askanArchivistDay https://twitter.com/
bymichalak/status/
1031855670134534145
https://analytics.twitter.com/
Quoi collecter ?
https://gwu-libraries.github.io/sfm-ui/
Tweet Visibility Dynamics in a Tweet Conversation Graph
http://ws-dl.blogspot.com/2016/07/2016-07-18-tweet-visibility-dynamics-in.html
L’analyse
La question des « usagers » - Humains ou robots ?
Formerly known as BotOrNot, part of the OSoMe project at Indiana University.
https://botometer.iuni.iu.edu/#!/
http://socialmediadata.org/social-media-research-toolkit/
La publication
https://tweetsets.library.gwu.edu/
La préservation
https://goo.gl/wyIdxt
Elections Européennes - Collecte du web électoral par la #BnF
0
125
250
375
500
2009 2014
Compte Twitter Pages Facebook Nombre URL Total
Elections régionales - Collecte du web électoral par la #BnF
0
750
1500
2250
3000
2010 2015
https://www.alfresco.com/products/ecm/integrations/alfresco-mulesoft
Des limites ?
- à toutes les étapes
- de différentes « natures »
- légales
- techniques
- éthiques
Les CGU des RSN
https://developer.twitter.com/en/docs/tweets/search/overview
via Anatoliy Gruzd
Une question Ethique ?
via Anatoliy Gruzd
Une question Ethique ?
• Voir le support « Social media research ethical and privacy guidelines »
• https://gwu-libraries.github.io/sfm-ui/resources/
social_media_research_ethical_and_privacy_guidelines.pdf
• Propose des «  lignes directrices  » pour aider à penser un projet autour des données issues des
médias sociaux lors des différents phases (de collecte, d’archivage, d’analyse , etc.)
• Surtout applicable aux données Twitter mais finalement parfois plus larges aux données sociales et
publiques.
• Pour la collecte, soyez particulièrement attentif :
• à la collecte de données des personnes vulnérables (mineurs, etc.)
• à la collecte des médias sociaux qui pourraient être sensibles ou nuisibles («  comportement
moralement douteux », pornographie, etc.)
• à la collecte de données avec une approche géographique car peut poser des problèmes de
protection de la vie privée des utilisateurs.
*Implications juridiques et éthiques*
[…] the ethical challenge concentrate on a larger question: juste because
we can archive social media, does that mean we should ? […]
Twitter permet aux utilisateurs de déposer des demandes de retraits pour
les personnes utilisants du contenu sans attribution
Droits des utilisateurs / droits de propriété intellectuelle
La question de la vie privée et/ou du consentement des utilisateurs
Nécessité pour l’archiviste de documenter l’ensemble de leurs actions et
de décision.
Rivers CM and Lewis BL (2014) Ethical research standards in a world of big data [v1; ref status: approved with
reservations 1, http://f1000r.es/2wq] F1000Research 2014, 3:38 (doi: 10.12688/f1000research.3-38.v1)
Matthew L Williams, Pete Burnap, Luke Sloan (2017). “Towards an Ethical Framework for Publishing Twitter Data in
Social Research: Taking into Account Users’ Views, Online Context and Algorithmic Estimation” http://
journals.sagepub.com/doi/full/10.1177/0038038517708140
Quelques projets en cours
https://archivesocial.com/whitehouse/
http://www.trumptwitterarchive.com/
http://goo.gl/qMNcbA
*Archives-it*
https://dash.harvard.edu/bitstream/handle/1/25658314/HL_web_archiving_env_scan_2006.pdf?sequence=1
*L’exemple du Smithsonian*
https://goo.gl/VlfUzL
https://archive.org/details/twitterstream&tab=collection
http://data.issy.com/explore/dataset/flux-rss-
du-twitter-issylesmoul/export/?
sort=published&disjunctive.published&disju
nctive.author
Comment collecter ?
[solution + ou – « geeks »]
https://github.com/edsu/twarc
http://140dev.com/free-twitter-api-source-code-library/
https://github.com/digitalmethodsinitiative/dmi-tcat
https://tags.hawksey.info/get-tags/
http://sferik.github.
A Web Scraping Methodology for Bypassing Twitter API
Restrictions. https://arxiv.org/pdf/1803.09875.pdf
https://github.com/bpb27/twitter_scraping
https://rtweet.info/
A pre-configured
collection of tools
including Social Feed
Manager and Lentil for
easily building Twitter and
Instagram social media
archives on your own
computer.
https://github.com/NCSU-Libraries/Social-Media-Combine
SocialMedia- Archives -ToolKit
Environmental Scan
https://www.lib.ncsu.edu/social-media-archives-toolkit/collecting/social-media-harvesting-tools
http://social-feed-manager.readthedocs.org/en/m5_004/
https://wiki.digitalmethods.net/Dmi/ToolDatabase?
cat=MediaAnalysis&subcat=Media%20Monitoring
Et du côté de Facebook
• même soucis que Twitter > versalité des collecte à
cause des API
• petite astuce : retrouver l’id des pages avec http://
lookup-id.com/#
A l’INHA
• Collecte de tous les hastags pilotés par l’INHA (via twarc)
• Téléchargement annuel des archives de comptes de tous les
comptes associés à l’INHA
• Téléchargement des données statistiques tous les 3 mois.
• Politique de nommage et sauvegarde en CSV sur serveurs
redondés (en attendant outils de conservation d’objets
numériques).
• analyse des statistiques et des collectes – aide au pilotage
Une approche pragmatique
Nouveaux « matériaux » pour
la recherche
http://digital.wustl.edu/ferguson/
http://goo.gl/M33QOs
«  Documenting the Now: Supporting Scholarly Use and
Preservation of Social Media Content » project.
http://goo.gl/Z9fc2p
• Projet lancé en janvier 2016
• 3 institutions partenaires
• Université du Maryland
• Université Saint-Louis de Washingtion
• Université Riverside de Californie
• Financé par la Fondation Andrew W. Mellon
(à hauteur de 517000$ pour 2 ans)
• Développement d’un outil DocNow
Le dossier "Le temps long des réseaux sociaux numériques" du Temps des médias, coordonné par Cécile Meadel, Frédéric Clavert et Martin Grandjeau vient de
paraitre. Disponible le 3 décembre en librairie et bientôt sur @Cairninfo
http://histnum.hypotheses.org/category/ww1
*Objet de recherche*
http://ideo2017.ensea.fr/plateforme/
http://politwoops.sunlightfoundation.com/
https://goo.gl/3va0rC
https://hal.archives-ouvertes.fr/hal-01758645
https://hal.archives-ouvertes.fr/hal-01145723
https://halshs.archives-ouvertes.fr/halshs-01217118
• Bibliographie sélective sur le dépôt légal de l’internet, Bibliothèque national de France (http://
www.bnf.fr/documents/bibliographie_dl_web.pdf)
• Web90 – Patrimoine, Mémoires et Histoire du Web dans les années 1990 (https://
web90.hypotheses.org/693)
• Web Archiving Environmental Scan, Harvard Library Report, January 2016 (https://goo.gl/
es2NDO)
• National Archives and Records Administration (White Paper on Best Practices for the Capture of
Social Media Records) http://goo.gl/d0sjSw
• @IanMiligan
• @ruebot
• @edsu
• @documentnow
*Ressources*
• @gruzd
• @valerie_schafer
• @inadlweb
• @HistWebArchives
Sans oublier, les séance « Social Media Archiving »
aux conférences IIPC (International Internet Preservation Consortium)
• @DLWebBnF
• @AndreaGoethals
• @was3210
Merci !

Contenu connexe

Tendances

đáNh giá công tác quản lý và xử lý chất thải tại bệnh viện đa khoa tỉnh hà giang
đáNh giá công tác quản lý và xử lý chất thải tại bệnh viện đa khoa tỉnh hà giangđáNh giá công tác quản lý và xử lý chất thải tại bệnh viện đa khoa tỉnh hà giang
đáNh giá công tác quản lý và xử lý chất thải tại bệnh viện đa khoa tỉnh hà giang
TÀI LIỆU NGÀNH MAY
 
Outils de veille - catalogue
Outils de veille - catalogueOutils de veille - catalogue
Outils de veille - catalogue
Raphaël Rey
 
Les enjeux du Big Data pour l'Entreprise - These professionnelle -Touria Engo...
Les enjeux du Big Data pour l'Entreprise - These professionnelle -Touria Engo...Les enjeux du Big Data pour l'Entreprise - These professionnelle -Touria Engo...
Les enjeux du Big Data pour l'Entreprise - These professionnelle -Touria Engo...
Touria Engohan
 
Utiliser Twitter pour la veille et la communication
Utiliser Twitter pour la veille et la communicationUtiliser Twitter pour la veille et la communication
Utiliser Twitter pour la veille et la communication
URFIST de Rennes
 
Plagiarism in Scientific Writing
Plagiarism in Scientific WritingPlagiarism in Scientific Writing
Plagiarism in Scientific Writing
Cognibrain Healthcare
 
les outils de veille
les outils de veilleles outils de veille
les outils de veille
Anne-Gaëlle Gaudion
 
How to-write-a-research-paper
How to-write-a-research-paperHow to-write-a-research-paper
How to-write-a-research-paper
Hussein Kh. Abusamra
 
good proposal ppt2.pptx
good proposal ppt2.pptxgood proposal ppt2.pptx
good proposal ppt2.pptx
Dr-Faisal Al-Shormany
 
Maaouia Hamza Rapport de stage
Maaouia Hamza Rapport de stageMaaouia Hamza Rapport de stage
Maaouia Hamza Rapport de stage
Maaouia Hamza
 
Big data : quels enjeux et opportunités pour l'entreprise - livre blanc - Blu...
Big data : quels enjeux et opportunités pour l'entreprise - livre blanc - Blu...Big data : quels enjeux et opportunités pour l'entreprise - livre blanc - Blu...
Big data : quels enjeux et opportunités pour l'entreprise - livre blanc - Blu...
Romain Fonnier
 
Table des matières - Mémoire Yann ALLEGRE
Table des matières - Mémoire Yann ALLEGRETable des matières - Mémoire Yann ALLEGRE
Table des matières - Mémoire Yann ALLEGRE
Yann ALLEGRE
 
data collection primary secondary methods
data collection primary secondary methodsdata collection primary secondary methods
data collection primary secondary methods
Alen philip
 
Introduction à la veille technologique S1E01
Introduction à la veille technologique S1E01Introduction à la veille technologique S1E01
Introduction à la veille technologique S1E01
Alain Marois
 
Research and Scientific Methods.pptx
Research and Scientific Methods.pptxResearch and Scientific Methods.pptx
Research and Scientific Methods.pptx
Dr Kirpa Ram Jangra
 
Presentation Of Research Work
Presentation Of Research WorkPresentation Of Research Work
Presentation Of Research Work
ChandraMouli Gunturi L
 
Plagiarism & Reference Management in Scholarly Writing
Plagiarism & Reference Management in Scholarly WritingPlagiarism & Reference Management in Scholarly Writing
Plagiarism & Reference Management in Scholarly Writing
Peter Odion Ubuane
 
Research Methodology-Research Process
Research Methodology-Research ProcessResearch Methodology-Research Process
Research Methodology-Research Process
Chinmay Rout
 
Research Process Steps
Research Process StepsResearch Process Steps
Research Process Steps
Shakeel Ahmed
 
Initiation à la veille documentaire
Initiation à la veille documentaireInitiation à la veille documentaire
Initiation à la veille documentaire
Joanne Mercher
 
Enseigner la veille informationnelle à la technique en documentation
Enseigner la veille informationnelle à la technique en documentationEnseigner la veille informationnelle à la technique en documentation
Enseigner la veille informationnelle à la technique en documentation
Elsa Drevon
 

Tendances (20)

đáNh giá công tác quản lý và xử lý chất thải tại bệnh viện đa khoa tỉnh hà giang
đáNh giá công tác quản lý và xử lý chất thải tại bệnh viện đa khoa tỉnh hà giangđáNh giá công tác quản lý và xử lý chất thải tại bệnh viện đa khoa tỉnh hà giang
đáNh giá công tác quản lý và xử lý chất thải tại bệnh viện đa khoa tỉnh hà giang
 
Outils de veille - catalogue
Outils de veille - catalogueOutils de veille - catalogue
Outils de veille - catalogue
 
Les enjeux du Big Data pour l'Entreprise - These professionnelle -Touria Engo...
Les enjeux du Big Data pour l'Entreprise - These professionnelle -Touria Engo...Les enjeux du Big Data pour l'Entreprise - These professionnelle -Touria Engo...
Les enjeux du Big Data pour l'Entreprise - These professionnelle -Touria Engo...
 
Utiliser Twitter pour la veille et la communication
Utiliser Twitter pour la veille et la communicationUtiliser Twitter pour la veille et la communication
Utiliser Twitter pour la veille et la communication
 
Plagiarism in Scientific Writing
Plagiarism in Scientific WritingPlagiarism in Scientific Writing
Plagiarism in Scientific Writing
 
les outils de veille
les outils de veilleles outils de veille
les outils de veille
 
How to-write-a-research-paper
How to-write-a-research-paperHow to-write-a-research-paper
How to-write-a-research-paper
 
good proposal ppt2.pptx
good proposal ppt2.pptxgood proposal ppt2.pptx
good proposal ppt2.pptx
 
Maaouia Hamza Rapport de stage
Maaouia Hamza Rapport de stageMaaouia Hamza Rapport de stage
Maaouia Hamza Rapport de stage
 
Big data : quels enjeux et opportunités pour l'entreprise - livre blanc - Blu...
Big data : quels enjeux et opportunités pour l'entreprise - livre blanc - Blu...Big data : quels enjeux et opportunités pour l'entreprise - livre blanc - Blu...
Big data : quels enjeux et opportunités pour l'entreprise - livre blanc - Blu...
 
Table des matières - Mémoire Yann ALLEGRE
Table des matières - Mémoire Yann ALLEGRETable des matières - Mémoire Yann ALLEGRE
Table des matières - Mémoire Yann ALLEGRE
 
data collection primary secondary methods
data collection primary secondary methodsdata collection primary secondary methods
data collection primary secondary methods
 
Introduction à la veille technologique S1E01
Introduction à la veille technologique S1E01Introduction à la veille technologique S1E01
Introduction à la veille technologique S1E01
 
Research and Scientific Methods.pptx
Research and Scientific Methods.pptxResearch and Scientific Methods.pptx
Research and Scientific Methods.pptx
 
Presentation Of Research Work
Presentation Of Research WorkPresentation Of Research Work
Presentation Of Research Work
 
Plagiarism & Reference Management in Scholarly Writing
Plagiarism & Reference Management in Scholarly WritingPlagiarism & Reference Management in Scholarly Writing
Plagiarism & Reference Management in Scholarly Writing
 
Research Methodology-Research Process
Research Methodology-Research ProcessResearch Methodology-Research Process
Research Methodology-Research Process
 
Research Process Steps
Research Process StepsResearch Process Steps
Research Process Steps
 
Initiation à la veille documentaire
Initiation à la veille documentaireInitiation à la veille documentaire
Initiation à la veille documentaire
 
Enseigner la veille informationnelle à la technique en documentation
Enseigner la veille informationnelle à la technique en documentationEnseigner la veille informationnelle à la technique en documentation
Enseigner la veille informationnelle à la technique en documentation
 

Similaire à Archiver les réseaux sociaux : Panorama des pratiques et des enjeux : entre approches théoriques et retours d’expériences

Archiver le web social: Quelles méthodes pour quels objectif ?
Archiver le web social: Quelles méthodes pour quels objectif ?Archiver le web social: Quelles méthodes pour quels objectif ?
Archiver le web social: Quelles méthodes pour quels objectif ?
Antoine Courtin
 
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-RéponsesFiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
Agropolis International
 
Cours magistral Internet et Recherche documentaire, SCD Université de Rennes 2
Cours magistral Internet et Recherche documentaire, SCD Université de Rennes 2Cours magistral Internet et Recherche documentaire, SCD Université de Rennes 2
Cours magistral Internet et Recherche documentaire, SCD Université de Rennes 2BELVEZE Damien
 
Internet 2011 2012 illustré v3
Internet 2011 2012 illustré v3Internet 2011 2012 illustré v3
Internet 2011 2012 illustré v3BELVEZE Damien
 
Veille et social bookmarking
Veille et social bookmarkingVeille et social bookmarking
Veille et social bookmarking
Claire Chignard
 
Curation urfist fevrier_mars_2013
Curation urfist fevrier_mars_2013Curation urfist fevrier_mars_2013
Curation urfist fevrier_mars_2013
François Magnan
 
Compte-Rendu rencontre du groupe Culture du Datalab
Compte-Rendu rencontre du groupe Culture du DatalabCompte-Rendu rencontre du groupe Culture du Datalab
Compte-Rendu rencontre du groupe Culture du DatalabDatalab_PDL
 
Reseaux sociaux professionnels- Curation de contenu - Scoop.it, Storify, Pape...
Reseaux sociaux professionnels- Curation de contenu - Scoop.it, Storify, Pape...Reseaux sociaux professionnels- Curation de contenu - Scoop.it, Storify, Pape...
Reseaux sociaux professionnels- Curation de contenu - Scoop.it, Storify, Pape...
Alban Jarry
 
Veille professionnelle : utiliser les ressources numériques
Veille professionnelle : utiliser les ressources numériquesVeille professionnelle : utiliser les ressources numériques
Veille professionnelle : utiliser les ressources numériques
Elisabeth Ranguin
 
Cnfpt formationmediationnumerique
Cnfpt formationmediationnumeriqueCnfpt formationmediationnumerique
Cnfpt formationmediationnumerique
ABES
 
Cnfpt formationmediationnumerique
Cnfpt formationmediationnumeriqueCnfpt formationmediationnumerique
Cnfpt formationmediationnumeriqueABES
 
L’internet des sciences humaines et sociales. Recherches - Perspectives
L’internet des sciences humaines et sociales. Recherches - Perspectives L’internet des sciences humaines et sociales. Recherches - Perspectives
L’internet des sciences humaines et sociales. Recherches - Perspectives
Phonothèque MMSH
 
Les enjeux de la valorisation numérique de la recherche
Les enjeux de la valorisation numérique de la rechercheLes enjeux de la valorisation numérique de la recherche
Les enjeux de la valorisation numérique de la recherche
Conseil constitutionnel, Constitutional Council, France
 
Mémoire de fin d'étude - La big data et les réseaux sociaux
Mémoire de fin d'étude - La big data et les réseaux sociauxMémoire de fin d'étude - La big data et les réseaux sociaux
Mémoire de fin d'étude - La big data et les réseaux sociaux
Chloé Marty
 
Les outils du web en bibliotheque 1er partie
Les outils du web en bibliotheque 1er partieLes outils du web en bibliotheque 1er partie
Les outils du web en bibliotheque 1er partie
Xavier Galaup
 
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Gautier Poupeau
 
Naturopédia : Publication multi-supports et animation communautaire augmenté...
Naturopédia  : Publication multi-supports et animation communautaire augmenté...Naturopédia  : Publication multi-supports et animation communautaire augmenté...
Naturopédia : Publication multi-supports et animation communautaire augmenté...
SemWebPro
 
Veille et curation synthèse
Veille et curation synthèseVeille et curation synthèse
Veille et curation synthèse
MarieCcileMichallet
 
Présentation d'Atelier Open data 2014
Présentation d'Atelier Open data 2014Présentation d'Atelier Open data 2014
Présentation d'Atelier Open data 2014
UNICAMP_masters_MIPI_MITIC
 

Similaire à Archiver les réseaux sociaux : Panorama des pratiques et des enjeux : entre approches théoriques et retours d’expériences (20)

Archiver le web social: Quelles méthodes pour quels objectif ?
Archiver le web social: Quelles méthodes pour quels objectif ?Archiver le web social: Quelles méthodes pour quels objectif ?
Archiver le web social: Quelles méthodes pour quels objectif ?
 
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-RéponsesFiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
 
Cm internet 2010 2011
Cm internet 2010 2011Cm internet 2010 2011
Cm internet 2010 2011
 
Cours magistral Internet et Recherche documentaire, SCD Université de Rennes 2
Cours magistral Internet et Recherche documentaire, SCD Université de Rennes 2Cours magistral Internet et Recherche documentaire, SCD Université de Rennes 2
Cours magistral Internet et Recherche documentaire, SCD Université de Rennes 2
 
Internet 2011 2012 illustré v3
Internet 2011 2012 illustré v3Internet 2011 2012 illustré v3
Internet 2011 2012 illustré v3
 
Veille et social bookmarking
Veille et social bookmarkingVeille et social bookmarking
Veille et social bookmarking
 
Curation urfist fevrier_mars_2013
Curation urfist fevrier_mars_2013Curation urfist fevrier_mars_2013
Curation urfist fevrier_mars_2013
 
Compte-Rendu rencontre du groupe Culture du Datalab
Compte-Rendu rencontre du groupe Culture du DatalabCompte-Rendu rencontre du groupe Culture du Datalab
Compte-Rendu rencontre du groupe Culture du Datalab
 
Reseaux sociaux professionnels- Curation de contenu - Scoop.it, Storify, Pape...
Reseaux sociaux professionnels- Curation de contenu - Scoop.it, Storify, Pape...Reseaux sociaux professionnels- Curation de contenu - Scoop.it, Storify, Pape...
Reseaux sociaux professionnels- Curation de contenu - Scoop.it, Storify, Pape...
 
Veille professionnelle : utiliser les ressources numériques
Veille professionnelle : utiliser les ressources numériquesVeille professionnelle : utiliser les ressources numériques
Veille professionnelle : utiliser les ressources numériques
 
Cnfpt formationmediationnumerique
Cnfpt formationmediationnumeriqueCnfpt formationmediationnumerique
Cnfpt formationmediationnumerique
 
Cnfpt formationmediationnumerique
Cnfpt formationmediationnumeriqueCnfpt formationmediationnumerique
Cnfpt formationmediationnumerique
 
L’internet des sciences humaines et sociales. Recherches - Perspectives
L’internet des sciences humaines et sociales. Recherches - Perspectives L’internet des sciences humaines et sociales. Recherches - Perspectives
L’internet des sciences humaines et sociales. Recherches - Perspectives
 
Les enjeux de la valorisation numérique de la recherche
Les enjeux de la valorisation numérique de la rechercheLes enjeux de la valorisation numérique de la recherche
Les enjeux de la valorisation numérique de la recherche
 
Mémoire de fin d'étude - La big data et les réseaux sociaux
Mémoire de fin d'étude - La big data et les réseaux sociauxMémoire de fin d'étude - La big data et les réseaux sociaux
Mémoire de fin d'étude - La big data et les réseaux sociaux
 
Les outils du web en bibliotheque 1er partie
Les outils du web en bibliotheque 1er partieLes outils du web en bibliotheque 1er partie
Les outils du web en bibliotheque 1er partie
 
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
 
Naturopédia : Publication multi-supports et animation communautaire augmenté...
Naturopédia  : Publication multi-supports et animation communautaire augmenté...Naturopédia  : Publication multi-supports et animation communautaire augmenté...
Naturopédia : Publication multi-supports et animation communautaire augmenté...
 
Veille et curation synthèse
Veille et curation synthèseVeille et curation synthèse
Veille et curation synthèse
 
Présentation d'Atelier Open data 2014
Présentation d'Atelier Open data 2014Présentation d'Atelier Open data 2014
Présentation d'Atelier Open data 2014
 

Plus de Antoine Courtin

#DHNord2019 : Pour un regard à 360 degrés des corpus visuels : pratiques de m...
#DHNord2019 : Pour un regard à 360 degrés des corpus visuels : pratiques de m...#DHNord2019 : Pour un regard à 360 degrés des corpus visuels : pratiques de m...
#DHNord2019 : Pour un regard à 360 degrés des corpus visuels : pratiques de m...
Antoine Courtin
 
Focus sur l’OpenData dans le champs culturel
Focus sur l’OpenData dans le champs culturelFocus sur l’OpenData dans le champs culturel
Focus sur l’OpenData dans le champs culturel
Antoine Courtin
 
(Brève) Introduction à la visualisation de données (en SHS)
(Brève) Introduction à la visualisation de données (en SHS)(Brève) Introduction à la visualisation de données (en SHS)
(Brève) Introduction à la visualisation de données (en SHS)
Antoine Courtin
 
Crodwsourcing dans les institutions culturelles: mise-à-jour pour l'année 2015
Crodwsourcing dans les institutions culturelles: mise-à-jour pour l'année 2015Crodwsourcing dans les institutions culturelles: mise-à-jour pour l'année 2015
Crodwsourcing dans les institutions culturelles: mise-à-jour pour l'année 2015
Antoine Courtin
 
Data, méthodes quantitatives, visualisation, stats… (Très) brève introduction...
Data, méthodes quantitatives, visualisation, stats… (Très) brève introduction...Data, méthodes quantitatives, visualisation, stats… (Très) brève introduction...
Data, méthodes quantitatives, visualisation, stats… (Très) brève introduction...
Antoine Courtin
 
Analyzing Social Network Interaction in Cultural Field
Analyzing Social Network Interaction in Cultural FieldAnalyzing Social Network Interaction in Cultural Field
Analyzing Social Network Interaction in Cultural Field
Antoine Courtin
 
#Weviz : Présentation d'outils
#Weviz : Présentation d'outils#Weviz : Présentation d'outils
#Weviz : Présentation d'outils
Antoine Courtin
 
Sources et ressources dans le domaine culturelle
Sources et ressources dans le domaine culturelleSources et ressources dans le domaine culturelle
Sources et ressources dans le domaine culturelle
Antoine Courtin
 
#OuEstSaintLouis: opération Twitter organisée par le musée de Cluny et le Cen...
#OuEstSaintLouis: opération Twitter organisée par le musée de Cluny et le Cen...#OuEstSaintLouis: opération Twitter organisée par le musée de Cluny et le Cen...
#OuEstSaintLouis: opération Twitter organisée par le musée de Cluny et le Cen...
Antoine Courtin
 
MuseumWeek2014: 1er infographie
MuseumWeek2014: 1er infographie MuseumWeek2014: 1er infographie
MuseumWeek2014: 1er infographie
Antoine Courtin
 
Brève introduction au Linked Open Data [appliqué aux institutions culturelles]
Brève introduction au Linked Open Data [appliqué aux institutions culturelles]Brève introduction au Linked Open Data [appliqué aux institutions culturelles]
Brève introduction au Linked Open Data [appliqué aux institutions culturelles]
Antoine Courtin
 
Médiation numérique dans les GLAMs: Crowdsourcing, réseaux sociaux, Open Data...
Médiation numérique dans les GLAMs: Crowdsourcing, réseaux sociaux, Open Data...Médiation numérique dans les GLAMs: Crowdsourcing, réseaux sociaux, Open Data...
Médiation numérique dans les GLAMs: Crowdsourcing, réseaux sociaux, Open Data...
Antoine Courtin
 
Methodological Proposals for Designing Federative Platforms in Cultural Linke...
Methodological Proposals for Designing Federative Platforms in Cultural Linke...Methodological Proposals for Designing Federative Platforms in Cultural Linke...
Methodological Proposals for Designing Federative Platforms in Cultural Linke...
Antoine Courtin
 
Données et institutions culturelles à l’heure de LinkedOpenData : quelles per...
Données et institutions culturelles à l’heure de LinkedOpenData : quelles per...Données et institutions culturelles à l’heure de LinkedOpenData : quelles per...
Données et institutions culturelles à l’heure de LinkedOpenData : quelles per...
Antoine Courtin
 
#MuseumWeekAnalyzes : Pistes méthodologiques autour de l'opération MuseumWeek
#MuseumWeekAnalyzes : Pistes méthodologiques autour de l'opération MuseumWeek#MuseumWeekAnalyzes : Pistes méthodologiques autour de l'opération MuseumWeek
#MuseumWeekAnalyzes : Pistes méthodologiques autour de l'opération MuseumWeek
Antoine Courtin
 
Archives & expériences collaboratives: l'objet Museomix
Archives & expériences collaboratives: l'objet MuseomixArchives & expériences collaboratives: l'objet Museomix
Archives & expériences collaboratives: l'objet Museomix
Antoine Courtin
 
Grand Prix DataCulture du MCC: le projet Laderdesders
Grand Prix DataCulture du MCC: le projet LaderdesdersGrand Prix DataCulture du MCC: le projet Laderdesders
Grand Prix DataCulture du MCC: le projet Laderdesders
Antoine Courtin
 

Plus de Antoine Courtin (17)

#DHNord2019 : Pour un regard à 360 degrés des corpus visuels : pratiques de m...
#DHNord2019 : Pour un regard à 360 degrés des corpus visuels : pratiques de m...#DHNord2019 : Pour un regard à 360 degrés des corpus visuels : pratiques de m...
#DHNord2019 : Pour un regard à 360 degrés des corpus visuels : pratiques de m...
 
Focus sur l’OpenData dans le champs culturel
Focus sur l’OpenData dans le champs culturelFocus sur l’OpenData dans le champs culturel
Focus sur l’OpenData dans le champs culturel
 
(Brève) Introduction à la visualisation de données (en SHS)
(Brève) Introduction à la visualisation de données (en SHS)(Brève) Introduction à la visualisation de données (en SHS)
(Brève) Introduction à la visualisation de données (en SHS)
 
Crodwsourcing dans les institutions culturelles: mise-à-jour pour l'année 2015
Crodwsourcing dans les institutions culturelles: mise-à-jour pour l'année 2015Crodwsourcing dans les institutions culturelles: mise-à-jour pour l'année 2015
Crodwsourcing dans les institutions culturelles: mise-à-jour pour l'année 2015
 
Data, méthodes quantitatives, visualisation, stats… (Très) brève introduction...
Data, méthodes quantitatives, visualisation, stats… (Très) brève introduction...Data, méthodes quantitatives, visualisation, stats… (Très) brève introduction...
Data, méthodes quantitatives, visualisation, stats… (Très) brève introduction...
 
Analyzing Social Network Interaction in Cultural Field
Analyzing Social Network Interaction in Cultural FieldAnalyzing Social Network Interaction in Cultural Field
Analyzing Social Network Interaction in Cultural Field
 
#Weviz : Présentation d'outils
#Weviz : Présentation d'outils#Weviz : Présentation d'outils
#Weviz : Présentation d'outils
 
Sources et ressources dans le domaine culturelle
Sources et ressources dans le domaine culturelleSources et ressources dans le domaine culturelle
Sources et ressources dans le domaine culturelle
 
#OuEstSaintLouis: opération Twitter organisée par le musée de Cluny et le Cen...
#OuEstSaintLouis: opération Twitter organisée par le musée de Cluny et le Cen...#OuEstSaintLouis: opération Twitter organisée par le musée de Cluny et le Cen...
#OuEstSaintLouis: opération Twitter organisée par le musée de Cluny et le Cen...
 
MuseumWeek2014: 1er infographie
MuseumWeek2014: 1er infographie MuseumWeek2014: 1er infographie
MuseumWeek2014: 1er infographie
 
Brève introduction au Linked Open Data [appliqué aux institutions culturelles]
Brève introduction au Linked Open Data [appliqué aux institutions culturelles]Brève introduction au Linked Open Data [appliqué aux institutions culturelles]
Brève introduction au Linked Open Data [appliqué aux institutions culturelles]
 
Médiation numérique dans les GLAMs: Crowdsourcing, réseaux sociaux, Open Data...
Médiation numérique dans les GLAMs: Crowdsourcing, réseaux sociaux, Open Data...Médiation numérique dans les GLAMs: Crowdsourcing, réseaux sociaux, Open Data...
Médiation numérique dans les GLAMs: Crowdsourcing, réseaux sociaux, Open Data...
 
Methodological Proposals for Designing Federative Platforms in Cultural Linke...
Methodological Proposals for Designing Federative Platforms in Cultural Linke...Methodological Proposals for Designing Federative Platforms in Cultural Linke...
Methodological Proposals for Designing Federative Platforms in Cultural Linke...
 
Données et institutions culturelles à l’heure de LinkedOpenData : quelles per...
Données et institutions culturelles à l’heure de LinkedOpenData : quelles per...Données et institutions culturelles à l’heure de LinkedOpenData : quelles per...
Données et institutions culturelles à l’heure de LinkedOpenData : quelles per...
 
#MuseumWeekAnalyzes : Pistes méthodologiques autour de l'opération MuseumWeek
#MuseumWeekAnalyzes : Pistes méthodologiques autour de l'opération MuseumWeek#MuseumWeekAnalyzes : Pistes méthodologiques autour de l'opération MuseumWeek
#MuseumWeekAnalyzes : Pistes méthodologiques autour de l'opération MuseumWeek
 
Archives & expériences collaboratives: l'objet Museomix
Archives & expériences collaboratives: l'objet MuseomixArchives & expériences collaboratives: l'objet Museomix
Archives & expériences collaboratives: l'objet Museomix
 
Grand Prix DataCulture du MCC: le projet Laderdesders
Grand Prix DataCulture du MCC: le projet LaderdesdersGrand Prix DataCulture du MCC: le projet Laderdesders
Grand Prix DataCulture du MCC: le projet Laderdesders
 

Dernier

Actualisation estimation élections européennes 2024
Actualisation estimation élections européennes 2024Actualisation estimation élections européennes 2024
Actualisation estimation élections européennes 2024
contact Elabe
 
Les Français et les élections législatives
Les Français et les élections législativesLes Français et les élections législatives
Les Français et les élections législatives
contact Elabe
 
Comprendre le vote aux élections européennes du 9 juin 2024
Comprendre le vote aux élections européennes du 9 juin 2024Comprendre le vote aux élections européennes du 9 juin 2024
Comprendre le vote aux élections européennes du 9 juin 2024
contact Elabe
 
Webinaire_les aides aux investissements.pptx
Webinaire_les aides aux investissements.pptxWebinaire_les aides aux investissements.pptx
Webinaire_les aides aux investissements.pptx
Institut de l'Elevage - Idele
 
Les Français et les élections européennes - 9ème vague
Les Français et les élections européennes - 9ème vagueLes Français et les élections européennes - 9ème vague
Les Français et les élections européennes - 9ème vague
contact Elabe
 
Etat de l’opinion - Journée CCR CAT « Protégeons l’assurabilité »
Etat de l’opinion - Journée CCR CAT « Protégeons l’assurabilité »Etat de l’opinion - Journée CCR CAT « Protégeons l’assurabilité »
Etat de l’opinion - Journée CCR CAT « Protégeons l’assurabilité »
contact Elabe
 
Sondage ELABE pour Les Echos et l'Institut Montaigne -Les Français et la guer...
Sondage ELABE pour Les Echos et l'Institut Montaigne -Les Français et la guer...Sondage ELABE pour Les Echos et l'Institut Montaigne -Les Français et la guer...
Sondage ELABE pour Les Echos et l'Institut Montaigne -Les Français et la guer...
contact Elabe
 
Productivité et politique industrielles: deux défis à relever conjointement
Productivité et politique industrielles: deux défis à relever conjointementProductivité et politique industrielles: deux défis à relever conjointement
Productivité et politique industrielles: deux défis à relever conjointement
La Fabrique de l'industrie
 
L'Observatoire politique ELABE pour Les Echos - Juin 2024
L'Observatoire politique ELABE pour Les Echos - Juin 2024L'Observatoire politique ELABE pour Les Echos - Juin 2024
L'Observatoire politique ELABE pour Les Echos - Juin 2024
contact Elabe
 
Deuxième actualisation estimation élections européennes 2024
Deuxième actualisation estimation élections européennes 2024Deuxième actualisation estimation élections européennes 2024
Deuxième actualisation estimation élections européennes 2024
contact Elabe
 
Estimation élections européennes 2024 ELABE
Estimation élections européennes 2024 ELABEEstimation élections européennes 2024 ELABE
Estimation élections européennes 2024 ELABE
contact Elabe
 
Estimations ELABE BFMTV ABSTENTION élections européennes 2024
Estimations ELABE BFMTV ABSTENTION élections européennes 2024Estimations ELABE BFMTV ABSTENTION élections européennes 2024
Estimations ELABE BFMTV ABSTENTION élections européennes 2024
contact Elabe
 

Dernier (12)

Actualisation estimation élections européennes 2024
Actualisation estimation élections européennes 2024Actualisation estimation élections européennes 2024
Actualisation estimation élections européennes 2024
 
Les Français et les élections législatives
Les Français et les élections législativesLes Français et les élections législatives
Les Français et les élections législatives
 
Comprendre le vote aux élections européennes du 9 juin 2024
Comprendre le vote aux élections européennes du 9 juin 2024Comprendre le vote aux élections européennes du 9 juin 2024
Comprendre le vote aux élections européennes du 9 juin 2024
 
Webinaire_les aides aux investissements.pptx
Webinaire_les aides aux investissements.pptxWebinaire_les aides aux investissements.pptx
Webinaire_les aides aux investissements.pptx
 
Les Français et les élections européennes - 9ème vague
Les Français et les élections européennes - 9ème vagueLes Français et les élections européennes - 9ème vague
Les Français et les élections européennes - 9ème vague
 
Etat de l’opinion - Journée CCR CAT « Protégeons l’assurabilité »
Etat de l’opinion - Journée CCR CAT « Protégeons l’assurabilité »Etat de l’opinion - Journée CCR CAT « Protégeons l’assurabilité »
Etat de l’opinion - Journée CCR CAT « Protégeons l’assurabilité »
 
Sondage ELABE pour Les Echos et l'Institut Montaigne -Les Français et la guer...
Sondage ELABE pour Les Echos et l'Institut Montaigne -Les Français et la guer...Sondage ELABE pour Les Echos et l'Institut Montaigne -Les Français et la guer...
Sondage ELABE pour Les Echos et l'Institut Montaigne -Les Français et la guer...
 
Productivité et politique industrielles: deux défis à relever conjointement
Productivité et politique industrielles: deux défis à relever conjointementProductivité et politique industrielles: deux défis à relever conjointement
Productivité et politique industrielles: deux défis à relever conjointement
 
L'Observatoire politique ELABE pour Les Echos - Juin 2024
L'Observatoire politique ELABE pour Les Echos - Juin 2024L'Observatoire politique ELABE pour Les Echos - Juin 2024
L'Observatoire politique ELABE pour Les Echos - Juin 2024
 
Deuxième actualisation estimation élections européennes 2024
Deuxième actualisation estimation élections européennes 2024Deuxième actualisation estimation élections européennes 2024
Deuxième actualisation estimation élections européennes 2024
 
Estimation élections européennes 2024 ELABE
Estimation élections européennes 2024 ELABEEstimation élections européennes 2024 ELABE
Estimation élections européennes 2024 ELABE
 
Estimations ELABE BFMTV ABSTENTION élections européennes 2024
Estimations ELABE BFMTV ABSTENTION élections européennes 2024Estimations ELABE BFMTV ABSTENTION élections européennes 2024
Estimations ELABE BFMTV ABSTENTION élections européennes 2024
 

Archiver les réseaux sociaux : Panorama des pratiques et des enjeux : entre approches théoriques et retours d’expériences

  • 1. Archiver les réseaux sociaux Panorama des pratiques et des enjeux : entre approches théoriques et retours d’expériences Formation INA - le 3 décembre 2018 responsable de la cellule d’ingénierie documentaire, département des étude et de la recherche (INHA) maitre de conférence associé à l’Université Paris Nanterre, laboratoire DICEN Antoine Courtin
  • 2. Avoir des «  billes  » pour élaborer des stratégies pour la collecte de contenu (communication officielle de l’institution + communication crowdsourcée des communautés d’intérêt). Connaitre les autres projets de collecte par d’autres organismes (cohérence/coopération, etc.) en France et à l’étranger. Evaluer les implications juridiques et éthique de l’archivage de contenu des médias sociaux Connaître les enjeux et les implications techniques de ce type de collecte Enjeux de l’intervention
  • 3. La question des archives de Museomix varie selon la manière dont on regarde l'initiative Museomix : » Museomix comme un événement de 3 jours organisé sur une année par des organisateurs. » Museomix comme une communauté
 » Museomix comme une performance Les ateliers méthodologiques du dépôt légal du web à l’Ina Vendredi 10 janvier 2014
  • 4. - Article L211-1 du Code du patrimoine [en ligne], modifié par la loi n° 2008-696 du 15 juillet 2008, disponible sur http://www.legifrance.gouv.fr/ « l'ensemble des documents, quels que soient leur date, leur lieu de conservation, leur forme et leur support, produits ou reçus par toute personne physique ou morale et par tout service ou organisme public ou privé dans l'exercice de leur activité. »
  • 5. 5 verbes pour définir les actions entourant une politique d’archive du web social Collecter Stocker Analyser Publier Préserver • que peut-on collecter (limite des CGU) • que faut-il collecter ? • avec quels outils ? • comment ? • la question du format ? • quels objectifs • quali/quanti ? • les biais à prendre en compte • quelles modalités • respect des CGU • comment ? Et quels acteurs aujourd’hui • à quel terme ? Pour quels usages futurs ?
  • 6. Médias sociaux : « les différentes activités qui intègrent la technologie, l’interaction sociale, et la création de contenu »
 
 Réseaux sociaux : « point de rassemblement sur internet d’un groupe d’individus, et qui met à leur disposition des outils favorisant les échanges entre eux »
  • 7.
  • 9. Source : Blog Books are social Une histoire (déjà) longue ?
  • 10.
  • 11. On n’est pas maître des algorithmes de visibilité et des évolutions des business plan Centralisation/captation des réseaux et donc des données (alternative à Twitter : Mastodon) Digital Labor
  • 12. • accroissement du volume des informations • apparition/disparition constante des plateformes de RSN • diversité des formats et mode d’accès aux données • mise à jour et agrégation continues des informations • Fréquence des captures, méthode et traitement des contenus + accessibilité des corpus et valorisation *Challenges*
  • 13. Zoom sur Twitter • Pourquoi ? • Quels biais ?
  • 14. juillet 2006 Lancement de Twitter Octobre 2009 Partenariat avec Google pour un flux en temps réel (jusqu’en juillet 2011) Août 2015 Nouveau partenariat avec Google (intégration temps réel dans les SERP sur mobile et postes fixes) Ventes d’accès (et de ses données) via la société Datasift et GNIP Septembre 2015 juillet 2014 L a n c e m e n t d e analytics.twitter.com Avril 2012 Possibilité de télécharger une «  archive  » de ses tweets Twitter devient le seul interlocuteur pour accéder à son FireHose *Twitter et ses data* Février 2013 Twitter donne accès à la totalité de son archives par son interface de recherche 14 avril 2010 Twitter reverse à la Library of Congress, 5 TO Fév. 2012 Restriction de l’API Avril 2014 Rachat de la société Gnip 1er tests des @UkNatArchives pour l’archivage des tweets de comptes gouvernementaux 2008 mai. 2009 Première version de l’API 2013 Depuis 2006, le volume de tweets archivés par la LOC est estimé à 170 milliards Sept. 2012 La LOC annonce quà partir du 1er janvier 2018, réaliser l’archivage des tweets par des sélections janvier 2018
  • 16. les tweets de « compte » les tweets d’évènements les tweets de conversations Les informations de comptes Les statistiques de tweets @seeksanusername #askanArchivistDay https://twitter.com/ bymichalak/status/ 1031855670134534145 https://analytics.twitter.com/ Quoi collecter ?
  • 17.
  • 18.
  • 20. Tweet Visibility Dynamics in a Tweet Conversation Graph http://ws-dl.blogspot.com/2016/07/2016-07-18-tweet-visibility-dynamics-in.html
  • 22. La question des « usagers » - Humains ou robots ? Formerly known as BotOrNot, part of the OSoMe project at Indiana University. https://botometer.iuni.iu.edu/#!/
  • 26.
  • 27.
  • 29.
  • 31. Elections Européennes - Collecte du web électoral par la #BnF 0 125 250 375 500 2009 2014 Compte Twitter Pages Facebook Nombre URL Total Elections régionales - Collecte du web électoral par la #BnF 0 750 1500 2250 3000 2010 2015
  • 33. Des limites ? - à toutes les étapes - de différentes « natures » - légales - techniques - éthiques
  • 34. Les CGU des RSN
  • 37. Une question Ethique ? via Anatoliy Gruzd
  • 38. Une question Ethique ? • Voir le support « Social media research ethical and privacy guidelines » • https://gwu-libraries.github.io/sfm-ui/resources/ social_media_research_ethical_and_privacy_guidelines.pdf • Propose des «  lignes directrices  » pour aider à penser un projet autour des données issues des médias sociaux lors des différents phases (de collecte, d’archivage, d’analyse , etc.) • Surtout applicable aux données Twitter mais finalement parfois plus larges aux données sociales et publiques. • Pour la collecte, soyez particulièrement attentif : • à la collecte de données des personnes vulnérables (mineurs, etc.) • à la collecte des médias sociaux qui pourraient être sensibles ou nuisibles («  comportement moralement douteux », pornographie, etc.) • à la collecte de données avec une approche géographique car peut poser des problèmes de protection de la vie privée des utilisateurs.
  • 39. *Implications juridiques et éthiques* […] the ethical challenge concentrate on a larger question: juste because we can archive social media, does that mean we should ? […] Twitter permet aux utilisateurs de déposer des demandes de retraits pour les personnes utilisants du contenu sans attribution Droits des utilisateurs / droits de propriété intellectuelle La question de la vie privée et/ou du consentement des utilisateurs Nécessité pour l’archiviste de documenter l’ensemble de leurs actions et de décision. Rivers CM and Lewis BL (2014) Ethical research standards in a world of big data [v1; ref status: approved with reservations 1, http://f1000r.es/2wq] F1000Research 2014, 3:38 (doi: 10.12688/f1000research.3-38.v1) Matthew L Williams, Pete Burnap, Luke Sloan (2017). “Towards an Ethical Framework for Publishing Twitter Data in Social Research: Taking into Account Users’ Views, Online Context and Algorithmic Estimation” http:// journals.sagepub.com/doi/full/10.1177/0038038517708140
  • 49. Comment collecter ? [solution + ou – « geeks »]
  • 50.
  • 52. A Web Scraping Methodology for Bypassing Twitter API Restrictions. https://arxiv.org/pdf/1803.09875.pdf https://github.com/bpb27/twitter_scraping https://rtweet.info/
  • 53.
  • 54. A pre-configured collection of tools including Social Feed Manager and Lentil for easily building Twitter and Instagram social media archives on your own computer. https://github.com/NCSU-Libraries/Social-Media-Combine SocialMedia- Archives -ToolKit Environmental Scan https://www.lib.ncsu.edu/social-media-archives-toolkit/collecting/social-media-harvesting-tools http://social-feed-manager.readthedocs.org/en/m5_004/
  • 56. Et du côté de Facebook • même soucis que Twitter > versalité des collecte à cause des API • petite astuce : retrouver l’id des pages avec http:// lookup-id.com/#
  • 58. • Collecte de tous les hastags pilotés par l’INHA (via twarc) • Téléchargement annuel des archives de comptes de tous les comptes associés à l’INHA • Téléchargement des données statistiques tous les 3 mois. • Politique de nommage et sauvegarde en CSV sur serveurs redondés (en attendant outils de conservation d’objets numériques). • analyse des statistiques et des collectes – aide au pilotage Une approche pragmatique
  • 61. «  Documenting the Now: Supporting Scholarly Use and Preservation of Social Media Content » project. http://goo.gl/Z9fc2p • Projet lancé en janvier 2016 • 3 institutions partenaires • Université du Maryland • Université Saint-Louis de Washingtion • Université Riverside de Californie • Financé par la Fondation Andrew W. Mellon (à hauteur de 517000$ pour 2 ans) • Développement d’un outil DocNow
  • 62. Le dossier "Le temps long des réseaux sociaux numériques" du Temps des médias, coordonné par Cécile Meadel, Frédéric Clavert et Martin Grandjeau vient de paraitre. Disponible le 3 décembre en librairie et bientôt sur @Cairninfo
  • 65. • Bibliographie sélective sur le dépôt légal de l’internet, Bibliothèque national de France (http:// www.bnf.fr/documents/bibliographie_dl_web.pdf) • Web90 – Patrimoine, Mémoires et Histoire du Web dans les années 1990 (https:// web90.hypotheses.org/693) • Web Archiving Environmental Scan, Harvard Library Report, January 2016 (https://goo.gl/ es2NDO) • National Archives and Records Administration (White Paper on Best Practices for the Capture of Social Media Records) http://goo.gl/d0sjSw • @IanMiligan • @ruebot • @edsu • @documentnow *Ressources* • @gruzd • @valerie_schafer • @inadlweb • @HistWebArchives Sans oublier, les séance « Social Media Archiving » aux conférences IIPC (International Internet Preservation Consortium) • @DLWebBnF • @AndreaGoethals • @was3210