Le	carnet	de	l'avent	de	la	sociologie	
francophone	sur	Twi7er	:	
réseaux	et	altmetrics	de	#SocioNoël	
13	janvier	2017	
séminaire	SRM	
http://bit.ly/srmCabanac2017	
n	Thème	2	:	IndexaJon	et	Recherche	d’InformaJons	
Équipe	IRIS	:	InformaJon	Retrieval	&	InformaJon	Synthesis	
Guillaume	Cabanac	
guillaume.cabanac@univ-tlse3.fr	
@gcabanac
2
3
Il	y	a	350	ans… 	G.	Cabanac
4
Δ	=	3650	j	!	
Visibilité	des	travaux	via	la	bibliométrie	évaluaJve
5
Latence	
Le	temps	long	de	l’accumulaJon	des	connaissances
6
Audience	
Rapports	science	−	société
7
Mise	en	visibilité	de	la	recherche	dans	les	médias	(sociaux,	mais	pas	que)
8
Lexique	des	interacJons	sur	Twi7er	
Prélude 		G.	Cabanac
9
Solidarité	pour	l’accès	à	l’IST	:	#icanhazpdf
10
Focus	sur	#SocioNoël	
Étude	du	phénomène	#SocioNoël	
CollaboraJon	avec	Erwan	Bahi	(2016),	stagiaire	de	DUT	informaJque	
On	a	aussi	travaillé	sur	IMDB	→
SOUTENANCE	DE	STAGE	
Ins/tut	de	Recherche	en	Informa/que	de	Toulouse	(IRIT)	
Année	universitaire	2015	/	2016	–	Durée	11	semaines	
Maître	de	stage	:	M.	Guillaume	Cabanac	
Tuteur	de	stage	:	M.	Mohand	Boughanem	
Analyse	du	phénomène	de	
diffusion	d’informaKon	#socionoel		
Erwan	Bahi
SOMMAIRE	
I	–	INTRODUCTION	
			1.	Ins/tut	de	Recherche	en	Informa/que	de	Toulouse	(IRIT)	
			2.	Fonc/onnement	et	lieu	de	travail	
			3.	Équipe	Informa/on	Retrieval	and	Informa/on	Synthesis	(IRIS)	
			4.	Objet	de	la	mission	
	
II – ANALYSE DU PHÉNOMÈNE #SOCIONOEL
			1.	Objec/fs	et	hypothèses	
			2.	Recherche	des	données	
			3.	Aspect	technique		
			4.	Synthèse	des	données	
III – Conclusion et bilan
2
I	–	INTRODUCTION	
1.	Ins/tut	de	Recherche	en	Informa/que	de	Toulouse	
-  Laboratoire	de	recherche	
-  4 sites, 700	membres,	21	équipes,	7	théma/ques	
-  Site	de	l’Université	Paul	Saba/er	-	Toulouse	3	(UPS)	
-  Équipe	Informa/on	Retrieval	and	Informa/on	Synthesis	(IRIS)	
	
	
3
I	–	INTRODUCTION	
2.	Fonc/onnement	et	lieu	de	travail	
Bureau	402	 Terrasse	
4
I	–	INTRODUCTION	
3.	Équipe	Informa/on	Retrieval	and	Informa/on	Synthesis	(IRIS)	
-  Créée	en	octobre	2015	
-  7 membres permanents
-  25	doctorants	et	étudiants	de	master	
	
Source	:	h*ps://www.irit.fr/Organigramme	
5
I	–	INTRODUCTION	
3.	Équipe	Informa/on	Retrieval	and	Informa/on	Synthesis	(IRIS)	
Source	:	h*ps://www.irit.fr/IRIS-site/	
Deux domaines : Recherche d’Information (IR) et Synthèse de l’Information (IS)
6
I	–	INTRODUCTION	
4.	Objet	de	la	mission	
Analyse	du	phénomène	de	diffusion	d’informaKon	#socionoel	
	
	
Source	:	h*p://bfontaine.github.io/SocioNoel/	
7
I	–	INTRODUCTION	
4.	Objet	de	la	mission	
Analyse	du	phénomène	de	diffusion	d’informaKon	#socionoel	
	
	
Recherche	d’InformaKon	(IR)	
-  Réseau	social	Twi[er	
-  Fichier	de	données	
-  Site	web	Sudoc	(références	bibliographiques)	
Synthèse	de	l’InformaKon	(IS)	
-  Aggrega/on	des	données	
-  Visualisa/on	de	réseaux	
-  Sta/s/ques	
8
II	–	ANALYSE	DU	PHÉNOMÈNE	#SOCIONOEL	
1.	Objec/f	et	hypothèse	
Bibliométrie	:	les	médias	sociaux	ne	sont	pas	pris	en	compte		
Hypothèse	:	Avec	Twi[er,	on	peut	déterminer	les	bonnes	références	bibliographiques	
9
II	–	ANALYSE	DU	PHÉNOMÈNE	#SOCIONOEL	
2.	Recherche	des	données	–	Glossaire	
	
	
Moissonnage (web scrapping) : Extraction
d’informations du web par un programme.
API : Application Programming Interface. Permet d’accéder
à un service à travers un programme.
YAML, XML, JSON : Formats de données.
XPATH : Langage permettant d’accéder à une portion d’un
document XML.
Java : Langage de programmation objet.
SQL : Langage des bases de données relationnelles.
10
II	–	ANALYSE	DU	PHÉNOMÈNE	#SOCIONOEL	
3.	Recherche	des	données	-	Twi[er	
Première	étape	:	récupérer	les	tweets.	SoluKons	testées	:	
LokLak.org
Données structurées
Pas d’authentification
Pas de limitation
Données incomplètes
API Twitter
Données structurées
Authentification
Limitations fortes
Recherches incomplètes
Moissonnage
Données non structurées
Pas d’authentification
Pas de limitation
Recherches complètes
11
II	–	ANALYSE	DU	PHÉNOMÈNE	#SOCIONOEL	
3.	Recherche	des	données	-	Twi[er	
Combinaison	du	moissonnage	et	de	l’API	Twi]er	
Obtenir	des	informa/ons	exhaus/ves	et	structurées	
Iden/fiants	
Tweets	
Données	
Tweets	+	
U/lisateurs	 Chaîne de traitement
12
II	–	ANALYSE	DU	PHÉNOMÈNE	#SOCIONOEL	
3.	Recherche	des	données	-	Twi[er	
RécupéraKon	des	followers	
Sur	le	sous-ensemble	d’u/lisateurs	ayant	posté	avec	l’hashtag	#socionoel	
Données	
Tweets	+	
U/lisateurs	 Chaîne de traitement
Données	
Followers	
13
II	–	ANALYSE	DU	PHÉNOMÈNE	#SOCIONOEL	
4.	Recherche	des	données	–	Références	bibliographiques	
RécupéraKon	des	sources	bibliographiques	à	par/r	des	tweets	
U/lisateur	@bfontn	qui	a	receuilli	manuellement	les	références	
Données	
Tweets	+	
U/lisateurs	 Chaîne de traitement
Titre	des	
références	
14
II	–	ANALYSE	DU	PHÉNOMÈNE	#SOCIONOEL	
4.	Recherche	des	données	-	Références	bibliographiques	
Enrichissement	des	données	bibliographiques	
Moissonnage	via	la	recherche	sur	Sudoc	
Chaîne de traitement
Titre	des	
références	
Données	
bibliographiques	
15
II	–	ANALYSE	DU	PHÉNOMÈNE	#SOCIONOEL	
5.	Recherche	des	données	–	Chaîne	de	traitement	
Iden/fiants	
Tweets	
Données	
Tweets	+	
U/lisateurs	
Données	
Followers	
Titre	des	
références	 Données	
bibliographiques	
16
II	–	ANALYSE	DU	PHÉNOMÈNE	#SOCIONOEL	
7.	Synthèse	des	données	–	Réseaux	d’u/lisateurs	
VisualisaKon	du	réseau	des	uKlisateurs	ayant	tweeté	#socionoel	
	
Permet	de	visualiser	le	réseau	complet,	l’ac/vité,	les	abonnements,	les	
interac/ons.	
	
	
OuKls	perme]ant	la	généraKon	:	
-  Gephi	
-  Code	SQL	générant	les	fichiers	de	données	
	
	
17
II	–	ANALYSE	DU	PHÉNOMÈNE	#SOCIONOEL	
7.	Synthèse	des	données	–	Exemple	de	tweet	
18
Réseau	des	uKlisateurs	ayant	tweeté	#socionoel
II	–	ANALYSE	DU	PHÉNOMÈNE	#SOCIONOEL	
7.	Synthèse	des	données	–	Réseaux	d’u/lisateurs	
@xmolenat	:	«	Journaliste	@AlterEcoMag	&	@AlterEcoPlus.	L'actualité	au	
prisme	des	sciences	sociales,	et	vice	versa	».	
20
II	–	ANALYSE	DU	PHÉNOMÈNE	#SOCIONOEL	
7.	Synthèse	des	données	–	Réseaux	d’u/lisateurs	
VisualisaKon	du	réseau	des	uKlisateurs	ayant	tweeté	#socionoel	avec	au	
moins	une	référence	bibliographique	
	
Permet	de	visualiser	les	vrais	acteurs	du	mouvement.	
	
21
Réseau	des	uKlisateurs	ayant	tweeté	#socionoel	
avec	au	moins	une	référence	bibliographique
II	–	ANALYSE	DU	PHÉNOMÈNE	#SOCIONOEL	
8.	Synthèse	des	données	–	Ac/vité	
0	
20	
40	
60	
80	
100	
120	
1	 2	 3	 4	 5	 6	 7	 8	 9	 10	 11	 12	 13	 14	 15	 16	 17	 18	 19	 20	 21	 22	 23	 24	 25	 26	 27	 28	 29	 30	 31	
Jour	du	mois	de	décembre	2015	
Nombre	de	tweets	 Nombre	de	livres	
ÉvoluKon	de	l’uKlisaKon	du	hashtag	#socionoel	
sur	le	mois	de	décembre	2015	
23
II	–	ANALYSE	DU	PHÉNOMÈNE	#SOCIONOEL	
9.	Synthèse	des	données	–	Principaux	auteurs	
24
III	–	CONCLUSION	
Rappel	hypothèse	:	
Avec	Twi[er,	on	peut	déterminer	les	bonnes	références	bibliographiques	
25
III	–	BILAN	
Technique	:	Appren/ssage	des	réseaux	et	de	nouvelles	compétences	
Méthodologie	et	organisaKon	:	
-  Travail	en	autonomie,	recherche	d’informa/ons	
-  Collabora/on	
	
Humain	:	
-  Découverte	d’un	laboratoire	de	recherche	
-  Par/cipa/on	à	un	Congrès,	rencontres	
26
IV	–	ANNEXES	
1.	Aspect	technique	–	Stockage	des	données	
Programme	 Base	de	données	Données	
OJDBC	
HtmlUnit	
Annexe	1
11
#SocioNoël	redux	avec	DMI-TCAT	
Les	effets	ina7endus	de	l’interdisciplinarité	autour	de	LisTIC...
12
@Excellagence	
h7p://excellagence.fr	
PotenJels	terrains	?
13
#ESRenPeinture	
C’est	arrivé	vendredi	dernier...	
texte	
visuels	
popularité
14
#ESRenPeinture	
C’est	arrivé	vendredi	dernier...
15
#ESRenPeinture	:	illustraJon	du	rapport	science-société	?	
C’est	arrivé	vendredi	dernier...

Le carnet de l'avent de la sociologie francophone sur Twitter : réseaux et altmetrics de #SocioNoël