Le rôle des visualisations de
données dans la recherche sur les
cultures numériques
Antonio A. Casilli
•
•
•
•

Succès et omniprésence des
visualisations de données
Biologie, géographie, météorologie
Mais aussi digital humanities,
internet studies
Media studies, social media,
journalisme etc.
•
•

Quelle différence avec les
visualisations traditionnelles ?
Définition opérationnelle :
« Utilisation de l’informatique
graphique interactive pour
représenter visuellement de
données abstraites afin
d’amplifier la cognition. » [Card,
Mackinlay & Shneiderman, 1999]
•

« The desire to take what normally
falls outside of the scale of human
senses and to make visible and
manageable » [Manovich 2002]

•

« Sensory expression – most often
visual, sometimes sonic or tactile –
[as] the only means to perceive many
contemporary data sets » [Diamond
2010]
Pour le quanti…
Pour le quali…
• Adopter une posture critique à l’égard des datavisualisations, pas prôner méfiance aveugle
• Quelles opportunités et quels risques s’ouvrent aux
chercheurs en SHS travaillant sur les cultures
numériques?
• Promesse d’aider la démocratisation de l’accès aux
résultats de la recherche
• Risque de réification de la donnée et de dissimulation des
conditions matérielles et sociales de sa production
EXEMPLES TIRES DU PROJET
ANAMIA (ANR-09-ALIA-001)
•

•
•
•

Les interactions en ligne de
personnes atteintes de troubles
alimentaires
Sites de partage et témoignage
Le qualificatif « pro-ana » :
stigmatisation et revendication
Une « subculture déviante » ? Un
« mouvement » ?
– Isolement IRL et resocialisation en ligne ?
– Nécessité d’étudier les structures sociales
de ces communautés
EXEMPLE 1 : DATAVIZ APPLIQUEE A LA COMMUNICATION GRAND
PUBLIC

Cartographie Gephi des communautés anorexiques / boulimiques
francophones (Projet ANR ANAMIA, 2010-13)
EQUILIBRE ENTRE
EXIGENCES
–
–
–
–

Rigueur scientifique
Esthétique
Accessibilité
Efficacité cognitive

 Articulation et composition
avec les mondes sociaux
LE RÔLE DE L’USAGER
•

•
•

Permettre d’appréhender et
manipuler les données, pour que
l’utilisateur ne soit pas cantonné à
un rôle passif
Cohérent avec tendances récentes :
« portabilité » et « ouverture » des
données
Passage de l’expérience numérique
orientée page à une « database
incursion » constante [Liu 2004]
LE RÔLE DE L’USAGER
•

•
•

‘Data-subjectivity’ : l’expérience
personnelle et quotidienne de
l’immersion et de la navigation dans
les données
Donner un sens à « la mise en
chiffres de soi » [Pharabond 2013]
La dataviz (surtout dans ses
superpositions possibles avec des
formes populaires telles
l’infographie) favorise cette
dynamique
EXEMPLE 2 : DATAVIZ APPLIQUEE A LA COLLECTE DE DONNEES

ANAMIA EGOCENTER (Projet ANR ANAMIA, 2010-13)
http://www.youtube.com/watch?v=AAlSaDdAaC
EXEMPLE 2 : DATAVIZ APPLIQUEE A LA COLLECTE DE DONNEES

ANAMIA EGOCENTER (Projet ANR ANAMIA, 2010-13)
Réseaux égocentrés d’interactions présentielles
EXEMPLE 2 : DATAVIZ APPLIQUEE A LA COLLECTE DE DONNEES

ANAMIA EGOCENTER (Projet ANR ANAMIA, 2010-13)
Réseaux égocentrés d’interactions via Internet
LE RÔLE DES CHERCHEURS
•

Le professionnel de la recherche
positionne dans un contexte
interprétatif ce qui est perçu comme
un ensemble de faits dépourvus de
signification
• Données : abstraction et
interprétation d’un phénomène
social
• Besoin de construire algorithmes et
outils pour extraction, sélection,
organisation et analyse des
données.
 NB: Enjeu de la transdisciplinarité
EXEMPLE 3 : DATAVIZ APPLIQUEE A L’ANALYSE

ANAMIA CORPUS (Projet ANR ANAMIA, 2010-13)
http://www.youtube.com/watch?v=BIxqG6j0Izs
POLITIQUE DE LA DATAVIZ
•
•

Equilibres de pouvoir, à l’intérieur
d’une équipe de recherche et dans
sa communication avec ses publics
Le même type de question que l’on
se posait pour les médias
traditionnels : Que faut-il montrer ?
– Qui a le pouvoir de choisir l’interface de
visualisation à adopter ?
– Mais aussi : quels codes, design de
l’interaction, niveau d’accessibilité ?

•

Faire émerger la nature arbitraire ou
instrumentale des choix de
visualisation des données
POLITIQUE DE LA DATAVIZ
•

•
•

•

Le « réalisme scientifique » mis à
mal par les exigences esthétiques
les équilibres sociaux
La question de la crédibilité des
visualisations de données
Attribuer une signification aux
données en construisant des récits
heuristiques qui résonnent avec les
contextes empiriques représentés
Telling stories with data…
EXEMPLE 4 : DATAVIZ POUR DEVELOPPER DES “RECITS
HEURISTIQUES”

ANAMIA PERSONAL (Projet ANR ANAMIA, 2010-13)
https://www.youtube.com/watch?v=E-eR0SnFI2M
MANQUE DE STANDARDS
•

•

Emergence d’une grammaire
commune ? Cartes, métaphores
naturelles, frises chronologiques,
graphes…
Mais nous n’avons pas encore de
standard de qualité, des formes de
régulation de la manière dans les
dataviz sont collectivement
construites
–
–
–
–

Normalisation des techniques
Minima d’accessibilité
Exigences de vérifiabilité et de reproductibilité
Encadrement de la diffusion
LA VISUALISATION CHANGE
LA DONN(E)E
•
•

•

Mise à distance du « raisonnement
analytique » ?
Ou bien béquille pour le
raisonnement : cf. le cas
l’introduction des coordonnées
cartésiennes au XVII siècle, le
double hélice pour représenter
l'ADN au XX siècle etc.
Représentations graphiques
peuvent devenir les clé de voute de
la recherche
NECESSITE DE LA DATAVIZ
•
•

•
•

Des « grands nombres » du XXe
siècle aux « big data » du XXIe
Impossible d’appliquer des
techniques traditionnelles dans
l’exploration automatique de grandes
quantités de données pour extraire
des patterns
Le visualisation des données : des
raccourcis outils ?
Des manières d’instrumenter la
logique néolibérale de « la mise en
chiffres du monde »
MATERIALITE DU TRAVAIL SUR
LA DATA
•

•

•
•

Construction sociale de l’objet dataviz
passe par le construction de l’objet
database
Evolution des dispositifs
sociotechniques : registres papier,
cartes perforées, bases données
relationnelles, tableurs …
Processus de fabrication de cet objet
Dimensions cachées :
– Data refinement
– Division du travail
MATERIALITE DU TRAVAIL SUR
LA DATA
•

•

•

Manque de compétences hybrides (le
visualisateur n’a pas forcément
emprise sur la base de données)
Relier dataviz aux univers de
pratiques dans lesquels évoluent les
organisations
Toute base données est « orientée
métier »  ceci est d’autant plus vrai
pour les visualisations de données
LE MYTHE DE LA DONNEE
BRUTE
•
•
•

•
•

La donnée non procéssée
A quel moment est-elle organisée,
triée, structurée ?
Au moment de la présentation finale
ou bien au moment de la mise en
tableur ?
Ou bien encore plus en amont ?
Surdétermination de la visualisation à
partir de la construction du jeu de
données
Merci !

- Mail : acasilli@ehess.fr
- Twitter : @bodyspacesoc
- Blog : http://www.bodyspacesociety.eu
REFERENCES
•
•

•

•
•
•
•

Card, S. K., Mackinlay, J. D. and B. Shneiderman (1999) Readings in Information Visualization:
Using Vision to Think, San Francisco, Morgan Kaufmann Publishers.
Diamond, S. (2010) ‘Lenticular Galaxies: The Polyvalent Aesthetics of Data Visualization’, Code
Drift: Essays in Critical Digital Studies, n. 2, www.ctheory.net/articles.aspx?id=651
Arthur and Marilouise Kroker, Editors
Liu, A. (2004) ‘Transcendental Data: Toward a Cultural History and Aesthetics of the New
Encoded Discourse’, Critical Inquiry 31.1
http://criticalinquiry.uchicago.edu/issues/current/31n1.liu.htm.
Manovich, L. (2002) The Anti-Sublime Ideal in Data Art’
http://www.manovich.net/DOCS/data_art.doc
Manovich, L. (2007) ‘The Database as Symbolic Form’, Database Aesthetics: Art in the Age of
Information Overload, V. Vesna (ed.) U. of Minnesota Press, pp. 39-60
Pharabod, Anne-Sylvie, Véra Nikolski, et Fabien Granjon. « La mise en chiffres de soi ». Réseaux
n° 177, no 1 (1 avril 2013): 97‑129. doi:10.3917/res.177.0097.
Whitelaw, M. (2008) Art Against Information: Case Studies in Data Practice, FiberCulture Journal,
11, FCJ-067, http://eleven.fibreculturejournal.org/fcj-067-art-against-information-case-studies-indata-practice/
PROJETS CITES :
•
•

ANAMIA (La sociabilité « Ana-mia » : une approche des troubles alimentaires par les réseaux
sociaux en ligne et hors ligne, ANR-09-ALIA-001).
ICCU (Internet Censorship and Civil Unrest).

ARTICLES RELATIFS AUX PROJETS :
•
•

Casilli, A. A. & P. Tubaro (2012) ‘Social Media Censorship in Times of Political Unrest – A Social
Simulation Experiment with the UK Riots’, Bulletin of Sociological Methodology, 115 (1).
P. Tubaro, Casilli, A. A. & L. Mounier (2014) ‘Eliciting personal network data in web surveys
through participant-generated sociograms’, Field Methods, 26 (2).

LOGICIELS DE VISUALISATION DES DONNEES DES PROJETS :
•
•

ANAMIA Datalab (GitHub).
ANAMIA Egocenter (GitHub).

Antonio CASILLI - Le rôle des visualisations de données dans la recherche sur les cultures numériques

  • 1.
    Le rôle desvisualisations de données dans la recherche sur les cultures numériques Antonio A. Casilli
  • 2.
    • • • • Succès et omniprésencedes visualisations de données Biologie, géographie, météorologie Mais aussi digital humanities, internet studies Media studies, social media, journalisme etc.
  • 3.
    • • Quelle différence avecles visualisations traditionnelles ? Définition opérationnelle : « Utilisation de l’informatique graphique interactive pour représenter visuellement de données abstraites afin d’amplifier la cognition. » [Card, Mackinlay & Shneiderman, 1999]
  • 4.
    • « The desireto take what normally falls outside of the scale of human senses and to make visible and manageable » [Manovich 2002] • « Sensory expression – most often visual, sometimes sonic or tactile – [as] the only means to perceive many contemporary data sets » [Diamond 2010]
  • 5.
  • 6.
  • 7.
    • Adopter uneposture critique à l’égard des datavisualisations, pas prôner méfiance aveugle • Quelles opportunités et quels risques s’ouvrent aux chercheurs en SHS travaillant sur les cultures numériques? • Promesse d’aider la démocratisation de l’accès aux résultats de la recherche • Risque de réification de la donnée et de dissimulation des conditions matérielles et sociales de sa production
  • 8.
    EXEMPLES TIRES DUPROJET ANAMIA (ANR-09-ALIA-001) • • • • Les interactions en ligne de personnes atteintes de troubles alimentaires Sites de partage et témoignage Le qualificatif « pro-ana » : stigmatisation et revendication Une « subculture déviante » ? Un « mouvement » ? – Isolement IRL et resocialisation en ligne ? – Nécessité d’étudier les structures sociales de ces communautés
  • 9.
    EXEMPLE 1 :DATAVIZ APPLIQUEE A LA COMMUNICATION GRAND PUBLIC Cartographie Gephi des communautés anorexiques / boulimiques francophones (Projet ANR ANAMIA, 2010-13)
  • 10.
  • 11.
    LE RÔLE DEL’USAGER • • • Permettre d’appréhender et manipuler les données, pour que l’utilisateur ne soit pas cantonné à un rôle passif Cohérent avec tendances récentes : « portabilité » et « ouverture » des données Passage de l’expérience numérique orientée page à une « database incursion » constante [Liu 2004]
  • 12.
    LE RÔLE DEL’USAGER • • • ‘Data-subjectivity’ : l’expérience personnelle et quotidienne de l’immersion et de la navigation dans les données Donner un sens à « la mise en chiffres de soi » [Pharabond 2013] La dataviz (surtout dans ses superpositions possibles avec des formes populaires telles l’infographie) favorise cette dynamique
  • 13.
    EXEMPLE 2 :DATAVIZ APPLIQUEE A LA COLLECTE DE DONNEES ANAMIA EGOCENTER (Projet ANR ANAMIA, 2010-13) http://www.youtube.com/watch?v=AAlSaDdAaC
  • 14.
    EXEMPLE 2 :DATAVIZ APPLIQUEE A LA COLLECTE DE DONNEES ANAMIA EGOCENTER (Projet ANR ANAMIA, 2010-13) Réseaux égocentrés d’interactions présentielles
  • 15.
    EXEMPLE 2 :DATAVIZ APPLIQUEE A LA COLLECTE DE DONNEES ANAMIA EGOCENTER (Projet ANR ANAMIA, 2010-13) Réseaux égocentrés d’interactions via Internet
  • 16.
    LE RÔLE DESCHERCHEURS • Le professionnel de la recherche positionne dans un contexte interprétatif ce qui est perçu comme un ensemble de faits dépourvus de signification • Données : abstraction et interprétation d’un phénomène social • Besoin de construire algorithmes et outils pour extraction, sélection, organisation et analyse des données.  NB: Enjeu de la transdisciplinarité
  • 17.
    EXEMPLE 3 :DATAVIZ APPLIQUEE A L’ANALYSE ANAMIA CORPUS (Projet ANR ANAMIA, 2010-13) http://www.youtube.com/watch?v=BIxqG6j0Izs
  • 18.
    POLITIQUE DE LADATAVIZ • • Equilibres de pouvoir, à l’intérieur d’une équipe de recherche et dans sa communication avec ses publics Le même type de question que l’on se posait pour les médias traditionnels : Que faut-il montrer ? – Qui a le pouvoir de choisir l’interface de visualisation à adopter ? – Mais aussi : quels codes, design de l’interaction, niveau d’accessibilité ? • Faire émerger la nature arbitraire ou instrumentale des choix de visualisation des données
  • 19.
    POLITIQUE DE LADATAVIZ • • • • Le « réalisme scientifique » mis à mal par les exigences esthétiques les équilibres sociaux La question de la crédibilité des visualisations de données Attribuer une signification aux données en construisant des récits heuristiques qui résonnent avec les contextes empiriques représentés Telling stories with data…
  • 20.
    EXEMPLE 4 :DATAVIZ POUR DEVELOPPER DES “RECITS HEURISTIQUES” ANAMIA PERSONAL (Projet ANR ANAMIA, 2010-13) https://www.youtube.com/watch?v=E-eR0SnFI2M
  • 21.
    MANQUE DE STANDARDS • • Emergenced’une grammaire commune ? Cartes, métaphores naturelles, frises chronologiques, graphes… Mais nous n’avons pas encore de standard de qualité, des formes de régulation de la manière dans les dataviz sont collectivement construites – – – – Normalisation des techniques Minima d’accessibilité Exigences de vérifiabilité et de reproductibilité Encadrement de la diffusion
  • 22.
    LA VISUALISATION CHANGE LADONN(E)E • • • Mise à distance du « raisonnement analytique » ? Ou bien béquille pour le raisonnement : cf. le cas l’introduction des coordonnées cartésiennes au XVII siècle, le double hélice pour représenter l'ADN au XX siècle etc. Représentations graphiques peuvent devenir les clé de voute de la recherche
  • 23.
    NECESSITE DE LADATAVIZ • • • • Des « grands nombres » du XXe siècle aux « big data » du XXIe Impossible d’appliquer des techniques traditionnelles dans l’exploration automatique de grandes quantités de données pour extraire des patterns Le visualisation des données : des raccourcis outils ? Des manières d’instrumenter la logique néolibérale de « la mise en chiffres du monde »
  • 24.
    MATERIALITE DU TRAVAILSUR LA DATA • • • • Construction sociale de l’objet dataviz passe par le construction de l’objet database Evolution des dispositifs sociotechniques : registres papier, cartes perforées, bases données relationnelles, tableurs … Processus de fabrication de cet objet Dimensions cachées : – Data refinement – Division du travail
  • 25.
    MATERIALITE DU TRAVAILSUR LA DATA • • • Manque de compétences hybrides (le visualisateur n’a pas forcément emprise sur la base de données) Relier dataviz aux univers de pratiques dans lesquels évoluent les organisations Toute base données est « orientée métier »  ceci est d’autant plus vrai pour les visualisations de données
  • 26.
    LE MYTHE DELA DONNEE BRUTE • • • • • La donnée non procéssée A quel moment est-elle organisée, triée, structurée ? Au moment de la présentation finale ou bien au moment de la mise en tableur ? Ou bien encore plus en amont ? Surdétermination de la visualisation à partir de la construction du jeu de données
  • 27.
    Merci ! - Mail: acasilli@ehess.fr - Twitter : @bodyspacesoc - Blog : http://www.bodyspacesociety.eu
  • 28.
    REFERENCES • • • • • • • Card, S. K.,Mackinlay, J. D. and B. Shneiderman (1999) Readings in Information Visualization: Using Vision to Think, San Francisco, Morgan Kaufmann Publishers. Diamond, S. (2010) ‘Lenticular Galaxies: The Polyvalent Aesthetics of Data Visualization’, Code Drift: Essays in Critical Digital Studies, n. 2, www.ctheory.net/articles.aspx?id=651 Arthur and Marilouise Kroker, Editors Liu, A. (2004) ‘Transcendental Data: Toward a Cultural History and Aesthetics of the New Encoded Discourse’, Critical Inquiry 31.1 http://criticalinquiry.uchicago.edu/issues/current/31n1.liu.htm. Manovich, L. (2002) The Anti-Sublime Ideal in Data Art’ http://www.manovich.net/DOCS/data_art.doc Manovich, L. (2007) ‘The Database as Symbolic Form’, Database Aesthetics: Art in the Age of Information Overload, V. Vesna (ed.) U. of Minnesota Press, pp. 39-60 Pharabod, Anne-Sylvie, Véra Nikolski, et Fabien Granjon. « La mise en chiffres de soi ». Réseaux n° 177, no 1 (1 avril 2013): 97‑129. doi:10.3917/res.177.0097. Whitelaw, M. (2008) Art Against Information: Case Studies in Data Practice, FiberCulture Journal, 11, FCJ-067, http://eleven.fibreculturejournal.org/fcj-067-art-against-information-case-studies-indata-practice/
  • 29.
    PROJETS CITES : • • ANAMIA(La sociabilité « Ana-mia » : une approche des troubles alimentaires par les réseaux sociaux en ligne et hors ligne, ANR-09-ALIA-001). ICCU (Internet Censorship and Civil Unrest). ARTICLES RELATIFS AUX PROJETS : • • Casilli, A. A. & P. Tubaro (2012) ‘Social Media Censorship in Times of Political Unrest – A Social Simulation Experiment with the UK Riots’, Bulletin of Sociological Methodology, 115 (1). P. Tubaro, Casilli, A. A. & L. Mounier (2014) ‘Eliciting personal network data in web surveys through participant-generated sociograms’, Field Methods, 26 (2). LOGICIELS DE VISUALISATION DES DONNEES DES PROJETS : • • ANAMIA Datalab (GitHub). ANAMIA Egocenter (GitHub).