La réflexion sur les enjeux épistémologiques, culturels, politiques et économiques de l’exposition, la valorisation et la réutilisation des données de la recherche mobilise actuellement une variété d’acteurs du milieu de la recherche : institutions, chercheurs, éditeurs scientifiques, documentalistes / bibliothécaires, etc. A partir d’une série d’entretiens semi-directifs menés auprès de chercheurs en sciences humaines et sociales (SHS), nous avons essayer de comprendre la façon spécifique dont cette question plurielle se pose dans ces disciplines : Qu’est-ce qu’une donnée de la recherche en SHS ? Quelles données partager et dans quel but ? Quelles conditions et quels freins à l’accès et au partage dans ces domaines ? Comment les chercheurs souhaitent-ils valoriser ces données ? Cette étude exploratoire a donné lieu à un présentation du groupe "Big data / Smart data" du GFII.
Le Lean sur une ligne de production : Formation et mise en application directe
Les « Données de la recherche » : définitions, enjeux et perspectives pour les sciences humaines et sociales
1. Cairn.info
Chercher : Repérer : Avancer 10/02/2015
{! }!
Les données de la recherche en sciences
humaines et sociales : enjeux et pratiques
Une étude exploratoire
Février 2015 - GFII
2. Cairn.info
Chercher : Repérer : Avancer 10/02/2015
{! }!
Les « données » : une promesse
multiple pour les SHS (1/2)
! Big Data : une matière première foisonnante, ancienne ou nouvelle
! Data Mining : un mode exploratoire nouveau pour la recherche
! Open Data : un nouvel impératif catégorique de l’action publique et
de la recherche
3. Cairn.info
Chercher : Repérer : Avancer 10/02/2015
{! }!
! Web sémantique : la possible interconnexion des SHS et de leur
environnement via le web
! Nouveaux services éditoriaux : valoriser les publications par les
données, et vice versa
! Humanités numériques : refonder les champs disciplinaires au prisme
du numérique
Les « données » : une promesse
multiple pour les SHS (2/2)
4. Cairn.info
Chercher : Repérer : Avancer 10/02/2015
{! }!
Une étude exploratoire pour y voir plus clair
! Phase 1 : Veille ciblée et identification d’axes de questionnement
! Phase 2 : Élaboration d’une structure d’interview
! Phase 3 : Constitution progressive d’un panel de répondants
(53 chercheurs, issus de différentes disciplines)
! Phase 4 : Traitement des résultats et premières analyses
5. Cairn.info
Chercher : Repérer : Avancer 10/02/2015
{! }!
Un constat partagé :
une réalité complexe (1/2)
" La distinction doit être faite entre « données brutes » et « données d’interprétation »
Ex : Méthodologie du travail historique ou l’art de l’herméneutique
" Préparer des données pour une diffusion sur internet requiert du travail et du temps,
aujourd’hui peu ou pas valorisé par les institutions de recherche
" La diffusion éventuelle des données doit être pensée au moment de leur production
Ex : Les grandes enquêtes réalisée par l’INSEE sont peu utilisables en l’état par les
chercheurs, pour qui la granularité n’y est pas assez fine
6. Cairn.info
Chercher : Repérer : Avancer 10/02/2015
{! }!
" Au-delà de la technologie, des verrous juridiques, éthiques et épistémologiques à lever
" Quand elle existe, la diffusion de « données de recherche » est généralement
cantonnée au laboratoire producteur, ou aux collectifs de chercheurs proches
" Les TICs constituent une opportunité, mais les SHS restent avant tout des disciplines
du sens et de l’interprétation
« Traiter une énorme masse de données ne dispense pas de partir d’une problématique et
d’élaborer un cadre conceptuel »
Historien, Directeur de recherche au CNRS
Un constat partagé :
une réalité complexe (2/2)
7. Cairn.info
Chercher : Repérer : Avancer 10/02/2015
{! }!
Des différences disciplinaires (1/2)
" Certains champs disciplinaires comme le droit semblent réfractaires
" Pour certaines disciplines, comme la philosophie ou l’étude littéraire, la question est
avant tout celle de l’accès aux sources
Ex : L’accès à d’anciens numéros de revues de philosophie ou des corpus de textes peut rester
difficile aujourd’hui, alors que leur étude est essentielle
" En histoire ou en sociologie, le constitution d’un jeu de « données » est perçue comme
une étape indispensable de la démarche propre (voire initiatique) de chaque chercheur
8. Cairn.info
Chercher : Repérer : Avancer 10/02/2015
{! }!
Des différences disciplinaires (2/2)
" En économie, publier des revues anglo-saxonnes signifie de plus en plus systématiquement
fournir un jeu de données
⇒ Nécessitée, comme en sciences exactes, de garantir la « reproductibilité des expériences »
" En ethnologie / anthropologie, partager ses données peut rapidement devenir une étape
indispensable pour poursuivre un travail à dimension comparative, ou travaillant sur des
populations très éclatées géographiquement
9. Cairn.info
Chercher : Repérer : Avancer 10/02/2015
{! }!
Des questions vives (1/6)
" Faut-il réutiliser les données produites par d’autres chercheurs ?
Oui : « Les 8.000 photos que j’ai extirpées des bulletins officiels du travail dans les colonies
pourraient être exploitées à des fins très différentes de celles que j’ai poursuivies »
Historien, Université de Nantes
Non : « A supposer qu’il mette en ligne les images d’archives collectées dans une base de
données, un chercheur ne pourrait plus les réutiliser en tant que données brutes, mais
devrait bien considérer celles-ci comme des données d’interprétation »
Historien, Institut des Hautes Etudes de l’Amérique Latine
10. Cairn.info
Chercher : Repérer : Avancer 10/02/2015
{! }!
Des questions vives (2/6)
" L’ouverture large des données a-t-elle un sens en SHS ?
Oui : « L’absence des données ou la rétention des données par certains organismes est une
barrière à la science mais aussi aux transformations de notre société »
Chercheur en sciences de l’éducation, ENS
Non : « la question de la diffusion des données se pose essentiellement pour les sciences
exactes, où les enjeux de vérification des procédures soulèvent des questions plus sensibles
qu’en sciences humaines. Le problème principal aujourd’hui est le manque de temps pour
lire toutes les publications disponibles et produites dans chaque champ spécialisé, pas la
mise en accès des données qui les accompagnent. »
Historien, Université de Bourgogne
11. Cairn.info
Chercher : Repérer : Avancer 10/02/2015
{! }!
Des questions vives (3/6)
" Y a-t-il une demande ?
Oui : « Les chercheurs commencent à se rendre compte que de plus en plus de revues
demandent les données et la méthodologie utilisées, ne se contentant plus du seul article.
Pour continuer à publier, les chercheurs devront progressivement s’habituer à préparer leurs
données en amont. »
Chercheuse en sciences de l’éducation, ENS Lyon
Non : « Les archives que j’avais rassemblées sur le terrorisme au pays basque ont été mises
en ligne il y a maintenant une dizaine d’années. A ce jour, seules deux personnes
appartenant déjà à mon cercle de connaissances ont fait des demandes pour la réutiliser
certaines de ces données »
Sociologue, Fondation Maison des Sciences de l’Homme
12. Cairn.info
Chercher : Repérer : Avancer 10/02/2015
{! }!
Des questions vives (4/6)
" Qui doit décider de l’ouverture des données ?
Le chercheur : « Le chercheur doit avoir la liberté de choisir s’il souhaite ou non partager
ses données. Toute contrainte à ce niveau, dans la veine de la société de « surveillance » qui
apparaît peu à peu, serait tout à fait regrettable »
Historien, Directeur de recherches au CNRS
L’institution : « Un programme de diffusion des données doit émaner d’initiatives collectives
voire institutionnelles. Ce type de programme nécessite non seulement une légitimité forte
au sein de la communauté des chercheurs à qui il s’adresse, mais aussi un travail de
préparation et de gestion qui ne peut pas être réalisé par un chercheur isolé »
Economiste, Université d’Artois
13. Cairn.info
Chercher : Repérer : Avancer 10/02/2015
{! }!
Des questions vives (5/6)
" Qui est propriétaire des données ?
« Concernant les pratiques des chercheurs, le constat est mitigé : certes les nombre
d’initiatives individuelles ou collectives visant à mettre à disposition des données est
croissant, mais la culture de la propriété et les modes de travail individualistes restent très
majoritaires. »
Chercheur en science politique, Sciences Po
« Les chercheurs souhaitent pouvoir trancher sur des questions juridiques touchant la
réutilisation des données, en tant que producteurs et en tant qu’utilisateurs (...) La
difficulté réside dans la définition des « données brutes», car dès qu’un donnée subit le
moindre traitement, elle ne l’est plus tout à fait »
Juriste, Université d'Aix-Marseille
14. Cairn.info
Chercher : Repérer : Avancer 10/02/2015
{! }!
Des questions vives (6/6)
" Faut-il publier ses données avant, pendant ou après la publication d’un article ?
« Une diffusion potentiellement intéressante pour ces données devrait se faire en parallèle
ou rapidement après la publication d’un article ou d’un ouvrage, car une fois qu’un
chercheur passe à un autre projet, il lui est difficile de se remettre dans sa/ses
production(s) précédentes et de préparer des données correctement »
Historien, Sciences Po
« La mise à disposition des données parallèlement à une publication est aussi important que
la citation des sources utilisées par un chercheur »
Chercheur en sciences de l’éducation, ENS Lyon