Let’s talk about sex policy
Quelles politiques publiques
pour la connaissance ?
SOData!
Pierre-Carl Langlais
Rayna Stamboliyska
OKF France & SavoirsCom1
http://scoms.hypotheses.org/
@Dorialexander
@Mali...
Au moins 70%
les bénéfices sont plus importants que les dommages
Climat, biotech
pas assez présents dans le débat public e...
Science et société
Profonde confiance et grand optimisme
MAIS
■ utilisation de “boîtes noires” quasi-
systématique ;
■ enc...
1.
Science
ouverte/fermée
Les fondamentaux
IL ÉTAIT UNE FOIS
Un chat (de Schrödinger), what else?
Un idéal communautaire
Journal des Savants
(janvier 1665)
Philosophical Transactions
(mars 1665)
“
The substantive findings of science are a
product of social collaboration and are
assigned to a community (…) The scient...
La circulation des savoirs
Les réseaux scientifiques du
XVIII s. selon Stanford
La circulation des savoirs
Dictionnaire de
Pierre Bayle
(1711)
Cyclopaedia
(1728)
Encyclopédie
(1751)
L’apologie du piratage
Les périodiques pratiquent
couramment un droit de
recopie (et en sont fiers…)
2.
Qu’est-ce que la
science ouverte ?
Une grande famille
SCIENCE OUVERTE
{Logiciels + données + publications + protocoles}
libres et ouverts
Pourquoi est-ce important ?
■ Reproducibilité grâce aux outils ouverts ;
■ Sauvegarde et transparence des
processus ;
■ Tr...
Qui a peur du grand méchant GNU ?
Projet de loi relatif à l’enseignement
supérieur et à la recherche, adopté le
9 juillet ...
Le droit de lire
La conférence de Berlin (1908) :
fin du droit de recopie
-> les mentions légales de type
“tous droits rés...
OLIGOPOLE
Le marché de la publication scientifique
est dominé par quelques grandes
multinationales.
Travail des
chercheurs
Article
processing
charges
Achat par les
bibliothèques
La recherche scientifique est payée… 3 fois
Chiffre d’affaire, EUR Bénéfice, EUR Marge, EUR
Elsevier 2 420 000 000 878 323 000 36,29%
Springer 866 000 000 294 000 000...
Dès 1991, Tim
Berners-Lee se met
à l’Open Access
Un hacking du droit d’auteur…
La licence de Creative Commons CC-BY est le cadre
juridique de référence du libre accès…
Sou...
…qui atteint ses limites
Le dépôt d’articles
ou de données en
archive ouverte
est conditionné à
l’accord de l’
éditeur.
So...
Vers une loi open access ?
Une recommandation européenne de 2012 invite à
ce que :
les publications issues de la recherche...
La carte mondiale du libre accès
Mexique
Pérou
Argentine
Italie
Alemagne
Irelande
Pays-Bas
Une loi open access… en VF
Un projet en préparation intègrerait les
restrictions suivantes :
■ Financé à moitié par l’État...
L’information (scientifique) veut être libre
Les outils de text
mining
permettent de lire
des millions d’
articles
scienti...
Êtes-vous un robot ?
La réutilisation des
données est de facto
contrôlée par les
éditeurs scientifiques
L’information est libre*
*But conditions apply:
■ Libre pour les abonnés d’Elsevier ;
■ API obligatoire ;
■ Uniquement pou...
Vers une privatisation des données scientifiques ?
Avec le
processus
Licences for
Europe, la
commission
européenne a
tenté...
USA : une
jurisprudence sur
Google books (le
data mining relève
du fair use)
Le développement des exceptions
UK : vote d’u...
3.
Certaines données sont
plus égales que d’autres
Snif
Quand l’open data oublie la recherche…
Le Ministère de l’Enseignement supérieur et de la
Recherche est heureusement engagé...
Qu’est-ce que la donnée de recherche ?
■ N’est pas de la donnée publique
■ Est visée par une exception CADA (accès ok, mai...
Qu’est-ce que la donnée de recherche ?
La donnée de recherche = le produit de la
recherche scientifique
■ données brutes (...
PRESQUE-LIBRES
Les données brutes sont libres par défaut,
mais cette liberté est entravée par les
pratiques et droits biza...
Quid de l’ouverture et du droit à réutilisation ?
It’s complicated…
■ dispositions légales non-unifiées en Europe ;
■ donn...
Quid du stockage et de la préservation ?
80% des jeux de données des 20 dernières années
ne sont plus disponibles (Vine et...
Vers une privatisation des données scientifiques ?
Avec le
processus
Licences for
Europe, la
commission
européenne a
tenté...
Merci !
Des questions?
http://scoms.hypotheses.org/
@Dorialexander
@MaliciaRogue
Annexes
On savait que vous alliez
poser ces questions
(ou on l’espérait, pour le moins)
Un système verrouillé par le facteur d’impact…
Les revues les plus
citées attirent
systématiquement les
chercheurs les plu...
… qui repose sur l’exploitation de travail bénévole
Avec la réduction des
frais d’édition, la
valeur des revue est
essenti...
Vers une loi open access ?
Plusieurs pays ont légiféré sur l’open access :
Allemagne, Italie, Mexique…
HORIZON2020
“A DMP is a document
outlining how research data
will be handled during a
research project, and after
it is co...
“
Citations were 9% higher for papers with
available data, independent of other variables
(p < 0.01, 95% confidence interv...
Crédits
Special thanks to all the people who made and released these awesome
resources for free:
■ Modèle de présentation ...
Let's talk about policy! Politiques publiques pour l’ouverture des données scientifiques
Prochain SlideShare
Chargement dans…5
×

Let's talk about policy! Politiques publiques pour l’ouverture des données scientifiques

3 169 vues

Publié le

Cette présentation était la keynote de fermeture pour l'édition 2015 de la conférence SOData! tenu le 26 mars 2015 (voir le programme ici http://sodata.org/?page_id=162). Pierre-Carl Langlais et moi-même avons parlé des défis et opportunités d'une politique publique visant l'ouverture des données de la recherche.

Publié dans : Sciences
0 commentaire
1 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
3 169
Sur SlideShare
0
Issues des intégrations
0
Intégrations
1 466
Actions
Partages
0
Téléchargements
6
Commentaires
0
J’aime
1
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Let's talk about policy! Politiques publiques pour l’ouverture des données scientifiques

  1. 1. Let’s talk about sex policy Quelles politiques publiques pour la connaissance ?
  2. 2. SOData! Pierre-Carl Langlais Rayna Stamboliyska OKF France & SavoirsCom1 http://scoms.hypotheses.org/ @Dorialexander @MaliciaRogue
  3. 3. Au moins 70% les bénéfices sont plus importants que les dommages Climat, biotech pas assez présents dans le débat public et la recherche Au moins 80% la recherche scientifique doit bénéficier de fonds publics National Science Board, 2008
  4. 4. Science et société Profonde confiance et grand optimisme MAIS ■ utilisation de “boîtes noires” quasi- systématique ; ■ enclosure des productions scientifiques ; ■ perversion fondamentale des pratiques.
  5. 5. 1. Science ouverte/fermée Les fondamentaux
  6. 6. IL ÉTAIT UNE FOIS Un chat (de Schrödinger), what else?
  7. 7. Un idéal communautaire Journal des Savants (janvier 1665) Philosophical Transactions (mars 1665)
  8. 8. “ The substantive findings of science are a product of social collaboration and are assigned to a community (…) The scientist’s claim to “his” intellectual “property” is limited to that of recognition and esteem. Robert K. Merton, The Normative Structure of Science
  9. 9. La circulation des savoirs Les réseaux scientifiques du XVIII s. selon Stanford
  10. 10. La circulation des savoirs Dictionnaire de Pierre Bayle (1711) Cyclopaedia (1728) Encyclopédie (1751)
  11. 11. L’apologie du piratage Les périodiques pratiquent couramment un droit de recopie (et en sont fiers…)
  12. 12. 2. Qu’est-ce que la science ouverte ? Une grande famille
  13. 13. SCIENCE OUVERTE {Logiciels + données + publications + protocoles} libres et ouverts
  14. 14. Pourquoi est-ce important ? ■ Reproducibilité grâce aux outils ouverts ; ■ Sauvegarde et transparence des processus ; ■ Transparence et traçabilité de la collecte des données et des méthodologies ; ■ Intéropérabilité et réutilisation des procédés et données.
  15. 15. Qui a peur du grand méchant GNU ? Projet de loi relatif à l’enseignement supérieur et à la recherche, adopté le 9 juillet 2013 (http://www.assemblee-nationale. fr/14/ta/ta0180.asp) Scientistsandtheirsoftware,Nature2010 http://ti.arc.nasa.gov/opensource/
  16. 16. Le droit de lire La conférence de Berlin (1908) : fin du droit de recopie -> les mentions légales de type “tous droits réservées” se multiplient dès années 1970 http://rue89.nouvelobs.com/2014/11/10/france-prefere-payer-deux-fois-les-articles-chercheurs- 255964
  17. 17. OLIGOPOLE Le marché de la publication scientifique est dominé par quelques grandes multinationales.
  18. 18. Travail des chercheurs Article processing charges Achat par les bibliothèques La recherche scientifique est payée… 3 fois
  19. 19. Chiffre d’affaire, EUR Bénéfice, EUR Marge, EUR Elsevier 2 420 000 000 878 323 000 36,29% Springer 866 000 000 294 000 000 33,95% Wiley 175 000 000 77 000 000 41,85% Une rentabilité phénoménale Source : Heather Morrison, 2011 (chiffres originaux en livre, convertis en euros)
  20. 20. Dès 1991, Tim Berners-Lee se met à l’Open Access
  21. 21. Un hacking du droit d’auteur… La licence de Creative Commons CC-BY est le cadre juridique de référence du libre accès… Source : DOAJ
  22. 22. …qui atteint ses limites Le dépôt d’articles ou de données en archive ouverte est conditionné à l’accord de l’ éditeur. Source : Données de Sherpa Romeo
  23. 23. Vers une loi open access ? Une recommandation européenne de 2012 invite à ce que : les publications issues de la recherche financée par des fonds publics soient librement accessibles dans les meilleurs délais, de préférence immédiatement.
  24. 24. La carte mondiale du libre accès Mexique Pérou Argentine Italie Alemagne Irelande Pays-Bas
  25. 25. Une loi open access… en VF Un projet en préparation intègrerait les restrictions suivantes : ■ Financé à moitié par l’État (<=> une ligne budgétaire explicite) ■ « Collection paraissant au moins deux fois par an » ; ■ Délai de 6 mois (les STM) et de 12 mois (les SHS) ■ Toute fin commerciale est exclue
  26. 26. L’information (scientifique) veut être libre Les outils de text mining permettent de lire des millions d’ articles scientifiques en quelques mois… Source : Text2Genome
  27. 27. Êtes-vous un robot ? La réutilisation des données est de facto contrôlée par les éditeurs scientifiques
  28. 28. L’information est libre* *But conditions apply: ■ Libre pour les abonnés d’Elsevier ; ■ API obligatoire ; ■ Uniquement pour les projets à visée “non commerciale” (La licence de data mining d’Elsevier) => Va-t-on payer les articles une quatrième fois ?
  29. 29. Vers une privatisation des données scientifiques ? Avec le processus Licences for Europe, la commission européenne a tenté de valider a posteriori les revendications des grands éditeurs
  30. 30. USA : une jurisprudence sur Google books (le data mining relève du fair use) Le développement des exceptions UK : vote d’une exception au data mining en juin 2014 Europe : le rapport de Julia Reda prévoit une exception.
  31. 31. 3. Certaines données sont plus égales que d’autres Snif
  32. 32. Quand l’open data oublie la recherche… Le Ministère de l’Enseignement supérieur et de la Recherche est heureusement engagé dans une démarche de big data : déjà 25 jeux de données en un an… (et toujours pas de stratégie open data recherche en vue)
  33. 33. Qu’est-ce que la donnée de recherche ? ■ N’est pas de la donnée publique ■ Est visée par une exception CADA (accès ok, mais pas réutilisation) ■ Limitations imposées par les secrets (pro, commercial, etc.) Loi n° 78-753 du 17 juillet 1978 - Article 11, version en vigueur au 1 mai 2009 Alors ?...
  34. 34. Qu’est-ce que la donnée de recherche ? La donnée de recherche = le produit de la recherche scientifique ■ données brutes (issues d’expériences, études, mesures) ; ■ métadonnées et détails d’analyse des données brutes ; ■ NB : pour les éditeurs, les données liées aux publications sont partie intégrante de la publication (publisher-driven data sharing) (exceptions “classiques” : données personnelles ou relatives à la sécurité d’État, etc.) Source : “Report consultation Open Research Data” https://ec.europa.eu/digital- agenda/sites/digital-agenda/files/Report_2013-07-OpenResearchData-Consultation-FINAL1.pdf
  35. 35. PRESQUE-LIBRES Les données brutes sont libres par défaut, mais cette liberté est entravée par les pratiques et droits bizarroïdes additionnels.
  36. 36. Quid de l’ouverture et du droit à réutilisation ? It’s complicated… ■ dispositions légales non-unifiées en Europe ; ■ données de recherche ≠ données publiques ; ■ droit des bases de données (France) ; ■ droits français inaliénables + reconnaissance des chercheurs ; ■ besoin d’inclure dans l’évaluation ; ■ question de redevance ; ■ données brutes vs. élaborées ; ■ données brutes assimilables à des oeuvres ; ■ données porteuses d’intérêts commerciaux ; ■ question du devenir potentiel (génomes & médecine, etc.) ; ■ ...
  37. 37. Quid du stockage et de la préservation ? 80% des jeux de données des 20 dernières années ne sont plus disponibles (Vine et al., 2013) La probabilité de sourcer un jeu de données produit lors des 20 dernières années ont baissé de 17% (Vine et al., 2013) 54% des ressources de 238 études ne sont pas identifiables => pas de vérification (Vasilevsky et al., 2013) 34 pays ont signé la Déclaration pour un accès publics aux données de recherche financées par fonds publics (OCDE)
  38. 38. Vers une privatisation des données scientifiques ? Avec le processus Licences for Europe, la commission européenne a tenté de valider a posteriori les revendications des grands éditeurs
  39. 39. Merci ! Des questions? http://scoms.hypotheses.org/ @Dorialexander @MaliciaRogue
  40. 40. Annexes On savait que vous alliez poser ces questions (ou on l’espérait, pour le moins)
  41. 41. Un système verrouillé par le facteur d’impact… Les revues les plus citées attirent systématiquement les chercheurs les plus prestigieux et augmentent ainsi leur facteur d’impact.
  42. 42. … qui repose sur l’exploitation de travail bénévole Avec la réduction des frais d’édition, la valeur des revue est essentiellement créée par les communautés scientifiques.
  43. 43. Vers une loi open access ? Plusieurs pays ont légiféré sur l’open access : Allemagne, Italie, Mexique…
  44. 44. HORIZON2020 “A DMP is a document outlining how research data will be handled during a research project, and after it is completed, is very important in all aspects for projects participating in the Horizon 2020 Open Research Data Pilot as well as almost any other research project.” Source: http://ec.europa. eu/research/participants/data/ref/h2020/grants_ manual/hi/oa_pilot/h2020-hi-oa-data-mgt_en. pdf
  45. 45. “ Citations were 9% higher for papers with available data, independent of other variables (p < 0.01, 95% confidence intervals). (...) The results indicate that dataset reuse has been increasing over time. H. Piwowar and T. Vision, Data reuse and the open data citation advantage (2013)
  46. 46. Crédits Special thanks to all the people who made and released these awesome resources for free: ■ Modèle de présentation par SlidesCarnival ■ Cadenas ouvert et fermé : Joel Bryant pour The Noun Project, CC-by-SA 3.0 ; chat du Schrödinger : Marco Petrucci pour The Noun Project, CC-by- SA 3.0 ; modifiés par auteurs. ■ Image “déclin” par hunotika pour The Noun Project, CC-by-SA 3.0 ; parapluie par Michael A. Salter pour The Noun Project, CC-by-SA 3.0 ■ “L’information veut être libre” : Pierre Selim sur Wikimedia Commons, CC-BY-SA

×