Dépollution de la littérature scientifique : traque d’expression torturées et autres manipulations
1. Dépollu'on de la li.érature scien'fique :
traque d’expression torturées
et autres manipula'ons
17 février 2022
10es
rencontres Infocom
Guillaume Cabanac
guillaume.cabanac@univ-tlse3.fr
@gcabanac
2. 2
La science : accumulation des connaissances
la science forme le mur de la connaissance
M
temps
qui
passe
:
sédimenta/on
c
i
t
e
1965
3. 3
Processus d’auto-correc5on
publication corrigée ou rétractée
publication erronée = édifice fragilisé
M
temps
qui
passe
:
sédimenta/on
c
i
t
e
h"ps://www.youtube.com/watch?v=yeX_Zs7zztY
M
⟹ poli/ques d’austérité
4. 4
Le serment des scientifiques
Évalua/on par les pairs
une revue :
6. 6
Massifica5on et mondialisa5on
STM Global Brief 2021
1665 – 2022
16 000 / jour
Voir aussi : h<p://uis.unesco.org/apps/visualisaCons/research-and-development-spending
2,0 % PIB
2,7 % PIB
1,6 % PIB
2,3 % PIB
7. 7
Un business et des oligopoles
Voir aussi : Larivière, V., Haustein, S., & Mongeon, P. (2015). The Oligopoly of Academic Publishers in the Digital Era. PLOS ONE, 10(6), h<ps://doi.org/10.1371/journal.pone.0127502
F = forecast
STM Global Brief 2021
STM Global Brief 2021
Deux fois plus de revues en 20 ans.
Deux fois plus d’experts mondiaux ?
Film “Paywall : the Business of Scholarship”
Financial Times
15. 15
Pollu5on en science
MODUS OPERANDI
1. Génération algorithmique : SCIgen
2. Plagiat et expressions torturées
3. Peer Review hacking
4. Paper mills alias moulins à papier
5. Citation hacking
16. 16
Quizz des expressions torturées
sun oriented force
solar energy
counterfeit consciousness
artificial intelligence
pinnacle flag to clamor propor/on (PSNR)
peak signal to noise ratio (PSNR)
bosom malignancy/peril
breast cancer
man-made brainpower
credulous Bayes
Naive Bayes
Nucleic corrosive enhancement tests (NAAT)
Nucleic acid amplifica/on tests (NAAT)
Extreme intense respiratory disorder
Severe acute respiratory syndrome (SRAS)
😵💫
21. 21
OpenAI GPT-2 Detector
72,1 % des résumés de MicroPro
publiés en 2021
ont un score GPT de 98.6%
‘Lazy Surveys’
état de l’art
du fainéant
😵💫
D’où viennent les expressions torturées ?
22. 22
PPS : iden5fier et signaler les ar5cles probléma5ques
h$ps://www.20minutes.fr/monde/2643491-20191104-maree-noire-bresil-pire-venir-aver?t-president-jair-bolsonaro
23. 23
Cons5tuer une communauté
🕵
Preprint : Open Call for Inves5ga5on
PPS : effet boule de neige avec PubPeer.org
Crowdsourcing de d’évalua5ons post-publica5on
33. Cas 2 : Arabian Journal of Geosciences (Springer)
https://github.com/gcabanac/editorial-assessment
33
h"ps://retrac,onwatch.com/2021/09/28/springer-nature-slaps-more-than-400-papers-with-expressions-of-concern-all-at-once/
34. 34
Pollu5on en science
MODUS OPERANDI
1. Généra/on algorithmique : SCIgen
2. Plagiat et expressions torturées
3. Peer Review hacking
4. Paper mills alias moulins à papier
5. Cita<on hacking
35. Le marché du fake : offre et demande
35
Description de la manipulation (février 2022) :
https://pubpeer.com/publications/940C291607CF03969C6A936F8BA5B9#2
40. 40
Pollution en science – Conclusion
Malfaiteurs : faussaires pseudo-auteurs
Mobile : promo;on, reconnaissance, capital symbolique
Modus operandi : plagiats, infiltra;on de revues, achats de cita;ons
Conséquences : pollu;on de la li[érature
érosion de la confiance que la société
place dans la science
Détec;ves : scien;fiques professionnels et amateurs
bénévoles et volontaires
Objec;f : cura;f → dépolluer la li[érature
préven;f → an;ciper les nouvelles fraudes
Moyen : Ré-évalua;on décentralisée soutenue par le
Problema)c Paper Screener
Il faut dépolluer la liérature scien/fique
h$ps://fr.wikipedia.org/wiki/Dépollu?on
Des bénévoles ne<oient les côtes après la catastrophe du PresCge (2002).