SlideShare une entreprise Scribd logo
Questionner le texte scientifique
pour caractériser la science
et l’innovation
Guillaume Cabanac
guillaume.cabanac@univ-tlse3.fr
9 mars 2017
TERRE-ISTEX
http://bit.ly/istexCabanac2017
 Thème 2 : Indexation et Recherche d’Informations
Équipe IRIS : Information Retrieval & Information Synthesis
2
Interroger le texte scientifique ?
Prélude : programme de recherche
3
Interroger le texte scientifique ?
Prélude : programme de recherche
Requêter
recherche d’information
Questionner
scientométrie
4
Prélude : programme de recherche
Dans ma boîte à outils
5
Merton
Price
Tukey
Hartley Hubert Milard
Prélude : programme de recherche
6
Prospection sur textes scientifiques
La matière première
1. Notice bibliographique
a. Nature des collaborations
b. Positions dans le champ
2. Plein texte
3. Site web d’une maison d’édition
4. Plateforme de partage
5. Bibliographie institutionnelle
Questionner le texte scientifique pour caractériser la science et l’innovation
7
Cabanac, G., Hubert, G., & Milard, B. (2015). Academic careers in Computer Science: continuance and transience
of lifetime co-authorships. Scientometrics, 102, 1, 135–150.
1a — Nature des collaborations scientifiques
8
Source: https://projects.groept.be/~emedia
La population
(N = 1 870 054)
L’échantillon des
« quinquas »
(N = 209 377)
1a — Nature des collaborations scientifiques
9
Collaborations entretenues versus éphémères
1a — Nature des collaborations scientifiques
10
Renouvellement
1a — Nature des collaborations scientifiques
11
Effet Matthieu et homophilie
1a — Nature des collaborations scientifiques
12
Positions dans le champ
1b — Positions des élites dans le champ de l’informatique
13
La matière première
1. Notice bibliographique
2. Plein texte
a. Éponymie et panthéon
b. Équilibre travail-loisirs
c. Écriture scientifique : collectifs et genre
3. Site web d’une maison d’édition
4. Plateforme de partage
5. Bibliographie institutionnelle
Questionner le texte scientifique pour caractériser la science et l’innovation
Prospection sur textes scientifiques
Uncitedness III : l’importance de ne pas être cité
14
“Eponyms remind us that science
and scholarship are the work of
dedicated people.” (p. 393)
“mnemonic and commemorative device” (p. 121)
Merton, R. K. (1942). Science and technology in a democratic order.
Journal of Legal and Political Sociology, 1(1), 115–126.
“the practice of affixing the name of the scientist to all or part of
what he has found, as with the Copernican system, Hooke’s law,
Planck’s constant, or Halley’s comet” (p. 643)
Merton, R. K. (1957). Priorities in scientific discovery: A chapter in the sociology of
science. American Sociological Review, 22(6), 635–659.
Cabanac, G. (2014). Extracting and quantifying eponyms in full-text articles. Scientometrics, 98, 3, 1631–1645.
2a — Éponymie et panthéon scientifique
15
 Théories
 The Reward System of Science (Merton, 1942, 1957)
 Obliteration by Incorporation (Merton, 1988; McCain, 2011, 2012)
 Non-indexed Eponymal Citedness (Száva-Kováts, 1994)
 Extraire et quantifier les éponymes en plein texte
 Connaître les savants les plus influents d’un champ donné
 Amender un dictionnaire d’éponymes
 Identifier les tendances et l’incorporation de méthodes
Appréciation implicite via les éponymes
2a — Éponymie et panthéon scientifique
16
Moissonnage d’éponymes en plein texte
2a — Éponymie et panthéon scientifique
17
Révélation du panthéon scientifique implicite
2a — Éponymie et panthéon scientifique
Work-life Balance
18
Cabanac, G., & Hartley, J. (2013). Issues of work-life balance among JASIST
authors and editors. JASIST, 64, 10, 2182–2186.
2b — Équilibre travail-loisirs
Fragrances du Publish or Perish ?
19
2b — Équilibre travail-loisirs
20
Faire parler les « séquelles » de la peer review
Sunday!
2b — Équilibre travail-loisirs
21
Ce que les traces révèlent...
Authors
Editors
2b — Équilibre travail-loisirs
22
Travailler dans sa bulle le week-end ?
[…]
2b — Équilibre travail-loisirs
23
Écriture et genre de l’auteur 1/3
 Théorie et observations en psychologie dans les années 1960
 Men are more spatially and mathematically oriented than women
 Women are more verbally oriented than men
http://www.kaheel7.com/eng/images/stories/2(5).jpg
2c — Écriture scientifique : collectifs et genre
Hartley, J. & Cabanac, G. (2014). Do men and women differ in their use of tables and graphs in academic publications?
Scientometrics, 98, 2, 1161-1172.
24
 Résultats sur 1 403 articles mono-signés en STM
 Les hommes emploient 26 % plus de figures que les femmes (p < 0.001)
 Les hommes emploient 11% plus de tableaux que les femmes (p = 0.102)
… cependant, cette différence se voit-elle en pratique ?
2c — Écriture scientifique : collectifs et genre
Écriture et genre de l’auteur 2/3
25
 Hypothèse
 Il est plus difficile de s’accorder sur du texte que sur des figures/graphes
 Davantage de figures et graphes dans les article co-signés
2c — Écriture scientifique : collectifs et genre
Cabanac, G., Hubert, G., & Hartley, J. (2014). Solo versus collaborative writing: Discrepancies in the use of tables and graph
in academic articles. Journal of the American Society for Information Science and Technology, 65, 4, 812–820.
Écriture et collectifs d’auteurs 3/3
26
 Davantage de tableaux dans les articles co-signés vs. mono-signés
2c — Écriture scientifique : collectifs et genre
Écriture et collectifs d’auteurs 1/2
27
 Davantage de figures dans les articles co-signés vs. mono-signés
2c — Écriture scientifique : collectifs et genre
Écriture et collectifs d’auteurs 2/2
28
La matière première
1. Notice bibliographique
2. Plein texte
3. Site web d’une maison d’édition
a. Effets d’ordonnancement sur l’évaluation par les pairs
b. Panorama d’un champ
4. Plateforme de partage
5. Bibliographie institutionnelle
Questionner le texte scientifique pour caractériser la science et l’innovation
Prospection sur textes scientifiques
29
Différences entre champs disciplinaires : les confs
3a — Effets d’ordonnancement sur l’évaluation par les pairs
30
Conférences : et si la date de soumission importait ? 
 Évaluation par les pairs
Cabanac, G., & Preuss, T. (2013). Capitalizing on order effects in the bids of peer-reviewed conferences to secure
reviews by expert referees. JASIST, 64, 2, 405–415.
3a — Effets d’ordonnancement sur l’évaluation par les pairs
31
3a — Effets d’ordonnancement sur l’évaluation par les pairs
32
Le biais de la date de soumission
 Données de ConfMaster : 42 conférences en informatique
3a — Effets d’ordonnancement sur l’évaluation par les pairs
33
Biais de la date de soumission
 Influence sur les enchères (bids)
3a — Effets d’ordonnancement sur l’évaluation par les pairs
34
Faites évaluer par ceux qui le veulent !
3a — Effets d’ordonnancement sur l’évaluation par les pairs
35
Les gardiens de l’évaluation par les pairs : gatekeepers
(Braun, 2009)
Cabanac, G. (2012). Shaping the landscape of research in information systems from the perspective of editorial boards:
A scientometric study of 77 leading journals. JASIST, 63, 5, 977–996.
3b — Panorama de la recherche en systèmes d’information
36
77 revues « cœur » en IS selon une autorité : le WoS
3b — Panorama de la recherche en systèmes d’information
37
Analyse exploratoire des données recueillies
 77 revues
 2 846 gatekeepers
3b — Panorama de la recherche en systèmes d’information
38
3b — Panorama de la recherche en systèmes d’information
Analyse exploratoire des données recueillies
39
Graphe thématique des 77 revues référencées en SI
3b — Panorama de la recherche en systèmes d’information
40
Influence, pouvoir, verrouillage...
(1984)
3b — Panorama de la recherche en systèmes d’information
41
Un siège à la table des négociations ?
3b — Panorama de la recherche en systèmes d’information
42
(Manque de) Diversité géographique et de genre
3b — Panorama de la recherche en systèmes d’information
43
La matière première
1. Notice bibliographique
2. Plein texte
3. Site web d’une maison d’édition
4. Plateforme de partage
a. Marché noir de l’édition scientifique
5. Bibliographie institutionnelle
Questionner le texte scientifique pour caractériser la science et l’innovation
Prospection sur textes scientifiques
Émergence de l’Open Access gris/clandestin
44
 Domaines
 Science de l’information
 Sociologie des sciences
 Contexte : (non)-accès à l’IST
 8 millions de chercheurs + des amateurs (sciences participatives) + grand public
 114 millions de documents scientifiques en ligne
mais seulement 24 % accessibles librement
 Défi : dévoiler rouages et contenu des bibliothèques clandestines
 Library Genesis (23M d’articles, 1M d’ouvrages), Sci-Hub, #icanhazpdf, /r/scholar
 Contribution : article JASIST accepté en octobre 2014
 Alimentation : biblioleaks + crowdsourcing
 Contenu : distribution des éditeurs, disciplines, langues…
@rickypo
Cabanac, G. (2016). Bibliogifts in LibGen? A study of a text-sharing platform driven by biblioleaks and crowdsourcing. Journal of the
Association for Information Science and Technology, 67, 4, 874–884.
4a — Le marché noir de l’édition scientifique
Étudier l’Open Access clandestin : les enjeux
45
4a — Le marché noir de l’édition scientifique
46
La matière première
1. Notice bibliographique
2. Plein texte
3. Site web d’une maison d’édition
4. Plateforme de partage
5. Bibliographie institutionnelle
a. Collaborations et thématiques d’un laboratoire
Questionner le texte scientifique pour caractériser la science et l’innovation
Prospection sur textes scientifiques
Que fait ce labo multi-site de 686 personnes ?
47
5a — Collaborations et thématiques d’un laboratoire
Que fait ce labo de 686 personnes ?
48
http://www.irit.fr/IMG/pdf/ORGANIGRAMME_IRIT_RECHERCHE_MAI_2015.pdf
5a — Collaborations et thématiques d’un laboratoire
Que fait ce labo de 686 personnes ?
49
https://websecu.irit.fr/IMG/pdf/Rapport_Web_HCERES_IRIT.pdf
5a — Collaborations et thématiques d’un laboratoire
Des données publiques…
50
5a — Collaborations et thématiques d’un laboratoire
Analyse scientométrique
 Contexte : l’évaluation de l’IRIT (octobre 2014)
 Question : qu’apprend-t-on de l’analyse des publications ?
 Source : le site web de l’IRIT (données publiques)
ex : http://dbweb.irit.fr/publi/recherche.list_crit_avance?theme=0&crit1=2&op1=5&texte1=2009&crit2=2&op2=6&texte2=2014&typpub=5
 Critères d’échantillonage
 Revues et conférences à comité de lecture (RICL, RNCL, CICL et CNCL)
 Année ≥ 2009 (certaines publications étaient à paraître)
 Auteurs listés parmi les « membres permanents » des équipes
 Statistiques
 260 auteurs
 3 860 publications dont 82 % en international
Avertissement : étude exploratoire à consolider.
51
5a — Collaborations et thématiques d’un laboratoire
Méthodo : les collaborations inter-thèmes
 Graphe des collaborations
 Un sommet = un membre de l’IRIT
 Couleur : son thème IRIT
 Taille : nombre de publications normalisé
S 1/N
 Modélise un « effort » : effort d’écrire à 2 > effort d’écrire à 10
(en supposant une répartition uniforme du travail)
 Une arrête = une collaboration
 Couleur : mélange des couleurs des sommets reliés
 Taille : nombre de coauteurs par co-publication normalisé
S 1 / ((N × (N – 1)) / 2)
 Modélise la force du lien interpersonnel : collaborer à 2 > collaborer à 10
52
5a — Collaborations et thématiques d’un laboratoire
53
T2
T1
T3
T4
T5
T7
T6
Preuve de concept : IRIT
Données :
• 2009-2014
• RICL, RNCL, CICL, CNCL
• 260 auteurs
• 3 860 articles (82 % internat.)
Interprétation :
• Collaboration inter-thèmes
• Force des liens faibles
Attention :
• Variabilité des pratiques de
publication selon les
domaines : fréquence,
travail ± collaboratif…
Réalisé avec Gephi
Caractérisation des collaborations inter-thème
5a — Collaborations et thématiques d’un laboratoire
Méthodo : les thématiques
 Analyse lexicométrique
 Un titre de publication = un document
 Focus sur les RICL et CICL pour ne pas mélanger les langues
 Élimination des mots non discriminants (stop-list + manuelle)
 Deux résultats
 Classification en 7 classes (paramètres fixé) avec la méthode Reinert
 Extraction des mots-clés
54
5a — Collaborations et thématiques d’un laboratoire
55Réalisé avec Iramuteq
Caractérisation des thématiques 1/2
5a — Collaborations et thématiques d’un laboratoire
56
Interprétation :
• 4 objets principaux
• Des pétales à explorer
NB : le nombre de mots représentés
peut être paramétré pour ajuster le
niveau de détail.
Réalisé avec Iramuteq
Caractérisation des thématiques 2/2
5a — Collaborations et thématiques d’un laboratoire
57
Conclusion et perspectives générales
Reconnaître les structures d’opportunités
Question de recherche :
- captivante
- originale / inattendue
- importante
Revue de la littérature :
- interdisciplinaire
- sur le temps long
Données et méthodes :
- données originales en libre accès, de préférence
- méthode mixte : quanti + quali
Merci
http://www.irit.fr/~Guillaume.Cabanac
@gcabanac

Contenu connexe

En vedette

Best Pregnancy Pillow
Best Pregnancy PillowBest Pregnancy Pillow
Best Pregnancy Pillow
jimperfekt
 
Laura alejandra tapia hernandez
Laura alejandra tapia hernandez Laura alejandra tapia hernandez
Laura alejandra tapia hernandez
pipe palencia
 
Juan felipe palencia figueredo
Juan felipe palencia figueredoJuan felipe palencia figueredo
Juan felipe palencia figueredo
pipe palencia
 
Planeación matemáticas primero 7.2.1
Planeación matemáticas primero 7.2.1Planeación matemáticas primero 7.2.1
Planeación matemáticas primero 7.2.1
yodzonot123
 
Anabell
AnabellAnabell
Animals mini book
Animals mini bookAnimals mini book
Animals mini book
Pedro Marques
 
Adevertencias espirituales
Adevertencias espiritualesAdevertencias espirituales
Adevertencias espirituales
carlos arturo rubio jimenez
 
Lectura2
Lectura2Lectura2
Tecnologias 2017
Tecnologias 2017Tecnologias 2017
Tecnologias 2017
Monica Romero
 
Himnos sistemas yurani
Himnos sistemas yuraniHimnos sistemas yurani
Himnos sistemas yurani
yurani90mora
 
Certificación internacional coaching ontologico Brasil
Certificación internacional coaching ontologico BrasilCertificación internacional coaching ontologico Brasil
Certificación internacional coaching ontologico Brasil
UCG Perú
 
Clase09 03personals.
Clase09 03personals.Clase09 03personals.
Clase09 03personals.
Lupe Alpiste Dionicio
 
Semantic Support for Complex Ecosystem Research Environments
Semantic Support for Complex Ecosystem Research EnvironmentsSemantic Support for Complex Ecosystem Research Environments
Semantic Support for Complex Ecosystem Research Environments
Henrique O. Santos
 
Ideas for Improving Finger Strength for Guitarists
Ideas for Improving Finger Strength for GuitaristsIdeas for Improving Finger Strength for Guitarists
Ideas for Improving Finger Strength for Guitarists
Terrell Herring
 
Sistemas operativos
Sistemas operativosSistemas operativos
Sistemas operativos
Marco Landa
 
Doorrekening verkiezingsprogramma Politieke Partijen 2017
Doorrekening verkiezingsprogramma Politieke Partijen 2017Doorrekening verkiezingsprogramma Politieke Partijen 2017
Doorrekening verkiezingsprogramma Politieke Partijen 2017
Peter van Heuveln
 
χελωνα καρέτα καρέτα (τελικο)
χελωνα καρέτα  καρέτα (τελικο)χελωνα καρέτα  καρέτα (τελικο)
χελωνα καρέτα καρέτα (τελικο)
YPEPTH
 
1er grado
1er grado1er grado
plastic roads
plastic roadsplastic roads
plastic roads
AJITH KURIEN
 

En vedette (20)

Best Pregnancy Pillow
Best Pregnancy PillowBest Pregnancy Pillow
Best Pregnancy Pillow
 
Laura alejandra tapia hernandez
Laura alejandra tapia hernandez Laura alejandra tapia hernandez
Laura alejandra tapia hernandez
 
Juan felipe palencia figueredo
Juan felipe palencia figueredoJuan felipe palencia figueredo
Juan felipe palencia figueredo
 
Planeación matemáticas primero 7.2.1
Planeación matemáticas primero 7.2.1Planeación matemáticas primero 7.2.1
Planeación matemáticas primero 7.2.1
 
Anabell
AnabellAnabell
Anabell
 
Animals mini book
Animals mini bookAnimals mini book
Animals mini book
 
Adevertencias espirituales
Adevertencias espiritualesAdevertencias espirituales
Adevertencias espirituales
 
Lectura2
Lectura2Lectura2
Lectura2
 
Tecnologias 2017
Tecnologias 2017Tecnologias 2017
Tecnologias 2017
 
Himnos sistemas yurani
Himnos sistemas yuraniHimnos sistemas yurani
Himnos sistemas yurani
 
Certificación internacional coaching ontologico Brasil
Certificación internacional coaching ontologico BrasilCertificación internacional coaching ontologico Brasil
Certificación internacional coaching ontologico Brasil
 
Clase09 03personals.
Clase09 03personals.Clase09 03personals.
Clase09 03personals.
 
Semantic Support for Complex Ecosystem Research Environments
Semantic Support for Complex Ecosystem Research EnvironmentsSemantic Support for Complex Ecosystem Research Environments
Semantic Support for Complex Ecosystem Research Environments
 
Ideas for Improving Finger Strength for Guitarists
Ideas for Improving Finger Strength for GuitaristsIdeas for Improving Finger Strength for Guitarists
Ideas for Improving Finger Strength for Guitarists
 
Sistemas operativos
Sistemas operativosSistemas operativos
Sistemas operativos
 
Doorrekening verkiezingsprogramma Politieke Partijen 2017
Doorrekening verkiezingsprogramma Politieke Partijen 2017Doorrekening verkiezingsprogramma Politieke Partijen 2017
Doorrekening verkiezingsprogramma Politieke Partijen 2017
 
χελωνα καρέτα καρέτα (τελικο)
χελωνα καρέτα  καρέτα (τελικο)χελωνα καρέτα  καρέτα (τελικο)
χελωνα καρέτα καρέτα (τελικο)
 
1er grado
1er grado1er grado
1er grado
 
Dani vlg oxelo
Dani vlg oxeloDani vlg oxelo
Dani vlg oxelo
 
plastic roads
plastic roadsplastic roads
plastic roads
 

Similaire à Questionner le texte scientifique pour caractériser la science et l'innovation

Prospection de textes scientifiques : vision prospective
Prospection de textes scientifiques : vision prospectiveProspection de textes scientifiques : vision prospective
Prospection de textes scientifiques : vision prospective
Guillaume Cabanac
 
Cartographie sciences
Cartographie sciencesCartographie sciences
Cartographie sciences
L'Atelier de Cartographie
 
En marge du Rang A : quel espace pour la recherche ?
En marge du Rang A : quel espace pour la recherche ?En marge du Rang A : quel espace pour la recherche ?
En marge du Rang A : quel espace pour la recherche ?
Manuel Durand Barthez
 
Boussole Nanotec Hv2
Boussole Nanotec Hv2Boussole Nanotec Hv2
Boussole Nanotec Hv2
L'Atelier de Cartographie
 
Les métriques de la science (ou La bibliométrie pour les nuls)
Les métriques de la science (ou La bibliométrie pour les nuls)Les métriques de la science (ou La bibliométrie pour les nuls)
Les métriques de la science (ou La bibliométrie pour les nuls)
URFIST de Paris
 
Comment les usages numériques transforment-ils les sciences sociales ?
Comment les usages numériques transforment-ils les sciences sociales ?Comment les usages numériques transforment-ils les sciences sociales ?
Comment les usages numériques transforment-ils les sciences sociales ?
Bodyspacesociety Blog
 
En marge du Rang A : quel espace pour la recherche ?
En marge du Rang A : quel espace pour la recherche ?En marge du Rang A : quel espace pour la recherche ?
En marge du Rang A : quel espace pour la recherche ?
URFIST de Paris
 
Exploring Enlightenment: Text Mining the 18th-Century Republic of Letters
Exploring Enlightenment: Text Mining the 18th-Century Republic of LettersExploring Enlightenment: Text Mining the 18th-Century Republic of Letters
Exploring Enlightenment: Text Mining the 18th-Century Republic of Letters
glennroe
 
Goritsa Ninova, Le Partage De Corpus Comme Objet De Recherche En Sic
Goritsa Ninova, Le Partage De Corpus Comme Objet De Recherche En SicGoritsa Ninova, Le Partage De Corpus Comme Objet De Recherche En Sic
Goritsa Ninova, Le Partage De Corpus Comme Objet De Recherche En Sic
SFSIC Association
 
Confrontation à la perception humaine de mesures de similarité entre membres
Confrontation à la perception humaine de mesures de similarité entre membres Confrontation à la perception humaine de mesures de similarité entre membres
Confrontation à la perception humaine de mesures de similarité entre membres
Guillaume Cabanac
 
EDWoS (Explorateur de Données du Web of Science)
EDWoS (Explorateur de Données du Web of Science)EDWoS (Explorateur de Données du Web of Science)
EDWoS (Explorateur de Données du Web of Science)
L'Atelier de Cartographie
 
Droit documentation electronique edshs
Droit documentation electronique edshsDroit documentation electronique edshs
Droit documentation electronique edshs
carovalerie37
 
Documentation électronique. Ecole doctorale, droit
Documentation électronique. Ecole doctorale, droitDocumentation électronique. Ecole doctorale, droit
Documentation électronique. Ecole doctorale, droit
carovalerie37
 
JE USAGIS - Rennes 2016 : Matthieu Noucher
JE USAGIS - Rennes 2016 : Matthieu NoucherJE USAGIS - Rennes 2016 : Matthieu Noucher
JE USAGIS - Rennes 2016 : Matthieu Noucher
geo_in_geo
 
Haustein, S. (2016). Les « altmetrics » et les médias sociaux dans la communi...
Haustein, S. (2016). Les « altmetrics » et les médias sociaux dans la communi...Haustein, S. (2016). Les « altmetrics » et les médias sociaux dans la communi...
Haustein, S. (2016). Les « altmetrics » et les médias sociaux dans la communi...
Stefanie Haustein
 
Recherche documentaire et Information Scientifique et Technique (IST) enjeux,...
Recherche documentaire et Information Scientifique et Technique (IST) enjeux,...Recherche documentaire et Information Scientifique et Technique (IST) enjeux,...
Recherche documentaire et Information Scientifique et Technique (IST) enjeux,...
Alain Marois
 
Pour une revue rigoureuse et systématique de la littérature en MIS : étude co...
Pour une revue rigoureuse et systématique de la littérature en MIS : étude co...Pour une revue rigoureuse et systématique de la littérature en MIS : étude co...
Pour une revue rigoureuse et systématique de la littérature en MIS : étude co...
Saïd Assar
 
Augmenter l’impact de vos publications avec l’Open Access
Augmenter l’impact de vos publications avec l’Open AccessAugmenter l’impact de vos publications avec l’Open Access
Augmenter l’impact de vos publications avec l’Open Access
ULB - Bibliothèques
 
Collaboratoires & shs lyon ens
Collaboratoires & shs lyon ensCollaboratoires & shs lyon ens
Collaboratoires & shs lyon ens
Manuel Zacklad
 

Similaire à Questionner le texte scientifique pour caractériser la science et l'innovation (20)

Prospection de textes scientifiques : vision prospective
Prospection de textes scientifiques : vision prospectiveProspection de textes scientifiques : vision prospective
Prospection de textes scientifiques : vision prospective
 
Cartographie sciences
Cartographie sciencesCartographie sciences
Cartographie sciences
 
En marge du Rang A : quel espace pour la recherche ?
En marge du Rang A : quel espace pour la recherche ?En marge du Rang A : quel espace pour la recherche ?
En marge du Rang A : quel espace pour la recherche ?
 
Boussole Nanotec Hv2
Boussole Nanotec Hv2Boussole Nanotec Hv2
Boussole Nanotec Hv2
 
Les métriques de la science (ou La bibliométrie pour les nuls)
Les métriques de la science (ou La bibliométrie pour les nuls)Les métriques de la science (ou La bibliométrie pour les nuls)
Les métriques de la science (ou La bibliométrie pour les nuls)
 
Comment les usages numériques transforment-ils les sciences sociales ?
Comment les usages numériques transforment-ils les sciences sociales ?Comment les usages numériques transforment-ils les sciences sociales ?
Comment les usages numériques transforment-ils les sciences sociales ?
 
Cartes des sciences
Cartes des sciencesCartes des sciences
Cartes des sciences
 
En marge du Rang A : quel espace pour la recherche ?
En marge du Rang A : quel espace pour la recherche ?En marge du Rang A : quel espace pour la recherche ?
En marge du Rang A : quel espace pour la recherche ?
 
Exploring Enlightenment: Text Mining the 18th-Century Republic of Letters
Exploring Enlightenment: Text Mining the 18th-Century Republic of LettersExploring Enlightenment: Text Mining the 18th-Century Republic of Letters
Exploring Enlightenment: Text Mining the 18th-Century Republic of Letters
 
Goritsa Ninova, Le Partage De Corpus Comme Objet De Recherche En Sic
Goritsa Ninova, Le Partage De Corpus Comme Objet De Recherche En SicGoritsa Ninova, Le Partage De Corpus Comme Objet De Recherche En Sic
Goritsa Ninova, Le Partage De Corpus Comme Objet De Recherche En Sic
 
Confrontation à la perception humaine de mesures de similarité entre membres
Confrontation à la perception humaine de mesures de similarité entre membres Confrontation à la perception humaine de mesures de similarité entre membres
Confrontation à la perception humaine de mesures de similarité entre membres
 
EDWoS (Explorateur de Données du Web of Science)
EDWoS (Explorateur de Données du Web of Science)EDWoS (Explorateur de Données du Web of Science)
EDWoS (Explorateur de Données du Web of Science)
 
Droit documentation electronique edshs
Droit documentation electronique edshsDroit documentation electronique edshs
Droit documentation electronique edshs
 
Documentation électronique. Ecole doctorale, droit
Documentation électronique. Ecole doctorale, droitDocumentation électronique. Ecole doctorale, droit
Documentation électronique. Ecole doctorale, droit
 
JE USAGIS - Rennes 2016 : Matthieu Noucher
JE USAGIS - Rennes 2016 : Matthieu NoucherJE USAGIS - Rennes 2016 : Matthieu Noucher
JE USAGIS - Rennes 2016 : Matthieu Noucher
 
Haustein, S. (2016). Les « altmetrics » et les médias sociaux dans la communi...
Haustein, S. (2016). Les « altmetrics » et les médias sociaux dans la communi...Haustein, S. (2016). Les « altmetrics » et les médias sociaux dans la communi...
Haustein, S. (2016). Les « altmetrics » et les médias sociaux dans la communi...
 
Recherche documentaire et Information Scientifique et Technique (IST) enjeux,...
Recherche documentaire et Information Scientifique et Technique (IST) enjeux,...Recherche documentaire et Information Scientifique et Technique (IST) enjeux,...
Recherche documentaire et Information Scientifique et Technique (IST) enjeux,...
 
Pour une revue rigoureuse et systématique de la littérature en MIS : étude co...
Pour une revue rigoureuse et systématique de la littérature en MIS : étude co...Pour une revue rigoureuse et systématique de la littérature en MIS : étude co...
Pour une revue rigoureuse et systématique de la littérature en MIS : étude co...
 
Augmenter l’impact de vos publications avec l’Open Access
Augmenter l’impact de vos publications avec l’Open AccessAugmenter l’impact de vos publications avec l’Open Access
Augmenter l’impact de vos publications avec l’Open Access
 
Collaboratoires & shs lyon ens
Collaboratoires & shs lyon ensCollaboratoires & shs lyon ens
Collaboratoires & shs lyon ens
 

Plus de Guillaume Cabanac

Adoption de l’identifiant ORCID : le cas des universités toulousaines
Adoption de l’identifiant ORCID : le cas des universités toulousainesAdoption de l’identifiant ORCID : le cas des universités toulousaines
Adoption de l’identifiant ORCID : le cas des universités toulousaines
Guillaume Cabanac
 
Dépollution de la littérature scientifique : traque d’expression torturées ...
Dépollution de la littérature scientifique : traque d’expression torturées ...Dépollution de la littérature scientifique : traque d’expression torturées ...
Dépollution de la littérature scientifique : traque d’expression torturées ...
Guillaume Cabanac
 
Valoriser le capital documentaire (en sommeil) d’une organisation : exploitat...
Valoriser le capital documentaire (en sommeil) d’une organisation : exploitat...Valoriser le capital documentaire (en sommeil) d’une organisation : exploitat...
Valoriser le capital documentaire (en sommeil) d’une organisation : exploitat...
Guillaume Cabanac
 
Comment analyser une mobilisation collective dans les réseaux socionumériques...
Comment analyser une mobilisation collective dans les réseaux socionumériques...Comment analyser une mobilisation collective dans les réseaux socionumériques...
Comment analyser une mobilisation collective dans les réseaux socionumériques...
Guillaume Cabanac
 
Gender as a Variable to Study Academic Writing
Gender as a Variable to Study Academic WritingGender as a Variable to Study Academic Writing
Gender as a Variable to Study Academic Writing
Guillaume Cabanac
 
Le carnet de l'avent de la sociologie francophone sur Twitter : réseaux et al...
Le carnet de l'avent de la sociologie francophone sur Twitter : réseaux et al...Le carnet de l'avent de la sociologie francophone sur Twitter : réseaux et al...
Le carnet de l'avent de la sociologie francophone sur Twitter : réseaux et al...
Guillaume Cabanac
 
Interroger le texte scientifique
Interroger le texte scientifiqueInterroger le texte scientifique
Interroger le texte scientifique
Guillaume Cabanac
 
The promises of web scrapping: Mining the web for relational data about artists
The promises of web scrapping: Mining the web for relational data about artistsThe promises of web scrapping: Mining the web for relational data about artists
The promises of web scrapping: Mining the web for relational data about artists
Guillaume Cabanac
 
Émergence de l’open access « gris » : LibGen et Sci-Hub comme filières clande...
Émergence de l’open access « gris » : LibGen et Sci-Hub comme filières clande...Émergence de l’open access « gris » : LibGen et Sci-Hub comme filières clande...
Émergence de l’open access « gris » : LibGen et Sci-Hub comme filières clande...
Guillaume Cabanac
 
« T'as pensé à retweeter mon article ? » Enjeux, limites et critique de la bi...
« T'as pensé à retweeter mon article ? » Enjeux, limites et critique de la bi...« T'as pensé à retweeter mon article ? » Enjeux, limites et critique de la bi...
« T'as pensé à retweeter mon article ? » Enjeux, limites et critique de la bi...
Guillaume Cabanac
 
Émergence de l’open access « gris » : LibGen et Sci-Hub
Émergence de l’open access « gris » : LibGen et Sci-HubÉmergence de l’open access « gris » : LibGen et Sci-Hub
Émergence de l’open access « gris » : LibGen et Sci-Hub
Guillaume Cabanac
 
Sur les étagères des bibliothèques numériques clandestines:
Sur les étagères des bibliothèques numériques clandestines: Sur les étagères des bibliothèques numériques clandestines:
Sur les étagères des bibliothèques numériques clandestines:
Guillaume Cabanac
 
Les altmetrics : estimer l'engouement pour la recherche sur les médias sociaux
Les altmetrics : estimer l'engouement pour la recherche sur les médias sociauxLes altmetrics : estimer l'engouement pour la recherche sur les médias sociaux
Les altmetrics : estimer l'engouement pour la recherche sur les médias sociaux
Guillaume Cabanac
 
A Journey in Scientometrics: quantitative studies of science at the crossroad...
A Journey in Scientometrics: quantitative studies of science at the crossroad...A Journey in Scientometrics: quantitative studies of science at the crossroad...
A Journey in Scientometrics: quantitative studies of science at the crossroad...
Guillaume Cabanac
 
Bibliogifts ? Les bibliothèques clandestines de l'édition scientifique
Bibliogifts ? Les bibliothèques clandestines de l'édition scientifiqueBibliogifts ? Les bibliothèques clandestines de l'édition scientifique
Bibliogifts ? Les bibliothèques clandestines de l'édition scientifique
Guillaume Cabanac
 
Le renfort des liens forts - dynamique relationnelle du coauthorship
Le renfort des liens forts - dynamique relationnelle du coauthorshipLe renfort des liens forts - dynamique relationnelle du coauthorship
Le renfort des liens forts - dynamique relationnelle du coauthorship
Guillaume Cabanac
 
Médias sociaux et visibilité des chercheurs
Médias sociaux et visibilité des chercheursMédias sociaux et visibilité des chercheurs
Médias sociaux et visibilité des chercheurs
Guillaume Cabanac
 
In Praise of Interdisciplinary Research through Scientometrics
In Praise of Interdisciplinary Research through ScientometricsIn Praise of Interdisciplinary Research through Scientometrics
In Praise of Interdisciplinary Research through Scientometrics
Guillaume Cabanac
 
Programmation événementielle avec Windev
Programmation événementielle avec WindevProgrammation événementielle avec Windev
Programmation événementielle avec Windev
Guillaume Cabanac
 
Scientometric Studies of Academic Writing
Scientometric Studies of Academic WritingScientometric Studies of Academic Writing
Scientometric Studies of Academic Writing
Guillaume Cabanac
 

Plus de Guillaume Cabanac (20)

Adoption de l’identifiant ORCID : le cas des universités toulousaines
Adoption de l’identifiant ORCID : le cas des universités toulousainesAdoption de l’identifiant ORCID : le cas des universités toulousaines
Adoption de l’identifiant ORCID : le cas des universités toulousaines
 
Dépollution de la littérature scientifique : traque d’expression torturées ...
Dépollution de la littérature scientifique : traque d’expression torturées ...Dépollution de la littérature scientifique : traque d’expression torturées ...
Dépollution de la littérature scientifique : traque d’expression torturées ...
 
Valoriser le capital documentaire (en sommeil) d’une organisation : exploitat...
Valoriser le capital documentaire (en sommeil) d’une organisation : exploitat...Valoriser le capital documentaire (en sommeil) d’une organisation : exploitat...
Valoriser le capital documentaire (en sommeil) d’une organisation : exploitat...
 
Comment analyser une mobilisation collective dans les réseaux socionumériques...
Comment analyser une mobilisation collective dans les réseaux socionumériques...Comment analyser une mobilisation collective dans les réseaux socionumériques...
Comment analyser une mobilisation collective dans les réseaux socionumériques...
 
Gender as a Variable to Study Academic Writing
Gender as a Variable to Study Academic WritingGender as a Variable to Study Academic Writing
Gender as a Variable to Study Academic Writing
 
Le carnet de l'avent de la sociologie francophone sur Twitter : réseaux et al...
Le carnet de l'avent de la sociologie francophone sur Twitter : réseaux et al...Le carnet de l'avent de la sociologie francophone sur Twitter : réseaux et al...
Le carnet de l'avent de la sociologie francophone sur Twitter : réseaux et al...
 
Interroger le texte scientifique
Interroger le texte scientifiqueInterroger le texte scientifique
Interroger le texte scientifique
 
The promises of web scrapping: Mining the web for relational data about artists
The promises of web scrapping: Mining the web for relational data about artistsThe promises of web scrapping: Mining the web for relational data about artists
The promises of web scrapping: Mining the web for relational data about artists
 
Émergence de l’open access « gris » : LibGen et Sci-Hub comme filières clande...
Émergence de l’open access « gris » : LibGen et Sci-Hub comme filières clande...Émergence de l’open access « gris » : LibGen et Sci-Hub comme filières clande...
Émergence de l’open access « gris » : LibGen et Sci-Hub comme filières clande...
 
« T'as pensé à retweeter mon article ? » Enjeux, limites et critique de la bi...
« T'as pensé à retweeter mon article ? » Enjeux, limites et critique de la bi...« T'as pensé à retweeter mon article ? » Enjeux, limites et critique de la bi...
« T'as pensé à retweeter mon article ? » Enjeux, limites et critique de la bi...
 
Émergence de l’open access « gris » : LibGen et Sci-Hub
Émergence de l’open access « gris » : LibGen et Sci-HubÉmergence de l’open access « gris » : LibGen et Sci-Hub
Émergence de l’open access « gris » : LibGen et Sci-Hub
 
Sur les étagères des bibliothèques numériques clandestines:
Sur les étagères des bibliothèques numériques clandestines: Sur les étagères des bibliothèques numériques clandestines:
Sur les étagères des bibliothèques numériques clandestines:
 
Les altmetrics : estimer l'engouement pour la recherche sur les médias sociaux
Les altmetrics : estimer l'engouement pour la recherche sur les médias sociauxLes altmetrics : estimer l'engouement pour la recherche sur les médias sociaux
Les altmetrics : estimer l'engouement pour la recherche sur les médias sociaux
 
A Journey in Scientometrics: quantitative studies of science at the crossroad...
A Journey in Scientometrics: quantitative studies of science at the crossroad...A Journey in Scientometrics: quantitative studies of science at the crossroad...
A Journey in Scientometrics: quantitative studies of science at the crossroad...
 
Bibliogifts ? Les bibliothèques clandestines de l'édition scientifique
Bibliogifts ? Les bibliothèques clandestines de l'édition scientifiqueBibliogifts ? Les bibliothèques clandestines de l'édition scientifique
Bibliogifts ? Les bibliothèques clandestines de l'édition scientifique
 
Le renfort des liens forts - dynamique relationnelle du coauthorship
Le renfort des liens forts - dynamique relationnelle du coauthorshipLe renfort des liens forts - dynamique relationnelle du coauthorship
Le renfort des liens forts - dynamique relationnelle du coauthorship
 
Médias sociaux et visibilité des chercheurs
Médias sociaux et visibilité des chercheursMédias sociaux et visibilité des chercheurs
Médias sociaux et visibilité des chercheurs
 
In Praise of Interdisciplinary Research through Scientometrics
In Praise of Interdisciplinary Research through ScientometricsIn Praise of Interdisciplinary Research through Scientometrics
In Praise of Interdisciplinary Research through Scientometrics
 
Programmation événementielle avec Windev
Programmation événementielle avec WindevProgrammation événementielle avec Windev
Programmation événementielle avec Windev
 
Scientometric Studies of Academic Writing
Scientometric Studies of Academic WritingScientometric Studies of Academic Writing
Scientometric Studies of Academic Writing
 

Questionner le texte scientifique pour caractériser la science et l'innovation

  • 1. Questionner le texte scientifique pour caractériser la science et l’innovation Guillaume Cabanac guillaume.cabanac@univ-tlse3.fr 9 mars 2017 TERRE-ISTEX http://bit.ly/istexCabanac2017  Thème 2 : Indexation et Recherche d’Informations Équipe IRIS : Information Retrieval & Information Synthesis
  • 2. 2 Interroger le texte scientifique ? Prélude : programme de recherche
  • 3. 3 Interroger le texte scientifique ? Prélude : programme de recherche Requêter recherche d’information Questionner scientométrie
  • 4. 4 Prélude : programme de recherche
  • 5. Dans ma boîte à outils 5 Merton Price Tukey Hartley Hubert Milard Prélude : programme de recherche
  • 6. 6 Prospection sur textes scientifiques La matière première 1. Notice bibliographique a. Nature des collaborations b. Positions dans le champ 2. Plein texte 3. Site web d’une maison d’édition 4. Plateforme de partage 5. Bibliographie institutionnelle Questionner le texte scientifique pour caractériser la science et l’innovation
  • 7. 7 Cabanac, G., Hubert, G., & Milard, B. (2015). Academic careers in Computer Science: continuance and transience of lifetime co-authorships. Scientometrics, 102, 1, 135–150. 1a — Nature des collaborations scientifiques
  • 8. 8 Source: https://projects.groept.be/~emedia La population (N = 1 870 054) L’échantillon des « quinquas » (N = 209 377) 1a — Nature des collaborations scientifiques
  • 9. 9 Collaborations entretenues versus éphémères 1a — Nature des collaborations scientifiques
  • 10. 10 Renouvellement 1a — Nature des collaborations scientifiques
  • 11. 11 Effet Matthieu et homophilie 1a — Nature des collaborations scientifiques
  • 12. 12 Positions dans le champ 1b — Positions des élites dans le champ de l’informatique
  • 13. 13 La matière première 1. Notice bibliographique 2. Plein texte a. Éponymie et panthéon b. Équilibre travail-loisirs c. Écriture scientifique : collectifs et genre 3. Site web d’une maison d’édition 4. Plateforme de partage 5. Bibliographie institutionnelle Questionner le texte scientifique pour caractériser la science et l’innovation Prospection sur textes scientifiques
  • 14. Uncitedness III : l’importance de ne pas être cité 14 “Eponyms remind us that science and scholarship are the work of dedicated people.” (p. 393) “mnemonic and commemorative device” (p. 121) Merton, R. K. (1942). Science and technology in a democratic order. Journal of Legal and Political Sociology, 1(1), 115–126. “the practice of affixing the name of the scientist to all or part of what he has found, as with the Copernican system, Hooke’s law, Planck’s constant, or Halley’s comet” (p. 643) Merton, R. K. (1957). Priorities in scientific discovery: A chapter in the sociology of science. American Sociological Review, 22(6), 635–659. Cabanac, G. (2014). Extracting and quantifying eponyms in full-text articles. Scientometrics, 98, 3, 1631–1645. 2a — Éponymie et panthéon scientifique
  • 15. 15  Théories  The Reward System of Science (Merton, 1942, 1957)  Obliteration by Incorporation (Merton, 1988; McCain, 2011, 2012)  Non-indexed Eponymal Citedness (Száva-Kováts, 1994)  Extraire et quantifier les éponymes en plein texte  Connaître les savants les plus influents d’un champ donné  Amender un dictionnaire d’éponymes  Identifier les tendances et l’incorporation de méthodes Appréciation implicite via les éponymes 2a — Éponymie et panthéon scientifique
  • 16. 16 Moissonnage d’éponymes en plein texte 2a — Éponymie et panthéon scientifique
  • 17. 17 Révélation du panthéon scientifique implicite 2a — Éponymie et panthéon scientifique
  • 18. Work-life Balance 18 Cabanac, G., & Hartley, J. (2013). Issues of work-life balance among JASIST authors and editors. JASIST, 64, 10, 2182–2186. 2b — Équilibre travail-loisirs
  • 19. Fragrances du Publish or Perish ? 19 2b — Équilibre travail-loisirs
  • 20. 20 Faire parler les « séquelles » de la peer review Sunday! 2b — Équilibre travail-loisirs
  • 21. 21 Ce que les traces révèlent... Authors Editors 2b — Équilibre travail-loisirs
  • 22. 22 Travailler dans sa bulle le week-end ? […] 2b — Équilibre travail-loisirs
  • 23. 23 Écriture et genre de l’auteur 1/3  Théorie et observations en psychologie dans les années 1960  Men are more spatially and mathematically oriented than women  Women are more verbally oriented than men http://www.kaheel7.com/eng/images/stories/2(5).jpg 2c — Écriture scientifique : collectifs et genre Hartley, J. & Cabanac, G. (2014). Do men and women differ in their use of tables and graphs in academic publications? Scientometrics, 98, 2, 1161-1172.
  • 24. 24  Résultats sur 1 403 articles mono-signés en STM  Les hommes emploient 26 % plus de figures que les femmes (p < 0.001)  Les hommes emploient 11% plus de tableaux que les femmes (p = 0.102) … cependant, cette différence se voit-elle en pratique ? 2c — Écriture scientifique : collectifs et genre Écriture et genre de l’auteur 2/3
  • 25. 25  Hypothèse  Il est plus difficile de s’accorder sur du texte que sur des figures/graphes  Davantage de figures et graphes dans les article co-signés 2c — Écriture scientifique : collectifs et genre Cabanac, G., Hubert, G., & Hartley, J. (2014). Solo versus collaborative writing: Discrepancies in the use of tables and graph in academic articles. Journal of the American Society for Information Science and Technology, 65, 4, 812–820. Écriture et collectifs d’auteurs 3/3
  • 26. 26  Davantage de tableaux dans les articles co-signés vs. mono-signés 2c — Écriture scientifique : collectifs et genre Écriture et collectifs d’auteurs 1/2
  • 27. 27  Davantage de figures dans les articles co-signés vs. mono-signés 2c — Écriture scientifique : collectifs et genre Écriture et collectifs d’auteurs 2/2
  • 28. 28 La matière première 1. Notice bibliographique 2. Plein texte 3. Site web d’une maison d’édition a. Effets d’ordonnancement sur l’évaluation par les pairs b. Panorama d’un champ 4. Plateforme de partage 5. Bibliographie institutionnelle Questionner le texte scientifique pour caractériser la science et l’innovation Prospection sur textes scientifiques
  • 29. 29 Différences entre champs disciplinaires : les confs 3a — Effets d’ordonnancement sur l’évaluation par les pairs
  • 30. 30 Conférences : et si la date de soumission importait ?   Évaluation par les pairs Cabanac, G., & Preuss, T. (2013). Capitalizing on order effects in the bids of peer-reviewed conferences to secure reviews by expert referees. JASIST, 64, 2, 405–415. 3a — Effets d’ordonnancement sur l’évaluation par les pairs
  • 31. 31 3a — Effets d’ordonnancement sur l’évaluation par les pairs
  • 32. 32 Le biais de la date de soumission  Données de ConfMaster : 42 conférences en informatique 3a — Effets d’ordonnancement sur l’évaluation par les pairs
  • 33. 33 Biais de la date de soumission  Influence sur les enchères (bids) 3a — Effets d’ordonnancement sur l’évaluation par les pairs
  • 34. 34 Faites évaluer par ceux qui le veulent ! 3a — Effets d’ordonnancement sur l’évaluation par les pairs
  • 35. 35 Les gardiens de l’évaluation par les pairs : gatekeepers (Braun, 2009) Cabanac, G. (2012). Shaping the landscape of research in information systems from the perspective of editorial boards: A scientometric study of 77 leading journals. JASIST, 63, 5, 977–996. 3b — Panorama de la recherche en systèmes d’information
  • 36. 36 77 revues « cœur » en IS selon une autorité : le WoS 3b — Panorama de la recherche en systèmes d’information
  • 37. 37 Analyse exploratoire des données recueillies  77 revues  2 846 gatekeepers 3b — Panorama de la recherche en systèmes d’information
  • 38. 38 3b — Panorama de la recherche en systèmes d’information Analyse exploratoire des données recueillies
  • 39. 39 Graphe thématique des 77 revues référencées en SI 3b — Panorama de la recherche en systèmes d’information
  • 40. 40 Influence, pouvoir, verrouillage... (1984) 3b — Panorama de la recherche en systèmes d’information
  • 41. 41 Un siège à la table des négociations ? 3b — Panorama de la recherche en systèmes d’information
  • 42. 42 (Manque de) Diversité géographique et de genre 3b — Panorama de la recherche en systèmes d’information
  • 43. 43 La matière première 1. Notice bibliographique 2. Plein texte 3. Site web d’une maison d’édition 4. Plateforme de partage a. Marché noir de l’édition scientifique 5. Bibliographie institutionnelle Questionner le texte scientifique pour caractériser la science et l’innovation Prospection sur textes scientifiques
  • 44. Émergence de l’Open Access gris/clandestin 44  Domaines  Science de l’information  Sociologie des sciences  Contexte : (non)-accès à l’IST  8 millions de chercheurs + des amateurs (sciences participatives) + grand public  114 millions de documents scientifiques en ligne mais seulement 24 % accessibles librement  Défi : dévoiler rouages et contenu des bibliothèques clandestines  Library Genesis (23M d’articles, 1M d’ouvrages), Sci-Hub, #icanhazpdf, /r/scholar  Contribution : article JASIST accepté en octobre 2014  Alimentation : biblioleaks + crowdsourcing  Contenu : distribution des éditeurs, disciplines, langues… @rickypo Cabanac, G. (2016). Bibliogifts in LibGen? A study of a text-sharing platform driven by biblioleaks and crowdsourcing. Journal of the Association for Information Science and Technology, 67, 4, 874–884. 4a — Le marché noir de l’édition scientifique
  • 45. Étudier l’Open Access clandestin : les enjeux 45 4a — Le marché noir de l’édition scientifique
  • 46. 46 La matière première 1. Notice bibliographique 2. Plein texte 3. Site web d’une maison d’édition 4. Plateforme de partage 5. Bibliographie institutionnelle a. Collaborations et thématiques d’un laboratoire Questionner le texte scientifique pour caractériser la science et l’innovation Prospection sur textes scientifiques
  • 47. Que fait ce labo multi-site de 686 personnes ? 47 5a — Collaborations et thématiques d’un laboratoire
  • 48. Que fait ce labo de 686 personnes ? 48 http://www.irit.fr/IMG/pdf/ORGANIGRAMME_IRIT_RECHERCHE_MAI_2015.pdf 5a — Collaborations et thématiques d’un laboratoire
  • 49. Que fait ce labo de 686 personnes ? 49 https://websecu.irit.fr/IMG/pdf/Rapport_Web_HCERES_IRIT.pdf 5a — Collaborations et thématiques d’un laboratoire
  • 50. Des données publiques… 50 5a — Collaborations et thématiques d’un laboratoire
  • 51. Analyse scientométrique  Contexte : l’évaluation de l’IRIT (octobre 2014)  Question : qu’apprend-t-on de l’analyse des publications ?  Source : le site web de l’IRIT (données publiques) ex : http://dbweb.irit.fr/publi/recherche.list_crit_avance?theme=0&crit1=2&op1=5&texte1=2009&crit2=2&op2=6&texte2=2014&typpub=5  Critères d’échantillonage  Revues et conférences à comité de lecture (RICL, RNCL, CICL et CNCL)  Année ≥ 2009 (certaines publications étaient à paraître)  Auteurs listés parmi les « membres permanents » des équipes  Statistiques  260 auteurs  3 860 publications dont 82 % en international Avertissement : étude exploratoire à consolider. 51 5a — Collaborations et thématiques d’un laboratoire
  • 52. Méthodo : les collaborations inter-thèmes  Graphe des collaborations  Un sommet = un membre de l’IRIT  Couleur : son thème IRIT  Taille : nombre de publications normalisé S 1/N  Modélise un « effort » : effort d’écrire à 2 > effort d’écrire à 10 (en supposant une répartition uniforme du travail)  Une arrête = une collaboration  Couleur : mélange des couleurs des sommets reliés  Taille : nombre de coauteurs par co-publication normalisé S 1 / ((N × (N – 1)) / 2)  Modélise la force du lien interpersonnel : collaborer à 2 > collaborer à 10 52 5a — Collaborations et thématiques d’un laboratoire
  • 53. 53 T2 T1 T3 T4 T5 T7 T6 Preuve de concept : IRIT Données : • 2009-2014 • RICL, RNCL, CICL, CNCL • 260 auteurs • 3 860 articles (82 % internat.) Interprétation : • Collaboration inter-thèmes • Force des liens faibles Attention : • Variabilité des pratiques de publication selon les domaines : fréquence, travail ± collaboratif… Réalisé avec Gephi Caractérisation des collaborations inter-thème 5a — Collaborations et thématiques d’un laboratoire
  • 54. Méthodo : les thématiques  Analyse lexicométrique  Un titre de publication = un document  Focus sur les RICL et CICL pour ne pas mélanger les langues  Élimination des mots non discriminants (stop-list + manuelle)  Deux résultats  Classification en 7 classes (paramètres fixé) avec la méthode Reinert  Extraction des mots-clés 54 5a — Collaborations et thématiques d’un laboratoire
  • 55. 55Réalisé avec Iramuteq Caractérisation des thématiques 1/2 5a — Collaborations et thématiques d’un laboratoire
  • 56. 56 Interprétation : • 4 objets principaux • Des pétales à explorer NB : le nombre de mots représentés peut être paramétré pour ajuster le niveau de détail. Réalisé avec Iramuteq Caractérisation des thématiques 2/2 5a — Collaborations et thématiques d’un laboratoire
  • 57. 57 Conclusion et perspectives générales Reconnaître les structures d’opportunités Question de recherche : - captivante - originale / inattendue - importante Revue de la littérature : - interdisciplinaire - sur le temps long Données et méthodes : - données originales en libre accès, de préférence - méthode mixte : quanti + quali