Gérer l'information  d'une démarche scientifique J-M Monget Mines Paristech - Nov 2011 [email_address] Adresse  LinkedIn A...
L'information en recherche scientifique <ul><li>Gérer des textes publiés pour : </li></ul><ul><ul><li>Développer ses conna...
Les principales phases de gestion de l'information <ul><li>Démarche exploratoire </li></ul><ul><li>Organisation de l'infor...
1. La démarche exploratoire <ul><li>Les moteurs de recherche plein texte, spécialisés ou non </li></ul><ul><li>Les bases b...
Les moteurs de recherche  généraux <ul><li>Principe : tout atome d'information est indéxé. Le monde de Google y est omnipr...
Les bases bibliographiques <ul><li>L'accès par le serveur  Mines  Paritech </li></ul><ul><li>Les outils d'éditeurs :  Scie...
Les sources pédagogiques <ul><li>Les cours en ligne :  MIT,   Paritech </li></ul><ul><li>Les diaporama :  SlideShare   </l...
Les flux d'information <ul><li>Les flux d'information sur Internet permettent une veille scientifique systématique </li></...
2. L'organisation de l'information <ul><li>La capture en continu et la gestion des notes </li></ul><ul><li>Organiser et in...
La gestion des notes <ul><li>L'exemple de  Evernote </li></ul><ul><li>La capture et la saisie des notes </li></ul><ul><li>...
Structurer les données de projet <ul><li>La nature diversifiée des informations : mesures expérimentales, notes d’essais, ...
3. Les exigences de la thèse <ul><li>Le travail de thèse doit démontrer 4 choses : </li></ul><ul><li>Originalité, nouveaut...
Construire sa bibliographie <ul><li>La bibliographie doit démontrer la nouveauté de la démarche. </li></ul><ul><li>Un exem...
Travail collaboratif <ul><li>Travail collaboratif :  Google Docs   </li></ul><ul><li>Collaboration « on-line » :  TeamView...
Les nouveaux défis de la « Provenance » <ul><li>Authenticité : Détection plagiat ( ex :  Wikipedia  ) </li></ul><ul><li>Ré...
4. Publication et communication <ul><li>Archives ouvertes et publication :  HAL </li></ul><ul><li>Réseaux professionnels :...
Prochain SlideShare
Chargement dans…5
×

Gérer l’information d’une démarche scientifique

588 vues

Publié le

L’exposé porte sur l’illustration par des cas concrets des problèmes qui se posent de nos jours au scientifique dans la gestion de la masse considérable d’information qu’il doit consulter ou générer que sa démarche soit exploratoire (ex: thèse) ou finalisée (ex: projet contractuel).

Publié dans : Formation
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
588
Sur SlideShare
0
Issues des intégrations
0
Intégrations
1
Actions
Partages
0
Téléchargements
10
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive
  • L’exposé porte sur l’illustration par des cas concrets des problèmes qui se posent de nos jours au scientifique dans la gestion de la masse considérable d’information qu’il doit consulter ou générer que sa démarche soit exploratoire (ex: thèse) ou finalisée (ex: projet contractuel).
  • Dans l&apos;approche la plus classique, l&apos;information manipulée par le chercheur se trouve localisée dans des textes publiés ou non sur Internet et qui peuvent lui servir : (1) à développer ses connaissances; (2) à suivre l&apos;actualité scientifique; (3) à faire un point exhaustif sur un sujet particulier de recherche. Mais l&apos;information utile à une démarche de recherche se trouve aussi dans une foule d&apos;autres contenus et supports : notes, codes sources de logiciels, fichiers de données structurés ou non, flux d&apos;informations diverses provenant d&apos;Internet, images et vidéos provenant de sources pédagogiques ou non … Comment gérer cet ensemble toujours grandissant d&apos;information au fil de la vie d&apos;un projet ? Comment insérer cette démarche dans un travail d&apos;équipe ? Comment synthétiser cet ensemble pour produire des publications au meilleur standard du domaine et faire reconnaître son expertise ? Tels sont certains des problèmes abordés ici.
  • Pour naviguer dans l’océan des connaissances disponibles sur Internet tout le monde utilise Google. C’est probablement que sa recherche “plein texte” se révèle pour l’instant plus exploitable que celle par mots clefs. D’autres outils généraux peuvent aussi être utiles (Bing, Exalead). Pour une démarche plus finalisée : moteurs spécialisés (Google Scholar, Google Books). On n’oubliera pas les services multilingue offerts par Google Translate.
  • Bases de données d’éditeurs (ScienceDirect), bases ouvertes (HAL-SHS) et bases de données bibliométriques (Web of Science, SUDOC).
  • Mais aussi les exposés et conférences en Powerpoint (SlideShare)mais aussi en vidéo (YouTube ou Vimeo).
  • Une fois les cibles identifiées, il faut souvent se tenir au courant des nouveautés, des évènements et des démarches des collègues. La veille se fait soit par abonnement à des fils RSS grâce à un intégrateur de type Google Reader ou même par l’entremise des réseaux sociaux tel Twitter et ses “hash tags”.
  • Face au torrent d’information généré par cette démarche exploratoire comment synthétiser ou à défaut organiser ce que l’on a glané ? Souvent la lecture “en ligne” est brève et sert surtout à naviguer, l’analyse se pratiquant de manière différée sur un fichier pdf, souvent imprimé.. Comment garder une trace de sa démarche au “fil de l’eau” ? Des outils gratuits mais puissants existent : Evernote pour tous types d’extraits
  • Mais les diverses phases d’un projet de recherche génèrent une quantité encore plus importante de données : mesures expérimentales, notes d’essais, programmation … Le plus souvent ces informations restent cloisonnées. Une solution de gestion globale est possible à l’aide d’un système de type LIMS (Laboratory Information Management System ). Coûteux on les trouve plutôt dans l’industrie. Des solutions ouvertes peuvent être utilisées autour du “Cloud” avec Google Docs comme outil collaboratif ou Amazon pour construire un environnement informatique virtuel Google Fusion Tables
  • Le mémoire de thèse doit prouver la véracité de la démarche scientifique choisie, sa pertinence et son originalité. C’est le moment du retour aux outils bibliographiques: Google Scolar, Web of Science, Scopus et autres. Attention aux nouveaux outils de l’examinateur: authentification automatisée des notes bibliographiques et détection de plagiat. C’est la rançon du progrès technique … La première communauté à convaincre est celle des « rapporteurs ». Authenticité : ID-SUDOC (Numéro PPN), Autorités, site Web: Linked Data
  • Zotero pour construire une bibliographie structurée et annotée.
  • Enfin, le temps de la communication. Faire connaître son travail au sein d’un réseau professionnel (ex: LinkedIn ou Research Gate). Publier des archives ouvertes (HAL-SHS, license Creative Commons) ou des logiciels libres (Plume CNRS, CeCILL INRIA). Il faudra aussi prêter attention à l’archivage de l’ensemble des documents produits pour faciliter la réutilisation des résultats par les génération futures... Pour associer aux informations des méta-données détaillant le contenu et la provenance les outils du web sémantique se développent. La publication en ligne de style “Linked Data” sera peut-être un des défis du futur thésard.
  • Gérer l’information d’une démarche scientifique

    1. 1. Gérer l'information d'une démarche scientifique J-M Monget Mines Paristech - Nov 2011 [email_address] Adresse LinkedIn Adresse Sudoc : PPN=075598078
    2. 2. L'information en recherche scientifique <ul><li>Gérer des textes publiés pour : </li></ul><ul><ul><li>Développer ses connaissances </li></ul></ul><ul><ul><li>Suivre l'actualité scientifique </li></ul></ul><ul><ul><li>Faire le point exhaustif d'un sujet de recherche (démonstration d'originalité) </li></ul></ul><ul><li>Une foule d'autres contenus : </li></ul><ul><ul><li>Notes (colloques, e-mails, démarches et procédés) </li></ul></ul><ul><ul><li>Codes de logiciels </li></ul></ul><ul><ul><li>Fichiers de données structurés ou non (ex : tableaux Excel, schémas graphiques, fichiers SIG) </li></ul></ul><ul><ul><li>Flux d'information sur Internet </li></ul></ul><ul><ul><li>Images et vidéos (ex : cours) </li></ul></ul><ul><li>Des Questions : </li></ul><ul><ul><li>Comment gérer tout ceci au fil de la vie d'un projet ? </li></ul></ul><ul><ul><li>Comment partager dans un travail d'équipe ? </li></ul></ul><ul><ul><li>Comment synthétiser dans une publication de qualité ? </li></ul></ul><ul><ul><li>Comment faire reconnaître son expertise ? </li></ul></ul>
    3. 3. Les principales phases de gestion de l'information <ul><li>Démarche exploratoire </li></ul><ul><li>Organisation de l'information </li></ul><ul><li>Rédaction et travail collaboratif </li></ul><ul><li>Communication </li></ul>
    4. 4. 1. La démarche exploratoire <ul><li>Les moteurs de recherche plein texte, spécialisés ou non </li></ul><ul><li>Les bases bibliographiques </li></ul><ul><li>Les sources pédagogiques </li></ul><ul><li>Les flux d'information </li></ul>
    5. 5. Les moteurs de recherche généraux <ul><li>Principe : tout atome d'information est indéxé. Le monde de Google y est omniprésent </li></ul><ul><li>Google et ses outils </li></ul><ul><li>Les autres outils : Bing , Yahoo , Exalead , Baidu </li></ul><ul><li>La recherche de la litérature numérisée : Google Books + NGrams , Gallica </li></ul><ul><li>Le traitement multilingue : Google Translate </li></ul><ul><li>La recherche multimédia : Google Images , YouTube , DailyMotion </li></ul><ul><li>La recherche géographique : Google Maps , OpenStreetMap </li></ul>
    6. 6. Les bases bibliographiques <ul><li>L'accès par le serveur Mines Paritech </li></ul><ul><li>Les outils d'éditeurs : Science Direct </li></ul><ul><li>Les bases ouvertes : HAL-SHS </li></ul><ul><li>La recherche personnalisée (bibliométrie) : Web of Science , SUDOC </li></ul><ul><li>Un outil fédérateur : Google Scholar </li></ul>
    7. 7. Les sources pédagogiques <ul><li>Les cours en ligne : MIT, Paritech </li></ul><ul><li>Les diaporama : SlideShare </li></ul><ul><li>Les présentations différées : YouTube, Vimeo </li></ul><ul><li>Les séminaires on-line (Ex : EETimes ) </li></ul><ul><li>Les cours en ligne : MIT, Paritech </li></ul><ul><li>Les diaporama : SlideShare </li></ul><ul><li>Les présentations différées : YouTube, Vimeo </li></ul><ul><li>Les séminaires on-line (Ex : EETimes ) </li></ul>
    8. 8. Les flux d'information <ul><li>Les flux d'information sur Internet permettent une veille scientifique systématique </li></ul><ul><li>Les flux RSS de blogs </li></ul><ul><li>Twitter et ses « hashtags » </li></ul><ul><li>Un outil de regroupement et de veille : Google Reader </li></ul>
    9. 9. 2. L'organisation de l'information <ul><li>La capture en continu et la gestion des notes </li></ul><ul><li>Organiser et indexer ses fichiers </li></ul><ul><li>Les données de projet et leur structuration </li></ul><ul><li>Usage du « cloud » et dématérialisation </li></ul>
    10. 10. La gestion des notes <ul><li>L'exemple de Evernote </li></ul><ul><li>La capture et la saisie des notes </li></ul><ul><li>L'indexation par mot-clefs (tagging) et par catalogues </li></ul><ul><li>La gestion décentralisée des données </li></ul><ul><li>La consultation multi-plateformes </li></ul>
    11. 11. Structurer les données de projet <ul><li>La nature diversifiée des informations : mesures expérimentales, notes d’essais, programmation … </li></ul><ul><li>Indexation locale des contenus : Copernic </li></ul><ul><li>Des solutions décentralisées : Google Tables et ses outils de saisie : Google Refine </li></ul><ul><li>Gestion des versions : Google Code et SVN </li></ul><ul><li>Bases de données et outils d'intégration : Google Fusion </li></ul><ul><li>Utiliser le « Cloud Computing» : Amazon , Google App Engine </li></ul><ul><li>Une pratique industrielle, organisation et traçabilité : le LIMS </li></ul>
    12. 12. 3. Les exigences de la thèse <ul><li>Le travail de thèse doit démontrer 4 choses : </li></ul><ul><li>Originalité, nouveauté </li></ul><ul><li>Authenticité </li></ul><ul><li>Preuve de la véracité de la démarche (traçabilité) </li></ul><ul><li>Intégration dans un projet de recherche collectif </li></ul>
    13. 13. Construire sa bibliographie <ul><li>La bibliographie doit démontrer la nouveauté de la démarche. </li></ul><ul><li>Un exemple d'outil : Zotero </li></ul><ul><li>La capture et la saisie des notes références avec Google Scolar ou autres </li></ul><ul><li>L'indexation par mot-clefs (tagging) et par catalogues </li></ul><ul><li>La gestion décentralisée des données avec Firefox </li></ul><ul><li>La consultation : Web et locale </li></ul><ul><li>D'autres outils : EndNote , CiteULike </li></ul>
    14. 14. Travail collaboratif <ul><li>Travail collaboratif : Google Docs </li></ul><ul><li>Collaboration « on-line » : TeamViewer GotoMeeting , </li></ul><ul><li>E-Science - les grands projets : National Virtual Laboratory , IPCC Climate Models </li></ul><ul><li>Plateformes scientifiques « cloud » - HPC (High Performance Computing) : CINES (Centre Informatique National de l'Enseignement Supérieur) </li></ul><ul><li>Des outils publics : MyExperiment , Taverna </li></ul><ul><li>Une archive ouverte à consulter : E-Science, perspectives et opportunités </li></ul>
    15. 15. Les nouveaux défis de la « Provenance » <ul><li>Authenticité : Détection plagiat ( ex : Wikipedia ) </li></ul><ul><li>Référence unique des publications : DOI </li></ul><ul><li>Vérification automatisée et évaluation des citations : concept de nanopublication </li></ul><ul><li>Identité informatique du chercheur : SUDOC, ORCID </li></ul><ul><li>« Know thy examiners » </li></ul><ul><li>Suivi bibliométrique : Publish or Perish </li></ul><ul><li>Traçabilité : OSCAR (Open Source Chemical Analysis Routines) </li></ul>
    16. 16. 4. Publication et communication <ul><li>Archives ouvertes et publication : HAL </li></ul><ul><li>Réseaux professionnels : LinkedIn </li></ul><ul><li>Les espoirs et exigences du Web Sémantique </li></ul><ul><li>La base de connaissances universelle : LinkedData </li></ul>

    ×