Cours recherche documentaire Master Matières Premières Naturelles en Cosmétique
LA B O ÎTE À O UT I LS P OUR C H ERC H ER ET TRO U VER L’ I NFORMATI O N SCI E NTIFIQU E Master Matières Premières Naturelles en Cosmétique Février 2011
Web visible / Web invisible (bases de données, bibliothèques en ligne, publications archivées,…) 500 fois plus vaste que le web visible
Les revues électroniques : AZ Vous avez un titre en tête ? Utilisez la recherche par titre taper le titre de la revue (même incomplet) sélectionner la revue renseigner les informations (année, volume, numéro) ou cliquer directement sur et rechercher sur l’interface de la revue Vous naviguez à l’aveugle ? Utilisez la recherche par catégories (= disciplines) sélectionner une catégorie (ex : sciences de la vie) puis une sous- catégorie (ex : biotechnique) puis cliquer sur
Les bases de données en ligne Physique : AIP / APS / Institute of Physics Chimie : American Chemical Society / RSC Mathématiques : MathSciNet / Zentralblatt Santé : EMC / BioMedCentral / PubMedCentral / PubMed / Medline / Medworm / Revues Lippincott Toutes disciplines scientifiques confondues : Techniques de l’Ingénieur / PASCAL / Elsevier / Jstor / Springer / Wiley Education, pédagogie : Cerimes Presse généraliste : Factiva
Grande facilité d’utilisation (pas d’opération technique ni de maintenance) Mais manque de souplesse et une mise à jour régulière est indispensable ! Le blog est devenu un modèle alternatif de la publication scientifique Liens utiles : Café des sciences Blogs de la revue Nature http://usefulchem.blogspot.com/ Validité : attention aux dates et à la qualité du blogueur Citer un blog dans une bibliographie : Mounier, Pierre. « Jstor 2010". In Blogo-Numericus, [En ligne]. http://blog.homo-numericus.net/ (Page consultée le 15 octobre 2010) Les blogs de chercheurs
Les wikis Contenu organisé non pas sous forme de flux mais de réseaux d’articles. Il favorise l’écriture collaborative de documents tout en garantissant les contenus. Pérennité de l’article du wiki vs temporalité de l’article de blog Beaucoup de fils de syndication (flux RSS) sont possibles sur les wikis : nouveaux articles, modifications d’anciens articles ou d’un en particulier Des outils pour réaliser votre wiki : Quelques wikis :
Pour toute demande de renseignement : - à la banque d’accueil de la BU - [email_address] - [email_address] Nous vous remercions de votre attention !
Notes de l'éditeur
I nfobésité : c’est tout ce qui renvoie à la surabondance de données, au trop plein d’information. Certaines études vont jusqu’à avancer que cette infobésité créé un stress croissant : les individus accumulent des données à traiter tandis que le processus de sélection et de validation se complexifie : engendre une difficulté à prendre les bonnes décisions. Mésinformation : plus l’information est redondante, plus elle est reprise, plus il y a de risques qu’elle soit modifiée/réinterprétée/mal transcrite lors de sa reproduction. D’où la nécessité de confronter ses sources. Validation de l’information. Internet n’est pas une bibliothèque ou un centre documentaire (ni organisé, ni structuré). C’est un lieu de stockage de l’information.
Tout est-il vraiment accessible via Google ? L’illusion numérique : avoir conscience que tout n’est pas en ligne ni accessible par les moteurs. Étendue du web impossible à cerner (plus de mille milliards de pages avec une création de 7,3 millions de pages par jour). Web visible / invisible : En 2008 , le web dit "invisible" non référencé par les moteurs de recherche représente 70 à 75% de l'ensemble, soit environ un trilliard de pages non indexées Contenu en général de plus grande qualité : correspond aux bases de données, aux catalogues de bibliothèques.
Prendre le temps de définir les termes du sujet et ses limites. Ne pas écrire son sujet tel quel dans l’interface de recherche. 2. Le choix de mots clés : synthétique/précis/représentatif. Risque de silence : « pas de réponse » ne signifie pas qu’il n’y a rien sur votre sujet. Multiplier les termes synonymes, équivalents, spécifiques ou génériques. Choisir uniquement des mots qui ont du sens : éviter les verbes d’action, les articles, les pronoms, les adverbes, les adjectifs non significatifs. + prêter attention aux fautes d’orthographes ou d’inattention (un seul mot mal écrit va faire échouer la recherche ≠ Google) + penser à les traduire 3. Varier les outils : ouvrages, thèses, articles, contact personnes ressources, rapports, centres de documentation spécialisés, bases de données,… 4. Utiliser des opérateurs de recherche (opérateurs booléens) et des filtres. ET / AND : la recherche se fera obligatoirement sur les deux mots saisis. Ex : extraction et végétale. Si un des documents ne contient qu’un des mots, il ne sera pas pris en compte dans votre page de résultats. OU / OR : la recherche se fait sur l’un des mots saisis ou les deux. Ex : extraction ou végétale. Le moteur prendra en compte les pages qui contiennent les deux mots mais aussi celles qui ne contiennent qu’un seul des termes. SAUF / NOT : exclusion d’un terme. Ex : extraction sauf végétale. La recherche ne prendra pas en compte les pages contenant le mot optique. * : troncature. Permet de ne saisir qu’une partie du terme recherché. Ex : végé* : la recherche se fera sur tous les mots commençant par « végé » : végétal, végétarien, végétation, … « … » : les guillemets, expression exacte. Par ex : « extraction végétale » : la recherche s’effectuera sur les deux mots, l’un à côté de l’autre et dans cet ordre là. Une page qui contiendrait le mot « extraction » au début et le mot « végétale » à la fin ne serait pas prise en compte. 5. Utiliser toutes les possibilités de rebond (ex : bibliographies en fin d’ouvrage/article/thèse). Croiser les informations : chercher l’information à sa source et comparer. Utiliser plusieurs moteurs de recherche (Exalead, Scirus (moteur de recherche d’informations scientifiques), Google scholar (recherche uniquement sur des travaux universitaires), la recherche avancée sur Google (tri par date, par langue, par pays, par format de document…)…). 6. Avoir un œil critique . Pour des ouvrages : Analyser la notice bibliographique du document : adéquation titre / autres mots-clefs de la notice par rapport à votre sujet, la notoriété des auteurs dans le domaine où vous recherchez, la réputation de l’éditeur (ex : De Boeck : livres de bonne qualité), la date d’édition (les ouvrages anciens ne peuvent vous offrir un état récent des problématiques sur votre sujet mais peuvent constituer des ouvrages de référence précieux : définitions, historique, …), la présence d’une bibliographie pour voir quels ont été les ouvrages de référence de l’auteur. Pour des articles : Nom des chercheurs et de leur laboratoire d’appartenance (ne pas hésiter à googleliser ces noms-là pour avoir une idée plus précise de leur activité), construction de l’article (mise en page, références) extrêmement rigoureuse , r éputation de la revue Pour des sites internet : - Je vérifie si l’auteur a des compétences dans le domaine étudié : a-t-il publié des ouvrages sur la question ? est-il cité ailleurs ? que dit-on de lui ? (rechercher éventuellement dans d’autres sites en tapant son nom dans un moteur de recherche) - Institution : renommée, ... (+ fiable si précisé) - Adresse URL : site officiel ? site d’un particulier ? d’une organisation ? magazine d’information ?…. Une adresse .gouv est plus fiable qu’une adresse .com - Dernière date de mise à jour : vérif que l’info n’est pas obsolète - Quelles sont les intentions de l’auteur : veut-il informer ? vendre ? convaincre ? se faire valoir ? - Consulter le plan du site pour avoir une vue d’ensemble du contenu. - Style d'écriture et vocabulaire, clarté de l’argumentation - Sources (bibliographie) et liens vers d’autres sites me permettant de vérifier l’information : récentes, accessibles, suffisantes,…Je vérifie que l’information n’est pas unique, que je peux la trouver ailleurs.
Identifiants ENT nécessaires pour la consultation de la doc électronique à distance. Compte-lecteur (pavé en bas à droite du portail) : pour s’identifier : L+n° d’étudiant / date de naissance au format jjmmaaaa Le PEB : recherche sur le Sudoc pour voir la disponibilité des ouvrages/articles/thèses… puis demande en ligne sur le portail (pavé en bas à droite).
Ex : « cosmétique » « biosurfactant » : 0 résultat donc rebond dans le Sudoc
Accords financiers de la BU avec les éditeurs pour permettre l’accès au texte intégral. NE JAMAIS PAYER UN ARTICLE SUR INTERNET ! Ne pas hésiter à se créer un compte personnel sur les bdd qui vous intéressent vraiment : possibilité de recevoir des alertes, de sauvegarder des paniers, … Sélectionner l’onglet « article » puis choisir la discipline (biologie ou chimie). Ex : « ogm » dans « biologie »
Catégories : chiffre entre parenthèses (ex : biotechnique (97)) correspond au nombre de revues auxquelles on est abonné sur ce sujet.
Factiva (plus de 26 000 sources issues de 159 pays et dans 23 langues) Ex : « anti-âge » « au cours de l’année précédente ». Ensuite, possibilité de filtrer, par exemple, par type d’industrie. Rebondir sur la possibilité de trouver des infos sur les sociétés : rapports d’activité de la société Yves Rocher, L’Oréal… Pages d’infos = mon kiosque à journaux (principales sources d’informations de certains pays ou régions du monde). Plutôt qu’un pays ou une région, possibilité de choisir des sélections ciblées sur certains secteurs d’activité (ex : produits chimiques, produits pharmaceutiques,…). Dans « sociétés/marchés » : permettent de comprendre rapidement les données les plus importantes sur une industrie : actualités ciblées, rapports, graphiques, analyses et données financières. On trouve biotechnologie
SUDOC (Près de 10 millions de notices bibliographiques de documents présents dans près de 3000 établissements documentaires de l’enseignement supérieur et de la recherche), BnF, CCFr, Worldcat (considéré comme étant le plus grand catalogue du monde ) ,… Les bibliothèques numériques : Gallica : bib numérique de la BnF. Medic@ : réalisée par le Service d’Histoire de la médecine de la Bibliothèque interuniversitaire de médecine Europeana : Bibliothèque numérique européenne lancée en novembre 2008. Réunit les collections numériques des bibliothèques nationales des 27 États membres . Elle est accessible dans les 21 langues officielles de l'Union européenne . Les signets bibliographiques de l’ABES et de la BnF : r épertoires de sites internet sélectionnés, classés et organisés par les bibliothécaires. Il peut s’agir de sites web, de portails, de catalogues en ligne, de revues en ligne, de blogs…
Le brevet est un titre juridique délivré par une autorité publique. Il accorde à son détenteur un droit exclusif de propriété et d'exploitation sur une invention pour un temps et sur un territoire déterminés. Environ 17000 demandes de dépôt de brevets par an depuis 2001 en France (400000 au Japon) : Renault est en 1ère place puis L’Oréal et Peugeot Citroën. Une source d'information (très régulièrement actualisée et très vaste : plus d’1M de nouveaux docs par an) : technologique : il aide à réaliser l'état de l'art. En effet, les fascicules de brevets contiennent une information extrêmement riche, plus fraîche et plus détaillée que celle de la littérature technique ou académique. 40% de cette information technologique ne se trouve QUE dans les brevets. stratégique : il permet de suivre l'activité de ses pairs et de ses concurrents. Effectuer une veille sur les brevets sert à s'informer de l'arrivée de nouveaux produits et d'adapter sa stratégie en conséquence (marketing de développement). Il évite à l'entreprise d'engager du temps et de l'argent sur un produit ou un procédé déjà breveté. juridique : il permet de se protéger de la contrefaçon. Par la recherche d'antériorité, il donne l'assurance de la nouveauté de l'invention. La base [email_address] permet la consulation des brevets pour les offices français (INPI : Institut National de la Propriété Industrielle) et européen (OEB : Office Européen des Brevets). Elle couvre les années 1836 à nos jours et sa consultation est gratuite . L'ensemble des producteurs de bases de données utilise le même langage documentaire : la CIB. Elle répartit l'ensemble des domaines techniques en sections, classes, sous-classes et groupes, soit environ 69 000 subdivisions.
- Coût des revues : de plus en plus difficile de conserver les abonnements. Pourtant, la recherche est en grande partie financée par les contribuables à l’aide de fonds publics… - Lenteurs des délais : laps de temps s'écoulant entre le moment où un chercheur termine un projet et le moment où son travail est publié dans un journal peut être considérable. Problématique quand projet contient de nouvelles idées importantes. - L’expression « publier ou périr » est utilisée pour décrire la pression et les exigences académiques en matière de publication. La carrière des chercheurs risque de stagner s'ils ne justifient pas d'un assez grand nombre de publications. - Mais les gros éditeurs tiennent quand même les chercheurs avec le facteur d’impact : l’ ISI ( Institute for Scientific Information ) publie un rapport annuel qui établit le « facteur d’impact » de près de 8000 revues de par le monde. Ce facteur d’impact mesure l’importance d’une revue en fonction du nombre de fois où ses articles sont cités dans les 2 ans suivant leur parution.
… entre 1000 et 1700 réservoirs existent (dont moins de 40 en France) …des exemples de réservoirs : HAL , TEL , ArXiv … pour trouver un réservoir : OAIster , OpenDOAR , Scientific Commons Le dépôt sans retrait : on ne peut pas retirer un document d’une archive, mais déposer des versions successives. - assure la responsabilisation et donc le niveau scientifique de l’AO - évite les utilisations scientifiques frauduleuses (dépôt de résultats contradictoires pour prendre date avec retrait postérieur des dépôts faux…) - la stabilité des dépôts et des adresses est donc cruciale (on ne peut pas citer dans une publication scientifique un texte qui risque à tout moment d’être retiré par son auteur !) - laisse néanmoins le droit à l’erreur scientifique : possibilité de déposer de nouvelles versions, sachant que le dernière version est proposée par défaut au lecteur (mais versions antérieures accessibles quand même).
ArXiv (1ère archive - 1991) : archive de prépublications électroniques d'articles scientifiques dans les domaines de la physique , des mathématiques , de l' informatique , des sciences non linéaires et de la biologie quantitative HAL (acronyme de Hyper Articles en Ligne) développé par le CNRS : archives scientifiques multidisciplinaires. Archives directement alimentées par les chercheurs (auto-archivage). Ex : Recherche avancée dans HAL Mettre « contient » partout (dans le titre, ne surtout pas mettre « est exactement ») Je cherche des documents sur les « cellules eucaryotes » en biologie. Je vais dans Termsciences traduire mes termes en anglais, ce qui me donne « Eukaryotic Cells ». Je lance la recherche et j’obtiens 3 résultats. Titre de l’article / auteurs / résumé de l’article en anglais / labos dont dépendent les auteurs / domaines couverts par l’article / mots-clefs / liens vers le texte intégral / infos sur le dépôt. En haut à droite : possibilité de récupérer la notice aux formats Bibtex, Endnote, TEI, Refworks) Pour un article publié dans une revue, on aura en plus : titre de la revue, volume, n°, année, pages
Terme lancé par Tim O’Reilly, un des papes en matière d’Internet qui cherchait un nom pour une conférence ! Modèle économique repose sur la valorisation des contenus amateur et non pas sur un téléchargement payant. Vers un web 3.0 ? Il n’existe pas encore en tant que tel mais désigne le futur du web 2.0 L’idée est d’offrir : - des contenus mieux validés (encyclopédie collaborative Larousse) - et un accès quasi permanent au web (smartphones, géolocalisation) Développement du web sémantique : Le but est de permettre d’interroger les outils en langage naturel - la requête sera décodée et comprise et les résultats organisés
La blogosphère scientifique désigne l'ensemble des blogs dédiés à la production scientifique et se définit à la fois comme un espace et un outil de médiation scientifique. Des blogs scientifiques pour ... André GUNTHERT, maître de conférences à l’EHESS et directeur du laboratoire d’histoire visuelle contemporaine explique son activité de blogueur selon 3 axes : 1. se réapproprier les contraintes de publications : le blog est un modèle alternatif de la publication scientifique 2. ouvrir de nouveaux espaces de dialogue avec les étudiants et les pairs 3. témoigner du travail en train de se faire : le travail n’existe plus seulement que quand il est publié. Le blog sert de vitrine. Nature.com blogs C@fé des sciences http://usefulchem.blogspot.com/ : des chimistes mènent leur recherche à ciel ouvert (« open notebook science ») Chercher des blogs avec des moteurs généralistes : c ertains des moteurs de recherche classiques proposent un module spécifique pour la recherche de blogs : c'est le cas de Google avec Google Recherche de blogs Penser aussi à consulter la blogroll des blogs pour rebondir sur d’autres références.
Site internet dynamique qui permet rapidement aux utilisateurs d'ajouter, de modifier du contenu et de créer de nouvelles pages qui s'interagissent entre elles. La philosophie du wiki veut que les informations soient modifiables par tous mais, il est possible de restreindre la visualisation ou l'édition des pages par un mot de passe. Un wiki n'est pas un blog , l'information est faite pour durer sur un wiki , dans un blog, elle n'est valable le plus souvent bien entendu qu'à un instant T car très vite remplacée par d'autres articles. L'autre différence, qui n'est pas négligeable, est que le wiki est avant tout un outil collaboratif et le blog, à l'origine, un système de publication personnel. Généralement, on reconnaît un site Wiki à la présence de certaines fonctionnalités : éditer ou modifier rapidement les pages / ajout de commentaires aux pages / historique ou derniers changements avec possibilité de revenir à la version précédente Un Wiki pourquoi faire ? - écrire un projet en collaboration avec des collègues : on évite ainsi l'envoi multiple d'emails - un espace d'échange avec le public (site web traditionnel) - la création d'une base de connaissance Le cas wikipédia Le plus célèbre des wikis et l’un des sites les plus consultés au monde : 267 langues et plus de 15 millions d’articles Est-ce une source d’information fiable ? Problèmes : Anonymat des contributeurs / Absence de comité de validation/ Incohérences et partialité / Vulnérabilité face aux sabotages Points positifs : Articles de haut niveau / Réactivité face aux erreurs ( salebot ) / travail collectif (échanges et discussions : cf article « chimie ») En définitive : source incontournable mais à utiliser avec un œil critique et des réserves ! une communauté d’auteurs : quelques erreurs certes MAIS une forte réactivité (des articles en constante modification) une liberté de rédaction : la signature MAIS une structuration clairement établie du document une information fiable ? : à toujours évaluer car tout le monde peut publier de l’information en ligne. Regard critique indispensable. Depuis 2009, il y a un très net effort d’amélioration de la qualité des articles (quantité plutôt visée auparavant).
- l’enregistrement ne se fait pas sur votre ordinateur personnel ( gain de place + possibilité de les retrouver depuis n’importe quel ordinateur ) - immédiateté : on ne le remet pas à plus tard, on le fait tout de suite + possibilité de les exporter à tout moment - source de partage : vous pouvez travailler en équipe et envoyer ainsi un lien à tout un groupe. Vous pouvez aussi vous créer un network . - source de veille : possibilité d’avoir un fil RSS par tag, voire un fil RSS par combinaison de tags
Quel intérêt ? - la recherche d’informations demande du temps et de l’énergie - il faut donc la rentabiliser au maximum - c’est une autre façon de suivre l’actualité sur le web ! S’abonner aux newsletters envoyées par les administrateurs des sites. Pb : pas en temps réel. Les agrégateurs et les fils RSS (Rich Site Sumary : famille de formats XML utilisés pour la syndication de contenus web) : suivre en temps réel l’actualité d’un site information PUSH (qui s’oppose à la méthode PULL, méthode classique de l’utilisation d’internet : l’utilisateur se rend sur les sites pour en « tirer » les informations) : consiste à apporter les infos à l’internaute, de manière directe et automatique, en fonction de critères qu’il aura choisi au préalable. Et en plus, l’info vient à vous sans spam ! L’agrégateur va être l’outil qui va vous permettre de classer vos fils RSS. Il ne propose aucun contenu mais va recevoir celui d’autres sites. Les bases de données vous proposent souvent des fils RSS en fonction de la discipline qui vous intéresse : CAIRN, les TI, Pubmed.