SCIRUS : “ For scientific information only ” ? Recherche d’information scientifique sur le web
Rechercher de l’information scientifique 1/2 Bibliothèque Michel Serres ::  18 Mars 2008 Un besoin et des usages identifiés en dehors des outils payants : Succès des moteurs de recherche généralistes sur le web type  Google Simplicité, rapidité, sources variées  (inhérent au web) Mais ne répondent qu’en partie aux attentes des communautés aux usages spécificiques :  “ bruit ” ou “ silence ” sources non spécifiquement scientifiques absence de certaines fonctionnalités ( exploitation bibliographique ,…) manque de  rigueur éditoriale  (inhérent au web ?) indexation partielle des sources (notion de « web invisible ») Pourtant,  intérêt de certaines sources web  (sites académiques, d’institutions, de chercheurs,…), non présentes dans les bases de données bibliographiques
Rechercher de l’information scientifique 2/2  Bibliothèque Michel Serres ::  18 Mars 2008 De multiples stratégies possibles, et autant d’outils :  moteurs généralistes scientifiques  répertoires de liens scientifiques sélectionnés moteurs scientifiques spécialisés (par domaines particuliers, types de documents, ou spécifiques aux ressources dites «en accès libres ») Les services doivent répondre à un  dilemme  : prendre en compte et donner accès aux sources traditionnelles utilisées par les chercheurs (articles, congrès,…) très  structurées qualité  homogène  (filtre éditorial) souvent présentes dans des ressources à  accès réservé tout en proposant des ressources web utiles peu ou pas structurés qualité  très hétérogène  (pas ou peu de filtre éditorial) accès libre, besoin d’un  tri préalable  face à la quantité de documents
 
Scirus – Présentation et origines Bibliothèque Michel Serres ::  18 Mars 2008 Scirus créé en  2001  par l’éditeur  Elsevier  (portail ScienceDirect) avec l’objectif de combler ces manques, résoudre ce dilemme …et promouvoir ses revues en exploitant cette niche   “ For scientific information only ” :  http:// www . scirus . com / Innovation : créer un  seul point d’entrée  pour la recherche de littérature académique ( articles ,…) et “web” ( sites web )  Similaire dans son approche à  Google Scholar  (2004) Stratégie : garder la simplicité (= Google => respect des usages) rigueur et fonctionnalités avancées (    Google et Google Scholar) indexation de contenu de périodiques scientifiques et de bases bibliographiques (partenariats) et sélection en amont de sites pertinents Indexation “profonde”  des sources (technologie  FAST)
Bibliothèque Michel Serres ::  18 Mars 2008
Une volonté de transparence ?  Bibliothèque Michel Serres ::  18 Mars 2008 “ Ligne éditoriale” et  équipe éditoriale  signalées sur le site (internationale, à majorité anglophone) Sources indexées clairement  identifiées  (bases, éditeurs,…); taille de l’index signalée  http:// www . scirus . com / srsapp / aboutus /#range Distinction  entre plusieurs niveaux d’” autorité ” au sein des sources Une rubrique “ News ” qui informe régulièrement de l’extension de la couverture du moteur (nouvelles sources indexées  http:// www . scirus . com / srsapp / newsroom /)
Couverture Bibliothèque Michel Serres ::  18 Mars 2008 Multidisciplinaire , mais les  sciences exactes  sont plus représentées que les sciences sociales et humaines 3 types de sources  distinguées : Journal sources  : des périodiques électroniques (ScienceDirect, IOP, BioMed Central,…) Preferred Web sources  : des bases de ressources de type entrepôt institutionel et disciplinaire, serveur de prêt-publications, bases de sociétés savantes (ArXiv.org, CURATOR, LexisNexis,  NDLTD, PubMedCentral,….) Other Web sources  : des sites web académiques, d’entreprises, sélectionnés (.edu, .ac.uk, .gouv,…)  Indexation profonde  donnant accès à une partie du  web invisible Scirus référence des :  articles ,  pré-publications ,  thèses ,  rapports techniques ,  actes de congrés ,  brevets ,  cours, livres ,…
Couverture : 3 types de sources…? Bibliothèque Michel Serres ::  18 Mars 2008 Exemple : un article de revue sur ScienceDirect (Journal Sources) peut être dans une archive institutionnelle (Preferred Web Sources), et l’auteur peut avoir mis une « version auteur » sur sa page perso (Other Web Sources) Plusieurs versions d’un même documents peuvent se retrouver dans différentes catégories
La recherche dans Scirus Bibliothèque Michel Serres ::  18 Mars 2008 Scirus index le plus souvent possible les documents en  texte intégral . Les sites web sont indexés dans leur totalité Peu de différences  entre le nombre de résultats via les outils natifs des bases indexées et celui de Scirus (notion de  périodicité de mise à jour , différence de  traitement des contenus  indexés par les algorithmes) La recherche simple permet de  combiner des mots-clés  avec différents opérateurs La recherche se fait en  langage naturel  (pas de vocabulaire contrôlé type thésaurus, listes fermées,..) Pas d'index multilingue, auteurs souvent mal référencés     utiliser la langue du document recherché     utiliser des  caractères génériques  ( “*” ou “?”) L'accentuation n'est pas prise en compte
Une recherche avancée performante Bibliothèque Michel Serres ::  18 Mars 2008 Recherche  multi-champs  : auteur, nom de publication et intervalle de dates certaines options ne s’appliquent qu’à certains types de documents (ISSN, affiliation, date,…) Des champs qui remplissent les fonctions des  opérateurs booléens  AND, OR, “guillemets” Filtres  : type de document, format de fichier, source, domaine disciplinaire Note : La catégorisation par domaines est  automatique  (algorithme) et réalisée par comparaison à des bases de connaissances (dictionnaires) issues de corpus disciplinaires modèles (+ intervention humaine pour affiner le poids des mots-clés) Une référence peut appartenir à plusieurs domaines disciplinaires
Bibliothèque Michel Serres ::  18 Mars 2008
Evaluation des résultats Bibliothèque Michel Serres ::  18 Mars 2008 Le type de document est soit clairement signalé, soit il s’agit d’un site web ou d’un fichier présent sur un site web (cf. url et/ou poids du fichier en ko) Tri par pertinence utilisé par défaut  (autre : date. Note : il n'est pas aisé de dater un site web…) Cas des  doublons  :  Des documents présents dans plusieurs bases en même temps     doublons dans les résultats Ces doublons ne sont  pas regroupés  (   GS) sous une seule entrée dans la liste de résultats Les résultats issus de sites d'éditeurs (accès payant) ne semblent  pas favorisés  dans ce cas (test : deux références identiques provenant d'archives ouvertes et de journaux en ligne sont classées au même niveau dans la liste des résultats)
Affiner ou élargir sa recherche simplement Bibliothèque Michel Serres ::  18 Mars 2008 Affiner sa recherche : pour diminuer le bruit Filtrer  en amont  (voir  Recherche avancée ) Filtrer  en aval  : par catégories de ressources interrogées Utiliser la liste de mots clés proposés via le  panneau «  Refine your search » . (utilisation de la connaissance utilisée pour la catégorisation par domaines) Note : Ces mots-clés sont proposés dynamiquement (algorithme) après analyse des 100 premiers résultats trouvés, une fois classés par pertinence N’afficher que les résultats d’une source particulière : “ more hits from ” (activer l’option : Cluster results by domain) Elargir sa recherche “ similar results ” permet d'afficher des résultats similaires
Bibliothèque Michel Serres ::  18 Mars 2008
Usages avancés Bibliothèque Michel Serres ::  18 Mars 2008 Définir ses  préférences  de recherche via “ Search Preferences ” Results clustering  : active le  regroupement  des résultats par domaines  Library Partner Links  : partenariat avec les bibliothèques pour faciliter le lien vers le texte intégral des documents (technologie OpenURL) Se constituer une  bibliographie Save checked results  : sauvegarder des références ATTENTION : sauvegarde uniquement par cookie Email checked results  : envoi des références par e-mail Export checked results  :export vers un logiciel de gestion bibliographique (format RIS conseillié) Submit Web Site  : soumettre un site web;  le moteur permet, via un formulaire, de soumettre un site pour référencement. Les domaines disciplinaires de rattachement peuvent être proposés
Bibliothèque Michel Serres ::  18 Mars 2008
Bibliothèque Michel Serres ::  18 Mars 2008
Avantages...et limites Bibliothèque Michel Serres ::  18 Mars 2008 Scirus permet : une  recherche pluri-disciplinaire en texte intégral  sur un corpus constitué à la fois de  sources web  de qualité, et de  documents académiques  plus classiques la recheche de  brevets De  repérer rapidement des sources  valides (BDD, revues) Mais n’offre pas:  la possibilité de réaliser du  citation tracking  (système permettant un rebond possible via les citations sortantes et entrantes (type “cited by” du WoS, et dans une certaine mesure Google Scholar) la fonction de  dédoublonnage  (voir précédemment) De nombreuses sources sont (bien entendu) payantes Utilisation : “ fouille documentaire ”; recherche de  versions en libres accès de documents en texte intégral  non accessibles;  identification de ressources  (bases, titres de revues)
Scirus Topic Pages : présentation Bibliothèque Michel Serres ::  18 Mars 2008 Un service d’éditions de  pages de références  sur des sujets scientifiques proposé par Scirus : Gratuit Ouvert (uniquement) aux auteurs académiques : statut d’auteur uniquement sur invitation (     « club ») Possibilité de demander la création d’une page Auteurs identifiés Pas de reviewing , mais un responsable ( curator ) veille à la « fraîcheur » de l’information 1 sujet = 1 « Topic Page » Version Beta  (en test) depuis  juin 2007 Une façon pour les auteurs de  promouvoir leurs recherches , mais aussi de mettre en place des  collaborations A terme, des fonctionnalités d’édition collaborative (commentaires,…) seront proposées
Bibliothèque Michel Serres ::  18 Mars 2008
Scirus Topic Pages : contenu Bibliothèque Michel Serres ::  18 Mars 2008 Aspect  « Wiki »  (…pédia) Information sur l’auteur Texte faisant le point sur le sujet Références bibliographiques Liens Table des matières Keywords  (=> rebonds sur Scirus Search) Web Searchs results , liens SCOPUS (échantillons si usager non abonné) vers des articles traitant du même sujet => élargit les sources par rapport à Scirus (index SCOPUS    15 000 titres)
Bibliothèque Michel Serres ::  18 Mars 2008
Liens - documents Bibliothèque Michel Serres ::  18 Mars 2008 Elsevier,  Scirus. 2007a. About Us . [en ligne]. WWW : < http:// www . scirus . com / srsapp / aboutus / >,  consulté le 14/03/2008 Elsevier,  Scirus White Paper. How Scirus Works  [en ligne] WWW : < http:// www . scirus . com / press / pdf / WhitePaper _ Scirus . pdf >, consulté le 14/03/2008 Elsevier, Scirus Topic Pages Demos, consulté le 14/03/2008< http://info. scirus . com / topicpagesdemo /> Jacso, P.  SCIRUS. In : Peter’s Digital Reference Shelf , décembre 2006 [en ligne]. WWW : < http:// www . galegroup . com / reference / peter /2006/12/ scirus . htm >, consulté le 14//032008 Lardy J.P.  SCIRUS – support de cours . mars 2006,  < http:// urfist . univ -lyon1. fr /SCIRUS. pdf >, consulté le 14/03/2008 Marois, A.  SCIRUS :”for scientific information only ?”.  mars 2008, [en ligne]  WWW : < http:// bibli . ec -lyon. fr /documents/ Scirus _support_diff. pdf > Notess Greg R.,  Scholarly Web Searching: Google Scholar and Scirus . Online Vol. 29 No. 4 — Jul/Aug 2005 [en ligne] WWW : < http:// www . infotoday . com / online /jul05/ OnTheNet . shtml >, consulté le 26/03/2007 Tompson, Sara R.  Scirus -- for Scientific Information . Issues in Science and Technology Librarianship, n° 49, 2007 [en ligne] WWW : < http:// www . istl . org /07- winter /electronic3. html >, consulté le 27/03/2007

Scirus. For scientific communication only ? (mars 2008)

  • 1.
    SCIRUS : “For scientific information only ” ? Recherche d’information scientifique sur le web
  • 2.
    Rechercher de l’informationscientifique 1/2 Bibliothèque Michel Serres :: 18 Mars 2008 Un besoin et des usages identifiés en dehors des outils payants : Succès des moteurs de recherche généralistes sur le web type Google Simplicité, rapidité, sources variées (inhérent au web) Mais ne répondent qu’en partie aux attentes des communautés aux usages spécificiques : “ bruit ” ou “ silence ” sources non spécifiquement scientifiques absence de certaines fonctionnalités ( exploitation bibliographique ,…) manque de rigueur éditoriale (inhérent au web ?) indexation partielle des sources (notion de « web invisible ») Pourtant, intérêt de certaines sources web (sites académiques, d’institutions, de chercheurs,…), non présentes dans les bases de données bibliographiques
  • 3.
    Rechercher de l’informationscientifique 2/2 Bibliothèque Michel Serres :: 18 Mars 2008 De multiples stratégies possibles, et autant d’outils : moteurs généralistes scientifiques répertoires de liens scientifiques sélectionnés moteurs scientifiques spécialisés (par domaines particuliers, types de documents, ou spécifiques aux ressources dites «en accès libres ») Les services doivent répondre à un dilemme : prendre en compte et donner accès aux sources traditionnelles utilisées par les chercheurs (articles, congrès,…) très structurées qualité homogène (filtre éditorial) souvent présentes dans des ressources à accès réservé tout en proposant des ressources web utiles peu ou pas structurés qualité très hétérogène (pas ou peu de filtre éditorial) accès libre, besoin d’un tri préalable face à la quantité de documents
  • 4.
  • 5.
    Scirus – Présentationet origines Bibliothèque Michel Serres :: 18 Mars 2008 Scirus créé en 2001 par l’éditeur Elsevier (portail ScienceDirect) avec l’objectif de combler ces manques, résoudre ce dilemme …et promouvoir ses revues en exploitant cette niche  “ For scientific information only ” : http:// www . scirus . com / Innovation : créer un seul point d’entrée pour la recherche de littérature académique ( articles ,…) et “web” ( sites web ) Similaire dans son approche à Google Scholar (2004) Stratégie : garder la simplicité (= Google => respect des usages) rigueur et fonctionnalités avancées (  Google et Google Scholar) indexation de contenu de périodiques scientifiques et de bases bibliographiques (partenariats) et sélection en amont de sites pertinents Indexation “profonde” des sources (technologie FAST)
  • 6.
  • 7.
    Une volonté detransparence ? Bibliothèque Michel Serres :: 18 Mars 2008 “ Ligne éditoriale” et équipe éditoriale signalées sur le site (internationale, à majorité anglophone) Sources indexées clairement identifiées (bases, éditeurs,…); taille de l’index signalée http:// www . scirus . com / srsapp / aboutus /#range Distinction entre plusieurs niveaux d’” autorité ” au sein des sources Une rubrique “ News ” qui informe régulièrement de l’extension de la couverture du moteur (nouvelles sources indexées http:// www . scirus . com / srsapp / newsroom /)
  • 8.
    Couverture Bibliothèque MichelSerres :: 18 Mars 2008 Multidisciplinaire , mais les sciences exactes sont plus représentées que les sciences sociales et humaines 3 types de sources distinguées : Journal sources : des périodiques électroniques (ScienceDirect, IOP, BioMed Central,…) Preferred Web sources : des bases de ressources de type entrepôt institutionel et disciplinaire, serveur de prêt-publications, bases de sociétés savantes (ArXiv.org, CURATOR, LexisNexis, NDLTD, PubMedCentral,….) Other Web sources : des sites web académiques, d’entreprises, sélectionnés (.edu, .ac.uk, .gouv,…) Indexation profonde donnant accès à une partie du web invisible Scirus référence des : articles , pré-publications , thèses , rapports techniques , actes de congrés , brevets , cours, livres ,…
  • 9.
    Couverture : 3types de sources…? Bibliothèque Michel Serres :: 18 Mars 2008 Exemple : un article de revue sur ScienceDirect (Journal Sources) peut être dans une archive institutionnelle (Preferred Web Sources), et l’auteur peut avoir mis une « version auteur » sur sa page perso (Other Web Sources) Plusieurs versions d’un même documents peuvent se retrouver dans différentes catégories
  • 10.
    La recherche dansScirus Bibliothèque Michel Serres :: 18 Mars 2008 Scirus index le plus souvent possible les documents en texte intégral . Les sites web sont indexés dans leur totalité Peu de différences entre le nombre de résultats via les outils natifs des bases indexées et celui de Scirus (notion de périodicité de mise à jour , différence de traitement des contenus indexés par les algorithmes) La recherche simple permet de combiner des mots-clés avec différents opérateurs La recherche se fait en langage naturel (pas de vocabulaire contrôlé type thésaurus, listes fermées,..) Pas d'index multilingue, auteurs souvent mal référencés  utiliser la langue du document recherché  utiliser des caractères génériques ( “*” ou “?”) L'accentuation n'est pas prise en compte
  • 11.
    Une recherche avancéeperformante Bibliothèque Michel Serres :: 18 Mars 2008 Recherche multi-champs : auteur, nom de publication et intervalle de dates certaines options ne s’appliquent qu’à certains types de documents (ISSN, affiliation, date,…) Des champs qui remplissent les fonctions des opérateurs booléens AND, OR, “guillemets” Filtres : type de document, format de fichier, source, domaine disciplinaire Note : La catégorisation par domaines est automatique (algorithme) et réalisée par comparaison à des bases de connaissances (dictionnaires) issues de corpus disciplinaires modèles (+ intervention humaine pour affiner le poids des mots-clés) Une référence peut appartenir à plusieurs domaines disciplinaires
  • 12.
  • 13.
    Evaluation des résultatsBibliothèque Michel Serres :: 18 Mars 2008 Le type de document est soit clairement signalé, soit il s’agit d’un site web ou d’un fichier présent sur un site web (cf. url et/ou poids du fichier en ko) Tri par pertinence utilisé par défaut (autre : date. Note : il n'est pas aisé de dater un site web…) Cas des doublons : Des documents présents dans plusieurs bases en même temps  doublons dans les résultats Ces doublons ne sont pas regroupés (  GS) sous une seule entrée dans la liste de résultats Les résultats issus de sites d'éditeurs (accès payant) ne semblent pas favorisés dans ce cas (test : deux références identiques provenant d'archives ouvertes et de journaux en ligne sont classées au même niveau dans la liste des résultats)
  • 14.
    Affiner ou élargirsa recherche simplement Bibliothèque Michel Serres :: 18 Mars 2008 Affiner sa recherche : pour diminuer le bruit Filtrer en amont (voir Recherche avancée ) Filtrer en aval : par catégories de ressources interrogées Utiliser la liste de mots clés proposés via le panneau «  Refine your search » . (utilisation de la connaissance utilisée pour la catégorisation par domaines) Note : Ces mots-clés sont proposés dynamiquement (algorithme) après analyse des 100 premiers résultats trouvés, une fois classés par pertinence N’afficher que les résultats d’une source particulière : “ more hits from ” (activer l’option : Cluster results by domain) Elargir sa recherche “ similar results ” permet d'afficher des résultats similaires
  • 15.
  • 16.
    Usages avancés BibliothèqueMichel Serres :: 18 Mars 2008 Définir ses préférences de recherche via “ Search Preferences ” Results clustering : active le regroupement des résultats par domaines Library Partner Links : partenariat avec les bibliothèques pour faciliter le lien vers le texte intégral des documents (technologie OpenURL) Se constituer une bibliographie Save checked results : sauvegarder des références ATTENTION : sauvegarde uniquement par cookie Email checked results : envoi des références par e-mail Export checked results :export vers un logiciel de gestion bibliographique (format RIS conseillié) Submit Web Site : soumettre un site web; le moteur permet, via un formulaire, de soumettre un site pour référencement. Les domaines disciplinaires de rattachement peuvent être proposés
  • 17.
  • 18.
  • 19.
    Avantages...et limites BibliothèqueMichel Serres :: 18 Mars 2008 Scirus permet : une recherche pluri-disciplinaire en texte intégral sur un corpus constitué à la fois de sources web de qualité, et de documents académiques plus classiques la recheche de brevets De repérer rapidement des sources valides (BDD, revues) Mais n’offre pas: la possibilité de réaliser du citation tracking (système permettant un rebond possible via les citations sortantes et entrantes (type “cited by” du WoS, et dans une certaine mesure Google Scholar) la fonction de dédoublonnage (voir précédemment) De nombreuses sources sont (bien entendu) payantes Utilisation : “ fouille documentaire ”; recherche de versions en libres accès de documents en texte intégral non accessibles; identification de ressources (bases, titres de revues)
  • 20.
    Scirus Topic Pages: présentation Bibliothèque Michel Serres :: 18 Mars 2008 Un service d’éditions de pages de références sur des sujets scientifiques proposé par Scirus : Gratuit Ouvert (uniquement) aux auteurs académiques : statut d’auteur uniquement sur invitation (  « club ») Possibilité de demander la création d’une page Auteurs identifiés Pas de reviewing , mais un responsable ( curator ) veille à la « fraîcheur » de l’information 1 sujet = 1 « Topic Page » Version Beta (en test) depuis juin 2007 Une façon pour les auteurs de promouvoir leurs recherches , mais aussi de mettre en place des collaborations A terme, des fonctionnalités d’édition collaborative (commentaires,…) seront proposées
  • 21.
  • 22.
    Scirus Topic Pages: contenu Bibliothèque Michel Serres :: 18 Mars 2008 Aspect « Wiki » (…pédia) Information sur l’auteur Texte faisant le point sur le sujet Références bibliographiques Liens Table des matières Keywords (=> rebonds sur Scirus Search) Web Searchs results , liens SCOPUS (échantillons si usager non abonné) vers des articles traitant du même sujet => élargit les sources par rapport à Scirus (index SCOPUS  15 000 titres)
  • 23.
  • 24.
    Liens - documentsBibliothèque Michel Serres :: 18 Mars 2008 Elsevier, Scirus. 2007a. About Us . [en ligne]. WWW : < http:// www . scirus . com / srsapp / aboutus / >, consulté le 14/03/2008 Elsevier, Scirus White Paper. How Scirus Works [en ligne] WWW : < http:// www . scirus . com / press / pdf / WhitePaper _ Scirus . pdf >, consulté le 14/03/2008 Elsevier, Scirus Topic Pages Demos, consulté le 14/03/2008< http://info. scirus . com / topicpagesdemo /> Jacso, P. SCIRUS. In : Peter’s Digital Reference Shelf , décembre 2006 [en ligne]. WWW : < http:// www . galegroup . com / reference / peter /2006/12/ scirus . htm >, consulté le 14//032008 Lardy J.P. SCIRUS – support de cours . mars 2006, < http:// urfist . univ -lyon1. fr /SCIRUS. pdf >, consulté le 14/03/2008 Marois, A. SCIRUS :”for scientific information only ?”. mars 2008, [en ligne] WWW : < http:// bibli . ec -lyon. fr /documents/ Scirus _support_diff. pdf > Notess Greg R., Scholarly Web Searching: Google Scholar and Scirus . Online Vol. 29 No. 4 — Jul/Aug 2005 [en ligne] WWW : < http:// www . infotoday . com / online /jul05/ OnTheNet . shtml >, consulté le 26/03/2007 Tompson, Sara R. Scirus -- for Scientific Information . Issues in Science and Technology Librarianship, n° 49, 2007 [en ligne] WWW : < http:// www . istl . org /07- winter /electronic3. html >, consulté le 27/03/2007