Recherche QUESTEL & PRESSED

403 vues

Publié le

Equations de recherche. Travail effectué à l'INTD Paris en décembre 2010.

Publié dans : Formation, Business
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
403
Sur SlideShare
0
Issues des intégrations
0
Intégrations
2
Actions
Partages
0
Téléchargements
3
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Recherche QUESTEL & PRESSED

  1. 1. INTD T1 2010-2011 Groupe 3 Recherche d’information - 03/12/2010 1 MODULE 4 – RECHERCHE ET VEILLE Recherche d’information Sujet Internet et les serveurs professionnels : quelles opportunités pour la fonction documentaire Serveurs utilisés QUESTEL et l’Européenne de données via l’interface de recherche Pressed.edd.fr (EDD)
  2. 2. INTD T1 2010-2011 Groupe 3 Recherche d’information - 03/12/2010 2 Introduction : Analyse de la question et type de résultat communiqué Cette question est en réalité une problématique qui correspond à une demande d’information spécialisée, à caractère technique dans le domaine informatique. Nous apporterons donc à cette question une réponse d’ordre technique via des requêtes effectuées sur 2 serveurs (QUESTEL-ORBIT et PRESSED) et non un état de l’art.
  3. 3. INTD T1 2010-2011 Groupe 3 Recherche d’information - 03/12/2010 3 RECHERCHE SUR PRESSED (Européenne de données) METHODOLOGIE Le découpage des termes de la question a été compartimenté comme suit : Internet, serveurs professionnels, opportunités, fonction documentaire. Ensuite, chacun d’eux a été le fruit d’une recherche synonymique, à l’aide des outils suivants : synonymes.com ; « vocabulaire de la doc » du site de l’Association des professionnels de l’information et de la documentation (ADBS) ; Wikipedia ; Google. Enfin une réflexion personnelle, et en groupe, est venue compléter cette recherche. Liste exhaustive des mots et des syntagmes utilisés pour analyser la question : Internet : Réseau, réseau web, web 2.0, NTIC, TIC, nouvelles technologies de l’information, communautés, internet, portail, site web, accès en ligne, sources d’information. Serveurs professionnels : Serveur, GED, CMS, logiciel, machine, outil, application, CRM, gestion de la relation client, base de données, serveur information, serveur dédié, mémoire, mémoire serveur, serveur de données. Fonction : Profession, métier, travail, activité, emploi, rôle, carrière, processus, tâche, compétence, poste, procédé. Fonction documentaire : Management des connaissances, documentation, documentaliste, recherche, recherche de l’information, information, veille, gestion de l’information, knowledge management, records manager, bibliothécaire, archiviste, profession documentaire, techniques documentaires, web documentaire, informatique documentaire, métier de la documentation, métier de l’information, recherchiste, professionnel de l’info-doc. Opportunités : Opportunités, avantages, atouts, pertinence, perspective, évolution, modernisation, possibilité, mutation, innovation, impact, bouleversement. Enfin, nous avons pris connaissance du langage d’interrogation grâce à l’aide en ligne du serveur PRESSED.
  4. 4. INTD T1 2010-2011 Groupe 3 Recherche d’information - 03/12/2010 4  Choix de la période de recherche : Nous avons cherché à savoir à partir de quelle année la question de l’utilisation d’Internet a été abordée dans le monde de la documentation. Ainsi, en tapant dans le moteur de recherche Google la requête « utilisation internet documentation », nous avons trouvé le document suivant : « L’utilisation d’internet dans un service documentaire et ses conséquences pour la profession », communication de Jean MICHEL au Colloque ADBS le 21 novembre 1995 (Strasbourg)1 . La source de ce document nous a paru suffisamment fiable pour se baser sur l’année de sa publication pour débuter notre recherche. Nous avons donc choisi de modifier dans PRESSED la période de recherche proposée par défaut. Nous avons personnalisé la période et choisi les dates suivantes : du 01/01/1995 au 03/11/2010 (date où nous avons arrêté notre recherche car nos résultats étaient pertinents). Pour information, vous pourrez trouver la communication de Jean MICHEL à l’adresse suivante : http ://michel.jean.free.fr/publi/JM269.html  Choix des sources : Nous avons choisi de réduire la liste des sources sur lesquelles effectuer nos requêtes, d’éliminer celles qui nous paraissaient non pertinentes et avons créé une sélection personnalisée. 1. 1ère sélection effectuée :  Presse Grand Public : a. Presse Quotidienne Nationale : tous les titres, excepté les titres Sport et Libération en régions (sites internet) b. Magazines et périodiques :  Périodiques d’Actualité Générale : Challenges, L’Express, le Nouvel Observateur, …  Culture et Loisirs : Science et Avenir  Economie (tous)  Education (tous)  Finance (tous)  Nouvelles technologies (tous)  Presse Ecofi : les titres phares type Courrier Cadres, L’Entreprise, La vie des Entreprises,…  Presse Technique et Professionnelle : a. Nouvelles Technologies (tous) b. Information et Documentation (tous) c. Médias et Communication (tous) 1 Source (url) : http://michel.jean.free.fr/publi/JM269.html
  5. 5. INTD T1 2010-2011 Groupe 3 Recherche d’information - 03/12/2010 5 A l’issue des recherches effectuées avec cette sélection, nous nous sommes aperçus que la liste des sources (trop longue) donnait trop de bruit. Nous avons donc restreint cette liste et créée une seconde sélection personnalisée. 2. Deuxième sélection Notre sélection a été recentrée sur les sources les plus en lien avec le sujet, soit : - Presse Grand Public / Magazines et périodiques : Nouvelles technologies (tous) - Presse Technique et Professionnelle :  Nouvelles Technologies (tous)  Information et Documentation (tous)  Médias et Communication (tous)  Equations de recherche : Pour chacun des termes de la question, une requête (ou équation) individuelle a été effectuée à l’aide d’unitermes, en utilisant, lorsque cela était nécessaire, des opérateurs d’adjacence pour les syntagmes nominaux ou encore des formes fléchies (ou opérateurs de troncature) permettant de trouver les variantes d’un terme : [Internet, serveurs professionnels, opportunités, fonction documentaire] En ce qui concerne le syntagme nominal « fonction documentaire », nous avons décidé de le séparer en 2 requêtes distinctes : « fonction » et « fonction documentaire ». Cette dissociation a permis d’isoler le terme généraliste (fonction en tant que métier) des termes spécifiques aux métiers de la documentation (par exemple, fonction en tant que webmaster ou encore archiviste).  Voir le tableau présenté en page 4. Par ailleurs, il est nécessaire d’indiquer que nous avons volontairement réservé l’intégration du terme « opportunités » pour l’étape finale de notre équation de recherche, ceci afin de réduire le champ de réponses et donner tout son sens à la question posée. Ensuite, à partir des requêtes effectuées pour chacun des termes de la question, nous avons testé une série de croisements possibles à l’aide d’opérateurs booléens (ET, OU), l’objectif étant de coupler les éléments de réponses des syntagmes nominaux (par exemple « fonction » ET « fonction documentaire ») et de croiser, en utilisant le OU, les réponses obtenues pour chacun des termes de la question. Après une première série d’équations de recherche infructueuses (soit trop peu de résultats, voire aucun ; soit trop de résultats non pertinents), nous avons décidé d’affiner notre équation en fragmentant le syntagme nominal « serveurs professionnels » en 3 requêtes distinctes : [Serveurs, professionnels, serveurs professionnels ]
  6. 6. INTD T1 2010-2011 Groupe 3 Recherche d’information - 03/12/2010 6 Ce morcellement nous a permis, d’une part, d’élargir notre recherche avec des termes généralistes (serveur en tant qu’outil ou machine et professionnels dans le sens spécialisé du terme) et d’autre part, d’apporter des précisions plus techniques (par exemple, serveurs professionnels en tant que base de données).  Voir le tableau présenté en page 4. Vous trouverez, dans le tableau ci-dessous, la liste des descripteurs contrôlés sélectionnés et rejetés pour l’équation finale. En effet, certains d'entres-eux se sont avérés non pertinents à la lecture des résultats obtenus. Termes rejetés Termes conservés FONCTION Attribution Profession Rôle Métier Tache Travail Poste Fonction Carrière Activité Emploi Processus Compétence Procédé Bibliothécaire Archiviste Documenta* Recherchiste Veill* Knowledge manag* Record manag* Webm* FONCTION DOCUMENTAIRE Management de connaissances Fonction documentaire Web documentaire Professionnel de la documentation Informatique documentaire Profession de la documentation Métier de l’information Technique documentaire Gestion* de l’information Activité documentaire Spécialiste de l’information Professionnel de l’information Professionnel de l’information et de la documentation Métier de la documentation INTERNET Réseau web Web NTIC Web 2.0 Portail Navigateur web Communauté Réseau Media internet *TIC Source d’information Nouvelles technologies de l’information Intranet Internet Accès en ligne
  7. 7. INTD T1 2010-2011 Groupe 3 Recherche d’information - 03/12/2010 7 Web visible Web invisible SERVEURS Machine Serveur Outil Logiciel Application Serveur informatique Mémoire Site serveur Serveur internet PROFESSIONNEL Specialis* Technicien Professionnel SERVEURS PROFESSIONNELS GED Base de données Gestion électronique de document Serveur dédié CMS Serveur de données Content management system Serveur spécialisé CRM Serveur professionnel Gestion de la relation client BDD Serveur de messagerie Mémoire serveur L’utilisation de quorums en phase finale de notre équation de recherche est venue augmenter la pertinence et le nombre de résultats en exigeant qu’au moins un certain nombre de termes (3 ou 4) soient présents dans les notices. Ils ont été utilisés pour les requêtes individuelles les plus longues (internet, fonction et fonction documentaire). Enfin, après avoir effectué plusieurs requêtes non pertinentes sur « titre » et « chapô », nous avons préféré laisser le champ de recherche le plus ouvert possible et ne pas demander ces 2 options. Précisons également que l’option «singulier/pluriel» a été choisie afin d’obtenir le plus de résultats possibles. Ces explications nous conduisent à vous présenter l’équation de recherche finale permettant d’aboutir à 126 notices pertinentes sur un résultat total de 159 notices2 . 2 Les 159 notices sont le résultat de l’équation de recherche effectuée le 03/11/2010 sur EDD.
  8. 8. INTD T1 2010-2011 Groupe 3 Recherche d’information - 03/12/2010 8 Equation de recherche finale 1. Interrogation sur l’uniterme INTERNET (web : « site web » : « web 2.0 » : « navigateur web » : reseau : *tic : « nouvelles technologies de l’information » : intranet : internet : « acces en ligne » : «web visible» : «web invisible»)q>=3 1. Interrogation sur l’uniterme SERVEURS (serveur ou logiciel ou « serveur informatique » ou «site serveur » ou «serveur internet») 2. Interrogation sur l’uniterme PROFESSIONNEL (specialis* ou technicien ou professionnel) 3. Interrogation sur le syntagme nominal SERVEURS PROFESSIONNELS (« base de donnees » ou « serveur dedie » ou « serveur de donnees » ou « serveur specialise » ou «serveur professionnel») 4. Interrogation sur l’uniterme FONCTION (termes génériques) (profession : metier : travail : fonction : activite : emploi : processus : competence : procede)q>=4 5. Interrogation sur l’uniterme FONCTION (métiers de la documentation) (bibliothécaire : archiviste : documenta* : recherchiste : veill* : « knowledge manag* » : « record manag*» : webm*)q>=3 6. Interrogation sur le syntagme nominal FONCTION DOCUMENTAIRE (« fonction documentaire » ou « profession* 2AV documenta* » ou « technique documentaire » ou « gestion* de l’information » ou « activite documentaire » ou « specialiste de l’information » ou « professionnel de l’information » ou « professionnel de l’information AV documentation » ou « métier de la documentation ») 7. Interrogation sur l’uniterme OPPORTUNITES (opportunite ou atout ou avantage ou pertinence ou perspective ou evolution ou modernisation ou possibilite ou mutation ou innovation ou impact ou bouleversement) 8. Croisement : 2 ET 3 ET 4 9. Croisement : (1 OU 9) ET (5 ET (6 OU 7)) ET 8 159 résultats dont 126 pertinents Taux de précision : 76%
  9. 9. INTD T1 2010-2011 Groupe 3 Recherche d’information - 03/12/2010 9 NB : Il est à noter que le jour où nous avons trouvé ces 159 résultats pertinents, nous avons imprimé chacun des articles afin de pouvoir les parcourir rapidement et de vérifier leur pertinence. Une semaine plus tard (le 10/11 – lorsque nous avons bénéficié de nouveaux mots de passe de connexion au serveur), nous avons reformulé l’équation à l’identique et en avons trouvé moins (79), bien que également pertinents (39 d’entre eux précisément), avec d'ailleurs la présence d’un certain nombre de doublons. Cet exercice a permis de témoigner de la validité de nos équations de recherche. Au total, nous avons trouvé plus de 160 résultats pertinents. Vous trouverez ces résultats sous la forme de : - Une liste des résultats de notre dernière requête du 10/11 (« imprim écran » de la page de résultats Pressed avec signalement des articles retenus- format Ppt) voir Annexe 1 - A titre d’exemple, une sélection des 10 articles les plus pertinents en texte intégral voir Annexe 1 - La totalité des résultats issus de la fusion de nos requêtes du 3 et du 10/11 excluant les doublons identifiés (format Word – support CD-Rom)
  10. 10. INTD T1 2010-2011 Groupe 3 Recherche d’information - 03/12/2010 10 RECHERCHE SUR QUESTEL-ORBIT METHODOLOGIE  Choix des bases Nous avons éliminé les bases spécialisées en brevets, jurisprudence, énergie et entreprises, car ces domaines ne concernent pas notre sujet. Parmi les bases spécialisées en Sciences & Technologies, nous avons éliminé : - BIOT, car c’est une base spécialisée en biotechnologies - Et WELD, car elle est spécialisée en soudage En revanche, nous avons interrogé la base Pascal, spécialisée en Sciences et Technologies, Biologie et Médecine, car elle nous a semblé être la plus pertinente pour traiter notre sujet. Il est à noter que nous avons tenté, au début de notre recherche, d’interroger également la base Inspec, car celle-ci est notamment spécialisée dans les technologies de l’information. Ce qui nous a poussé à créér un cluster réunissant Pascal et Inspec. Or, nous avons dû abandonner cette démarche en raison des différences de langage d’interrogation. A titre d’exemple, nous n’avons pas pu interroger les deux bases à la fois sur le champ « descripteurs » (commande /DE sur Pascal VS commande /IT sur Inspec).
  11. 11. INTD T1 2010-2011 Groupe 3 Recherche d’information - 03/12/2010 11 Par conséquent, nos recherches se sont concentrées sur la base Pascal. Ensuite, nous avons pris connaissance du langage d’interrogation grâce à la fiche technique de Pascal.  Analyse de la question Notre choix s'est porté sur le même découpage des termes de la question que lors de l’interrogation via Pressed, soit : Internet, serveurs, professionnels, serveurs professionnels, fonction et fonction documentaire, opportunités. Cependant, avec quelques adaptations.  Equations de recherche : 1. Adaptation de l'équation de Pressed: Nous avons repris l’équation finale utilisée pour le serveur Pressed et nous l'avons adaptée au langage d’interrogation de la base Pascal. Abandon de la requête par dates : Alors que sur Pressed le choix d'un champ chronologique s'imposait dès le début de notre recherche, sur Questel la pertinence des résultats obtenus lors de nos requêtes nous a démontré qu'une requête par dates n'était nullement opportune. Raisons du choix de la recherche sur les descripteurs : N’ayant pas de connaissances particulières du sujet à travers les champs titre et auteur, et ne pouvant pas nous limiter au simple langage naturel, la recherche par mots-clés (ou descripteurs /DE) s’est imposée d’elle-même et nous a semblé la plus efficace. Nous avons procédé à la méthode dite de « l’entonnoir » : chercher un maximum de descripteurs pour affiner de plus en plus notre recherche et préciser au mieux nos résultats. Cette démarche nous a permis de vérifier que les mots-clés utilisés pour la recherche étaient bien ceux qui permettaient d’indexer les articles (francophones et anglophones). 2. Recherche de descripteurs : La recherche de descripteurs via la commande résultats/statistiques a permis de faire ressortir un certain nombre de mots clefs français par occurrence. 3. Reformulation des équations avec les descripteurs les plus pertinents : Nous avons éliminé la requête « professionnels », car nous n'avons trouvé qu'un seul descripteur, « spécialisation », qui ne nous a pas permis d’affiner nos résultats et a produit beaucoup de bruit. 4. Essai de divers croisements: Les divers essais de croisements nous ont donné du bruit ou du silence avec des résultats très peu pertinents.
  12. 12. INTD T1 2010-2011 Groupe 3 Recherche d’information - 03/12/2010 12 5. Nouvelle recherche de descripteurs pour les requêtes « fonction documentaire » et « serveur pro » : Cette nouvelle recherche de descripteurs, à partir d'une nouvelle liste de mots, s'est imposée, car les résultats de ces requêtes individuelles n’étaient pas pertinents : REQUETE FONCTION DOCUMENTAIRE=> a été complétée avec les termes suivants : (ACTIVITE? AV DOCUMENTAIRE?) OU (GESTION 1AV CONTENU) OU (GESTION 1AV DOCUMENT) OU (GESTION 2AV INFORMATION) OU (SYSTEME? DOCUMENTAIRE?) OU (SYSTEME 1AV NFORMATION) OU (ACCES 2AV INFORMATION) OU (DIFFUSION 2AV INFORMATION) OU (SERVICE 1 AV INFORMATION) OU (ANALYSE 1AV CONTENU) OU (TRAITEMENT 1AV DOCUMENT?) OU (TRAITEMENT 2AV INFORMATION?) OU (RECHERCHE AV DOCUMENTAIRE) OU (RECHERCHE AV INFORMATION) OU (RESEAU AV DOCUMENTAIRE) OU (SPECIALISTE 2AV INFORMATION) REQUETE SERVEURS PRO => a été complétée avec le terme suivant : (SERVEUR AV DOCUMENTAIRE)
  13. 13. INTD T1 2010-2011 Groupe 3 Recherche d’information - 03/12/2010 13 Equation de recherche finale 1. Requête INTERNET /DE INTERNET OU EN LIGNE OU SITE WEB OU RESEAU SOCIAL OU RESEAU WEB OU TIC OU COMMUNICATION OU LOGICIEL OU PARTAGE DES CONNAISSANCES OU SERVICE WEB OU BASE DE DONNEES OU LOGICIEL LIBRE OU MESSAGERIE INSTANTANEE OU REALITE VIRTUELLE OU RELATION HOMME MACHINE OU WEB 2 2. Requête SERVEURS PROFESSIONNELS /DE LOGICIEL OU BASE DE DONNEES OU ALGORITHME OU INTERFACE OU TRAITEMENT DONNEE OU SERVEUR DOCUMENTAIRE OU ORDINATEUR HOTE OU SOURCE INFORMATION OU ACCES INFORMATION OU INTERFACE UTILISATEUR OU INTERROGATION BASE DONNEE OU TRANSMISSION DONNEE OU RESSOURCE ELECTRONIQUE OU STN OU SERVEUR DOCUMENTAIRE 3. Requête FONCTION /DE FONCTION OBJECTIF OU GESTION TACHE OU INFORMATION OU PRATIQUE PROFESSIONNELLE OU CHARGE TRAVAIL OU ROLE PROFESSIONNEL 4. Requête FONCTION DOCUMENTAIRE /DE PROCESSUS OU RECHERCHE OU TEMPS TRAITEMENT OU TRAITEMENT INFORMATION OU DIFFUSION DONNEE OU DIFFUSION INFORMATION OU ANALYSE CONTENU OU RECHERCHE INFORMATION OU TRANSMISSION INFORMATION OU DEBIT INFORMATION OU ACTIVITE DOCUMENTAIRE OU DOCUMENTATION OU PROFESSIONNEL INFORMATION OU SYSTEME INFORMATION OU ACTIVITE BIBLIOTHEQUE OU ACTIVITE PROFESSIONNELLE OU CENTRE DOCUMENTATION OU GESTION INFORMATION OU RECHERCHE INFORMATION OU TRAITEMENT DOCUMENT OU TRAITEMENT INFORMATION OU DOCUMENTALISTE OU SERVICE INFORMATION OU BASE DONNEE OU GESTION FONDS OU RECHERCHE DOCUMENTAIRE OU TECHNOLOGIE INFORMATION OU BIBLIOTHECAIRE OU CENTRE INFORMATION OU CHAINE INFORMATION OU DIFFUSION INFORMATION OU DOCUMENT ELECTRONIQUE OU DOCUMENT OU SCIENCE INFORMATION OU TECHNOLOGIE INFORMATION COMMUNICATION 5. Requête OPPORTUNITES /DE OPTIMISATION OU CHANGEMENT OU EVOLUTION OU ADAPTATION OU DEVELOPPEMENT OU INNOVATION 1ère tentative de croisement : 6. 1 OU 2 7. 3 OU 4 8. 5 ET 6 ET 7 ( 233 résultats non pertinents)
  14. 14. INTD T1 2010-2011 Groupe 3 Recherche d’information - 03/12/2010 14 2ème tentative de croisement : 6. 1 ET 2 7. 3 ET 4 8. 5 OU 6 OU 7 (496.820 résultats) 3ème et dernière tentative de croisement : 6. 1 OU 2 7. 3 ET 4 8. 5 ET 6 ET 7 260 résultats dont 133 pertinents Taux de précision : 52% Vous trouverez donc ci-après les notices de ces 133 résultats (format Word support CD-Rom). Notons que 1/3 des articles s’avère extrêmement pertinent (45 articles) et sont signalés en rouge dans le document. A titre d’exemple, une sélection des 15 articles les plus pertinents ont été imprimés (voir Annexe 2).
  15. 15. INTD T1 2010-2011 Groupe 3 Recherche d’information - 03/12/2010 15 Conclusion : A l’issue de ces deux recherches (l’une sous PRESSED et l’autre sous QUESTEL), c’est près de 300 résultats pertinents que nous vous soumettons sous plusieurs formats (texte intégral d’une partie des articles, listes des notices sélectionnées et impression papier à titre d’exemple d’une sélection des résultats les plus pertinents). Nous vous transmettons sur CD-Rom l’intégralité des articles pertinents sélectionnés, aussi bien sur PRESSED que sur QUESTEL, sachant que c’est ce que nous aurions fait dans un cadre professionnel face à un commanditaire, afin qu’il puisse, s’il le souhaite, aller vérifier une information dans son intégralité.

×