Étude comparative entre le SQL et NoSQL avec deux moteurs de recherche spécifiques du domaine biomédicale ---> le corpus LiSSA (NoSQL) VS Le DOC'Cismef (SQL)
-----
# lien du site web LiSSa : https://www.lissa.fr/dc/#env=lissa
# lien du site web Doc'Cismef ( SQL): https://doccismef.chu-rouen.fr/dc/
Cet exposé donnera un aperçu du paysage NoSQL et une classification pour les différentes catégories architecturales, clarifiera les concepts de base et la terminologie, et fournira une comparaison des caractéristiques, des forces et des inconvénients des projets les plus populaires (CouchDB, MongoDB , Riak, Redis, Membase, Neo4j, Cassandra, HBase, Hypertable).
Les bases de données NoSQL bénéficient d'une large couverture médiatique, mais il semble y avoir beaucoup de confusion autour de celles-ci, comme dans quelles situations elles fonctionnent mieux qu'une base de données relationnelle, et comment choisir l'une plutôt qu'une autre.
Base de données graphe, Noe4j concepts et mise en oeuvreMICHRAFY MUSTAFA
Cette étude vise à présenter les concepts clés d’une base de données orientée graphe. La modélisation et la mise en œuvre des cas d’utilisation seront réalisées avec la base de données NEO4J, version 3.1.
Architecture web aujourd'hui, besoin de scalabilité des bases de données relationnelles, découverte des bases de données NoSQL et des différents types de celles-ci. La vidéo de présentation peut être consultée à l'adresse suivante : http://youtu.be/oIpjcqHyx2M
Cet exposé donnera un aperçu du paysage NoSQL et une classification pour les différentes catégories architecturales, clarifiera les concepts de base et la terminologie, et fournira une comparaison des caractéristiques, des forces et des inconvénients des projets les plus populaires (CouchDB, MongoDB , Riak, Redis, Membase, Neo4j, Cassandra, HBase, Hypertable).
Les bases de données NoSQL bénéficient d'une large couverture médiatique, mais il semble y avoir beaucoup de confusion autour de celles-ci, comme dans quelles situations elles fonctionnent mieux qu'une base de données relationnelle, et comment choisir l'une plutôt qu'une autre.
Base de données graphe, Noe4j concepts et mise en oeuvreMICHRAFY MUSTAFA
Cette étude vise à présenter les concepts clés d’une base de données orientée graphe. La modélisation et la mise en œuvre des cas d’utilisation seront réalisées avec la base de données NEO4J, version 3.1.
Architecture web aujourd'hui, besoin de scalabilité des bases de données relationnelles, découverte des bases de données NoSQL et des différents types de celles-ci. La vidéo de présentation peut être consultée à l'adresse suivante : http://youtu.be/oIpjcqHyx2M
Serveur web / Base de donnees Langages de développementLudovic REUS
Une présentation des outils et technologies de l'information et de la communication.
Les serveurs webs et leur marché à ce jour
Les base de données relationnelles et NoSQL
Les langages de développements informatiques
L'ABES a pour métier la gestion des métadonnées bibliographiques de l'enseignement supérieur français. Soit elle les récupère auprès de fournisseurs (autres catalogues, éditeurs), soit elle coordonne leur production par le réseau des bibliothèques universitaires.
Depuis 2008 et surtout 2010, l'ABES mise sur le web sémantique. Comme d'autres, elle a d'abord décidé de partager et de lier ses métadonnées sur le web de données. Cela concerne tous ses catalogues : le catalogue général Sudoc, le catalogue des archives et des manuscrits Calames, le catalogue theses.fr et sa base-référentiel de personnes, collectivités, concepts... IdRef. Ce travail d'ouverture est toujours en cours, car le principal format natif à traduire en RDF, appelé MARC, est très riche, et même touffu. Pour l'instant, l'exposition en RDF se fait à la volée, à partir d'une base XML qui stocke du MARC en XML. Passer à un triplestore semble tentant, mais on résiste... tout en cherchant une solution pour devenir interrogeable en SPARQL.
A partir de 2013, l'ABES a commencé à utiliser RDF comme pivot pour agréger et traiter des métadonnées fournies par des des tiers sous des formes très variées. Il s'agit donc de commencer à travailler en RDF, et plus seulement de l'utiliser en sortie.
Aujourd'hui, on commence à réfléchir à l'avenir des outils de production de métadonnées du réseau Sudoc. Là encore, faut-il aller vers du RDF natif ? Tout en retraçant ce cheminement qui touche tous les aspects de nos expertises et applications métier, nous tenterons d'expliciter les contraintes et les principes directeurs qui déterminent nos actions et nos interrogations.
Une base de données, pourquoi faire ? Le SQL, c’est quoi ce langage ? Un DBA, ça sert à quoi ? Cette session est là pour démystifier la base de données du point de vue des développeurs. Au programme : des bonnes pratiques, de la méthodologie, quelques tips techniques… De quoi rapprocher les développeurs et les DBA.
La formation complète est disponible ici:
http://www.alphorm.com/tutoriel/formation-en-ligne-mongodb-administration
Cette formation vous apprendra à maîtriser le système de gestion de base de données MongoDB.
Durant cette formation vous appréhenderez le fonctionnement du moteur MongoDB, à administrer mongoDB au quotidien (collection, document, sauvegarde, sécurité) et à mettre en œuvre une solution de haute disponibilité avec le système de Replica Set.
Vous apprendrez également à mettre en œuvre une solution performante pour la montée en charge avec la fonctionnalité avancée du Sharding.
Ce cours vous permettra également d'optimiser vos bases de données MongoDB par la mise en place d'une indexation optimale.
Nouvelles opportunités pour les données fortement interconnectées : La base d...Cédric Fauvet
Si vous vous arrachez les cheveux avec de nombreuses jointures et les procédures stockées complexes il est fort possible que vous soyez en train de construire un graphe sans le savoir car les graphes sont partout. Depuis l'ajout d'une couche sociale aux applications web jusqu'à l'analyse d'impact sur un réseau Telecom en passant par la recherche en Biologie, de nombreuses organisations ont adopté les bases de données de graphes et leur modèle de données parfaitement adapté aux requêtes complexes et hautement connectées tout en garantissant des performances exceptionnelles.
Découvrez avec nous ce qu'apporte la puissance de Neo4j à une large variété de clients tels que Adobe, Cisco, Deutsche Telekom, Viadeo ou Glowbl.
MongoDB in a scale-up: how to get away from a monolithic hell — MongoDB Paris...Horgix
This is the slide deck of a talk by Alexis "Horgix" Chotard and Laurentiu Capatina presented at the MongoDB Paris User Group in June 2024 about the feedback on how PayFit move away from a monolithic hell of a self-hosted MongoDB cluster to managed alternatives. Pitch below.
March 15, 2023, 6:59 AM: a MongoDB cluster collapses. Tough luck, this cluster contains 95% of user data and is absolutely vital for even minimal operation of our application. To worsen matters, this cluster is 7 years behind on versions, is not scalable, and barely observable. Furthermore, even the data model would quickly raise eyebrows: applications communicating with each other by reading/writing in the same MongoDB documents, documents reaching the maximum limit of 16MiB with hundreds of levels of nesting, and so forth. The incident will last several days and result in the loss of many users. We've seen better scenarios.
Let's explore how PayFit found itself in this hellish situation and, more importantly, how we managed to overcome it!
On the agenda: technical stabilization, untangling data models, breaking apart a Single Point of Failure (SPOF) into several elements with a more restricted blast radius, transitioning to managed services, improving internal accesses, regaining control over risky operations, and ultimately, approaching a technical migration when it impacts all development teams.
L'IA connaît une croissance rapide et son intégration dans le domaine éducatif soulève de nombreuses questions. Aujourd'hui, nous explorerons comment les étudiants utilisent l'IA, les perceptions des enseignants à ce sujet, et les mesures possibles pour encadrer ces usages.
Constat Actuel
L'IA est de plus en plus présente dans notre quotidien, y compris dans l'éducation. Certaines universités, comme Science Po en janvier 2023, ont interdit l'utilisation de l'IA, tandis que d'autres, comme l'Université de Prague, la considèrent comme du plagiat. Cette diversité de positions souligne la nécessité urgente d'une réponse institutionnelle pour encadrer ces usages et prévenir les risques de triche et de plagiat.
Enquête Nationale
Pour mieux comprendre ces dynamiques, une enquête nationale intitulée "L'IA dans l'enseignement" a été réalisée. Les auteurs de cette enquête sont Le Sphynx (sondage) et Compilatio (fraude académique). Elle a été diffusée dans les universités de Lyon et d'Aix-Marseille entre le 21 juin et le 15 août 2023, touchant 1242 enseignants et 4443 étudiants. Les questionnaires, conçus pour étudier les usages de l'IA et les représentations de ces usages, abordaient des thèmes comme les craintes, les opportunités et l'acceptabilité.
Résultats de l'Enquête
Les résultats montrent que 55 % des étudiants utilisent l'IA de manière occasionnelle ou fréquente, contre 34 % des enseignants. Cependant, 88 % des enseignants pensent que leurs étudiants utilisent l'IA, ce qui pourrait indiquer une surestimation des usages. Les usages identifiés incluent la recherche d'informations et la rédaction de textes, bien que ces réponses ne puissent pas être cumulées dans les choix proposés.
Analyse Critique
Une analyse plus approfondie révèle que les enseignants peinent à percevoir les bénéfices de l'IA pour l'apprentissage, contrairement aux étudiants. La question de savoir si l'IA améliore les notes sans développer les compétences reste débattue. Est-ce un dopage académique ou une opportunité pour un apprentissage plus efficace ?
Acceptabilité et Éthique
L'enquête révèle que beaucoup d'étudiants jugent acceptable d'utiliser l'IA pour rédiger leurs devoirs, et même un quart des enseignants partagent cet avis. Cela pose des questions éthiques cruciales : copier-coller est-il tricher ? Utiliser l'IA sous supervision ou pour des traductions est-il acceptable ? La réponse n'est pas simple et nécessite un débat ouvert.
Propositions et Solutions
Pour encadrer ces usages, plusieurs solutions sont proposées. Plutôt que d'interdire l'IA, il est suggéré de fixer des règles pour une utilisation responsable. Des innovations pédagogiques peuvent également être explorées, comme la création de situations de concurrence professionnelle ou l'utilisation de détecteurs d'IA.
Conclusion
En conclusion, bien que l'étude présente des limites, elle souligne un besoin urgent de régulation. Une charte institutionnelle pourrait fournir un cadre pour une utilisation éthique.
Serveur web / Base de donnees Langages de développementLudovic REUS
Une présentation des outils et technologies de l'information et de la communication.
Les serveurs webs et leur marché à ce jour
Les base de données relationnelles et NoSQL
Les langages de développements informatiques
L'ABES a pour métier la gestion des métadonnées bibliographiques de l'enseignement supérieur français. Soit elle les récupère auprès de fournisseurs (autres catalogues, éditeurs), soit elle coordonne leur production par le réseau des bibliothèques universitaires.
Depuis 2008 et surtout 2010, l'ABES mise sur le web sémantique. Comme d'autres, elle a d'abord décidé de partager et de lier ses métadonnées sur le web de données. Cela concerne tous ses catalogues : le catalogue général Sudoc, le catalogue des archives et des manuscrits Calames, le catalogue theses.fr et sa base-référentiel de personnes, collectivités, concepts... IdRef. Ce travail d'ouverture est toujours en cours, car le principal format natif à traduire en RDF, appelé MARC, est très riche, et même touffu. Pour l'instant, l'exposition en RDF se fait à la volée, à partir d'une base XML qui stocke du MARC en XML. Passer à un triplestore semble tentant, mais on résiste... tout en cherchant une solution pour devenir interrogeable en SPARQL.
A partir de 2013, l'ABES a commencé à utiliser RDF comme pivot pour agréger et traiter des métadonnées fournies par des des tiers sous des formes très variées. Il s'agit donc de commencer à travailler en RDF, et plus seulement de l'utiliser en sortie.
Aujourd'hui, on commence à réfléchir à l'avenir des outils de production de métadonnées du réseau Sudoc. Là encore, faut-il aller vers du RDF natif ? Tout en retraçant ce cheminement qui touche tous les aspects de nos expertises et applications métier, nous tenterons d'expliciter les contraintes et les principes directeurs qui déterminent nos actions et nos interrogations.
Une base de données, pourquoi faire ? Le SQL, c’est quoi ce langage ? Un DBA, ça sert à quoi ? Cette session est là pour démystifier la base de données du point de vue des développeurs. Au programme : des bonnes pratiques, de la méthodologie, quelques tips techniques… De quoi rapprocher les développeurs et les DBA.
La formation complète est disponible ici:
http://www.alphorm.com/tutoriel/formation-en-ligne-mongodb-administration
Cette formation vous apprendra à maîtriser le système de gestion de base de données MongoDB.
Durant cette formation vous appréhenderez le fonctionnement du moteur MongoDB, à administrer mongoDB au quotidien (collection, document, sauvegarde, sécurité) et à mettre en œuvre une solution de haute disponibilité avec le système de Replica Set.
Vous apprendrez également à mettre en œuvre une solution performante pour la montée en charge avec la fonctionnalité avancée du Sharding.
Ce cours vous permettra également d'optimiser vos bases de données MongoDB par la mise en place d'une indexation optimale.
Nouvelles opportunités pour les données fortement interconnectées : La base d...Cédric Fauvet
Si vous vous arrachez les cheveux avec de nombreuses jointures et les procédures stockées complexes il est fort possible que vous soyez en train de construire un graphe sans le savoir car les graphes sont partout. Depuis l'ajout d'une couche sociale aux applications web jusqu'à l'analyse d'impact sur un réseau Telecom en passant par la recherche en Biologie, de nombreuses organisations ont adopté les bases de données de graphes et leur modèle de données parfaitement adapté aux requêtes complexes et hautement connectées tout en garantissant des performances exceptionnelles.
Découvrez avec nous ce qu'apporte la puissance de Neo4j à une large variété de clients tels que Adobe, Cisco, Deutsche Telekom, Viadeo ou Glowbl.
MongoDB in a scale-up: how to get away from a monolithic hell — MongoDB Paris...Horgix
This is the slide deck of a talk by Alexis "Horgix" Chotard and Laurentiu Capatina presented at the MongoDB Paris User Group in June 2024 about the feedback on how PayFit move away from a monolithic hell of a self-hosted MongoDB cluster to managed alternatives. Pitch below.
March 15, 2023, 6:59 AM: a MongoDB cluster collapses. Tough luck, this cluster contains 95% of user data and is absolutely vital for even minimal operation of our application. To worsen matters, this cluster is 7 years behind on versions, is not scalable, and barely observable. Furthermore, even the data model would quickly raise eyebrows: applications communicating with each other by reading/writing in the same MongoDB documents, documents reaching the maximum limit of 16MiB with hundreds of levels of nesting, and so forth. The incident will last several days and result in the loss of many users. We've seen better scenarios.
Let's explore how PayFit found itself in this hellish situation and, more importantly, how we managed to overcome it!
On the agenda: technical stabilization, untangling data models, breaking apart a Single Point of Failure (SPOF) into several elements with a more restricted blast radius, transitioning to managed services, improving internal accesses, regaining control over risky operations, and ultimately, approaching a technical migration when it impacts all development teams.
L'IA connaît une croissance rapide et son intégration dans le domaine éducatif soulève de nombreuses questions. Aujourd'hui, nous explorerons comment les étudiants utilisent l'IA, les perceptions des enseignants à ce sujet, et les mesures possibles pour encadrer ces usages.
Constat Actuel
L'IA est de plus en plus présente dans notre quotidien, y compris dans l'éducation. Certaines universités, comme Science Po en janvier 2023, ont interdit l'utilisation de l'IA, tandis que d'autres, comme l'Université de Prague, la considèrent comme du plagiat. Cette diversité de positions souligne la nécessité urgente d'une réponse institutionnelle pour encadrer ces usages et prévenir les risques de triche et de plagiat.
Enquête Nationale
Pour mieux comprendre ces dynamiques, une enquête nationale intitulée "L'IA dans l'enseignement" a été réalisée. Les auteurs de cette enquête sont Le Sphynx (sondage) et Compilatio (fraude académique). Elle a été diffusée dans les universités de Lyon et d'Aix-Marseille entre le 21 juin et le 15 août 2023, touchant 1242 enseignants et 4443 étudiants. Les questionnaires, conçus pour étudier les usages de l'IA et les représentations de ces usages, abordaient des thèmes comme les craintes, les opportunités et l'acceptabilité.
Résultats de l'Enquête
Les résultats montrent que 55 % des étudiants utilisent l'IA de manière occasionnelle ou fréquente, contre 34 % des enseignants. Cependant, 88 % des enseignants pensent que leurs étudiants utilisent l'IA, ce qui pourrait indiquer une surestimation des usages. Les usages identifiés incluent la recherche d'informations et la rédaction de textes, bien que ces réponses ne puissent pas être cumulées dans les choix proposés.
Analyse Critique
Une analyse plus approfondie révèle que les enseignants peinent à percevoir les bénéfices de l'IA pour l'apprentissage, contrairement aux étudiants. La question de savoir si l'IA améliore les notes sans développer les compétences reste débattue. Est-ce un dopage académique ou une opportunité pour un apprentissage plus efficace ?
Acceptabilité et Éthique
L'enquête révèle que beaucoup d'étudiants jugent acceptable d'utiliser l'IA pour rédiger leurs devoirs, et même un quart des enseignants partagent cet avis. Cela pose des questions éthiques cruciales : copier-coller est-il tricher ? Utiliser l'IA sous supervision ou pour des traductions est-il acceptable ? La réponse n'est pas simple et nécessite un débat ouvert.
Propositions et Solutions
Pour encadrer ces usages, plusieurs solutions sont proposées. Plutôt que d'interdire l'IA, il est suggéré de fixer des règles pour une utilisation responsable. Des innovations pédagogiques peuvent également être explorées, comme la création de situations de concurrence professionnelle ou l'utilisation de détecteurs d'IA.
Conclusion
En conclusion, bien que l'étude présente des limites, elle souligne un besoin urgent de régulation. Une charte institutionnelle pourrait fournir un cadre pour une utilisation éthique.
Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)Laurent Speyser
(Conférence dessinée)
Vous êtes certainement à l’origine, ou impliqué, dans un changement au sein de votre organisation. Et peut être que cela ne se passe pas aussi bien qu’attendu…
Depuis plusieurs années, je fais régulièrement le constat de l’échec de l’adoption de l’Agilité, et plus globalement de grands changements, dans les organisations. Je vais tenter de vous expliquer pourquoi ils suscitent peu d'adhésion, peu d’engagement, et ils ne tiennent pas dans le temps.
Heureusement, il existe un autre chemin. Pour l'emprunter il s'agira de cultiver l'invitation, l'intelligence collective , la mécanique des jeux, les rites de passages, .... afin que l'agilité prenne racine.
Vous repartirez de cette conférence en ayant pris du recul sur le changement tel qu‘il est généralement opéré aujourd’hui, et en ayant découvert (ou redécouvert) le seul guide valable à suivre, à mon sens, pour un changement authentique, durable, et respectueux des individus! Et en bonus, 2 ou 3 trucs pratiques!
Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...OCTO Technology
Par Nicolas Bordier (Consultant numérique responsable @OCTO Technology) et Alaric Rougnon-Glasson (Sustainable Tech Consultant @OCTO Technology)
Sur un exemple très concret d’audit d’éco-conception de l’outil de bilan carbone C’Bilan développé par ICDC (Caisse des dépôts et consignations) nous allons expliquer en quoi l’ACV (analyse de cycle de vie) a été déterminante pour identifier les pistes d’actions pour réduire jusqu'à 82% de l’empreinte environnementale du service.
Vidéo Youtube : https://www.youtube.com/watch?v=7R8oL2P_DkU
Compte-rendu :
1. Étude comparative entre le SQL et le NoSQL
avec deux moteurs de recherche
spécifiques du domaine biomédical
UNIVERSITE DE JENDOUBA
Institut Supérieur d’Informatique de Kef
Mastere de Recherche
Réalisé par: Hajer MHIMDI Encadré par : Dr. Saoussen SAKJI
Année universitaire 2017/2018
4. 4
Les bases de données
se sont bien améliorés
dans le modèle
relationnel. Ils ont
connu une tendance et
des résultats
spectaculaires par
rapport à l’existant
01
Avec l’augmentation
exponentielle des
données, plusieurs
utilisateurs des
SGBDR veulent
migrer vers les
nouvelles
technologies NoSQL
02
Introduction
Conclusion&perspectivesL’étudecomparativeLeNoSQLLeModèlerelationnelIntroduction&problématique
5. LeNoSQLLeModèlerelationnelL’étudecomparativeConclusion&perspectivesIntroduction&problématique
L’objectif de la recherche : Une étude comparative et
objective entre le modèle SQL et le NoSQL dans le domaine
biomédical pour mesurer cette évolution
■ Quel impact a la « dé-relatinisation » des entités sur la RI
lorsqu’on manipule un modèle complexe avec plusieurs
entités reliées entre elles et que l’on doit parcourir avec des
sous-ensembles importants à unifier ou à exclure.
Problématique & Objectif
5
7. Le modèle relationnel : Concepts de base
■ Développé dans les années 70 par Ted Codd chez IBM
■ Héberge les données dans des tables dont les colonnes sont de type
strictement définie
■ Les tables peuvent être liées entre elles par des relations
■ L’interrogation des données repose sur un langage standardisées, le
SQL
■ Les transactions respectent le plus souvent les principes ACID
7
LeNoSQLL’étudecomparativeConclusion&perspectivesLeModèlerelationnelIntroduction&problématique
8. Principe ACID
Atomicité
• Lors d’une transaction toutes les modifications doivent être
couronnées de succès, sinon aucune de ces modifications n’est
validée.
Cohérence
• Une transaction n’est validée que si toutes les règles en vigueur sont
respectées (types de données, contraintes, etc.)
Isolation
• Une transaction ne peut affecter d’autres transactions
Durabilité
• Après validation, les données sont enregistrées de manière durable,
indépendamment d’erreurs, de crashs ou d’autres
dysfonctionnements
8
Conclusion&perspectivesL’étudecomparativeLeNoSQLIntroduction&problématiqueLeModèlerelationnel
9. Les avantages
■ Indépendance du mode de stockage
■ Cohérence des données
■ Pas de redondances
■ Repose sur l’algèbre relationnelle, dérivée de la théorie des
ensembles
■ Modèle de loin plus largement utilisé, notamment par toute
une série de logiciels SGBD (Oracle, DB2, PostgreSQL,
SQLite,… etc)
9
Introduction&problématiqueLeNoSQLL’étudecomparativeConclusion&perspectivesLeModèlerelationnel
10. Les inconvénients
10
Introduction&problématiqueLeNoSQLL’étudecomparativeConclusion&perspectives
■ Accroissement des coûts et de la complexité
■ Pas de traitement des objets complexes
■ Incapacité de gérer de très grands volumes de données
■ Impossibilité de gérer des débits extrêmes
■ Performance limitée dans un contexte distribué
■ Limite avec le langage de manipulation
■ Pour certains éditeurs, le prix de licence est élevé
LeModèlerelationnel
13. 13
■ Développé dès la fin des années 90
■ Distribution sur des groupes de serveurs
■ Formes de stockage de données différentes
■ Répondre aux questions de maintien des performances des
services WEB
■ Gérant de gros systèmes de données relativement plus complexes
■ Pas de support de jointures
■ Pas de support, du moins à l’origine, du langage SQL
■ Tendent à ne pas implémenter ACID
L’arrivée de NoSQL
Conclusion&perspectivesL’étudecomparativeLeNoSQLLeModèlerelationnelIntroduction&problématique
14. 14
LeModèlerelationnelIntroduction&problématiqueConclusion&perspectivesL’étudecomparativeLeNoSQL
Le théorème CAP
■ Eric Brewer, 2000 :
■ Cohérence (C) : Tous les nœuds du
système accèdent exactement aux
mêmes données au même moment
■ Disponibilité (A) : Garantie que toutes
les requêtes reçoivent une réponse
quant à leur succès ou échec
■ Tolérance aux partitionnement (P) :
Le système reste fonctionnel en cas des
ruptures de communication
(Coherence)
(C)
(Partition
tolerance)
(P)
(Availability)
(A)
21. 21
LeNoSQLLeModèlerelationnelIntroduction&problématiqueConclusion&perspectivesL’étudecomparative
■ Le CISMeF, Catalogue et Index des Sites Médicaux de langue Française
■ Un portail qui recense les principales ressources institutionnelles de santé
francophones disponibles sur internet
■ Ses objectifs:
■ Assister les professionnels de santé et le grand public dans leur quêtes
d’information sur le web
■ Améliorer la recherche d’information
■ Indexer les sites et les ressources d’information avec le thésaurus MeSH
(Medical Subject Headings)
Qu’est ce que CISMeF
23. Besoin d’information
Formulation de la
requête
Requête
correspondance
Documents indexés
indexation
documents
Documents trouvés
Retours de
l’utilisateur
Processus général de la recherche d’information 23
Conclusion&perspectivesL’étudecomparativeIntroduction&problématiqueLeModèlerelationnelLeNoSQL
La recherche d’information
25. 25
■ LiSSa appliqué sur NoSQL
■ Ressource: https://www.lissa.fr (1223066 ressources scientifiques)
Conclusion&perspectivesL’étudecomparativeLeNoSQLLeModèlerelationnelIntroduction&problématique
La recherche d’information
26. 26
■ Types de recherche DOC’CISMeF/LiSSa :
■ La recherche simple
Seul terme / expression
Principaux champs (au, ap, mc, mt, tr, tc, ti, la, ur, nu, upd,…)
■ La recherche avancée
Le produit logique ET (AND en anglais)
L’intersection des documents retournés de requête
La somme logique OU (OR en anglais)
L’union des documents retournés de requête
La différence logique SAUF (NOT en anglais)
La recherche d’information
Conclusion&perspectivesL’étudecomparativeLeNoSQLLeModèlerelationnelIntroduction&problématique
27. 27
Conclusion&perspectivesL’étudecomparativeLeNoSQLLeModèlerelationnelIntroduction&problématique
Étude de cas
■ Les requêtes ont été construites par des spécialistes (2
documentalistes/pharmacienne)
■ Le gain et la perte de chaque requête selon la formule suivante:
■ Le rapport du temps d’exécution de SQL par rapport au NoSQL selon la
formule suivante :
Gain/Perte (%) = ((Temps d'exécution SQL - Temps
d'exécution NoSQL)/Temps d'exécution SQL)*100
Facteur = Temps d'exécution SQL / Temps
d'exécution NoSQL
33. Effectué la requête 2
corps de lewy.mc
33
LeNoSQLLeModèlerelationnelIntroduction&problématiqueConclusion&perspectivesL’étudecomparative
Étude 1 (R2) corps de lewy.mc
LiSSa est plus rapide que Doc’CISMeF, et bien que le corpus LiSSa est
plus grand on a un nombre de réponses moins important et moins
pertinent. Car, Lissa a envoyé un seul document parmi 20 qui est vraiment
pertinent (Précision(R2) = 1/20= 0.05), par rapport à Doc’CISMeF qui a
envoyé les deux documents pertinents et sont dans le thème (Précision(R2) =
2/2 =1).
34. Effectué la requête 6
(Disciplines et professions.mc
ET diverticule du côlon.mc )
SAUF pneumologie.mt
Effectué la requête 5
(diverticule du côlon.mc ET
phénomènes.tc) SAUF
2011.an
34
LeNoSQLLeModèlerelationnelIntroduction&problématiqueConclusion&perspectivesL’étudecomparative
Étude 6 (R5) (diverticule du côlon.mc
ET phénomènes.tc) SAUF
2011.an
35. Effectué la requête 6
(Disciplines et professions.mc
ET diverticule du côlon.mc )
SAUF pneumologie.mt
35
LeNoSQLLeModèlerelationnelIntroduction&problématiqueConclusion&perspectivesL’étudecomparative
Étude 6 (R6) (Disciplines et
professions.mc ET diverticule
du côlon.mc ) SAUF
pneumologie.mt
Les temps d’exécution de Doc’CISMeF sont plus rapides que LiSSa, tous les
documents retournés de Doc’CISMeF sont pertinents (Précision(R5) = 1/1=1 et
Précision(R6) = 2/2=1), cependant LiSSa a retourné dans chacune des deux
requêtes que les 9 premiers documents qui sont dans le thème (Précision(R5) =
9/39=0.23 et Précision(R6) = 9/37=0.24).
36. Effectué la requête 1
(roche.au OU asthénie.mc ) ET
agents cardiovasculaires/usage
thérapeutique.mc
36
LeNoSQLLeModèlerelationnelIntroduction&problématiqueConclusion&perspectivesL’étudecomparative
Étude 8 (R1) (roche.au OU
asthénie.mc ) ET agents
cardiovasculaires/usage
thérapeutique.mc
Doc’CISMeF est plus rapide que LiSSa.
il a retourné un seul document qui est vraiment pertinent
(Précision(R1) = 1/1=1) par rapport à LiSSa qui a retourné un
seul document pertinent parmi 14 (Précision(R1)
=1/14=0.07).
37. Effectué la requête 1
(produits dermatologiques.mc ET
diclofenac.mc) OU (diclofenac.mc ET
maladies de la peau/traitement
médicamenteux.mc)
37
Conclusion&perspectivesIntroduction&problématiqueLeModèlerelationnelL’étudecomparativeLeNoSQL
Étude 14
(R1) (produits dermatologiques.mc
ET diclofenac.mc) OU
(diclofenac.mc ET maladies de la
peau/traitement
médicamenteux.mc)
38. Effectué la requête 14
(acétaminophène.mc et association
médicamenteuse.mc et
douleur/thérapie.mc) sauf (hypnotiques
et sédatifs.mc ou tranquillisants.mc ou
analgésiques morphiniques.mc ou acide
acétylsalicylique.mc)
38
Conclusion&perspectivesIntroduction&problématiqueLeModèlerelationnelL’étudecomparativeLeNoSQL
Étude 14 (R10) (acétaminophène.mc et
association médicamenteuse.mc et
douleur/thérapie.mc) sauf
(hypnotiques et sédatifs.mc ou
tranquillisants.mc ou analgésiques
morphiniques.mc ou acide
acétylsalicylique.mc)
on a choisi les deux requêtes 1 et 10 selon leurs complexités
et pour ce cas Doc’CISMeF est plus pertinent
(Précision(R1) = 2/3=0.66 et Précision(R10) =6/8=0.75)
que LiSSa (Précision(R1) =1/2=0.5 et Précision(R10) =
4/8=0.5).
39. 39
• NoSQL meilleur
• NoSQL plus flexible
Plusieurs travaux
Modèle relationnel
Ce n’est pas toujours vrai Dépend du domaine
SQL est plus pertinent et plus accéléré que le NoSQL.
Ainsi que le NoSQL avec LiSSa a généré plus de bruit
que de pertinence.
Le domaine biomédical
Discussion
Conclusion&perspectivesL’étudecomparativeLeNoSQLLeModèlerelationnelIntroduction&problématique
42. 42
Conclusion&perspectivesL’étudecomparativeLeNoSQLLeModèlerelationnelIntroduction&problématique
Conclusion & perspectives
■ Jeu de requêtes plus important et plus complexe
■ Détecter le profil de l’utilisateur pour étudier la complexité des
requêtes
■ Étaler la comparaison dans toutes les études et toutes les requêtes,
même qui ont une différence des résultats assez importante
■ Étudier des requêtes avec d’autres abréviations à savoir : Mot
réservé, Nom commercial de médicaments, URL et Date de
création ou de mise à jour ….