Introduction sur les domaines scientifiques impliqués dans la fouille de textes
- TAL et fouille de données : En quoi les données textuelles sont particulières (lexique, syntaxe mais aussi diversité langagière, des formats, des entités, des méta-données etc.) et quels sont les types de ressources utiles ou disponibles.
- Des modèles et des tâches (analyse grammaticale, désambiguisation, similarité textuelle, recherche et extraction d'information, classification...) et des collections standard pour évaluer des modèles et des outils
- Les approches automatisées sont associées à différentes manières de travailler les corpus (règles manuelles, apprentissage et bases d'exemples, degrés de supervision humaine, ...) : avantages / inconvénients, risques ...
Panorama méthodologique de l'offre logicielle académique ou commerciale
- Des outils pour l'utilisateur final, des APIs pour le développement, des plateformes d'annotation pour la création de bases d'apprentissage, des outils pour écrire des règles symboliques
- Des outils logiciels plus ou moins interactifs
The document is a seminar presentation on the Unified Medical Language System (UMLS). It defines UMLS as a compendium of controlled biomedical vocabularies that provides a mapping structure between them to allow translation. UMLS was started in 1986 at the National Library of Medicine as a long-term research project to develop tools for understanding medical meaning across systems and to facilitate information retrieval and communication between different medical systems and literature. It consists of three main knowledge sources - the Metathesaurus, Semantic Network, and SPECIALIST Lexicon - which can be accessed remotely through terminology services browsers and downloads or locally using subset browsers.
This document discusses collaborative information retrieval models based on users' domain expertise and roles. It presents two main types of models:
1. Domain expertise-based CIR models that personalize collaborative rankings based on a vertical/horizontal distinction of users' domain expertise levels.
2. User-driven system-mediated CIR models that adapt the system's mediation based on users' predefined or dynamically determined roles during collaboration. These models aim to better support collaborators' behaviors, strategies and division of labor.
The document provides an overview and comparison of these expertise-based and role-based CIR models, highlighting how they leverage different evidence sources like relevance feedback or user behaviors to optimize collaborative search. It contributes to the research by
IRIT at clef 2015: A product search model for head queriesLamjed Ben Jabeur
We describe in this paper our participation in the product search task of LL4IR CLEF 2015 Lab. This task aims to evaluate, with living labs protective point of view,
the retrieval effectiveness over e-commerce search engines. During the online shopping process, users would search for interesting products and quickly access those that fit with their needs among a long tail of similar or closely related products. Our contribution addresses head queries that are frequently submitted on e-commerce Web sites. Head queries usually target featured products with several variations, accessories, and complementary products. We propose a probabilistic model for product search based on the intuition that descriptive fields and the category might fit with the query.
Finaly, we present results obtained during the second round of the product search task.
Introduction sur les domaines scientifiques impliqués dans la fouille de textes
- TAL et fouille de données : En quoi les données textuelles sont particulières (lexique, syntaxe mais aussi diversité langagière, des formats, des entités, des méta-données etc.) et quels sont les types de ressources utiles ou disponibles.
- Des modèles et des tâches (analyse grammaticale, désambiguisation, similarité textuelle, recherche et extraction d'information, classification...) et des collections standard pour évaluer des modèles et des outils
- Les approches automatisées sont associées à différentes manières de travailler les corpus (règles manuelles, apprentissage et bases d'exemples, degrés de supervision humaine, ...) : avantages / inconvénients, risques ...
Panorama méthodologique de l'offre logicielle académique ou commerciale
- Des outils pour l'utilisateur final, des APIs pour le développement, des plateformes d'annotation pour la création de bases d'apprentissage, des outils pour écrire des règles symboliques
- Des outils logiciels plus ou moins interactifs
The document is a seminar presentation on the Unified Medical Language System (UMLS). It defines UMLS as a compendium of controlled biomedical vocabularies that provides a mapping structure between them to allow translation. UMLS was started in 1986 at the National Library of Medicine as a long-term research project to develop tools for understanding medical meaning across systems and to facilitate information retrieval and communication between different medical systems and literature. It consists of three main knowledge sources - the Metathesaurus, Semantic Network, and SPECIALIST Lexicon - which can be accessed remotely through terminology services browsers and downloads or locally using subset browsers.
This document discusses collaborative information retrieval models based on users' domain expertise and roles. It presents two main types of models:
1. Domain expertise-based CIR models that personalize collaborative rankings based on a vertical/horizontal distinction of users' domain expertise levels.
2. User-driven system-mediated CIR models that adapt the system's mediation based on users' predefined or dynamically determined roles during collaboration. These models aim to better support collaborators' behaviors, strategies and division of labor.
The document provides an overview and comparison of these expertise-based and role-based CIR models, highlighting how they leverage different evidence sources like relevance feedback or user behaviors to optimize collaborative search. It contributes to the research by
IRIT at clef 2015: A product search model for head queriesLamjed Ben Jabeur
We describe in this paper our participation in the product search task of LL4IR CLEF 2015 Lab. This task aims to evaluate, with living labs protective point of view,
the retrieval effectiveness over e-commerce search engines. During the online shopping process, users would search for interesting products and quickly access those that fit with their needs among a long tail of similar or closely related products. Our contribution addresses head queries that are frequently submitted on e-commerce Web sites. Head queries usually target featured products with several variations, accessories, and complementary products. We propose a probabilistic model for product search based on the intuition that descriptive fields and the category might fit with the query.
Finaly, we present results obtained during the second round of the product search task.
Unified Medical Language System & MetaMapOsama Jomaa
UMLS is a metathesaurus that facilitates the development of computer systems that behave as if they "understand"
the meaning of the language of biomedicine
and health. It comprises a controlled vocabulary, semantic network and specialist lexicon and lexical tools. MetaMap is a tool for recognizing UMLS concepts in text
This document discusses techniques for analyzing and summarizing medical images using language modeling. It presents several technical contributions, including multi-scale texture description using wavelet and Riesz transforms, developing a visual grammar from bags of visual words, and detecting regions of interest using geodesic operations. Experiments are described applying these methods to analyze texture in 2D and 3D medical images from datasets of lung CT and brain MRI scans.
This document provides an overview of a company called QualityMetric that offers health surveys and tools for capturing patient-reported outcomes. It discusses QualityMetric's smart measurement system which allows for health surveys to be administered and scored via various modes including phone, online, paper, and mobile devices. It also describes how QualityMetric's tools can be used to monitor population health metrics like disease burden, risk prediction, cost-benefit analysis, and program evaluation. The document concludes with a case study of Alberta Health Services which used QualityMetric's surveys and reporting features to evaluate outcomes of diabetes and obesity management programs.
Medical Information Retrieval and its Evaluation: an Overview of CLEF eHealth...lorrainegoeuriot
Talk given at the International Workshop on Knowledge Discovery from (Big) Text: Challenges and Opportunities when Mining Biomedical Text in Leuven on the 18th of May 2015
This document discusses challenges with a data science project including the experimental and unpredictable nature, difficulties with scheduling due to unknown completion times, proposing new products with data and technology limitations, and addressing failures by breaking the work into smaller pieces with increased visibility and producing functional interim results to stay on track.
Quels facteurs de pertinence pour la recherche de produits e-commerce ?Lamjed Ben Jabeur
Laure Soulier, Lamjed Ben Jabeur, Paul Mousset, Lynda Tamine. Quels facteurs de pertinence pour la recherche de produits e-commerce ?. Dans : Conférence francophone en Recherche d'Information et Applications (CORIA 2016), Toulouse, 09/03/2016-11/03/2016, Association Francophone de Recherche d'Information et Applications (ARIA), p. 415-430, mars 2016. https://www.irit.fr/publis/SIG/2016_CORIA_SOULIER.pdf
Un moteur de recherche e-commerce vise à fournir un accès rapide et efficace à des produits qui correspondent aux besoins et aux préférences de l'utilisateur parmi une liste de produits similaires ou étroitement liés. Nous avons participé à la campagne d'évaluation « Living Lab for Information Retrieval » qui proposait une tâche de recherche de produits évaluée par des utilisateurs réels lors de scénarios de recherche réelle sur un site de e-commerce. L’évaluation expérimentale a montré des résultats prometteurs de notre modèle. Dans ce papier, nous proposons une analyse des fichiers logs issus de notre modèle afin d'identifier des facteurs d’efficacité liés à la requête et aux produits. L'objectif de cette étude est d'ouvrir des pistes de recherche pour la formalisation de modèles de recherche de produits.
E-commerce product retrieval aims to provide a quick and efficient access to products that fit user’s needs and preferences among a tail of similar or closely related products. We participated to the ``Living Lab for Information Retrieval'' evaluation campaign devoted to a product search task in which real users evaluated participants' retrieval models in real search scenarios on e-commerce websites. The experimental evaluation has shown encouraging results for our proposed model. In this paper, we conduct an analysis of users' feeadback with respect to the clicks obtained by our model. The goal of the paper is therefore to identify the effectiveness factors underlying the user's queries and the retrieved products in order to open perspectives in the formalization of product search models.
INTRODUCTION TO INFORMATION RETRIEVAL
This lecture will introduce the information retrieval problem, introduce the terminology related to IR, and provide a history of IR. In particular, the history of the web and its impact on IR will be discussed. Special attention and emphasis will be given to the concept of relevance in IR and the critical role it has played in the development of the subject. The lecture will end with a conceptual explanation of the IR process, and its relationships with other domains as well as current research developments.
INFORMATION RETRIEVAL MODELS
This lecture will present the models that have been used to rank documents according to their estimated relevance to user given queries, where the most relevant documents are shown ahead to those less relevant. Many of these models form the basis for many of the ranking algorithms used in many of past and today’s search applications. The lecture will describe models of IR such as Boolean retrieval, vector space, probabilistic retrieval, language models, and logical models. Relevance feedback, a technique that either implicitly or explicitly modifies user queries in light of their interaction with retrieval results, will also be discussed, as this is particularly relevant to web search and personalization.
Accès à l’information dans les réseaux sociaux : quelles formes de collaborat...Lamjed Ben Jabeur
Nous présentons dans cet article une analyse exploratoire dans l’objectif d’identifier les patrons de collaboration au sein des réseaux sociaux pour l’accès à l’information. Nous nous focalisons sur le cas de la gestion de crise au travers de la plateforme sociale Twitter. Nous nous appuyons ainsi sur deux types de crises : une catastrophe naturelle (l’ouragan Sandy) et une crise sanitaire (Ebola). Nous proposons une méthodologie en trois étapes qui permet 1) d’analyser les structures de collaboration, 2) d’identifier les thématiques de collaboration et 3) de présenter les réseaux latents de collaboration sur l’ensemble du réseau. Les résultats montrent paradoxalement que le périmètre de la collaboration est réduit, que les sujets sousjacents sont diversifiés et impliquent des utilisateurs qui peuvent être à l’interface de différents sujets.
Définition et évaluation de modèles d'agrégation pour l'estimation de la pert...Bilel Moulahi
Présentation de thèse intitulée : Définition et évaluation de modèles d'agrégation pour l'estimation de la pertinence multi-dimensionnelle en recherche d'information
Thèse soutenue le 11/12/2015 à l'IRIT (UPS, Toulouse)
Télécharger la présentation (.pptx) : http://www.irit.fr/publis/SIG/Presentation_thesis_Moulahi_2015.pptx
Télécharger la thèse : http://www.irit.fr/publis/SIG/Thesis_Moulahi_2015.pdf
Este documento presenta tres valores fundamentales para ser ciudadanos democráticos: la solidaridad, el respeto y la discusión haciendo uso de la razón. Propone actividades para que los estudiantes reflexionen sobre estos valores a través de ejercicios prácticos como identificar situaciones donde se requiere solidaridad y realizar crucigramas sobre derechos humanos.
Monitoreo.Net es una empresa dedicada a desarrollar planes estratégicos para garantizar el éxito y sostenibilidad de sus clientes a través del monitoreo de medios. Su misión es lograr el crecimiento rentable de sus clientes de manera innovadora y su visión es ser reconocida en 2020 por sus buenas prácticas éticas. Sus objetivos incluyen mantenerse informados de las noticias relevantes para sus clientes y permanecer a la vanguardia técnica.
Este documento describe cómo enseñar música a niños de segundo grado a través del juego. Explica que la música implica más que enseñar canciones y debe abarcar audición, interpretación y creación. Luego presenta tres actividades musicales basadas en juegos para desarrollar sensibilidad auditiva, reconocimiento de instrumentos y atención musical. El objetivo final es que los niños aprendan música de una manera divertida y permanente.
Este documento presenta un tutorial básico sobre PowerPoint. Explica cómo elegir el formato de las diapositivas al abrir una nueva presentación, incluidas las opciones de diapositivas en blanco, con título o con gráficos. También cubre cómo crear diapositivas, guardar la presentación en una ubicación deseada y utilizar diferentes funciones como cuadros de texto e iconos en la barra de herramientas.
El documento describe el municipio de Tlachichuca en el estado de Puebla, México. Habla sobre su ubicación, historia, topografía, hidrografía, clima, ecosistemas y recursos naturales. El municipio tiene una superficie de 459 km2 y limita con otros municipios de Puebla y Veracruz. Su relieve incluye el volcán Citlaltépetl, la sierra de Quimixtlán y llanuras. Sus ríos son tributarios del río Jamapa. Su clima y vegetación varían de templado a fr
Etude de visualisation des données selon le modèle LRM - Journée professionne...ABES
Etude de visualisation des données selon le modèle LRM
Présentation lors de la 4e journée professionnelle du groupe Systèmes & Données (BnF, 15 novembre 2019) du programme Transition Bibliographique : N’oubliez pas les données d’autorité
Raphaëlle Poveda, Maité Roux - Abes
Unified Medical Language System & MetaMapOsama Jomaa
UMLS is a metathesaurus that facilitates the development of computer systems that behave as if they "understand"
the meaning of the language of biomedicine
and health. It comprises a controlled vocabulary, semantic network and specialist lexicon and lexical tools. MetaMap is a tool for recognizing UMLS concepts in text
This document discusses techniques for analyzing and summarizing medical images using language modeling. It presents several technical contributions, including multi-scale texture description using wavelet and Riesz transforms, developing a visual grammar from bags of visual words, and detecting regions of interest using geodesic operations. Experiments are described applying these methods to analyze texture in 2D and 3D medical images from datasets of lung CT and brain MRI scans.
This document provides an overview of a company called QualityMetric that offers health surveys and tools for capturing patient-reported outcomes. It discusses QualityMetric's smart measurement system which allows for health surveys to be administered and scored via various modes including phone, online, paper, and mobile devices. It also describes how QualityMetric's tools can be used to monitor population health metrics like disease burden, risk prediction, cost-benefit analysis, and program evaluation. The document concludes with a case study of Alberta Health Services which used QualityMetric's surveys and reporting features to evaluate outcomes of diabetes and obesity management programs.
Medical Information Retrieval and its Evaluation: an Overview of CLEF eHealth...lorrainegoeuriot
Talk given at the International Workshop on Knowledge Discovery from (Big) Text: Challenges and Opportunities when Mining Biomedical Text in Leuven on the 18th of May 2015
This document discusses challenges with a data science project including the experimental and unpredictable nature, difficulties with scheduling due to unknown completion times, proposing new products with data and technology limitations, and addressing failures by breaking the work into smaller pieces with increased visibility and producing functional interim results to stay on track.
Quels facteurs de pertinence pour la recherche de produits e-commerce ?Lamjed Ben Jabeur
Laure Soulier, Lamjed Ben Jabeur, Paul Mousset, Lynda Tamine. Quels facteurs de pertinence pour la recherche de produits e-commerce ?. Dans : Conférence francophone en Recherche d'Information et Applications (CORIA 2016), Toulouse, 09/03/2016-11/03/2016, Association Francophone de Recherche d'Information et Applications (ARIA), p. 415-430, mars 2016. https://www.irit.fr/publis/SIG/2016_CORIA_SOULIER.pdf
Un moteur de recherche e-commerce vise à fournir un accès rapide et efficace à des produits qui correspondent aux besoins et aux préférences de l'utilisateur parmi une liste de produits similaires ou étroitement liés. Nous avons participé à la campagne d'évaluation « Living Lab for Information Retrieval » qui proposait une tâche de recherche de produits évaluée par des utilisateurs réels lors de scénarios de recherche réelle sur un site de e-commerce. L’évaluation expérimentale a montré des résultats prometteurs de notre modèle. Dans ce papier, nous proposons une analyse des fichiers logs issus de notre modèle afin d'identifier des facteurs d’efficacité liés à la requête et aux produits. L'objectif de cette étude est d'ouvrir des pistes de recherche pour la formalisation de modèles de recherche de produits.
E-commerce product retrieval aims to provide a quick and efficient access to products that fit user’s needs and preferences among a tail of similar or closely related products. We participated to the ``Living Lab for Information Retrieval'' evaluation campaign devoted to a product search task in which real users evaluated participants' retrieval models in real search scenarios on e-commerce websites. The experimental evaluation has shown encouraging results for our proposed model. In this paper, we conduct an analysis of users' feeadback with respect to the clicks obtained by our model. The goal of the paper is therefore to identify the effectiveness factors underlying the user's queries and the retrieved products in order to open perspectives in the formalization of product search models.
INTRODUCTION TO INFORMATION RETRIEVAL
This lecture will introduce the information retrieval problem, introduce the terminology related to IR, and provide a history of IR. In particular, the history of the web and its impact on IR will be discussed. Special attention and emphasis will be given to the concept of relevance in IR and the critical role it has played in the development of the subject. The lecture will end with a conceptual explanation of the IR process, and its relationships with other domains as well as current research developments.
INFORMATION RETRIEVAL MODELS
This lecture will present the models that have been used to rank documents according to their estimated relevance to user given queries, where the most relevant documents are shown ahead to those less relevant. Many of these models form the basis for many of the ranking algorithms used in many of past and today’s search applications. The lecture will describe models of IR such as Boolean retrieval, vector space, probabilistic retrieval, language models, and logical models. Relevance feedback, a technique that either implicitly or explicitly modifies user queries in light of their interaction with retrieval results, will also be discussed, as this is particularly relevant to web search and personalization.
Accès à l’information dans les réseaux sociaux : quelles formes de collaborat...Lamjed Ben Jabeur
Nous présentons dans cet article une analyse exploratoire dans l’objectif d’identifier les patrons de collaboration au sein des réseaux sociaux pour l’accès à l’information. Nous nous focalisons sur le cas de la gestion de crise au travers de la plateforme sociale Twitter. Nous nous appuyons ainsi sur deux types de crises : une catastrophe naturelle (l’ouragan Sandy) et une crise sanitaire (Ebola). Nous proposons une méthodologie en trois étapes qui permet 1) d’analyser les structures de collaboration, 2) d’identifier les thématiques de collaboration et 3) de présenter les réseaux latents de collaboration sur l’ensemble du réseau. Les résultats montrent paradoxalement que le périmètre de la collaboration est réduit, que les sujets sousjacents sont diversifiés et impliquent des utilisateurs qui peuvent être à l’interface de différents sujets.
Définition et évaluation de modèles d'agrégation pour l'estimation de la pert...Bilel Moulahi
Présentation de thèse intitulée : Définition et évaluation de modèles d'agrégation pour l'estimation de la pertinence multi-dimensionnelle en recherche d'information
Thèse soutenue le 11/12/2015 à l'IRIT (UPS, Toulouse)
Télécharger la présentation (.pptx) : http://www.irit.fr/publis/SIG/Presentation_thesis_Moulahi_2015.pptx
Télécharger la thèse : http://www.irit.fr/publis/SIG/Thesis_Moulahi_2015.pdf
Este documento presenta tres valores fundamentales para ser ciudadanos democráticos: la solidaridad, el respeto y la discusión haciendo uso de la razón. Propone actividades para que los estudiantes reflexionen sobre estos valores a través de ejercicios prácticos como identificar situaciones donde se requiere solidaridad y realizar crucigramas sobre derechos humanos.
Monitoreo.Net es una empresa dedicada a desarrollar planes estratégicos para garantizar el éxito y sostenibilidad de sus clientes a través del monitoreo de medios. Su misión es lograr el crecimiento rentable de sus clientes de manera innovadora y su visión es ser reconocida en 2020 por sus buenas prácticas éticas. Sus objetivos incluyen mantenerse informados de las noticias relevantes para sus clientes y permanecer a la vanguardia técnica.
Este documento describe cómo enseñar música a niños de segundo grado a través del juego. Explica que la música implica más que enseñar canciones y debe abarcar audición, interpretación y creación. Luego presenta tres actividades musicales basadas en juegos para desarrollar sensibilidad auditiva, reconocimiento de instrumentos y atención musical. El objetivo final es que los niños aprendan música de una manera divertida y permanente.
Este documento presenta un tutorial básico sobre PowerPoint. Explica cómo elegir el formato de las diapositivas al abrir una nueva presentación, incluidas las opciones de diapositivas en blanco, con título o con gráficos. También cubre cómo crear diapositivas, guardar la presentación en una ubicación deseada y utilizar diferentes funciones como cuadros de texto e iconos en la barra de herramientas.
El documento describe el municipio de Tlachichuca en el estado de Puebla, México. Habla sobre su ubicación, historia, topografía, hidrografía, clima, ecosistemas y recursos naturales. El municipio tiene una superficie de 459 km2 y limita con otros municipios de Puebla y Veracruz. Su relieve incluye el volcán Citlaltépetl, la sierra de Quimixtlán y llanuras. Sus ríos son tributarios del río Jamapa. Su clima y vegetación varían de templado a fr
Etude de visualisation des données selon le modèle LRM - Journée professionne...ABES
Etude de visualisation des données selon le modèle LRM
Présentation lors de la 4e journée professionnelle du groupe Systèmes & Données (BnF, 15 novembre 2019) du programme Transition Bibliographique : N’oubliez pas les données d’autorité
Raphaëlle Poveda, Maité Roux - Abes
Didactique de l’Information-Documentation, des modèles, des concepts et un p...FADBEN
[Muriel FRISCH - Maître de conférences en Sciences de l’Education - Université de Lorraine / ESPE - Laboratoire LISEC E.A. 2310 - Equipe Tech&Co]
De nombreux « modèles » peuvent être convoqués en Information-Documentation. Beaucoup d’entre eux s’inscrivent dans une « logique de modèles à étapes », expression que nous expliciterons. Consciemment ou inconsciemment ils induisent après leur exposition en formation des formes d’application, de reproduction. Certains répondent également à une « logique prescriptive », expression que nous définirons également, courant parfois le risque d’une dérive de formatage. Ces modèles sont-ils pour autant des « modèles didactiques » ? Il nous faut appréhender un champ de validité plus large que celui « des démarches types », « des modèles à étapes », « des modèles prescriptifs » en dépassant la conception de « modèles à appliquer ». « Le modèle a aussi (et surtout ?) un rôle heuristique : en raison de l’approche nouvelle qu’il autorise, son emploi d’un champ du savoir à un autre dégage des perspectives jusqu’alors inexplorées », nous pouvons ainsi aborder la question de « modèles didactiques » à construire, et, composés d’un ensemble d’éléments en interaction.
En rapport avec la thématique du Congrès «Enseigner-apprendre l’information-documentation ! Approches didactiques et démarches pédagogiques pour développer la culture de l’information des élèves» ; dans le contexte de convergence entre Information-Documentation, Culture de l’Information et Education aux Média et à l’Information (EMI) évoqué dans l’argumentaire et dans le cadre de nos recherches en didactique de l’Information-Documentation, nous proposons dans cette communication une réflexion soumise à la discussion au sein de la communauté professionnelle et scientifique autour de trois entrées. La première consiste à observer certains « modèles » issus de sources variées qui peuvent être conçus comme référent à reproduire. La seconde consiste à caractériser ce que l’on peut entendre par didactique de l’Information-Documentation aujourd’hui, notamment en tenant compte du concept d’info-diversité émergeant au cours de nos recherches. Les enseignants, les apprenants sont confrontés à différents types d’information (information brute, information traitée, information durable…) ; différentes natures d’information (physique, logique, analogique, numérique…) ; différents supports d’information, différentes formes d’information, différents formats d’information… Ils doivent gérer une variété de contextes d’information. Notre dernier chantier de recherche a contribué à élaborer des critères d’intelligibilité de la pratique enseignante en construction dans le rapport à cette « info-diversité ». La troisième porte sur l’élaboration de matrices curriculaires dynamiques, qui tiennent compte d’une progression des apprentissages, du développement de l’individu et de formes «d’efficacité réflexive». [...]
De l’utilité, utilisabilité et acceptabilité d’une technologie “top down” a l...Caféine.Studio
Sémel, B., Roland, N. (2014). De l’utilité, utilisabilité et acceptabilité d’une technologie “top down” a l’université : étude multicas des facteurs d’intégration du podcasting par les enseignants. Colloque scientifique international sur les TIC en éducation, Montréal, 1 au 2 mai.
Les humanités numériques, enjeu de transdisciplinarité et pistes d’actions pé...Elie ALLOUCHE
Les humanités numériques, enjeu de transdisciplinarité et pistes d’actions pédagogiques : intervention auprès des professeurs documentalistes de l'académie de Dijon (22/05/18)
Apprentissage des langues en ligne et humanités numériques : une mise en équa...Claudespringer
Cette présentation a pour but d'analyser les nouveaux environnements d'apprentissage des langues en ligne et de voir s'ils répondent aux promesses du marketing qui les qualifie de révolution pédagogique.
This presentation analyses the new online learning environnement to see if they propose a real revolutionary pedagogical approach
La démarche d'innovation MODIM : industrie, art et imaginairesGehan Kamachi
Conférence "La démarche d’innovation MODIM : industrie, art et imaginaires" donnée dans le cadre du colloque « De l'injonction à la créativité à sa mise en œuvre : quel parallèle entre monde de l'art et monde productif ? », 9-10 avril 2015, MSH Ange-Guépin, Nantes, France.
1. De la pénurie à la surabondance de
connaissances : évolution de l'ingénierie
des connaissances en France depuis 25 ans
NATHALIE AUSSENAC-GILLES – IRIT (TOULOUSE)
aussenac@irit.fr
14 mai 2014 EVOLUTION DE L’IC DEPUIS 25 ANS 1
2. Co-auteurs
AUSSENAC-GILLES N., CHARLET J., REYNAUD C. Chapitre 7 - Les enjeux de l’Ingénierie des
Connaissances, in Information-Interaction-Intelligence : le point sur le I3. Eds: Sèdes F., Ogier J-
M., Marquis P., Toulouse : Cépaduès Editions, p 244-266, 2012
AUSSENAC-GILLES N., CHARLET J., REYNAUD C. Chapitre 20 – Ingénierie des connaissances, in
Panorama de l’intelligence artificielle. Représentation des connaissances et formalisation des
raisonnements, Volume 1. Eds: Marquis P., Papini O., Prades H. , Toulouse : Cépaduès Editions,
2014.
AUSSENAC-GILLES N., GANDON F., From the knowledge acquisition bottleneck to the knowledge
acquisition overflow: A brief French history of knowledge acquisition, in Int. J. Human-Computer
Stud.es, 71 (2013) 157–165
GANDON F., préface, actes de IC 2010, Hammamet (Tunisie)
14 mai 2014 EVOLUTION DE L’IC DEPUIS 25 ANS 2
3. 25 ans d’IC en France
14 mai 2014 EVOLUTION DE L’IC DEPUIS 25 ANS 3
Ekaw 1989
Paris
Journée Acquisition des Connaissances 1988
Paris
JAC 1990
Lannion
IC 1998JAVA95 IC 2009
Hammamet
Ekaw 1993
Toulouse-Caylus
Ekaw 2000
Juan-les-Pins
ESWC 2012
Montpellier
Collège IC
4. Evolution croisée de l’IC et du web
14 mai 2014 EVOLUTION DE L’IC DEPUIS 25 ANS 4
1990
Idée du Web CERN
JAC 1990
Knowledge acquisition
bottleneck
Knowledge overflow
5. Objectifs de l’exposé
Qu’est-ce qui a fondamentalement changé dans cette evolution?
Nouvelles questions de recherche
En quoi l’IC est-elle toujours de l’IC ?
Quelles sont les questions, problématiques qui fondent l’IC ?
14 mai 2014 EVOLUTION DE L’IC DEPUIS 25 ANS 5
7. Jalons historiques : au début était l’expert
Les années 70 et le début des années 80 furent
marqués par la réalisation de nombreux systèmes
experts [Smith, 1984], où une connaissance experte
dans un domaine spécialisé est exprimée sous
forme de règles « si ... alors ... » et est applicable à
tout ensemble de faits décrivant une situation sur
laquelle le système doit produire des conclusions.
Les premiers furent : DENDRAL en chimie organique
[Lindsay et al., 1980], MYCIN en médecine
[Buchanan et Shortliffe (eds.), 1984], HEARSAY-II en
compréhension de la parole [Erman et al., 1980],
PROSPECTOR en géologie [Duda et al., 1976, 1981].
Marquis, Papini, Prades, 2014
14 mai 2014 EVOLUTION DE L’IC DEPUIS 25 ANS 7
SI
la coloration de l'organisme est GRAM+
et si la morphologie de l'organisme est Cocci
et si le mode de développement de l'organisme est en colonies
ALORS
il existe une évidence (0.7) que l'identité de l'organisme soit Staphylococcus.
Knowledge
acquisition
bottleneck
8. Jalons historiques : au début était l’expert
14 mai 2014 EVOLUTION DE L’IC DEPUIS 25 ANS 8
Compromised
Host
Gram-Negative
Infection
Immunosupressed
Leukopenia
WBC < 2.5
E. coli
Abstract
Refine
Match
Abstract
Abstract
SI
la coloration de l'organisme est GRAM+
et si la morphologie de l'organisme est Cocci
et si le mode de développement de l'organisme est en colonies
ALORS
il existe une évidence (0.7) que l'identité de l'organisme soit Staphylococcus.
- Techniques d’entretien
- Observation de l’activité
- Langages de modélisation
- Knowledge Level (Newell)
- Modélisation du processus
de résolution de problème
- Problem solving method
- Generic tasks
- Réutilisation
9. Jalons historiques :
de l’acquisition à l’ingénierie des connaissances
14 mai 2014 EVOLUTION DE L’IC DEPUIS 25 ANS 9
- La connaissance de l’entreprise est distribuée
et collective
- La connaissance experte est accessible
lorsqu’elle est mise en oeuvre en situation.
JAC 1992
Knowledge
acquisition
Is modelling
KADS
Knowledge acquisition
bottleneck
IC 1998
Knowledge is
(cooperative)
problem solving
CommonKADS
Ekaw 1993
Toulouse-Caylus
.
.
.
.
. .
10. Jalons historiques : du web au web 2.0
14 mai 2014 EVOLUTION DE L’IC DEPUIS 25 ANS 10
1990
Idée du Web
CERN
1995 : 10 000 serveurs web
1996 : 100 000 serveurs web
1998 : 1 M de serveurs1991
1 serveur web
hors Europe
1994
1999
Web 2.0
Chacun peut produire
des contenus multimedia
1998
1ere ref au web à IC
11. Jalons historiques : ingénierie des connaissances
14 mai 2014
EVOLUTION DE L’IC DEPUIS 25 ANS
11
- Diversifier les sources de connaissances
- Réutiliser les fragments de modèles
- Gestion des connaissances2000
Systèmes coopératifs
Modèles du domaine
Knowledge engineering
1997
Connaisances du
domaine et
Ontologies
.
.
- Le système aide l’utilisateur
- Le modèle est une construction
.
.
.
.
. .
Ekaw 2000
Juan-Les-Pins
12. Premiers fondamentaux
L’acquisition des connaissances est un domaine de recherche à part entière.
o proche de l’intelligence artificielle
o Fait partie des sciences cognitives
L’acquisition des connaissances définit une démarche interdisciplinaire.
oPsychologie cognitive
oErgonomie
oSociologie, anthropologie
oSciences de Gestion
oInformatique et intelligence artificielle
o> problématiser les notions de connaissance, information, donnée, activité, tâche
14 mai 2014 EVOLUTION DE L’IC DEPUIS 25 ANS 12
13. Premiers fondamentaux
L’acquisition des connaissances est une recherche de type ingénierie
oInnovation dans l’articulation de techniques connues
oPrise en compte des usages
oValidation par l’expérimentation en situation : produire “mieux” un système à base de
connaissances.
oImportance de la réutilisation
Contributions attendues
oMéthodologiques
oConceptuelles
oFormellees : Représentation des connaissances
oLogicielles : aides à l’explicitation de connaissances, à la modélisation, à l’évaluation
14 mai 2014 EVOLUTION DE L’IC DEPUIS 25 ANS 13
14. Jalons historiques : convergence autour du document
14 mai 2014
EVOLUTION DE L’IC DEPUIS 25 ANS
14
2000
Extraire des
connaissances à
partir de textes
Reasoning
Intelligent browsing
Support systems
1996
HTML
1998
XML
Semantic Web Road Map
.
.
- Approches terminologiques
- Traitement automatique des langues
- Ressources termino-ontologiques
.
. .
.
. .
TIA 1993 Paris
15. Deuxième série de fondamentaux
la question des sources de connaissances hétérogènes
gérer l’hétérogénéïté
exploiter les complémentarités
adapter les techniques aux sources de connaissances et savoir combiner les résultats
la question de la généricité / réutilisabilité des modèles
prendre en compte l’objectif d’utilisation dans la realisation du modèle
Savoir adapter des ressources génériques
Méthodes de resolution de problème
Ontologies de domaine
Ontologies de haut niveau
14 mai 2014 EVOLUTION DE L’IC DEPUIS 25 ANS 15
.
.
.
.
. .
16. Deuxième série de fondamentaux
Étudier l’articulation entre langage naturel (écrit) et connaissances formalisées
est un des défis de l’IC
o en lien avec le Traitement Automatique des Langues (TAL)
o en lien avec une analyse fine des phénomènes linguistiques
Changement de paradigme
o recul de la formalisation logique
ocaractérisation des contenus
o approche “annotation sémantique”
o rapprochement de la recherche d’information
14 mai 2014 EVOLUTION DE L’IC DEPUIS 25 ANS 16
17. Jalons historiques : un monde d’ontologies
14 mai 2014
EVOLUTION DE L’IC DEPUIS 25 ANS
17
Reasoning
Intelligent browsing
Support systems
2001
Spécification RDF
Spécification RDFs
2003 privacy P3P
.
.
- Plus de navigation, d’annotation
- plus d’accès à l’information /
connaissances
- Moins de resolution de problème
- Dimension sociale des annotations
2001
Semantic web à IC
2004
OWL
2007
FreeBase, DBPedia
2004
Exploiter wiki
Réseaux sociaux
18. Jalons historiques : des données aux connaissances
14 mai 2014
EVOLUTION DE L’IC DEPUIS 25 ANS
18
2008
Moteurs de recherche
sémantique
- Plus de manipulation de données
- Fouille des données > connaissances
- Extraction d’information
- Typage, alignement de données
- Dynamique, évolution 2010
Analyse de traces numériques
2008
Web des données
IC2.0
alignements
TAL
.
2011
OWL 2, SPARQL 1.1
19. Jalons historiques : toujours plus de données liées
14 mai 2014 EVOLUTION DE L’IC DEPUIS 25 ANS 19
- Exploitation des données
- (enfin !) vraie exploitation de la sémantique et
de l’axiomatique des ontologies
- Les règles, le retour
- Typage, alignement de données
- Domaines très porteurs : médecine, agronomie,
données publiques
Inference
TAL
ML
20. Troisième série de fondamentaux
Evolution des paradigmes
o Exploitation croissante de la formalisation logique
o Caractérisation precise des contenus
o approche “annotation sémantique”
o rapprochement de la recherché d’information
Les ontologies sont-elles les réponses aux questions du web sémantique ?
o nouveau goulet d’étranglement entre ontologies et utilisations des données
oRôle du crowd sourcing à l’avenir ?
oOntologies // big Data
14 mai 2014 EVOLUTION DE L’IC DEPUIS 25 ANS 20
21. l’IC et les connaissances dans les strategies de recherche
Stratégie de recherche Nationale, atelier 7, M. Ghallab
14 mai 2014 EVOLUTION DE L’IC DEPUIS 25 ANS 21
22. Ontologies et profusion de données
Thème de l’ “ontology summit” du printemps 2014
oSemantic Web and Big Data Meets Applied Ontology
ohttp://ontolog.cim3.net/cgi-bin/wiki.pl?OntologySummit2014_Communique
Questions
oQuels bouleversements sur les ontologies accompagnent les travaux sur Web Sémantique et
Linked Data ?
oQuel apport des ontologies (de domaine, formelles) aux Linked Data ?
oJusqu’où peut-on automatiser la construction d’ontologies ? Leur peuplement ?
Les travaux du communiqué
oEtat des lieux des usages des ontologies pour caractériser les données
oQuestions d’expressivité des langages
oQuestion de mise au point : RDF rules
oQuestion de couverture des ontologies : plutôt des ontologies spécialisées
oPassage à l’échelle
14 mai 2014 EVOLUTION DE L’IC DEPUIS 25 ANS 22
23. Ontologies et profusion de données : les conclusions
Vers des approches hybrides
Agile engineering techniques
approches statistiques et sémantiques
ontologies et analyse des contenus « à la demande »
données extraites et ontologies (pour typer les données)
Quels sont les contenus partageables ? Réutilisables ?
limite de la réutilisation des ontologies
Ontology Design patterns : vers des patrons spécifiques à des domaines
prolifération / réutilisation d’ontologies réutilisables et de vocabulaires
Intégration
Modularité
Organiser et documenter des entrepôts d’ontologies
14 mai 2014 EVOLUTION DE L’IC DEPUIS 25 ANS 23
24. Ontologies et profusion de données : les conclusions
Freins à la construction d’ontologies
oCoût, complexité, temps
oFacteurs sociaux
Bonnes pratiques
o réutilisation : réutiliser, adapter, documenter
o bien formaliser
o design patterns de petite taille
o Exploiter la sémantique
Vers plus d’automatisation de la constructuion des ontologies / BC ?
oIl reste bq à faire, utilisation ML
oAdapter les plate-formes
oRaisonnement et vérification
oUtiliser mappings et alignements
14 mai 2014 EVOLUTION DE L’IC DEPUIS 25 ANS 24
25. 2014 : une IC fondue dans le web sémantique ?
ex de travaux à rendre plus visibles
o Méthodologies
o Plateformes de modélisation (PROTÉGÉ “monopole”)
o modélisation de thesaurus, terminologies et ontologies terminologiques
oproduction d’outils diffusables pour la construction/ manipulation de triplets, d’alignements
ex de travaux moins développés
o dimension cognitive : seulement dans les traces numériques
o dimension cooperative et sociale : wiki sémantiques, collaborations d’experts etc.
14 mai 2014 EVOLUTION DE L’IC DEPUIS 25 ANS 25
26. 2014 : une IC fondue dans le web sémantique ?
Problématiser l’articulation connaissances (experts) de domaine vs données
du web
au-delà d’affirmations de principe
aspects techniques et quantitatifs
complexité sémantique, assister la modélisation >> IC
Faire de la recherche au service d’une INGENIERIE
o articulation avec d’autres aspects de l’informatique (TAL, ML, BD, RI, Cloud, CHP,…)
o effet de mode : effet “tendance” vs travaux fondamentaux
o ne pas y perdre son identité ?
o Revenir à plus d’interdisciplinarité
14 mai 2014 EVOLUTION DE L’IC DEPUIS 25 ANS 26
27. IC – la conf - est-elle soluble dans les critères
d’évaluation de la recherché ?
IC, une conférence mais aussi une communauté scientifique
IC dans l’AFIA
o participation à la plate-forme de conferences années impaires
o reconnaissances scientifique > qualité, selection
o ateliers
IC vs l’international
◦ Présentation des projets ANR
◦ Et les projet seuropéens
◦ Conférences internationals du domaine : EKAW et K-CAP, ESWC et ISWC
14 mai 2014 EVOLUTION DE L’IC DEPUIS 25 ANS 27