RÉSUMÉ. L’analyse des avis (commentaires) générés par les utilisateurs devient de plus en plus exploitable par une variété d’applications. Elle permet de suivre l’évolution des avis ou d’effectuer des enquêtes sur des produits. La détection d’avis contradictoires autour d’une ressource Web (ex. cours, film, produit, etc.) est une tâche importante pour évaluer cette dernière. Dans cet article, nous nous concentrons sur le problème de détection des contradictions et de la mesure de leur intensité en se basant sur l’analyse du sentiment autour des aspects spécifiques à une ressource (document). Premièrement, nous identifions certains aspects, selon les distributions des termes émotionnels au voisinage des noms les plus fréquents dans l’ensemble des commentaires. Deuxièmement, nous estimons la polarité de chaque segment de commentaire contenant un aspect. Ensuite, nous prenons uniquement les ressources contenant ces aspects avec des polarités opposées (positive, négative). Troisièmement, nous introduisons une mesure de l’intensité de la contradiction basée sur la dispersion conjointe de la polarité et du rating des commentaires contenant les aspects au sein de chaque ressource. Nous évaluons l’efficacité de notre approche sur une collection de MOOC (Massive Open Online Courses) contenant 2244 cours et leurs 73873 commentaires, collectés à partir de Coursera. Nos résultats montrent l’efficacité de l’approche proposée pour capturer les contradictions de manière significative.
ABSTRACT. Analysis of opinions (reviews) generated by users becomes increasingly exploited by a variety of applications. It allows to follow the evolution of the opinions or to carry out investigations on products. The detection of contradictory opinions about a Web resource (e.g., courses, movies, products, etc.) is an important task to evaluate the latter. In this paper, we focus on the problem of detecting contradictions based on the sentiment analysis around specific aspects of a resource (document). First, we identify certain aspects, according to the distributions of the emotional terms in the vicinity of the most frequent names in the whole of the reviews. Second, we estimate the polarity of each review segment containing one aspect. Then we take only the resources containing these aspects with opposite polarities (positive, negative). Third, we introduce a measure of the intensity of the contradiction based on the joint dispersion of the polarity and the rating of the reviews containing the aspects within each resource. We evaluate the effectiveness of our approach on the Massive Open Online Courses (MOOC) collection containing 2244 courses and their 73873 reviews, collected from Coursera. Our results show the effectiveness of the proposed approach to capture contradictions significantly.
Prédire l’intensité de contradiction dans les commentaires : faible, forte ou...Ismail BADACHE
Les commentaires sur des ressources Web (ex. des cours, des films) deviennent de plus en plus exploitées dans des tâches d’analyse de texte (ex. détection d’opinion, détection de controverses). Cet article étudie l’intensité de contradiction dans les commentaires en exploitant différents critères tels que la variation des notations et la variation des polarités autour d’entités spécifiques (ex. aspects, sujets). Premièrement, les aspects sont identifiés en fonction des distributions des termes émotionnels à proximité des noms les plus fréquents dans la collection des commentaires. Deuxièmement, la polarité est estimée pour chaque segment de commentaire contenant un aspect. Seules les ressources ayant des commentaires contenant des aspects avec des polarités opposées sont prises en compte. Enfin, les critères sont évalués, en utilisant des algorithmes de sélection d’attributs, pour déterminer leur impact sur l’efficacité de la détection de l’intensité des contradictions. Les critères sélectionnés sont ensuite introduits dans des modèles d’apprentissage pour prédire l’intensité de contradiction. L’évaluation expérimentale est menée sur une collection contenant 2244 cours et leurs 73873 commentaires, collectés à partir de coursera.org. Les résultats montrent que la variation des notations, la variation des polarités et la quantité de commentaires sont les meilleurs prédicteurs de l’intensité de contradiction. En outre, J48 est l’approche d’apprentissage la plus efficace pour cette tâche.
Intensité de contradiction dans les commentaires (Séminaire à l'EHESS 04 avri...Ismail BADACHE
L’analyse des avis (commentaires) générés par les utilisateurs devient de plus en plus exploitable par une variété d’applications. Elle permet de suivre l’évolution des avis ou d’effectuer des enquêtes sur des produits. La détection d’avis contradictoires autour d’une ressource Web (ex. cours, film, produit, etc.) est une tâche importante pour évaluer cette dernière. Dans cet article, nous nous concentrons sur le problème de détection des contradictions et de la mesure de leur intensité en se basant sur l’analyse du sentiment autour des aspects spécifiques à une ressource (document). Premièrement, nous identifions certains aspects, selon les distributions des termes émotionnels au voisinage des noms les plus fréquents dans l’ensemble des commentaires. Deuxièmement, nous estimons la polarité de chaque segment de commentaire contenant un aspect. Ensuite, nous prenons uniquement les ressources contenant ces aspects avec des polarités opposées (positive, négative). Troisièmement, nous introduisons une mesure de l’intensité de la contradiction basée sur la dispersion conjointe de la polarité et du rating des commentaires contenant les aspects au sein de chaque ressource. Nous évaluons l’efficacité de notre approche sur une collection de MOOC (Massive Open Online Courses) contenant 2244 cours et leurs 73873 commentaires, collectés à partir de Coursera. Nos résultats montrent l’efficacité de l’approche proposée pour capturer les contradictions de manière significative.
Harnessing social signals to enhance a searchIsmail BADACHE
This paper describes an approach of information retrieval which takes into account social signals associated with Web resources to estimate its relevance to a query. We show how these data, which are in the form of actions within social activities (e.g. like, tweet), can be exploited to quantify social properties such as popularity and reputation. We propose a model that combines the social relevance, estimated from these properties, with the conventional textual relevance. We evaluated the effectiveness of our approach on IMDb dataset containing 32706 resources and their social characteristics collected from several social networks. We used also the selected criteria to learn models to determine their effectiveness in information retrieval. Our experimental results are promising and show the interest of integrating social signals in retrieval model to enhance a search.
Social Priors to Estimate Relevance of a ResourceIsmail BADACHE
In this paper we propose an approach that exploits social data associated with a Web resource to measure its a priori relevance. We show how these interaction traces left by the users on the resources, which are in the form of social signals as the number of like and share, can be exploited to quantify social properties such as popularity and reputation. We propose to model these properties as a priori probability that we integrate into language model. We evaluated the effectiveness of our approach on IMDb dataset containing 167438 resources and their social signals collected from several social networks. Our experimental results are statistically significant and show the interest of integrating social properties in a search model to enhance the information retrieval.
Pertinence a Priori Basée sur la Diversité et la Temporalité des Signaux SociauxIsmail BADACHE
RÉSUMÉ. Les signaux sociaux associés aux ressources web peuvent être considérés comme une information additionnelle qui peut jouer un rôle pour mesurer une importance a priori de la ressource indépendamment de la requête. Dans cet article, nous nous intéressons particulièrement à la temporalité associée à ces signaux ainsi qu’à leur diversité. Nous supposons que l’importance a priori d’un document (ressource) dépend non seulement de la qualité de ces signaux mais aussi de la date de leur création, leur diversité ainsi que la date de publication de la ressource. De ce fait, plutôt que d’estimer cette importance (probabilité) a priori par un simple comptage des signaux liés au document, nous intégrons également la date de publication de la ressource, pour ne pas pénaliser les nouvelles ressources, les dates des signaux pour privilégier les signaux récents, ainsi que la diversité de ces signaux. Nous évaluons la performance de notre approche sur la collection d’IMDb contenant 167438 ressources et leurs données sociales collectées à partir de plusieurs réseaux sociaux. Nos résultats montrent l’intérêt des signaux temporellement sensibilisés à la sélection des ressources pertinentes.
ABSTRACT. Social signals associated with web resources can be considered as an additional information that can play a role to measure a priori importance of the resource regardless of the query. In this paper, we are particularly interested in the temporality associated with these signals and their diversity. We assume that the a priori importance of a document (resource) depends not only on the quality of these signals, but also on the dates of their creation, their diversity and the publication date of the resource. Therefore, rather than estimating the significance (probability) a priori by simply counting the number of signals associated to a resource, we also integrate the publication date of the resource, to avoid penalizing recent resources, the date of signals to boost recent actions, as well as their diversity. We evaluate the effectiveness of our approach on IMDb dataset containing 167438 resources and their social data collected from social networks. Our experiments show the interest of temporally-aware signals at capturing relevant resources.
MOTS-CLÉS : Signaux sociaux, Date du signal, Date de Publication de la ressource, Diversité.
KEYWORDS: Social signals, Signal date, Resource publication date, Diversity.
A Priori Relevance Based On Quality and Diversity Of Social SignalsIsmail BADACHE
Social signals (users' actions) associated with web resources (documents) can be considered as an additional information that can play a role to estimate a priori importance of the resource. In this paper, we are particularly interested in: rst, showing the impact of signals diversity associated to a resource on information retrieval performance; second, studying the influence of their social networks origin on their quality. We propose to model these social features as prior that we integrate into language model. We evaluated the effectiveness of our approach on IMDb dataset containing 167438 resources and their social signals collected from several social networks. Our experimental results are statistically signicant and show the interest of integrating signals diversity in the retrieval process.
Priors Based On Time-Sensitive Social SignalsIsmail BADACHE
Abstract. Relevance estimation of a Web resource (document) can benefit from using social signals. In this paper, we propose a language model document prior exploiting temporal characteristics of social signals. We assume that a priori significance of a document depends on the date of users actions (social signals) and on the publication date (first occurrence) of the document. Particularly, rather than estimating the priors by simply counting signals related to the document, we bias this counting by taking into account the dates of the resource and the action. We evaluate our approach on IMDb dataset containing 167438 resources and their social data collected from several social networks. The experiments show the interest of temporally-aware signals at capturing relevant resources.
Keywords: Social Information Retrieval, Social Signals, Signal Time, Resource Publication Date, Social Ranking, Language Models.
Fresh and Diverse Social Signals: Any Impacts on Search?Ismail BADACHE
In this paper, we extensively study the impact of social signals (users' actions) obtained from several social networks on search ranking task. Social signals associated with web resources (documents) can be considered as an additional information that can play a vital role to estimate a priori importance of these resources. Particularly, we are interested in the freshness of signals and their diversity. We hypothesize that the moment (the date) when the user actions occur and the diversity of actions may impact the search performance. We propose to model these heterogeneous social features as document prior. We evaluate the effectiveness of our approach by carrying out extensive experiments on two different INEX datasets, namely SBS and IMDb, enriched with several social signals collected from social networks. Our experimental results consistently demonstrate the interest of integrating fresh and diverse signals in the retrieval process.
Prédire l’intensité de contradiction dans les commentaires : faible, forte ou...Ismail BADACHE
Les commentaires sur des ressources Web (ex. des cours, des films) deviennent de plus en plus exploitées dans des tâches d’analyse de texte (ex. détection d’opinion, détection de controverses). Cet article étudie l’intensité de contradiction dans les commentaires en exploitant différents critères tels que la variation des notations et la variation des polarités autour d’entités spécifiques (ex. aspects, sujets). Premièrement, les aspects sont identifiés en fonction des distributions des termes émotionnels à proximité des noms les plus fréquents dans la collection des commentaires. Deuxièmement, la polarité est estimée pour chaque segment de commentaire contenant un aspect. Seules les ressources ayant des commentaires contenant des aspects avec des polarités opposées sont prises en compte. Enfin, les critères sont évalués, en utilisant des algorithmes de sélection d’attributs, pour déterminer leur impact sur l’efficacité de la détection de l’intensité des contradictions. Les critères sélectionnés sont ensuite introduits dans des modèles d’apprentissage pour prédire l’intensité de contradiction. L’évaluation expérimentale est menée sur une collection contenant 2244 cours et leurs 73873 commentaires, collectés à partir de coursera.org. Les résultats montrent que la variation des notations, la variation des polarités et la quantité de commentaires sont les meilleurs prédicteurs de l’intensité de contradiction. En outre, J48 est l’approche d’apprentissage la plus efficace pour cette tâche.
Intensité de contradiction dans les commentaires (Séminaire à l'EHESS 04 avri...Ismail BADACHE
L’analyse des avis (commentaires) générés par les utilisateurs devient de plus en plus exploitable par une variété d’applications. Elle permet de suivre l’évolution des avis ou d’effectuer des enquêtes sur des produits. La détection d’avis contradictoires autour d’une ressource Web (ex. cours, film, produit, etc.) est une tâche importante pour évaluer cette dernière. Dans cet article, nous nous concentrons sur le problème de détection des contradictions et de la mesure de leur intensité en se basant sur l’analyse du sentiment autour des aspects spécifiques à une ressource (document). Premièrement, nous identifions certains aspects, selon les distributions des termes émotionnels au voisinage des noms les plus fréquents dans l’ensemble des commentaires. Deuxièmement, nous estimons la polarité de chaque segment de commentaire contenant un aspect. Ensuite, nous prenons uniquement les ressources contenant ces aspects avec des polarités opposées (positive, négative). Troisièmement, nous introduisons une mesure de l’intensité de la contradiction basée sur la dispersion conjointe de la polarité et du rating des commentaires contenant les aspects au sein de chaque ressource. Nous évaluons l’efficacité de notre approche sur une collection de MOOC (Massive Open Online Courses) contenant 2244 cours et leurs 73873 commentaires, collectés à partir de Coursera. Nos résultats montrent l’efficacité de l’approche proposée pour capturer les contradictions de manière significative.
Harnessing social signals to enhance a searchIsmail BADACHE
This paper describes an approach of information retrieval which takes into account social signals associated with Web resources to estimate its relevance to a query. We show how these data, which are in the form of actions within social activities (e.g. like, tweet), can be exploited to quantify social properties such as popularity and reputation. We propose a model that combines the social relevance, estimated from these properties, with the conventional textual relevance. We evaluated the effectiveness of our approach on IMDb dataset containing 32706 resources and their social characteristics collected from several social networks. We used also the selected criteria to learn models to determine their effectiveness in information retrieval. Our experimental results are promising and show the interest of integrating social signals in retrieval model to enhance a search.
Social Priors to Estimate Relevance of a ResourceIsmail BADACHE
In this paper we propose an approach that exploits social data associated with a Web resource to measure its a priori relevance. We show how these interaction traces left by the users on the resources, which are in the form of social signals as the number of like and share, can be exploited to quantify social properties such as popularity and reputation. We propose to model these properties as a priori probability that we integrate into language model. We evaluated the effectiveness of our approach on IMDb dataset containing 167438 resources and their social signals collected from several social networks. Our experimental results are statistically significant and show the interest of integrating social properties in a search model to enhance the information retrieval.
Pertinence a Priori Basée sur la Diversité et la Temporalité des Signaux SociauxIsmail BADACHE
RÉSUMÉ. Les signaux sociaux associés aux ressources web peuvent être considérés comme une information additionnelle qui peut jouer un rôle pour mesurer une importance a priori de la ressource indépendamment de la requête. Dans cet article, nous nous intéressons particulièrement à la temporalité associée à ces signaux ainsi qu’à leur diversité. Nous supposons que l’importance a priori d’un document (ressource) dépend non seulement de la qualité de ces signaux mais aussi de la date de leur création, leur diversité ainsi que la date de publication de la ressource. De ce fait, plutôt que d’estimer cette importance (probabilité) a priori par un simple comptage des signaux liés au document, nous intégrons également la date de publication de la ressource, pour ne pas pénaliser les nouvelles ressources, les dates des signaux pour privilégier les signaux récents, ainsi que la diversité de ces signaux. Nous évaluons la performance de notre approche sur la collection d’IMDb contenant 167438 ressources et leurs données sociales collectées à partir de plusieurs réseaux sociaux. Nos résultats montrent l’intérêt des signaux temporellement sensibilisés à la sélection des ressources pertinentes.
ABSTRACT. Social signals associated with web resources can be considered as an additional information that can play a role to measure a priori importance of the resource regardless of the query. In this paper, we are particularly interested in the temporality associated with these signals and their diversity. We assume that the a priori importance of a document (resource) depends not only on the quality of these signals, but also on the dates of their creation, their diversity and the publication date of the resource. Therefore, rather than estimating the significance (probability) a priori by simply counting the number of signals associated to a resource, we also integrate the publication date of the resource, to avoid penalizing recent resources, the date of signals to boost recent actions, as well as their diversity. We evaluate the effectiveness of our approach on IMDb dataset containing 167438 resources and their social data collected from social networks. Our experiments show the interest of temporally-aware signals at capturing relevant resources.
MOTS-CLÉS : Signaux sociaux, Date du signal, Date de Publication de la ressource, Diversité.
KEYWORDS: Social signals, Signal date, Resource publication date, Diversity.
A Priori Relevance Based On Quality and Diversity Of Social SignalsIsmail BADACHE
Social signals (users' actions) associated with web resources (documents) can be considered as an additional information that can play a role to estimate a priori importance of the resource. In this paper, we are particularly interested in: rst, showing the impact of signals diversity associated to a resource on information retrieval performance; second, studying the influence of their social networks origin on their quality. We propose to model these social features as prior that we integrate into language model. We evaluated the effectiveness of our approach on IMDb dataset containing 167438 resources and their social signals collected from several social networks. Our experimental results are statistically signicant and show the interest of integrating signals diversity in the retrieval process.
Priors Based On Time-Sensitive Social SignalsIsmail BADACHE
Abstract. Relevance estimation of a Web resource (document) can benefit from using social signals. In this paper, we propose a language model document prior exploiting temporal characteristics of social signals. We assume that a priori significance of a document depends on the date of users actions (social signals) and on the publication date (first occurrence) of the document. Particularly, rather than estimating the priors by simply counting signals related to the document, we bias this counting by taking into account the dates of the resource and the action. We evaluate our approach on IMDb dataset containing 167438 resources and their social data collected from several social networks. The experiments show the interest of temporally-aware signals at capturing relevant resources.
Keywords: Social Information Retrieval, Social Signals, Signal Time, Resource Publication Date, Social Ranking, Language Models.
Fresh and Diverse Social Signals: Any Impacts on Search?Ismail BADACHE
In this paper, we extensively study the impact of social signals (users' actions) obtained from several social networks on search ranking task. Social signals associated with web resources (documents) can be considered as an additional information that can play a vital role to estimate a priori importance of these resources. Particularly, we are interested in the freshness of signals and their diversity. We hypothesize that the moment (the date) when the user actions occur and the diversity of actions may impact the search performance. We propose to model these heterogeneous social features as document prior. We evaluate the effectiveness of our approach by carrying out extensive experiments on two different INEX datasets, namely SBS and IMDb, enriched with several social signals collected from social networks. Our experimental results consistently demonstrate the interest of integrating fresh and diverse signals in the retrieval process.
Learning Analytics : entre Promesses et RéalitéSerge Garlatti
Université Bretagne Pays de Loire, UTICE : LES LEARNING ANALYTICS : QUAND LE BIG DATA S’INTÉRESSE À L’ÉDUCATION.
https://utice.u-bretagneloire.fr/evenement/les-learning-analytics-quand-le-big-data-sinteresse-leducation
L’usage du numérique dans l’éducation permet d’accéder aujourd’hui à une multitude de données sur le comportement des étudiants : identité, interactions entre apprenants, interactions avec les plateformes et outils d’apprentissage, résultats aux évaluations... La collecte et l’exploitation de ces données permettent de mieux comprendre les processus d’apprentissage et ainsi d’adapter les parcours pédagogiques proposés pour en renforcer l’efficacité, mais aussi de personnaliser les apprentissages ou de développer des outils de pilotage des formations. Une communauté de chercheurs et d’enseignants se développe autour de ce que l’on appelle les learning analytics, ou l’analyse des données d’apprentissage. Ce séminaire basé sur les recherches et des retours d’expérience d’enseignants-chercheurs et de jeunes entreprises permettra de cerner les enjeux et les perspectives des learning analytics.
L’évaluation constitue l’un des actes les plus complexes de la pratique enseignante. En comprendre les difficultés améliore l’efficacité de l’enseignement
Définition et évaluation de modèles d'agrégation pour l'estimation de la pert...Bilel Moulahi
Présentation de thèse intitulée : Définition et évaluation de modèles d'agrégation pour l'estimation de la pertinence multi-dimensionnelle en recherche d'information
Thèse soutenue le 11/12/2015 à l'IRIT (UPS, Toulouse)
Télécharger la présentation (.pptx) : http://www.irit.fr/publis/SIG/Presentation_thesis_Moulahi_2015.pptx
Télécharger la thèse : http://www.irit.fr/publis/SIG/Thesis_Moulahi_2015.pdf
Fr presenLes obstacles à l'adoption des logiciels libres pour les systemes ...Placide Poba Nzaou
Extrait de la source suivante:
Poba-Nzaou, P. & Uwizeyemungu, S.
Les obstacles à l'adoption des logiciels libres pour les
systemes critiques par les organisations :
le point de vue des fournisseurs
Comptes rendus de la 19eme conference des Ameriques sur
les systemes d'information (AMCIS),
Chicago, Etats Unis, 15-17 Ao^ut, 2013,
10 pages
Présentation aux collègues du lycée Blaise Pascal (Charbonnières les bains) de notre objectif de développer chez les élèves les conditions d’un meilleur accès aux savoirs, en jouant notamment sur la motivation, l’attention, l’intérêt et l’ implication dans les apprentissages scolaires à travers une plate-forme pédagogique (SPIRAL).
Inscrivez-vous à la formation EMFPS du 25 au 27 septembre 2018 "Maîtriser la...Jean-Luc Balança
animée par Muriel Tounsi (Responsable des statistiques, Chef de Projet – Axonal – Biostatem), Nicolas Lemaire (Biostatisticien senior, Chef de Projet – Axonal – Biostatem), Béranger Lueza, PhD (Lead Consultant – Amaris HEMA)
https://bit.ly/2u7MTlC
Un dispositif d'autoformation aux connaissances technopédagogiques : une rech...Université de Sherbrooke
Florian Meyer & Sonia Proust-Androwkha & Marie-Eve Desrochers, Université de Sherbrooke, Sherbrooke, Québec, Canada
La crise sanitaire récente a bien mis en exergue l’importance du numérique dans l’enseignement et de la maitrise de la compétence numérique (Karsenti, Poellhuber, Roy et Parent, 2020). Malheureusement pour le personnel enseignant cette compétence représente un réel défi et le besoin d’accompagnement et de soutien est grand et multidimensionnel.
Dans cette optique d’actualisation de la formation au numérique des personnes enseignantes, nous avons développé une première version d’un dispositif d’autoformation dynamique pour l’innovation (DADI) (Desrochers, Meyer et Bourque, 2019). Ce dispositif a pour objectif de favoriser le développement du savoir technopédagogique disciplinaire (Bachy, 2014) des personnes enseignantes et de mieux les outiller pour faire face aux défis technopédagogiques qu’elles rencontrent dans leurs réalités pédagogiques quotidiennes. DADI leur permet d’avoir un meilleur portrait d’ensemble de leurs pratiques, de leur compétence numérique et d’être guidées vers des ressources d’autoformation personnalisées qui sont adaptées à leurs besoins individuels et à leurs contextes de formation.
Cette première version du DADI, bien que solidement fondée d’un point de vue théorique (Desrochers, Meyer et Dyan-Charles, soumis), a été développée dans une logique pragmatique de formation et n’a fait l’objet d’aucun étude scientifique à proprement parler, ni de programmation impliquant de l’intelligence artificielle. Dans la recherche que nous présentons ici, la mise en pratique du modèle STPD dans l’outil d’autopositionnement est étudiée afin de comprendre comment assurer une réelle applicabilité formative. En complément de cette validation de l’applicabilité formative du modèle STPD, nous travaillons à l’élaboration d’une structure permettant d’y associer une intelligence artificielle efficace. En d’autres termes, cette recherche vise à permettre au dispositif DADI de devenir encore plus précis et efficace et de faire appel à un robot intelligent permettant un dialogue souple pour l’autodiagnostic.
Présentation réalisée par l'ANIC lors des journées Internet à Très Haut Débit : une révolution des usages ? organisée par la plate-forme THD de Cap Digital
BigText, compréhension et inférence avancées sur les textesPALO IT
Les groupes de travail de l’association EGC – « Fouille de Données Complexes » (GT-FDC), « Fouille de Grands Graphes » (GT-FGG), « Visualisation d’informations, interaction et fouille de données » (GT-VIF, commun avec l’AFIHM) et « Gestion et Analyse de données Spatiales et Temporelles » (GT-GAST, commun avec l’action prospective EXCES, GDR MAGIS) – organisent la 7ème édition des journées thématiques visant d’une part à poursuivre les activités des groupes et d’autre part à développer des axes communs autour de la prise en compte, la gestion, l’analyse, le traitement et la visualisation des données massives (Big Data).
Patrick LAFFITTE, Raja HADDAD et Yassin CHABEB ont présenté la conférence : BigText, compréhension et inférence avancées sur les textes.
Aujourd’hui, le volume des données textuelles échangées par les systèmes numériques est en croissance continue. L’exploitation de ces données offre de nombreuses perspectives de développement de nouveaux services pour les particuliers comme pour les professionnels.
Pour exploiter cette richesse, il est indispensable d’extraire et de produire des connaissances à partir de ce type de données.
Ce projet de fin d'étude avait pour but de tester les connaissances et l'expérience que nous avons acquises tout au long de notre cursus, dans un projet qui a qui englobe plusieurs technologies, il s'agit de réaliser une plateforme d'elearning, suivre les comportements de l'apprenant et de récupérer ses traces pendant une session d'apprentissage, nous avons expliqué les différentes étapes du processus du projet au cours de cette présentation.
DOWNLOAD : https://drive.google.com/file/d/1Z5d3V96Gc1Fob5yQseIh18zryge4xQ_k/view
TEMPLATE : https://drive.google.com/file/d/11plmfBHh9UHd9Vrmn41s6vx_oJorlkys/view?usp=sharing
Recherche d'Information Sociale en Langue Arabe : Cas de FacebookIsmail BADACHE
Cet article propose une approche de recherche d'information (RI) en langue arabe sur Facebook, qui exploite toutes les traces des utilisateurs (ex. polarité, partage, j'aime, haha) laissées sur des publications Facebook pour estimer leur importance sociale. Notre objectif est de montrer comment ces signaux peuvent jouer un rôle vital dans l'amélioration de la recherche en langue arabe sur Facebook. Premièrement, des polarités (positive ou négative) portée par les signaux textuels (ex. commentaires) et non textuels (ex. les réactions j'adore et triste) ont été identifiées pour chaque publication Facebook. Par conséquent, la polarité de chaque commentaire exprimé sur une publication donnée, est estimée sur la base d'un modèle neuronal de sentiment en langue arabe. Deuxièmement, des signaux en fonction de leur complémentarité ont été regroupés en utilisant des algorithmes de sélection. Troisièmement, des algorithmes de learning to rank ont été appliqués pour re-ordonner les résultats de recherche de Facebook en fonction des groupes de signaux sélectionnés. Enfin, des expérimentations sont réalisées sur 13500 publications Facebook, collectées à partir de 45 requêtes en langue arabe. Les expérimentations révèlent des résultats prometteurs pour la RI en langue arabe sur Facebook.
Predicting Contradiction Intensity: Low, Strong or Very Strong?Ismail BADACHE
Reviews on web resources (e.g. courses, movies) become increasingly exploited in text analysis tasks (e.g. opinion detection, controversy detection). This paper investigates contradiction intensity in reviews exploiting different features such as variation of ratings and variation of polarities around specific entities (e.g. aspects, topics). Firstly, aspects are identified according to the distributions of the emotional terms in the vicinity of the most frequent nouns in the reviews collection. Secondly, the polarity of each review segment containing an aspect is estimated. Only resources containing these aspects with opposite polarities are considered. Finally, some features are evaluated, using feature selection algorithms, to determine their impact on the effectiveness of contradiction intensity detection. The selected features are used to learn some state-of-the-art learning approaches. The experiments are conducted on the Massive Open Online Courses data set containing 2244 courses and their 73,873 reviews, collected from coursera.org. Results showed that variation of ratings, variation of polarities, and reviews quantity are the best predictors of contradiction intensity. Also, J48 was the most effective learning approach for this type of classification.
Contenu connexe
Similaire à Détection de contradiction dans les commentaires
Learning Analytics : entre Promesses et RéalitéSerge Garlatti
Université Bretagne Pays de Loire, UTICE : LES LEARNING ANALYTICS : QUAND LE BIG DATA S’INTÉRESSE À L’ÉDUCATION.
https://utice.u-bretagneloire.fr/evenement/les-learning-analytics-quand-le-big-data-sinteresse-leducation
L’usage du numérique dans l’éducation permet d’accéder aujourd’hui à une multitude de données sur le comportement des étudiants : identité, interactions entre apprenants, interactions avec les plateformes et outils d’apprentissage, résultats aux évaluations... La collecte et l’exploitation de ces données permettent de mieux comprendre les processus d’apprentissage et ainsi d’adapter les parcours pédagogiques proposés pour en renforcer l’efficacité, mais aussi de personnaliser les apprentissages ou de développer des outils de pilotage des formations. Une communauté de chercheurs et d’enseignants se développe autour de ce que l’on appelle les learning analytics, ou l’analyse des données d’apprentissage. Ce séminaire basé sur les recherches et des retours d’expérience d’enseignants-chercheurs et de jeunes entreprises permettra de cerner les enjeux et les perspectives des learning analytics.
L’évaluation constitue l’un des actes les plus complexes de la pratique enseignante. En comprendre les difficultés améliore l’efficacité de l’enseignement
Définition et évaluation de modèles d'agrégation pour l'estimation de la pert...Bilel Moulahi
Présentation de thèse intitulée : Définition et évaluation de modèles d'agrégation pour l'estimation de la pertinence multi-dimensionnelle en recherche d'information
Thèse soutenue le 11/12/2015 à l'IRIT (UPS, Toulouse)
Télécharger la présentation (.pptx) : http://www.irit.fr/publis/SIG/Presentation_thesis_Moulahi_2015.pptx
Télécharger la thèse : http://www.irit.fr/publis/SIG/Thesis_Moulahi_2015.pdf
Fr presenLes obstacles à l'adoption des logiciels libres pour les systemes ...Placide Poba Nzaou
Extrait de la source suivante:
Poba-Nzaou, P. & Uwizeyemungu, S.
Les obstacles à l'adoption des logiciels libres pour les
systemes critiques par les organisations :
le point de vue des fournisseurs
Comptes rendus de la 19eme conference des Ameriques sur
les systemes d'information (AMCIS),
Chicago, Etats Unis, 15-17 Ao^ut, 2013,
10 pages
Présentation aux collègues du lycée Blaise Pascal (Charbonnières les bains) de notre objectif de développer chez les élèves les conditions d’un meilleur accès aux savoirs, en jouant notamment sur la motivation, l’attention, l’intérêt et l’ implication dans les apprentissages scolaires à travers une plate-forme pédagogique (SPIRAL).
Inscrivez-vous à la formation EMFPS du 25 au 27 septembre 2018 "Maîtriser la...Jean-Luc Balança
animée par Muriel Tounsi (Responsable des statistiques, Chef de Projet – Axonal – Biostatem), Nicolas Lemaire (Biostatisticien senior, Chef de Projet – Axonal – Biostatem), Béranger Lueza, PhD (Lead Consultant – Amaris HEMA)
https://bit.ly/2u7MTlC
Un dispositif d'autoformation aux connaissances technopédagogiques : une rech...Université de Sherbrooke
Florian Meyer & Sonia Proust-Androwkha & Marie-Eve Desrochers, Université de Sherbrooke, Sherbrooke, Québec, Canada
La crise sanitaire récente a bien mis en exergue l’importance du numérique dans l’enseignement et de la maitrise de la compétence numérique (Karsenti, Poellhuber, Roy et Parent, 2020). Malheureusement pour le personnel enseignant cette compétence représente un réel défi et le besoin d’accompagnement et de soutien est grand et multidimensionnel.
Dans cette optique d’actualisation de la formation au numérique des personnes enseignantes, nous avons développé une première version d’un dispositif d’autoformation dynamique pour l’innovation (DADI) (Desrochers, Meyer et Bourque, 2019). Ce dispositif a pour objectif de favoriser le développement du savoir technopédagogique disciplinaire (Bachy, 2014) des personnes enseignantes et de mieux les outiller pour faire face aux défis technopédagogiques qu’elles rencontrent dans leurs réalités pédagogiques quotidiennes. DADI leur permet d’avoir un meilleur portrait d’ensemble de leurs pratiques, de leur compétence numérique et d’être guidées vers des ressources d’autoformation personnalisées qui sont adaptées à leurs besoins individuels et à leurs contextes de formation.
Cette première version du DADI, bien que solidement fondée d’un point de vue théorique (Desrochers, Meyer et Dyan-Charles, soumis), a été développée dans une logique pragmatique de formation et n’a fait l’objet d’aucun étude scientifique à proprement parler, ni de programmation impliquant de l’intelligence artificielle. Dans la recherche que nous présentons ici, la mise en pratique du modèle STPD dans l’outil d’autopositionnement est étudiée afin de comprendre comment assurer une réelle applicabilité formative. En complément de cette validation de l’applicabilité formative du modèle STPD, nous travaillons à l’élaboration d’une structure permettant d’y associer une intelligence artificielle efficace. En d’autres termes, cette recherche vise à permettre au dispositif DADI de devenir encore plus précis et efficace et de faire appel à un robot intelligent permettant un dialogue souple pour l’autodiagnostic.
Présentation réalisée par l'ANIC lors des journées Internet à Très Haut Débit : une révolution des usages ? organisée par la plate-forme THD de Cap Digital
BigText, compréhension et inférence avancées sur les textesPALO IT
Les groupes de travail de l’association EGC – « Fouille de Données Complexes » (GT-FDC), « Fouille de Grands Graphes » (GT-FGG), « Visualisation d’informations, interaction et fouille de données » (GT-VIF, commun avec l’AFIHM) et « Gestion et Analyse de données Spatiales et Temporelles » (GT-GAST, commun avec l’action prospective EXCES, GDR MAGIS) – organisent la 7ème édition des journées thématiques visant d’une part à poursuivre les activités des groupes et d’autre part à développer des axes communs autour de la prise en compte, la gestion, l’analyse, le traitement et la visualisation des données massives (Big Data).
Patrick LAFFITTE, Raja HADDAD et Yassin CHABEB ont présenté la conférence : BigText, compréhension et inférence avancées sur les textes.
Aujourd’hui, le volume des données textuelles échangées par les systèmes numériques est en croissance continue. L’exploitation de ces données offre de nombreuses perspectives de développement de nouveaux services pour les particuliers comme pour les professionnels.
Pour exploiter cette richesse, il est indispensable d’extraire et de produire des connaissances à partir de ce type de données.
Ce projet de fin d'étude avait pour but de tester les connaissances et l'expérience que nous avons acquises tout au long de notre cursus, dans un projet qui a qui englobe plusieurs technologies, il s'agit de réaliser une plateforme d'elearning, suivre les comportements de l'apprenant et de récupérer ses traces pendant une session d'apprentissage, nous avons expliqué les différentes étapes du processus du projet au cours de cette présentation.
DOWNLOAD : https://drive.google.com/file/d/1Z5d3V96Gc1Fob5yQseIh18zryge4xQ_k/view
TEMPLATE : https://drive.google.com/file/d/11plmfBHh9UHd9Vrmn41s6vx_oJorlkys/view?usp=sharing
Similaire à Détection de contradiction dans les commentaires (20)
Recherche d'Information Sociale en Langue Arabe : Cas de FacebookIsmail BADACHE
Cet article propose une approche de recherche d'information (RI) en langue arabe sur Facebook, qui exploite toutes les traces des utilisateurs (ex. polarité, partage, j'aime, haha) laissées sur des publications Facebook pour estimer leur importance sociale. Notre objectif est de montrer comment ces signaux peuvent jouer un rôle vital dans l'amélioration de la recherche en langue arabe sur Facebook. Premièrement, des polarités (positive ou négative) portée par les signaux textuels (ex. commentaires) et non textuels (ex. les réactions j'adore et triste) ont été identifiées pour chaque publication Facebook. Par conséquent, la polarité de chaque commentaire exprimé sur une publication donnée, est estimée sur la base d'un modèle neuronal de sentiment en langue arabe. Deuxièmement, des signaux en fonction de leur complémentarité ont été regroupés en utilisant des algorithmes de sélection. Troisièmement, des algorithmes de learning to rank ont été appliqués pour re-ordonner les résultats de recherche de Facebook en fonction des groupes de signaux sélectionnés. Enfin, des expérimentations sont réalisées sur 13500 publications Facebook, collectées à partir de 45 requêtes en langue arabe. Les expérimentations révèlent des résultats prometteurs pour la RI en langue arabe sur Facebook.
Predicting Contradiction Intensity: Low, Strong or Very Strong?Ismail BADACHE
Reviews on web resources (e.g. courses, movies) become increasingly exploited in text analysis tasks (e.g. opinion detection, controversy detection). This paper investigates contradiction intensity in reviews exploiting different features such as variation of ratings and variation of polarities around specific entities (e.g. aspects, topics). Firstly, aspects are identified according to the distributions of the emotional terms in the vicinity of the most frequent nouns in the reviews collection. Secondly, the polarity of each review segment containing an aspect is estimated. Only resources containing these aspects with opposite polarities are considered. Finally, some features are evaluated, using feature selection algorithms, to determine their impact on the effectiveness of contradiction intensity detection. The selected features are used to learn some state-of-the-art learning approaches. The experiments are conducted on the Massive Open Online Courses data set containing 2244 courses and their 73,873 reviews, collected from coursera.org. Results showed that variation of ratings, variation of polarities, and reviews quantity are the best predictors of contradiction intensity. Also, J48 was the most effective learning approach for this type of classification.
Contradiction in Reviews: is it Strong or Low?Ismail BADACHE
Analysis of opinions (reviews) generated by users becomes increasingly exploited by a variety of applications. It allows to follow the evolution of the opinions or to carry out investigations on web resource (e.g. courses, movies, products). The detection of contradictory opinions is an important task to evaluate the latter. This paper focuses on the problem of detecting and estimating contradiction intensity based on the sentiment analysis around specific aspects of a resource. Firstly, certain aspects are identified, according to the distributions of the emotional terms in the vicinity of the most frequent names in the whole of the reviews. Secondly, the polarity of each review segment containing an aspect is estimated using the state-of-the-art approach SentiNeuron. Then, only the resources containing these aspects with opposite polarities (positive, negative) are considered. Thirdly, a measure of the intensity of the contradiction is introduced. It is based on the joint dispersion of the polarity and the rating of the reviews containing the aspects within each resource. The evaluation of the proposed approach is conducted on the Massive Open Online Courses collection containing 2244 courses and their 73,873 reviews, collected from Coursera. The results revealed the effectiveness of the proposed approach to detect and quantify contradictions.
Emotional Social Signals for Search RankingIsmail BADACHE
A large amount of social feedback expressed by social signals (e.g. like, +1, rating) are assigned to web resources. These signals are often exploited as additional sources of evidence in search engines. Our objective in this paper is to study the impact of the new social signals, called Facebook reactions (love, haha, angry, wow, sad) in the retrieval. These reactions allow users to express more nuanced emotions compared to classic signals (e.g. like, share). First, we analyze these reactions and show how users use these signals to interact with posts. Second, we evaluate the impact of each such reaction in the retrieval, by comparing them to both the textual model without social features and the first classical signal (like-based model). These social features are modeled as document prior and are integrated into a language model. We conducted a series of experiments on IMDb dataset. Our findings reveal that incorporating social features is a promising approach for improving the retrieval ranking performance.
Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity i...Ismail BADACHE
Analysis of opinions (reviews) generated by users becomes increasingly exploited by a variety of applications. It allows to follow the evolution of the opinions or to carry out investigations on products. The detection of contradictory opinions about a web resource (e.g., courses, movies, products, etc.) is an important task to evaluate the latter. This paper focuses on the problem of detecting contradictions in reviews based on the sentiment analysis around specific aspects of a resource (document). In general, for web resources such as online courses (e.g. on Coursera or edX), reviews are often generated during course sessions. Between each session users stop reviewing on the course, and this course may have updates. So, in order to avoid the confusion of contradictory reviews coming from two or more different sessions, the reviews related to a given resource should be firstly grouped according to their session. Secondly, certain aspects are extracted according to the distributions of the emotional terms in the vicinity of the most frequent names in the reviews collection. Thirdly, the polarity of each review segment containing an aspect is identified. Then taking only the resources containing these aspects with opposite polarities (positive, negative). Finally, we propose a measure of contradiction intensity based on the joint dispersion of the polarity and the rating of the reviews containing the aspects within each resource. The evaluation of our approach is conducted on the Massive Open Online Courses (MOOC) collection containing 2244 courses and their 73,873 reviews, collected from Coursera. The results of experiments revealed the effectiveness of the proposed approach to capture and quantify contradiction intensity.
Finding and Quantifying Temporal-Aware Contradiction in ReviewsIsmail BADACHE
Opinions (reviews) on web resources (e.g., courses, movies), generated by users, become increasingly exploited in text analysis tasks, the detection of contradictory opinions being one of them. This paper focuses on the quantification of sentiment-based contradictions around specific aspects in reviews. However, it is necessary to study the contradictions with respect to the temporal dimension of reviews (their sessions). In general, for web resources such as online courses (e.g. coursera or edX), reviews are often generated during the course sessions. Between sessions, users stop reviewing courses, and there are chances that courses will be updated. So, in order to avoid the confusion of contradictory reviews coming from two or more different sessions, the reviews related to a given resource should be firstly grouped according to their corresponding session. Secondly, aspects are identified according to the distributions of the emotional terms in the vicinity of the most frequent nouns in the reviews collection. Thirdly, the polarity of each review segment containing an aspect is estimated. Then, only resources containing these aspects with opposite polarities are considered. Finally, the contradiction intensity is estimated based on the joint dispersion of polarities and ratings of the reviews containing aspects. The experiments are conducted on the Massive Open Online Courses data set containing 2244 courses and their 73,873 reviews, collected from \textit{coursera.org}. The results confirm the effectiveness of our approach to find and quantify contradiction intensity.
Les Signaux Sociaux Émotionnels : Quel impact sur la RI ? Ismail BADACHE
RÉSUMÉ. Une grande partie des traces des utilisateurs exprimées par des signaux sociaux (ex. j’aime, +1, rating) sont attribuées aux ressources web. Ces signaux sont souvent exploités par les systèmes de RI comme des sources d’évidence additionnelles pour trier les résultats de recherche. Notre objectif dans cet article est d’étudier l’impact des nouveaux signaux sociaux, appelés Facebook reactions (j’adore, haha, grrr, wouah, triste) sur le tri de ces résultats. Ces réactions permettent aux utilisateurs d’exprimer des émotions plus nuancés par rapport aux signaux classiques (ex. like, share). Nous analysons tout d’abord ces réactions et montrons la manière dont les internautes les utilisent pour interagir avec les ressources (ex. posts, vidéo, etc). Ensuite, nous évaluons l’impact de ces réactions dans le tri des résultats de recherche en les comparant à un modèles de tri textuel et à un modèle qui prend en compte le signal j’aime. Ces caractéristiques sociales sont modélisées comme une probabilité a priori du document et elles sont intégrées dans un modèle de langue. Nous avons effectué une série d’expérimentations sur la collection INEX IMDb. Nos résultats révèlent que la prise en compte de ces signaux améliore significativement la qualité des résultats de recherche.
ABSTRACT. A large amount of social feedback expressed by social signals (e.g. like, +1, rating) are assigned to web resources. These signals are often exploited as additional sources of evidence in search engines. Our objective in this paper is to study the impact of the new social signals, called Facebook reactions (love, haha, angry, wow, sad) in the retrieval. These reactions allow users to express more nuanced emotions compared to classic signals (e.g. like, share). First, we analyze these reactions and show how users use these signals to interact with resources (e.g. posts, video, etc). Second, we evaluate the impact of each such reaction in the retrieval, by comparing them to both the textual model without social features and the first classical signal (like-based model). These social features are modeled as document prior and are integrated into a language model. We conducted a series of experiments on INEX IMDb dataset. Our findings reveal that incorporating social features is a promising approach for improving the retrieval ranking performance.
Today’s information retrieval applications have become increasingly complex. The Social Book Search (SBS) lab at CLEF 2015 allows evaluating retrieval methods on a complex search task with several textual and non-textual meta-data fields. The challenge is to incorporate the different information types (modalities) into a single ranked list. We build a strong textual baseline and combine it with a document prior based on social signals. Further, we include non-textual modalities in relation to the user preferences using random forest learning to rank. Our experiments show that both the social document prior and the learning to rank approach improve the search results.
Exploitation de signaux sociaux pour estimer la pertinence a priori d’une res...Ismail BADACHE
Dans cet article nous proposons une approche de recherche d’information (RI) qui prend en compte le contenu social associé à une ressource pour mesurer sa pertinence a priori vis-à-vis d’une requête. Nous démontrons comment ces caractéristiques, qui sont sous forme d’actions (signaux sociaux) tels que le nombre de "j’aime" et de "partage", peuvent être combinées pour quantifier des propriétés sociales telles que la popularité et la réputation. Nous proposons de modéliser ces propriétés comme des probabilités a priori que nous intégrons dans un modèle de langue. Nous avons évalué l’efficacité de notre approche sur la collection d’IMDb contenant 32706 documents et leurs caractéristiques sociales collectées sur plusieurs réseaux sociaux. Nos résultats expérimentaux sont très prometteurs et montrent l'intérêt de l'intégration des propriétés sociales dans un modèle de recherche pour améliorer la RI.
1. Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Détection de contradiction dans les commentaires
Ismail Badache - Sébastien Fournier - Adrian-Gabriel Chifu
Prénom.Nom@lsis.org
Laboratoire des Sciences de l’Information et des Systèmes
Aix-Marseille Université
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 1 / 22
2. Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Plan
Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 2 / 22
3. Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Introduction
• Diversité des opinions sur un sujet donné ⇒ Contradiction
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 3 / 22
4. Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Hypothèses
Hypothèse 1 : une contradiction
Une contradiction dans des commentaires liés à une ressource
donnée (ex. film, cours, etc) signifie des opinions contradictoires
exprimées sur un aspect spécifique, qui est une forme de diversité
de sentiments autour de l’aspect au sein de la même ressource.
Hypothèse 2 : intensité d’une contradiction
Un aspect avec un sentiment négatif dans un commentaire avec un
rating positif (et inversement) a un impact plus important sur
l’intensité de la contradiction qu’un aspect avec un sentiment
positif dans un commentaire avec un rating positif.
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 4 / 22
5. Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Questions de recherche
• Comment identifier une contradiction sur un aspect dans les
commentaires ?
• Comment mesurer le degré de contradiction entre les
commentaires ?
• Quel est l’impact de la prise en compte conjointe de la polarité
et du rating des commentaires sur la mesure de l’intensité de
la contradiction ?
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 5 / 22
6. Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Vue d’ensemble : travaux relatifs
Détection de controverses
• Wikipédia (Wang et al., 2014), les "news" (Tsytsarau et al.,
2014), lors de l’analyse de débat (Qiu et al., 2013) ou de
manière générique sur le Web (Jang et Allan, 2016).
Détection d’aspects
• les HMM (Hidden Markov Models) ou les CRF (Conditional
Random Fields) comme (Hamdan et al., 2015).
• non supervisée (Kim, 2013), règles statistiques (Poria, 2014).
Analyse de sentiments
• lexiques (Turney, 2002) ou corpus (Mohammad et al., 2013).
• naïve bayes (Pang et al., 2002), RNN (Socher et al., 2013).
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 6 / 22
7. Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Comment détecter la contradiction ?
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 7 / 22
8. Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Extraction des aspects
1 Calcul fréquentiel des termes constituant le corpus des
commentaires,
2 Catégorisation des termes de chaque commentaire en utilisant
Stanford Parser 1,
3 Sélection des termes ayant la catégorie nominale,
4 Sélection des noms avec des termes émotionnels dans leur
voisinages de 5 mots (en utilisant SentiWordNet 2),
5 Extraction des termes les plus fréquents (utilisés) dans le
corpus parmi ceux sélectionner dans l’étape précédente. Ces
termes seront considérés comme des aspects.
1. http://nlp.stanford.edu:8080/parser/
2. http://sentiwordnet.isti.cnr.it/
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 8 / 22
9. Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Extraction des aspects : exemple
Étape Description
(1)
course : 44219, material : 3286, assignments : 3118, content : 2947,
lecturer : 2705, ....... termei
(2)
The/DT lecturer/NN was/VBD an/DT annoying/VBG speaker/NN
and/CC very/RB repetitive/JJ ./. I/PRP found/VBD the/DT format-
ting/NN so/RB different/JJ from/IN other/JJ courses/NNS I/PRP
’ve/VBP taken/VBN ,/, that/IN it/PRP was/VBD hard/JJ to/TO
get/VB started/VBN and/CC figure/VB things/NNS out/RP ./.
(3) lecturer, speaker, formatting, things
(4) lecturer, speaker
(5) lecturer
L’aspect utile est "lecturer"
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 9 / 22
10. Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Analyse de sentiment
Définition 1 : Sentiment
Les sentiments par rapport à un aspect sont un nombre réel dans la
plage [-1, 1] qui indique la polarité de l’opinion exprimée dans le
commentaire. Les valeurs négatives et positives représentent
respectivement des opinions négatives et positives.
Modèle d’analyse de sentiments :
• Modèle supervisé basé sur Naïve Bayes.
• Traitement des simples négations (not, n’t, no).
• Traitement d’intensificateurs et d’adverbes (very, absolutely).
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 10 / 22
11. Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Mesure de contradiction
Définition 2 : Contradiction
Il y a une contradiction sur un aspect donné, entre deux extraits de
commentaires contenant cet aspect (ca1, ca2 ∈ D), lorsque les
polarités autour de l’aspect sont opposées, Pol(ca1) ∩ Pol(ca2) = φ.
• Pol(cai ) représente la fonction qui retourne la polarité
(positive, négative) du commentaire-aspect cai .
Intensité de contradiction :
• Dimensions (poli , rati ) pour chaque commentaire-aspect cai .
• Dispersion des cai modélisés par un nuage de points.
• Plus la distance est élevée entre les points cai par rapport à un
centroide cacentroide du même document D, plus le degré de
contradiction est important.
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 11 / 22
12. Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Mesure de contradiction
• Fonction de dispersion (inertie du nuage) :
Disp(capol
rat , D) =
1
n
n
i=1
Distance(poli , rati ) (1)
avec :
Distance(poli , rati ) = (poli − pol)2 + (rati − rat)2 (2)
• Normalisation des ratings rati : rati = rati −3
2 .
• Distance(poli , rati ) est la distance du point cai du nuage au
point centroide cacentroide, tandis que n est le nombre de
points cai du nuage.
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 12 / 22
13. Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Mesure de contradiction
Figure – Dispersion des commentaires-aspect cai par rapport au cacentroide
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 13 / 22
14. Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Mesure de contradiction
Les coordonnées (pol, rat) du centroide cacentroide peuvent être
calculées de deux manières différentes :
1 Centroïde basé sur la moyenne des poli et des rati
pol=
pol1+pol2+...+poln
n
; rat=
rat1+rat2+...+ratn
n
(3)
2 Centroïde basé sur la moyenne pondérée des poli et rati
pol =
c1 · pol1 + c2 · pol2 + ... + cn · poln
n
(4)
rat =
c1 · rat1 + c2 · rat2 + ... + cn · ratn
n
(5)
avec :
ci =
|Rati − Poli |
2n
(6)
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 14 / 22
15. Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Objectifs et collection de test
• Évaluer l’impact de l’analyse de sentiment et du rating sur la
détection de contradictions autour de certains aspects.
• Évaluer l’impact du centroide moyenné et pondéré sur la
mesure de l’intensité des contradictions.
• Collection de test : issue de "coursera.org"
Champ Nombre Total
Cours 2244
Cours notés 1115
Commentaires 73873
Ratings 298326
Commentaires 1705
Commentaires 1443
Commentaires 3302
Commentaires 12202
Commentaires 55221
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 15 / 22
16. Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Les aspects détectés
• 22 aspects capturés automatiquement sur l’ensemble des
commentaires issus de "coursera.org"
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 16 / 22
17. Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Évaluation manuelle "User Study"
• Évaluation manuelle (contradictions et sentiments) :
• 3 évaluateurs.
• 10 cours pour chaque aspect.
• 1320 commentaires/aspect de 220 cours.
• Kappa Cohen (contradictions) : k = 0.68.
• Kappa Cohen (sentiments) : k = 0.76.
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 17 / 22
18. Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Protocole d’évaluation
• Analyseur de sentiments (Naïve Bayes) :
• Ensemble d’apprentissage : 50.000 commentaires d’IMDb 3
.
• Ensemble de test : les commentaires-aspect de coursera.
• Précision : 79% (taux d’erreur 21%).
• Les jugements des évaluateurs sur les sentiments, représentent
une précision de 100% (référence).
• Évaluation de la performance de notre approche :
• Étude de corrélation (mesure officielle de SemEval 4
).
• Entre les jugements de contradiction donnés par les
évaluateurs et les résultats obtenus par notre approche.
• Coefficients de corrélation de Pearson et Spearman.
3. http://ai.stanford.edu/~amaas/data/sentiment/
4. http://alt.qcri.org/semeval2016/task7/
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 18 / 22
19. Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Évaluation expérimentale
Figure – Corrélation entre les jugements de contradiction et les résultats
de notre approche (avec un taux d’erreur de 21% dans la détection de
sentiments)
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 19 / 22
20. Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Évaluation expérimentale
Figure – Corrélation entre les jugements de contradiction et les résultats
de notre approche (avec un taux d’erreur de 0% dans la détection de
sentiments)
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 20 / 22
21. Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Conclusion
• Contribution : estimation de l’intensité de contradiction
• Exploitation conjointe des polarités et des ratings.
• Calcul de centroide de 2 manières (moyenné et pondéré).
• limites :
• Dépendance de la qualité des modèles d’analyse de sentiments
et de détection des aspects.
• Simplicité des modèles de pré-traitements.
• Détection des phrases auxquelles appartient un aspect.
• Perspectives :
• Améliorer l’analyse de sentiments, d’aspects et des phrases.
• Prise en compte des sessions temporelles des commentaires.
• Prise en compte du profil de l’utilisateur.
• S’affranchir du rating.
• D’autres expérimentations à plus grande échelle sur d’autres
types de collections.
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 21 / 22
22. Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 22 / 22