SlideShare une entreprise Scribd logo
1  sur  22
Télécharger pour lire hors ligne
Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Détection de contradiction dans les commentaires
Ismail Badache - Sébastien Fournier - Adrian-Gabriel Chifu
Prénom.Nom@lsis.org
Laboratoire des Sciences de l’Information et des Systèmes
Aix-Marseille Université
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 1 / 22
Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Plan
Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 2 / 22
Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Introduction
• Diversité des opinions sur un sujet donné ⇒ Contradiction
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 3 / 22
Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Hypothèses
Hypothèse 1 : une contradiction
Une contradiction dans des commentaires liés à une ressource
donnée (ex. film, cours, etc) signifie des opinions contradictoires
exprimées sur un aspect spécifique, qui est une forme de diversité
de sentiments autour de l’aspect au sein de la même ressource.
Hypothèse 2 : intensité d’une contradiction
Un aspect avec un sentiment négatif dans un commentaire avec un
rating positif (et inversement) a un impact plus important sur
l’intensité de la contradiction qu’un aspect avec un sentiment
positif dans un commentaire avec un rating positif.
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 4 / 22
Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Questions de recherche
• Comment identifier une contradiction sur un aspect dans les
commentaires ?
• Comment mesurer le degré de contradiction entre les
commentaires ?
• Quel est l’impact de la prise en compte conjointe de la polarité
et du rating des commentaires sur la mesure de l’intensité de
la contradiction ?
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 5 / 22
Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Vue d’ensemble : travaux relatifs
Détection de controverses
• Wikipédia (Wang et al., 2014), les "news" (Tsytsarau et al.,
2014), lors de l’analyse de débat (Qiu et al., 2013) ou de
manière générique sur le Web (Jang et Allan, 2016).
Détection d’aspects
• les HMM (Hidden Markov Models) ou les CRF (Conditional
Random Fields) comme (Hamdan et al., 2015).
• non supervisée (Kim, 2013), règles statistiques (Poria, 2014).
Analyse de sentiments
• lexiques (Turney, 2002) ou corpus (Mohammad et al., 2013).
• naïve bayes (Pang et al., 2002), RNN (Socher et al., 2013).
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 6 / 22
Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Comment détecter la contradiction ?
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 7 / 22
Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Extraction des aspects
1 Calcul fréquentiel des termes constituant le corpus des
commentaires,
2 Catégorisation des termes de chaque commentaire en utilisant
Stanford Parser 1,
3 Sélection des termes ayant la catégorie nominale,
4 Sélection des noms avec des termes émotionnels dans leur
voisinages de 5 mots (en utilisant SentiWordNet 2),
5 Extraction des termes les plus fréquents (utilisés) dans le
corpus parmi ceux sélectionner dans l’étape précédente. Ces
termes seront considérés comme des aspects.
1. http://nlp.stanford.edu:8080/parser/
2. http://sentiwordnet.isti.cnr.it/
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 8 / 22
Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Extraction des aspects : exemple
Étape Description
(1)
course : 44219, material : 3286, assignments : 3118, content : 2947,
lecturer : 2705, ....... termei
(2)
The/DT lecturer/NN was/VBD an/DT annoying/VBG speaker/NN
and/CC very/RB repetitive/JJ ./. I/PRP found/VBD the/DT format-
ting/NN so/RB different/JJ from/IN other/JJ courses/NNS I/PRP
’ve/VBP taken/VBN ,/, that/IN it/PRP was/VBD hard/JJ to/TO
get/VB started/VBN and/CC figure/VB things/NNS out/RP ./.
(3) lecturer, speaker, formatting, things
(4) lecturer, speaker
(5) lecturer
L’aspect utile est "lecturer"
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 9 / 22
Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Analyse de sentiment
Définition 1 : Sentiment
Les sentiments par rapport à un aspect sont un nombre réel dans la
plage [-1, 1] qui indique la polarité de l’opinion exprimée dans le
commentaire. Les valeurs négatives et positives représentent
respectivement des opinions négatives et positives.
Modèle d’analyse de sentiments :
• Modèle supervisé basé sur Naïve Bayes.
• Traitement des simples négations (not, n’t, no).
• Traitement d’intensificateurs et d’adverbes (very, absolutely).
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 10 / 22
Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Mesure de contradiction
Définition 2 : Contradiction
Il y a une contradiction sur un aspect donné, entre deux extraits de
commentaires contenant cet aspect (ca1, ca2 ∈ D), lorsque les
polarités autour de l’aspect sont opposées, Pol(ca1) ∩ Pol(ca2) = φ.
• Pol(cai ) représente la fonction qui retourne la polarité
(positive, négative) du commentaire-aspect cai .
Intensité de contradiction :
• Dimensions (poli , rati ) pour chaque commentaire-aspect cai .
• Dispersion des cai modélisés par un nuage de points.
• Plus la distance est élevée entre les points cai par rapport à un
centroide cacentroide du même document D, plus le degré de
contradiction est important.
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 11 / 22
Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Mesure de contradiction
• Fonction de dispersion (inertie du nuage) :
Disp(capol
rat , D) =
1
n
n
i=1
Distance(poli , rati ) (1)
avec :
Distance(poli , rati ) = (poli − pol)2 + (rati − rat)2 (2)
• Normalisation des ratings rati : rati = rati −3
2 .
• Distance(poli , rati ) est la distance du point cai du nuage au
point centroide cacentroide, tandis que n est le nombre de
points cai du nuage.
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 12 / 22
Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Mesure de contradiction
Figure – Dispersion des commentaires-aspect cai par rapport au cacentroide
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 13 / 22
Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Mesure de contradiction
Les coordonnées (pol, rat) du centroide cacentroide peuvent être
calculées de deux manières différentes :
1 Centroïde basé sur la moyenne des poli et des rati
pol=
pol1+pol2+...+poln
n
; rat=
rat1+rat2+...+ratn
n
(3)
2 Centroïde basé sur la moyenne pondérée des poli et rati
pol =
c1 · pol1 + c2 · pol2 + ... + cn · poln
n
(4)
rat =
c1 · rat1 + c2 · rat2 + ... + cn · ratn
n
(5)
avec :
ci =
|Rati − Poli |
2n
(6)
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 14 / 22
Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Objectifs et collection de test
• Évaluer l’impact de l’analyse de sentiment et du rating sur la
détection de contradictions autour de certains aspects.
• Évaluer l’impact du centroide moyenné et pondéré sur la
mesure de l’intensité des contradictions.
• Collection de test : issue de "coursera.org"
Champ Nombre Total
Cours 2244
Cours notés 1115
Commentaires 73873
Ratings 298326
Commentaires 1705
Commentaires 1443
Commentaires 3302
Commentaires 12202
Commentaires 55221
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 15 / 22
Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Les aspects détectés
• 22 aspects capturés automatiquement sur l’ensemble des
commentaires issus de "coursera.org"
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 16 / 22
Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Évaluation manuelle "User Study"
• Évaluation manuelle (contradictions et sentiments) :
• 3 évaluateurs.
• 10 cours pour chaque aspect.
• 1320 commentaires/aspect de 220 cours.
• Kappa Cohen (contradictions) : k = 0.68.
• Kappa Cohen (sentiments) : k = 0.76.
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 17 / 22
Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Protocole d’évaluation
• Analyseur de sentiments (Naïve Bayes) :
• Ensemble d’apprentissage : 50.000 commentaires d’IMDb 3
.
• Ensemble de test : les commentaires-aspect de coursera.
• Précision : 79% (taux d’erreur 21%).
• Les jugements des évaluateurs sur les sentiments, représentent
une précision de 100% (référence).
• Évaluation de la performance de notre approche :
• Étude de corrélation (mesure officielle de SemEval 4
).
• Entre les jugements de contradiction donnés par les
évaluateurs et les résultats obtenus par notre approche.
• Coefficients de corrélation de Pearson et Spearman.
3. http://ai.stanford.edu/~amaas/data/sentiment/
4. http://alt.qcri.org/semeval2016/task7/
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 18 / 22
Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Évaluation expérimentale
Figure – Corrélation entre les jugements de contradiction et les résultats
de notre approche (avec un taux d’erreur de 21% dans la détection de
sentiments)
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 19 / 22
Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Évaluation expérimentale
Figure – Corrélation entre les jugements de contradiction et les résultats
de notre approche (avec un taux d’erreur de 0% dans la détection de
sentiments)
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 20 / 22
Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Conclusion
• Contribution : estimation de l’intensité de contradiction
• Exploitation conjointe des polarités et des ratings.
• Calcul de centroide de 2 manières (moyenné et pondéré).
• limites :
• Dépendance de la qualité des modèles d’analyse de sentiments
et de détection des aspects.
• Simplicité des modèles de pré-traitements.
• Détection des phrases auxquelles appartient un aspect.
• Perspectives :
• Améliorer l’analyse de sentiments, d’aspects et des phrases.
• Prise en compte des sessions temporelles des commentaires.
• Prise en compte du profil de l’utilisateur.
• S’affranchir du rating.
• D’autres expérimentations à plus grande échelle sur d’autres
types de collections.
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 21 / 22
Introduction
Vue d’ensemble : travaux relatifs
Détection et intensité de contradiction
Évaluation expérimentale
Conclusion
Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 22 / 22

Contenu connexe

Similaire à Détection de contradiction dans les commentaires

Persévérer en génie: l'apprentissage par problèmes y est-il pour quelque chose?
Persévérer en génie: l'apprentissage par problèmes y est-il pour quelque chose?Persévérer en génie: l'apprentissage par problèmes y est-il pour quelque chose?
Persévérer en génie: l'apprentissage par problèmes y est-il pour quelque chose?
Christelle Lison
 
Un dispositif d'autoformation aux connaissances technopédagogiques : une rech...
Un dispositif d'autoformation aux connaissances technopédagogiques : une rech...Un dispositif d'autoformation aux connaissances technopédagogiques : une rech...
Un dispositif d'autoformation aux connaissances technopédagogiques : une rech...
Université de Sherbrooke
 
#Mooc gd p – 56 - séminaire idea univ paris-est - 24-11-2014
#Mooc gd p – 56 - séminaire idea univ paris-est - 24-11-2014#Mooc gd p – 56 - séminaire idea univ paris-est - 24-11-2014
#Mooc gd p – 56 - séminaire idea univ paris-est - 24-11-2014
Rémi Bachelet
 
Détection de communautés dans des réseaux d’information utilisant liens et at...
Détection de communautés dans des réseaux d’information utilisant liens et at...Détection de communautés dans des réseaux d’information utilisant liens et at...
Détection de communautés dans des réseaux d’information utilisant liens et at...
David Combe
 

Similaire à Détection de contradiction dans les commentaires (20)

Learning Analytics : entre Promesses et Réalité
Learning Analytics : entre Promesses et RéalitéLearning Analytics : entre Promesses et Réalité
Learning Analytics : entre Promesses et Réalité
 
Persévérer en génie: l'apprentissage par problèmes y est-il pour quelque chose?
Persévérer en génie: l'apprentissage par problèmes y est-il pour quelque chose?Persévérer en génie: l'apprentissage par problèmes y est-il pour quelque chose?
Persévérer en génie: l'apprentissage par problèmes y est-il pour quelque chose?
 
Evaluer les acquis des étudiants
Evaluer les acquis des étudiantsEvaluer les acquis des étudiants
Evaluer les acquis des étudiants
 
Définition et évaluation de modèles d'agrégation pour l'estimation de la pert...
Définition et évaluation de modèles d'agrégation pour l'estimation de la pert...Définition et évaluation de modèles d'agrégation pour l'estimation de la pert...
Définition et évaluation de modèles d'agrégation pour l'estimation de la pert...
 
Evaluation des algorithmes d’apprentissage de structure pour les réseaux Bayé...
Evaluation des algorithmes d’apprentissage de structure pour les réseaux Bayé...Evaluation des algorithmes d’apprentissage de structure pour les réseaux Bayé...
Evaluation des algorithmes d’apprentissage de structure pour les réseaux Bayé...
 
Fr presenLes obstacles à l'adoption des logiciels libres pour les systemes ...
Fr presenLes obstacles à l'adoption des logiciels libres pour les systemes ...Fr presenLes obstacles à l'adoption des logiciels libres pour les systemes ...
Fr presenLes obstacles à l'adoption des logiciels libres pour les systemes ...
 
Confrontation à la perception humaine de mesures de similarité entre membres
Confrontation à la perception humaine de mesures de similarité entre membres Confrontation à la perception humaine de mesures de similarité entre membres
Confrontation à la perception humaine de mesures de similarité entre membres
 
Learning analytics&classejanvier2017
Learning analytics&classejanvier2017Learning analytics&classejanvier2017
Learning analytics&classejanvier2017
 
Vae V10
Vae V10Vae V10
Vae V10
 
Inscrivez-vous à la formation EMFPS du 25 au 27 septembre 2018 "Maîtriser la...
Inscrivez-vous à la formation EMFPS  du 25 au 27 septembre 2018 "Maîtriser la...Inscrivez-vous à la formation EMFPS  du 25 au 27 septembre 2018 "Maîtriser la...
Inscrivez-vous à la formation EMFPS du 25 au 27 septembre 2018 "Maîtriser la...
 
Projet VAE
Projet VAEProjet VAE
Projet VAE
 
Un dispositif d'autoformation aux connaissances technopédagogiques : une rech...
Un dispositif d'autoformation aux connaissances technopédagogiques : une rech...Un dispositif d'autoformation aux connaissances technopédagogiques : une rech...
Un dispositif d'autoformation aux connaissances technopédagogiques : une rech...
 
Toile de fond technologique de l'AFNIC
Toile de fond technologique de l'AFNICToile de fond technologique de l'AFNIC
Toile de fond technologique de l'AFNIC
 
#Mooc gd p – 56 - séminaire idea univ paris-est - 24-11-2014
#Mooc gd p – 56 - séminaire idea univ paris-est - 24-11-2014#Mooc gd p – 56 - séminaire idea univ paris-est - 24-11-2014
#Mooc gd p – 56 - séminaire idea univ paris-est - 24-11-2014
 
BigText, compréhension et inférence avancées sur les textes
BigText, compréhension et inférence avancées sur les textesBigText, compréhension et inférence avancées sur les textes
BigText, compréhension et inférence avancées sur les textes
 
Synthèse de la journée des recherches pour l'action
Synthèse de la journée des recherches pour l'action Synthèse de la journée des recherches pour l'action
Synthèse de la journée des recherches pour l'action
 
Détection de communautés dans des réseaux d’information utilisant liens et at...
Détection de communautés dans des réseaux d’information utilisant liens et at...Détection de communautés dans des réseaux d’information utilisant liens et at...
Détection de communautés dans des réseaux d’information utilisant liens et at...
 
Sp1 les acteurs des normes danedjo
Sp1 les acteurs des normes danedjoSp1 les acteurs des normes danedjo
Sp1 les acteurs des normes danedjo
 
POL4840 - Plan de cours de l'hiver 2017
POL4840 - Plan de cours de l'hiver 2017POL4840 - Plan de cours de l'hiver 2017
POL4840 - Plan de cours de l'hiver 2017
 
Presentation (SOUTENANCE) : PFE
Presentation (SOUTENANCE) : PFE Presentation (SOUTENANCE) : PFE
Presentation (SOUTENANCE) : PFE
 

Plus de Ismail BADACHE

Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity i...
Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity i...Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity i...
Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity i...
Ismail BADACHE
 
Finding and Quantifying Temporal-Aware Contradiction in Reviews
Finding and Quantifying Temporal-Aware Contradiction in ReviewsFinding and Quantifying Temporal-Aware Contradiction in Reviews
Finding and Quantifying Temporal-Aware Contradiction in Reviews
Ismail BADACHE
 
Les Signaux Sociaux Émotionnels : Quel impact sur la RI ?
Les Signaux Sociaux Émotionnels : Quel impact sur la RI ? Les Signaux Sociaux Émotionnels : Quel impact sur la RI ?
Les Signaux Sociaux Émotionnels : Quel impact sur la RI ?
Ismail BADACHE
 
Poster Recherche d'Information Sociale
Poster Recherche d'Information SocialePoster Recherche d'Information Sociale
Poster Recherche d'Information Sociale
Ismail BADACHE
 

Plus de Ismail BADACHE (13)

Recherche d'Information Sociale en Langue Arabe : Cas de Facebook
Recherche d'Information Sociale en Langue Arabe : Cas de FacebookRecherche d'Information Sociale en Langue Arabe : Cas de Facebook
Recherche d'Information Sociale en Langue Arabe : Cas de Facebook
 
Predicting Contradiction Intensity: Low, Strong or Very Strong?
Predicting Contradiction Intensity: Low, Strong or Very Strong?Predicting Contradiction Intensity: Low, Strong or Very Strong?
Predicting Contradiction Intensity: Low, Strong or Very Strong?
 
Contradiction in Reviews: is it Strong or Low?
Contradiction in Reviews: is it Strong or Low?Contradiction in Reviews: is it Strong or Low?
Contradiction in Reviews: is it Strong or Low?
 
LES CONTENUS SOCIAUX : Quel impact sur le processus de RI et la quantificatio...
LES CONTENUS SOCIAUX : Quel impact sur le processus de RI et la quantificatio...LES CONTENUS SOCIAUX : Quel impact sur le processus de RI et la quantificatio...
LES CONTENUS SOCIAUX : Quel impact sur le processus de RI et la quantificatio...
 
Emotional Social Signals for Search Ranking
Emotional Social Signals for Search RankingEmotional Social Signals for Search Ranking
Emotional Social Signals for Search Ranking
 
Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity i...
Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity i...Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity i...
Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity i...
 
Finding and Quantifying Temporal-Aware Contradiction in Reviews
Finding and Quantifying Temporal-Aware Contradiction in ReviewsFinding and Quantifying Temporal-Aware Contradiction in Reviews
Finding and Quantifying Temporal-Aware Contradiction in Reviews
 
Les Signaux Sociaux Émotionnels : Quel impact sur la RI ?
Les Signaux Sociaux Émotionnels : Quel impact sur la RI ? Les Signaux Sociaux Émotionnels : Quel impact sur la RI ?
Les Signaux Sociaux Émotionnels : Quel impact sur la RI ?
 
Social Signals: Any Impacts in Search?
Social Signals: Any Impacts in Search?Social Signals: Any Impacts in Search?
Social Signals: Any Impacts in Search?
 
Multimodal Social Book Search
Multimodal Social Book SearchMultimodal Social Book Search
Multimodal Social Book Search
 
Social Networks Statistics 2014
Social Networks Statistics 2014Social Networks Statistics 2014
Social Networks Statistics 2014
 
Exploitation de signaux sociaux pour estimer la pertinence a priori d’une res...
Exploitation de signaux sociaux pour estimer la pertinence a priori d’une res...Exploitation de signaux sociaux pour estimer la pertinence a priori d’une res...
Exploitation de signaux sociaux pour estimer la pertinence a priori d’une res...
 
Poster Recherche d'Information Sociale
Poster Recherche d'Information SocialePoster Recherche d'Information Sociale
Poster Recherche d'Information Sociale
 

Détection de contradiction dans les commentaires

  • 1. Introduction Vue d’ensemble : travaux relatifs Détection et intensité de contradiction Évaluation expérimentale Conclusion Détection de contradiction dans les commentaires Ismail Badache - Sébastien Fournier - Adrian-Gabriel Chifu Prénom.Nom@lsis.org Laboratoire des Sciences de l’Information et des Systèmes Aix-Marseille Université Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 1 / 22
  • 2. Introduction Vue d’ensemble : travaux relatifs Détection et intensité de contradiction Évaluation expérimentale Conclusion Plan Introduction Vue d’ensemble : travaux relatifs Détection et intensité de contradiction Évaluation expérimentale Conclusion Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 2 / 22
  • 3. Introduction Vue d’ensemble : travaux relatifs Détection et intensité de contradiction Évaluation expérimentale Conclusion Introduction • Diversité des opinions sur un sujet donné ⇒ Contradiction Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 3 / 22
  • 4. Introduction Vue d’ensemble : travaux relatifs Détection et intensité de contradiction Évaluation expérimentale Conclusion Hypothèses Hypothèse 1 : une contradiction Une contradiction dans des commentaires liés à une ressource donnée (ex. film, cours, etc) signifie des opinions contradictoires exprimées sur un aspect spécifique, qui est une forme de diversité de sentiments autour de l’aspect au sein de la même ressource. Hypothèse 2 : intensité d’une contradiction Un aspect avec un sentiment négatif dans un commentaire avec un rating positif (et inversement) a un impact plus important sur l’intensité de la contradiction qu’un aspect avec un sentiment positif dans un commentaire avec un rating positif. Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 4 / 22
  • 5. Introduction Vue d’ensemble : travaux relatifs Détection et intensité de contradiction Évaluation expérimentale Conclusion Questions de recherche • Comment identifier une contradiction sur un aspect dans les commentaires ? • Comment mesurer le degré de contradiction entre les commentaires ? • Quel est l’impact de la prise en compte conjointe de la polarité et du rating des commentaires sur la mesure de l’intensité de la contradiction ? Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 5 / 22
  • 6. Introduction Vue d’ensemble : travaux relatifs Détection et intensité de contradiction Évaluation expérimentale Conclusion Vue d’ensemble : travaux relatifs Détection de controverses • Wikipédia (Wang et al., 2014), les "news" (Tsytsarau et al., 2014), lors de l’analyse de débat (Qiu et al., 2013) ou de manière générique sur le Web (Jang et Allan, 2016). Détection d’aspects • les HMM (Hidden Markov Models) ou les CRF (Conditional Random Fields) comme (Hamdan et al., 2015). • non supervisée (Kim, 2013), règles statistiques (Poria, 2014). Analyse de sentiments • lexiques (Turney, 2002) ou corpus (Mohammad et al., 2013). • naïve bayes (Pang et al., 2002), RNN (Socher et al., 2013). Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 6 / 22
  • 7. Introduction Vue d’ensemble : travaux relatifs Détection et intensité de contradiction Évaluation expérimentale Conclusion Comment détecter la contradiction ? Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 7 / 22
  • 8. Introduction Vue d’ensemble : travaux relatifs Détection et intensité de contradiction Évaluation expérimentale Conclusion Extraction des aspects 1 Calcul fréquentiel des termes constituant le corpus des commentaires, 2 Catégorisation des termes de chaque commentaire en utilisant Stanford Parser 1, 3 Sélection des termes ayant la catégorie nominale, 4 Sélection des noms avec des termes émotionnels dans leur voisinages de 5 mots (en utilisant SentiWordNet 2), 5 Extraction des termes les plus fréquents (utilisés) dans le corpus parmi ceux sélectionner dans l’étape précédente. Ces termes seront considérés comme des aspects. 1. http://nlp.stanford.edu:8080/parser/ 2. http://sentiwordnet.isti.cnr.it/ Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 8 / 22
  • 9. Introduction Vue d’ensemble : travaux relatifs Détection et intensité de contradiction Évaluation expérimentale Conclusion Extraction des aspects : exemple Étape Description (1) course : 44219, material : 3286, assignments : 3118, content : 2947, lecturer : 2705, ....... termei (2) The/DT lecturer/NN was/VBD an/DT annoying/VBG speaker/NN and/CC very/RB repetitive/JJ ./. I/PRP found/VBD the/DT format- ting/NN so/RB different/JJ from/IN other/JJ courses/NNS I/PRP ’ve/VBP taken/VBN ,/, that/IN it/PRP was/VBD hard/JJ to/TO get/VB started/VBN and/CC figure/VB things/NNS out/RP ./. (3) lecturer, speaker, formatting, things (4) lecturer, speaker (5) lecturer L’aspect utile est "lecturer" Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 9 / 22
  • 10. Introduction Vue d’ensemble : travaux relatifs Détection et intensité de contradiction Évaluation expérimentale Conclusion Analyse de sentiment Définition 1 : Sentiment Les sentiments par rapport à un aspect sont un nombre réel dans la plage [-1, 1] qui indique la polarité de l’opinion exprimée dans le commentaire. Les valeurs négatives et positives représentent respectivement des opinions négatives et positives. Modèle d’analyse de sentiments : • Modèle supervisé basé sur Naïve Bayes. • Traitement des simples négations (not, n’t, no). • Traitement d’intensificateurs et d’adverbes (very, absolutely). Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 10 / 22
  • 11. Introduction Vue d’ensemble : travaux relatifs Détection et intensité de contradiction Évaluation expérimentale Conclusion Mesure de contradiction Définition 2 : Contradiction Il y a une contradiction sur un aspect donné, entre deux extraits de commentaires contenant cet aspect (ca1, ca2 ∈ D), lorsque les polarités autour de l’aspect sont opposées, Pol(ca1) ∩ Pol(ca2) = φ. • Pol(cai ) représente la fonction qui retourne la polarité (positive, négative) du commentaire-aspect cai . Intensité de contradiction : • Dimensions (poli , rati ) pour chaque commentaire-aspect cai . • Dispersion des cai modélisés par un nuage de points. • Plus la distance est élevée entre les points cai par rapport à un centroide cacentroide du même document D, plus le degré de contradiction est important. Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 11 / 22
  • 12. Introduction Vue d’ensemble : travaux relatifs Détection et intensité de contradiction Évaluation expérimentale Conclusion Mesure de contradiction • Fonction de dispersion (inertie du nuage) : Disp(capol rat , D) = 1 n n i=1 Distance(poli , rati ) (1) avec : Distance(poli , rati ) = (poli − pol)2 + (rati − rat)2 (2) • Normalisation des ratings rati : rati = rati −3 2 . • Distance(poli , rati ) est la distance du point cai du nuage au point centroide cacentroide, tandis que n est le nombre de points cai du nuage. Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 12 / 22
  • 13. Introduction Vue d’ensemble : travaux relatifs Détection et intensité de contradiction Évaluation expérimentale Conclusion Mesure de contradiction Figure – Dispersion des commentaires-aspect cai par rapport au cacentroide Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 13 / 22
  • 14. Introduction Vue d’ensemble : travaux relatifs Détection et intensité de contradiction Évaluation expérimentale Conclusion Mesure de contradiction Les coordonnées (pol, rat) du centroide cacentroide peuvent être calculées de deux manières différentes : 1 Centroïde basé sur la moyenne des poli et des rati pol= pol1+pol2+...+poln n ; rat= rat1+rat2+...+ratn n (3) 2 Centroïde basé sur la moyenne pondérée des poli et rati pol = c1 · pol1 + c2 · pol2 + ... + cn · poln n (4) rat = c1 · rat1 + c2 · rat2 + ... + cn · ratn n (5) avec : ci = |Rati − Poli | 2n (6) Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 14 / 22
  • 15. Introduction Vue d’ensemble : travaux relatifs Détection et intensité de contradiction Évaluation expérimentale Conclusion Objectifs et collection de test • Évaluer l’impact de l’analyse de sentiment et du rating sur la détection de contradictions autour de certains aspects. • Évaluer l’impact du centroide moyenné et pondéré sur la mesure de l’intensité des contradictions. • Collection de test : issue de "coursera.org" Champ Nombre Total Cours 2244 Cours notés 1115 Commentaires 73873 Ratings 298326 Commentaires 1705 Commentaires 1443 Commentaires 3302 Commentaires 12202 Commentaires 55221 Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 15 / 22
  • 16. Introduction Vue d’ensemble : travaux relatifs Détection et intensité de contradiction Évaluation expérimentale Conclusion Les aspects détectés • 22 aspects capturés automatiquement sur l’ensemble des commentaires issus de "coursera.org" Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 16 / 22
  • 17. Introduction Vue d’ensemble : travaux relatifs Détection et intensité de contradiction Évaluation expérimentale Conclusion Évaluation manuelle "User Study" • Évaluation manuelle (contradictions et sentiments) : • 3 évaluateurs. • 10 cours pour chaque aspect. • 1320 commentaires/aspect de 220 cours. • Kappa Cohen (contradictions) : k = 0.68. • Kappa Cohen (sentiments) : k = 0.76. Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 17 / 22
  • 18. Introduction Vue d’ensemble : travaux relatifs Détection et intensité de contradiction Évaluation expérimentale Conclusion Protocole d’évaluation • Analyseur de sentiments (Naïve Bayes) : • Ensemble d’apprentissage : 50.000 commentaires d’IMDb 3 . • Ensemble de test : les commentaires-aspect de coursera. • Précision : 79% (taux d’erreur 21%). • Les jugements des évaluateurs sur les sentiments, représentent une précision de 100% (référence). • Évaluation de la performance de notre approche : • Étude de corrélation (mesure officielle de SemEval 4 ). • Entre les jugements de contradiction donnés par les évaluateurs et les résultats obtenus par notre approche. • Coefficients de corrélation de Pearson et Spearman. 3. http://ai.stanford.edu/~amaas/data/sentiment/ 4. http://alt.qcri.org/semeval2016/task7/ Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 18 / 22
  • 19. Introduction Vue d’ensemble : travaux relatifs Détection et intensité de contradiction Évaluation expérimentale Conclusion Évaluation expérimentale Figure – Corrélation entre les jugements de contradiction et les résultats de notre approche (avec un taux d’erreur de 21% dans la détection de sentiments) Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 19 / 22
  • 20. Introduction Vue d’ensemble : travaux relatifs Détection et intensité de contradiction Évaluation expérimentale Conclusion Évaluation expérimentale Figure – Corrélation entre les jugements de contradiction et les résultats de notre approche (avec un taux d’erreur de 0% dans la détection de sentiments) Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 20 / 22
  • 21. Introduction Vue d’ensemble : travaux relatifs Détection et intensité de contradiction Évaluation expérimentale Conclusion Conclusion • Contribution : estimation de l’intensité de contradiction • Exploitation conjointe des polarités et des ratings. • Calcul de centroide de 2 manières (moyenné et pondéré). • limites : • Dépendance de la qualité des modèles d’analyse de sentiments et de détection des aspects. • Simplicité des modèles de pré-traitements. • Détection des phrases auxquelles appartient un aspect. • Perspectives : • Améliorer l’analyse de sentiments, d’aspects et des phrases. • Prise en compte des sessions temporelles des commentaires. • Prise en compte du profil de l’utilisateur. • S’affranchir du rating. • D’autres expérimentations à plus grande échelle sur d’autres types de collections. Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 21 / 22
  • 22. Introduction Vue d’ensemble : travaux relatifs Détection et intensité de contradiction Évaluation expérimentale Conclusion Ismail Badache CORIA 2017 Détection de contradiction dans les commentaires 22 / 22