SlideShare une entreprise Scribd logo
1  sur  27
Télécharger pour lire hors ligne
dans les Commentaires
Intensité de Contradiction
Ismaïl BADACHE
LIS UMR 7020 – Université Aix-Marseille
EHESS – Paris04 Avril 2018
Plan
Introduction
Vue d’ensemble : Etat de l’art
Détection & intensité de contradiction
Prédiction de l’intensité (supervisé)
Conclusion
4
1
3
2
5
1.1. Contexte : contradiction textuelle
3
Contradiction :
Une situation où il est extrêmement improbable que deux phrases soient
vraies lorsqu'elles sont considérées ensemble.
Exemples :
1. Négation : « I love you --- I do not love you »
2. Mots opposés : « hot --- cold, light --- dark »
3. Discordance numérique :
« There are 7 wonders of the world --- the number of wonders of the world are 9 »
1. Introduction 2. Vue d’ensemble : état de l’art
3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé)
1.1. Contexte : contradiction textuelle
4
1. Introduction 2. Vue d’ensemble : état de l’art
3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé)
1.2. Questions de recherche
5
Comment identifier une contradiction sur un aspect dans les
commentaires?
1
Comment mesurer le degré de contradiction entre les commentaires?2
Quel est l’impact de la prise en compte conjointe de la polarité et du
rating des commentaires sur la mesure de l’intensité de la
contradiction?
3
1. Introduction 2. Vue d’ensemble : état de l’art
3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé)
2. Vue d’ensemble : état de l’art
6
1. Introduction 2. Vue d’ensemble : état de l’art
3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé)
3.1. Comment détecter une contradiction ?
7
Commentaires
Non-Contradictoires
Commentaires
Mesure de contradiction
Détection de
Contradiction
Intensité de
Contradiction
Pré-traitement
Identification
des aspects
Analyse de
sentiments
1. Introduction 2. Vue d’ensemble : état de l’art
3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé)
Commentaires
Contradictoires
3.2. Détection d’aspects dans un commentaire
8
1. Calcul fréquentiel des termes constituant le corpus des commentaires,
2. Catégorisation des termes de chaque commentaire en utilisant Stanford
Parser,
3. Sélection des termes ayant la catégorie nominale,
4. Sélection des noms avec des termes émotionnels dans leur voisinages de
5 mots (en utilisant SentiWordNet),
5. Extraction des termes les plus fréquents (utilisés) dans le corpus parmi
ceux sélectionner dans l’étape précédente. Ces termes seront considérés
comme des aspects.
1. Introduction 2. Vue d’ensemble : état de l’art
3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé)
3.2. Détection d’aspects : Exemple
9
L’aspect utile est : « lecturer »
1. Introduction 2. Vue d’ensemble : état de l’art
3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé)
3.3. Analyse de sentiments
10
1. Introduction 2. Vue d’ensemble : état de l’art
3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé)
• Modèles d’analyse de sentiments :
 Modèle supervisé basé sur Naïve Bayes.
 Modèle non-supervisé appelé : SentiNeuron.
 Traitement des négations.
 Traitements d’intensificateurs et d’adverbes.
3.4. Mesure de contradiction
11
.
- Coordonnées (poli , rati) pour chaque commentaire-aspect cai
- Un commentaire cai aspect est un segment du commentaire contenant un
aspect (5 mots avant et après l’aspect).
1. Introduction 2. Vue d’ensemble : état de l’art
3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé)
3.4. Mesure de contradiction
12
• Fonction de dispersion (inertie du nuage)
- Distance (poli , rati ) est la distance du point cai du nuage au point centroide
cacentroide , tandis que n est le nombre de points cai du nuage.
- Normalisation des ratings rati :
1. Introduction 2. Vue d’ensemble : état de l’art
3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé)
3.4. Mesure de contradiction
13
1. Centroide basé sur la moyenne des poli et rati
Les coordonnées (pol, rat) du centroide cacentroide peuvent être calculées de
deux manières différentes :
2. Centroide basé sur la moyenne pondérée des poli et rati
1. Introduction 2. Vue d’ensemble : état de l’art
3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé)
4.1. Objectifs et collection de test
14
1. Introduction 2. Vue d’ensemble : état de l’art
3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé)
• Evaluer l’impact de l’analyse de sentiment et du rating sur la détection de
contradictions autour de certains aspects.
• Evaluer l’impact du centroide moyenné et pondéré sur la mesure de
l’intensité de contradiction.
• Collection de test : issue de « coursera.org »
4.2. Les aspects détectés
15
1. Introduction 2. Vue d’ensemble : état de l’art
3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé)
• 22 aspects capturés automatiquement sur l’ensemble des commentaires
issus de « coursera.org »
4.3. Évaluation manuelle « User Study »
16
1. Introduction 2. Vue d’ensemble : état de l’art
3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé)
• 3 évaluateurs
• 10 cours pour chaque aspect
• 1320 commentaires/aspect de 220 cours
• Kappa Cohen (contradictions) : k = 0.68
• Kappa Cohen (sentiments) : k = 0.76
4.4. Protocole d’évaluation
17
1. Introduction 2. Vue d’ensemble : état de l’art
3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé)
• Naïve Bayes (supervisé):
 Ensemble d’apprentissage : 50000 commentaires d’IMDb
 Ensemble de test : les commentaires-aspect de coursera
 Précision : 79% (taux d’erreur 21%)
• SentiNeuron (non-supervisé):
 Formé sur plus de 82 millions de commentaires issus d’Amazon.
 LSTM avec 4096 unités dont le 2389ème neurone se concentrait
spécifiquement sur le sentiment d'une phrase donnée.
 Ce neurone considéré comme critère a été normalisé entre 0 et 1.
 Précision : 93% (taux d’erreur 7%)
• Evaluation de la performance de notre approche :
 Etude de corrélation (mesure officielle de SemEval)
 Coefficient de corrélation de Pearson et précision
4.5. Résultats
18
1. Introduction 2. Vue d’ensemble : état de l’art
3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé)
Tableau. Résultats de corrélations et de précision
4.5. Résultats
19
1. Introduction 2. Vue d’ensemble : état de l’art
3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé)
Tableau. Nombre de contradictions pour chaque niveau
4.6. Prédiction de l’intensité de contradiction
20
Fig. Processus d’apprentissage automatique
1. Introduction 2. Vue d’ensemble : état de l’art
3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé)
Collection
coursera
Collection
d’apprentissage
Algorithmes de
selection d’attributs
- WrapperSubsetEval1
- CfsSubsetEval1
- ReliefFAttributeEval2
- SVMAttributeEval3
Algorithmes
d’apprentissage
- Naïve Bayes1
- J482
- SVM3
Résultats
d’évaluation
par itération
Répéter pour 5-itéraions de validation croisée
4.7. Les critères de prédiction
21
Tableau. Liste des critères exploités
1. Introduction 2. Vue d’ensemble : état de l’art
3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé)
4.8. Évaluation manuelle « User Study »
22
1. Introduction 2. Vue d’ensemble : état de l’art
3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé)
• 3 évaluateurs
• 50 cours pour chaque aspect
• 66104 commentaires-aspect de 1100 cours
• Kappa Cohen (contradictions) : k = 0.80
• Kappa Cohen (sentiments) : k = 0.78
5.1. Résultats : Précision
23
1. Introduction 2. Vue d’ensemble : état de l’art
3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé)
Conclusion
Contributions
1. Modèle d’estimation de l’intensité de
contradiction dans les commentaires.
 Exploitation conjointe du rating et du
sentiment autour d’un aspect donnée.
2. Impact du modèle de sentiment.
 21% de perte dans la précision du
sentiment engendre 50% d’erreur sur
l’intensité de contradiction.
3. Les meilleurs résultats de précision sont
obtenus par la méthode supervisée.
 SentiNeuron : modèle de sentiment fiable
 Combinaison entre les algorithmes de
sélection et les modèles d’apprentissage.
4. Etude par l’utilisateur « user study ».
5. Mise en place d’une collection de test.
Publications
1. «Contradiction in Reviews : is it Strong or Low?» à BroDyn
workshop, ECIR 2018
2. «Emotional Social Signals for Search Ranking» à SIGIR 2017
3. «Finding and Quantifying Temporal-Aware Contradiction in
Reviews» à AIRS 2017
4. «Harnessing Ratings and Aspect-Sentiment to Estimate
Contradiction Intensity in Temporal-Related Reviews» à KES 2017
5. «Fresh and Diverse Social Signals : Any Impacts on Search ?» à
ACM SIGIR CHIIR 2017.
6. «Multimodal Social Book Search» à CLEF 2015.
7. «A Priori Relevance Based On Quality and Diversity Of Social
Signals» à ACM SIGIR 2015.
8. «Document Priors Based On Time-Sensitive Social Signals» à
ECIR 2015.
9. «Social Priors to Estimate Relevance of a Resource» à ACM IIiX
2014.
10. «Harnessing Social Signals to Enhance a Search» à ACM/IEEE
WIC 2014.
11. «Détection de contradiction dans les commentaires» à CORIA
2017.
12. «Les Signaux Sociaux Émotionnels : Quel impact sur la RI ?» à
CORIA 2017.
13. «Pertinence a Priori Basée sur la Diversité et la Temporalité des
Signaux Sociaux» à CORIA 2015.
14. «Exploitation de signaux sociaux pour estimer la pertinence a
priori d’une ressource» à CORIA 2014.
15. «RI sociale : intégration de propriétés sociales dans un modèle
de recherche» à CORIA 2013.
http://www.irit.fr/~Ismail.Badache/
https://twitter.com/Ismail_badache
25
Références biographiques
S. Dori-Hacohen and J. Allan. Detecting controversy on the web. In CIKM, pages 1845–1848, 2013.
S. Dori-Hacohen and J. Allan. Automated controversy detection on the web. In ECIR, pages 423–434, 2015.
M. Jang and J. Allan. Improving automated controversy detection on the web. In SIGIR, pages 865–868, 2016.
M. Tsytsarau, T. Palpanas, and K. Denecke. Scalable discovery of contradictions on the web. In WWW, pages
1195–1196, 2010.
M. Tsytsarau, T. Palpanas, and K. Denecke. Scalable detection of sentiment-based contradictions.
DiversiWeb, WWW, 2011.
L. Wang, H. Raghavan, C. Cardie, and V. Castelli. Query-focused opinion summarization for user-generated
content. In COLING, pages 1660–1669, 2014.
M. Qiu, L. Yang, and J. Jiang. Modeling interaction features for debate side clustering. In CIKM, pages 873–
878, 2013.
H. Hamdan, P. Bellot, and F. Bechet. Lsislif: Crf and logistic regression for opinion target extraction and
sentiment polarity analysis. In SemEval, page 753758, 2015.
S. Kim, J. Zhang, Z. Chen, A. Oh, and S. Liu. A hierarchical aspect-sentiment model for online reviews. In
AAAI, 2013.
S. Poria, E. Cambria, L. Ku, C. Gui, and A. Gelbukh. A rule-based approach to aspect extraction from
product reviews. In SocialNLP, pages 28–37, 2014.
Références biographiques
I. Badache, S. Fournier, and A. Chifu. Contradiction in Reviews : is it Strong or Low?. In à BroDyn workshop,
ECIR, pages 11-22, 2018.
I. Badache, S. Fournier, and A. Chifu. Finding and Quantifying Temporal-Aware Contradiction in Reviews . In
AIRS, pages 167-180, 2017.
I. Badache, S. Fournier, and A. Chifu. Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction
Intensity in Temporal-Related Reviews. In KES, pages 1711-1720, 2017
I. Badache, S. Fournier, and A. Chifu. Détection de contradiction dans les commentaires. In CORIA, pages 75-
90, 2017.

Contenu connexe

Plus de Ismail BADACHE

Recherche d'Information Sociale en Langue Arabe : Cas de Facebook
Recherche d'Information Sociale en Langue Arabe : Cas de FacebookRecherche d'Information Sociale en Langue Arabe : Cas de Facebook
Recherche d'Information Sociale en Langue Arabe : Cas de FacebookIsmail BADACHE
 
Predicting Contradiction Intensity: Low, Strong or Very Strong?
Predicting Contradiction Intensity: Low, Strong or Very Strong?Predicting Contradiction Intensity: Low, Strong or Very Strong?
Predicting Contradiction Intensity: Low, Strong or Very Strong?Ismail BADACHE
 
Contradiction in Reviews: is it Strong or Low?
Contradiction in Reviews: is it Strong or Low?Contradiction in Reviews: is it Strong or Low?
Contradiction in Reviews: is it Strong or Low?Ismail BADACHE
 
LES CONTENUS SOCIAUX : Quel impact sur le processus de RI et la quantificatio...
LES CONTENUS SOCIAUX : Quel impact sur le processus de RI et la quantificatio...LES CONTENUS SOCIAUX : Quel impact sur le processus de RI et la quantificatio...
LES CONTENUS SOCIAUX : Quel impact sur le processus de RI et la quantificatio...Ismail BADACHE
 
Emotional Social Signals for Search Ranking
Emotional Social Signals for Search RankingEmotional Social Signals for Search Ranking
Emotional Social Signals for Search RankingIsmail BADACHE
 
Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity i...
Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity i...Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity i...
Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity i...Ismail BADACHE
 
Finding and Quantifying Temporal-Aware Contradiction in Reviews
Finding and Quantifying Temporal-Aware Contradiction in ReviewsFinding and Quantifying Temporal-Aware Contradiction in Reviews
Finding and Quantifying Temporal-Aware Contradiction in ReviewsIsmail BADACHE
 
Les Signaux Sociaux Émotionnels : Quel impact sur la RI ?
Les Signaux Sociaux Émotionnels : Quel impact sur la RI ? Les Signaux Sociaux Émotionnels : Quel impact sur la RI ?
Les Signaux Sociaux Émotionnels : Quel impact sur la RI ? Ismail BADACHE
 
Fresh and Diverse Social Signals: Any Impacts on Search?
Fresh and Diverse Social Signals: Any Impacts on Search?Fresh and Diverse Social Signals: Any Impacts on Search?
Fresh and Diverse Social Signals: Any Impacts on Search?Ismail BADACHE
 
Social Signals: Any Impacts in Search?
Social Signals: Any Impacts in Search?Social Signals: Any Impacts in Search?
Social Signals: Any Impacts in Search?Ismail BADACHE
 
Multimodal Social Book Search
Multimodal Social Book SearchMultimodal Social Book Search
Multimodal Social Book SearchIsmail BADACHE
 
A Priori Relevance Based On Quality and Diversity Of Social Signals
A Priori Relevance Based On Quality and Diversity Of Social SignalsA Priori Relevance Based On Quality and Diversity Of Social Signals
A Priori Relevance Based On Quality and Diversity Of Social SignalsIsmail BADACHE
 
Priors Based On Time-Sensitive Social Signals
Priors Based On Time-Sensitive Social SignalsPriors Based On Time-Sensitive Social Signals
Priors Based On Time-Sensitive Social SignalsIsmail BADACHE
 
Pertinence a Priori Basée sur la Diversité et la Temporalité des Signaux Sociaux
Pertinence a Priori Basée sur la Diversité et la Temporalité des Signaux SociauxPertinence a Priori Basée sur la Diversité et la Temporalité des Signaux Sociaux
Pertinence a Priori Basée sur la Diversité et la Temporalité des Signaux SociauxIsmail BADACHE
 
Social Networks Statistics 2014
Social Networks Statistics 2014Social Networks Statistics 2014
Social Networks Statistics 2014Ismail BADACHE
 
Exploitation de signaux sociaux pour estimer la pertinence a priori d’une res...
Exploitation de signaux sociaux pour estimer la pertinence a priori d’une res...Exploitation de signaux sociaux pour estimer la pertinence a priori d’une res...
Exploitation de signaux sociaux pour estimer la pertinence a priori d’une res...Ismail BADACHE
 
Social Priors to Estimate Relevance of a Resource
Social Priors to Estimate Relevance of a ResourceSocial Priors to Estimate Relevance of a Resource
Social Priors to Estimate Relevance of a ResourceIsmail BADACHE
 
Harnessing social signals to enhance a search
Harnessing social signals to enhance a searchHarnessing social signals to enhance a search
Harnessing social signals to enhance a searchIsmail BADACHE
 
Poster Recherche d'Information Sociale
Poster Recherche d'Information SocialePoster Recherche d'Information Sociale
Poster Recherche d'Information SocialeIsmail BADACHE
 

Plus de Ismail BADACHE (19)

Recherche d'Information Sociale en Langue Arabe : Cas de Facebook
Recherche d'Information Sociale en Langue Arabe : Cas de FacebookRecherche d'Information Sociale en Langue Arabe : Cas de Facebook
Recherche d'Information Sociale en Langue Arabe : Cas de Facebook
 
Predicting Contradiction Intensity: Low, Strong or Very Strong?
Predicting Contradiction Intensity: Low, Strong or Very Strong?Predicting Contradiction Intensity: Low, Strong or Very Strong?
Predicting Contradiction Intensity: Low, Strong or Very Strong?
 
Contradiction in Reviews: is it Strong or Low?
Contradiction in Reviews: is it Strong or Low?Contradiction in Reviews: is it Strong or Low?
Contradiction in Reviews: is it Strong or Low?
 
LES CONTENUS SOCIAUX : Quel impact sur le processus de RI et la quantificatio...
LES CONTENUS SOCIAUX : Quel impact sur le processus de RI et la quantificatio...LES CONTENUS SOCIAUX : Quel impact sur le processus de RI et la quantificatio...
LES CONTENUS SOCIAUX : Quel impact sur le processus de RI et la quantificatio...
 
Emotional Social Signals for Search Ranking
Emotional Social Signals for Search RankingEmotional Social Signals for Search Ranking
Emotional Social Signals for Search Ranking
 
Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity i...
Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity i...Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity i...
Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity i...
 
Finding and Quantifying Temporal-Aware Contradiction in Reviews
Finding and Quantifying Temporal-Aware Contradiction in ReviewsFinding and Quantifying Temporal-Aware Contradiction in Reviews
Finding and Quantifying Temporal-Aware Contradiction in Reviews
 
Les Signaux Sociaux Émotionnels : Quel impact sur la RI ?
Les Signaux Sociaux Émotionnels : Quel impact sur la RI ? Les Signaux Sociaux Émotionnels : Quel impact sur la RI ?
Les Signaux Sociaux Émotionnels : Quel impact sur la RI ?
 
Fresh and Diverse Social Signals: Any Impacts on Search?
Fresh and Diverse Social Signals: Any Impacts on Search?Fresh and Diverse Social Signals: Any Impacts on Search?
Fresh and Diverse Social Signals: Any Impacts on Search?
 
Social Signals: Any Impacts in Search?
Social Signals: Any Impacts in Search?Social Signals: Any Impacts in Search?
Social Signals: Any Impacts in Search?
 
Multimodal Social Book Search
Multimodal Social Book SearchMultimodal Social Book Search
Multimodal Social Book Search
 
A Priori Relevance Based On Quality and Diversity Of Social Signals
A Priori Relevance Based On Quality and Diversity Of Social SignalsA Priori Relevance Based On Quality and Diversity Of Social Signals
A Priori Relevance Based On Quality and Diversity Of Social Signals
 
Priors Based On Time-Sensitive Social Signals
Priors Based On Time-Sensitive Social SignalsPriors Based On Time-Sensitive Social Signals
Priors Based On Time-Sensitive Social Signals
 
Pertinence a Priori Basée sur la Diversité et la Temporalité des Signaux Sociaux
Pertinence a Priori Basée sur la Diversité et la Temporalité des Signaux SociauxPertinence a Priori Basée sur la Diversité et la Temporalité des Signaux Sociaux
Pertinence a Priori Basée sur la Diversité et la Temporalité des Signaux Sociaux
 
Social Networks Statistics 2014
Social Networks Statistics 2014Social Networks Statistics 2014
Social Networks Statistics 2014
 
Exploitation de signaux sociaux pour estimer la pertinence a priori d’une res...
Exploitation de signaux sociaux pour estimer la pertinence a priori d’une res...Exploitation de signaux sociaux pour estimer la pertinence a priori d’une res...
Exploitation de signaux sociaux pour estimer la pertinence a priori d’une res...
 
Social Priors to Estimate Relevance of a Resource
Social Priors to Estimate Relevance of a ResourceSocial Priors to Estimate Relevance of a Resource
Social Priors to Estimate Relevance of a Resource
 
Harnessing social signals to enhance a search
Harnessing social signals to enhance a searchHarnessing social signals to enhance a search
Harnessing social signals to enhance a search
 
Poster Recherche d'Information Sociale
Poster Recherche d'Information SocialePoster Recherche d'Information Sociale
Poster Recherche d'Information Sociale
 

Intensité de contradiction dans les commentaires (Séminaire à l'EHESS 04 avril 2018)

  • 1. dans les Commentaires Intensité de Contradiction Ismaïl BADACHE LIS UMR 7020 – Université Aix-Marseille EHESS – Paris04 Avril 2018
  • 2. Plan Introduction Vue d’ensemble : Etat de l’art Détection & intensité de contradiction Prédiction de l’intensité (supervisé) Conclusion 4 1 3 2 5
  • 3. 1.1. Contexte : contradiction textuelle 3 Contradiction : Une situation où il est extrêmement improbable que deux phrases soient vraies lorsqu'elles sont considérées ensemble. Exemples : 1. Négation : « I love you --- I do not love you » 2. Mots opposés : « hot --- cold, light --- dark » 3. Discordance numérique : « There are 7 wonders of the world --- the number of wonders of the world are 9 » 1. Introduction 2. Vue d’ensemble : état de l’art 3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé)
  • 4. 1.1. Contexte : contradiction textuelle 4 1. Introduction 2. Vue d’ensemble : état de l’art 3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé)
  • 5. 1.2. Questions de recherche 5 Comment identifier une contradiction sur un aspect dans les commentaires? 1 Comment mesurer le degré de contradiction entre les commentaires?2 Quel est l’impact de la prise en compte conjointe de la polarité et du rating des commentaires sur la mesure de l’intensité de la contradiction? 3 1. Introduction 2. Vue d’ensemble : état de l’art 3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé)
  • 6. 2. Vue d’ensemble : état de l’art 6 1. Introduction 2. Vue d’ensemble : état de l’art 3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé)
  • 7. 3.1. Comment détecter une contradiction ? 7 Commentaires Non-Contradictoires Commentaires Mesure de contradiction Détection de Contradiction Intensité de Contradiction Pré-traitement Identification des aspects Analyse de sentiments 1. Introduction 2. Vue d’ensemble : état de l’art 3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé) Commentaires Contradictoires
  • 8. 3.2. Détection d’aspects dans un commentaire 8 1. Calcul fréquentiel des termes constituant le corpus des commentaires, 2. Catégorisation des termes de chaque commentaire en utilisant Stanford Parser, 3. Sélection des termes ayant la catégorie nominale, 4. Sélection des noms avec des termes émotionnels dans leur voisinages de 5 mots (en utilisant SentiWordNet), 5. Extraction des termes les plus fréquents (utilisés) dans le corpus parmi ceux sélectionner dans l’étape précédente. Ces termes seront considérés comme des aspects. 1. Introduction 2. Vue d’ensemble : état de l’art 3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé)
  • 9. 3.2. Détection d’aspects : Exemple 9 L’aspect utile est : « lecturer » 1. Introduction 2. Vue d’ensemble : état de l’art 3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé)
  • 10. 3.3. Analyse de sentiments 10 1. Introduction 2. Vue d’ensemble : état de l’art 3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé) • Modèles d’analyse de sentiments :  Modèle supervisé basé sur Naïve Bayes.  Modèle non-supervisé appelé : SentiNeuron.  Traitement des négations.  Traitements d’intensificateurs et d’adverbes.
  • 11. 3.4. Mesure de contradiction 11 . - Coordonnées (poli , rati) pour chaque commentaire-aspect cai - Un commentaire cai aspect est un segment du commentaire contenant un aspect (5 mots avant et après l’aspect). 1. Introduction 2. Vue d’ensemble : état de l’art 3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé)
  • 12. 3.4. Mesure de contradiction 12 • Fonction de dispersion (inertie du nuage) - Distance (poli , rati ) est la distance du point cai du nuage au point centroide cacentroide , tandis que n est le nombre de points cai du nuage. - Normalisation des ratings rati : 1. Introduction 2. Vue d’ensemble : état de l’art 3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé)
  • 13. 3.4. Mesure de contradiction 13 1. Centroide basé sur la moyenne des poli et rati Les coordonnées (pol, rat) du centroide cacentroide peuvent être calculées de deux manières différentes : 2. Centroide basé sur la moyenne pondérée des poli et rati 1. Introduction 2. Vue d’ensemble : état de l’art 3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé)
  • 14. 4.1. Objectifs et collection de test 14 1. Introduction 2. Vue d’ensemble : état de l’art 3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé) • Evaluer l’impact de l’analyse de sentiment et du rating sur la détection de contradictions autour de certains aspects. • Evaluer l’impact du centroide moyenné et pondéré sur la mesure de l’intensité de contradiction. • Collection de test : issue de « coursera.org »
  • 15. 4.2. Les aspects détectés 15 1. Introduction 2. Vue d’ensemble : état de l’art 3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé) • 22 aspects capturés automatiquement sur l’ensemble des commentaires issus de « coursera.org »
  • 16. 4.3. Évaluation manuelle « User Study » 16 1. Introduction 2. Vue d’ensemble : état de l’art 3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé) • 3 évaluateurs • 10 cours pour chaque aspect • 1320 commentaires/aspect de 220 cours • Kappa Cohen (contradictions) : k = 0.68 • Kappa Cohen (sentiments) : k = 0.76
  • 17. 4.4. Protocole d’évaluation 17 1. Introduction 2. Vue d’ensemble : état de l’art 3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé) • Naïve Bayes (supervisé):  Ensemble d’apprentissage : 50000 commentaires d’IMDb  Ensemble de test : les commentaires-aspect de coursera  Précision : 79% (taux d’erreur 21%) • SentiNeuron (non-supervisé):  Formé sur plus de 82 millions de commentaires issus d’Amazon.  LSTM avec 4096 unités dont le 2389ème neurone se concentrait spécifiquement sur le sentiment d'une phrase donnée.  Ce neurone considéré comme critère a été normalisé entre 0 et 1.  Précision : 93% (taux d’erreur 7%) • Evaluation de la performance de notre approche :  Etude de corrélation (mesure officielle de SemEval)  Coefficient de corrélation de Pearson et précision
  • 18. 4.5. Résultats 18 1. Introduction 2. Vue d’ensemble : état de l’art 3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé) Tableau. Résultats de corrélations et de précision
  • 19. 4.5. Résultats 19 1. Introduction 2. Vue d’ensemble : état de l’art 3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé) Tableau. Nombre de contradictions pour chaque niveau
  • 20. 4.6. Prédiction de l’intensité de contradiction 20 Fig. Processus d’apprentissage automatique 1. Introduction 2. Vue d’ensemble : état de l’art 3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé) Collection coursera Collection d’apprentissage Algorithmes de selection d’attributs - WrapperSubsetEval1 - CfsSubsetEval1 - ReliefFAttributeEval2 - SVMAttributeEval3 Algorithmes d’apprentissage - Naïve Bayes1 - J482 - SVM3 Résultats d’évaluation par itération Répéter pour 5-itéraions de validation croisée
  • 21. 4.7. Les critères de prédiction 21 Tableau. Liste des critères exploités 1. Introduction 2. Vue d’ensemble : état de l’art 3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé)
  • 22. 4.8. Évaluation manuelle « User Study » 22 1. Introduction 2. Vue d’ensemble : état de l’art 3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé) • 3 évaluateurs • 50 cours pour chaque aspect • 66104 commentaires-aspect de 1100 cours • Kappa Cohen (contradictions) : k = 0.80 • Kappa Cohen (sentiments) : k = 0.78
  • 23. 5.1. Résultats : Précision 23 1. Introduction 2. Vue d’ensemble : état de l’art 3. Détection & intensité de contradiction 4. Prédiction de l’intensité (supervisé)
  • 24. Conclusion Contributions 1. Modèle d’estimation de l’intensité de contradiction dans les commentaires.  Exploitation conjointe du rating et du sentiment autour d’un aspect donnée. 2. Impact du modèle de sentiment.  21% de perte dans la précision du sentiment engendre 50% d’erreur sur l’intensité de contradiction. 3. Les meilleurs résultats de précision sont obtenus par la méthode supervisée.  SentiNeuron : modèle de sentiment fiable  Combinaison entre les algorithmes de sélection et les modèles d’apprentissage. 4. Etude par l’utilisateur « user study ». 5. Mise en place d’une collection de test. Publications 1. «Contradiction in Reviews : is it Strong or Low?» à BroDyn workshop, ECIR 2018 2. «Emotional Social Signals for Search Ranking» à SIGIR 2017 3. «Finding and Quantifying Temporal-Aware Contradiction in Reviews» à AIRS 2017 4. «Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity in Temporal-Related Reviews» à KES 2017 5. «Fresh and Diverse Social Signals : Any Impacts on Search ?» à ACM SIGIR CHIIR 2017. 6. «Multimodal Social Book Search» à CLEF 2015. 7. «A Priori Relevance Based On Quality and Diversity Of Social Signals» à ACM SIGIR 2015. 8. «Document Priors Based On Time-Sensitive Social Signals» à ECIR 2015. 9. «Social Priors to Estimate Relevance of a Resource» à ACM IIiX 2014. 10. «Harnessing Social Signals to Enhance a Search» à ACM/IEEE WIC 2014. 11. «Détection de contradiction dans les commentaires» à CORIA 2017. 12. «Les Signaux Sociaux Émotionnels : Quel impact sur la RI ?» à CORIA 2017. 13. «Pertinence a Priori Basée sur la Diversité et la Temporalité des Signaux Sociaux» à CORIA 2015. 14. «Exploitation de signaux sociaux pour estimer la pertinence a priori d’une ressource» à CORIA 2014. 15. «RI sociale : intégration de propriétés sociales dans un modèle de recherche» à CORIA 2013.
  • 26. Références biographiques S. Dori-Hacohen and J. Allan. Detecting controversy on the web. In CIKM, pages 1845–1848, 2013. S. Dori-Hacohen and J. Allan. Automated controversy detection on the web. In ECIR, pages 423–434, 2015. M. Jang and J. Allan. Improving automated controversy detection on the web. In SIGIR, pages 865–868, 2016. M. Tsytsarau, T. Palpanas, and K. Denecke. Scalable discovery of contradictions on the web. In WWW, pages 1195–1196, 2010. M. Tsytsarau, T. Palpanas, and K. Denecke. Scalable detection of sentiment-based contradictions. DiversiWeb, WWW, 2011. L. Wang, H. Raghavan, C. Cardie, and V. Castelli. Query-focused opinion summarization for user-generated content. In COLING, pages 1660–1669, 2014. M. Qiu, L. Yang, and J. Jiang. Modeling interaction features for debate side clustering. In CIKM, pages 873– 878, 2013. H. Hamdan, P. Bellot, and F. Bechet. Lsislif: Crf and logistic regression for opinion target extraction and sentiment polarity analysis. In SemEval, page 753758, 2015. S. Kim, J. Zhang, Z. Chen, A. Oh, and S. Liu. A hierarchical aspect-sentiment model for online reviews. In AAAI, 2013. S. Poria, E. Cambria, L. Ku, C. Gui, and A. Gelbukh. A rule-based approach to aspect extraction from product reviews. In SocialNLP, pages 28–37, 2014.
  • 27. Références biographiques I. Badache, S. Fournier, and A. Chifu. Contradiction in Reviews : is it Strong or Low?. In à BroDyn workshop, ECIR, pages 11-22, 2018. I. Badache, S. Fournier, and A. Chifu. Finding and Quantifying Temporal-Aware Contradiction in Reviews . In AIRS, pages 167-180, 2017. I. Badache, S. Fournier, and A. Chifu. Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity in Temporal-Related Reviews. In KES, pages 1711-1720, 2017 I. Badache, S. Fournier, and A. Chifu. Détection de contradiction dans les commentaires. In CORIA, pages 75- 90, 2017.