SlideShare une entreprise Scribd logo
1  sur  76
Télécharger pour lire hors ligne
Ismaïl BADACHE
LIS UMR 7020 – Université Aix-Marseille
LES CONTENUS SOCIAUX
Quel impact sur le processus de RI et
la quantification de contradiction
Séminaire à Lyon LIRIS – Equipe DRIM13 Mars 2018
Plan
Contexte
Etat de l’Art
Signaux et Propriétés Sociales
Temporalité des Signaux
Qualité et Diversité des Signaux
4
1
3
2
5
A) Exploitation des signaux sociaux pour améliorer la RI
B) Intensité de contradiction dans les commentaires
Signaux émotionnels : quel impact sur la RI ?6
Comment détecter une contradiction ?1
Mesurer l’intensité de contradiction2
4
Réseaux Sociaux : quelques « stats Jan. 2018 »
Contenu social par 1 min
70000 Publications
2,3 Millions J’aime
~410 GO de données
Facebook
Source:
blogdumoderateur.com
quantcast.com
semiocast.com
% Partages dans les RS
1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Conclusion5. Qualité et Diversité des Signaux4. Temporalité des Signaux
4 milliards d’internautes
80% sont au moins inscrits dans un réseau social
Vidéo
Photo
Page Web
Ressources Web
Ressource
.
.
.
Réseaux sociaux
Bookmark
Commentaire/Avis
Partage/Recommandation
Rating/Votes
J’aime/+1
Interactions
Signaux Sociaux
(Contenus générés par l’utilisateur)
5
Prise en compte
Vidéo
Photo
Page Web
Ressources Web
Ressource
.
.
.
Réseaux sociaux
Bookmark
Commentaire/Avis
Partage/Recommandation
Rating/Votes
J’aime/+1
Interactions
Signaux Sociaux
(Contenus générés par l’utilisateur)
6
Modèle de RI
Prise en compte
Requête Résultats
7
Contexte : RI
1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
Vidéo
Photo
Page Web
Ressources Web
Ressource
.
.
.
Réseaux sociaux
Bookmark
Commentaire/Avis
Partage/Recommandation
Rating/Votes
J’aime/+1
Interactions
Signaux Sociaux
(Contenus générés par l’utilisateur)
8
Nature
Provenance
Signification
Temporalité
Diversité
Rating
5
4
3
2
1
Émotion
9
Questions de recherche
Impact de la diversité des signaux sociaux sur les résultats ?3
Comment prendre en compte les signaux sociaux et leur temporalité
pour estimer l’importance d’une ressource ?
2
Comment traduire les signaux sociaux en « importance sociale »
d’une ressource ?
1
Quel modèle théorique pour combiner la pertinence a priori d’une
ressource et sa pertinence thématique ?
4
Est-ce que la qualité du signal est influencée par son réseau social ?5
1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
Les signaux émotionnels : quel impact sur la RI ?6
10
2. Etat de l’art
1) Recherche d’information dans les contenus sociaux
Recherche dans les médias sociaux (Moris et al., 2010) (Luo et al., 2012) (Damak et al., 2014)
Question-Réponse sociale (Dror et al., 2011) (Hecht et al., 2012)
Recherche de conversations (Magnani et al., 2012) (Ould-Amer et al., 2014)
Recherche d’opinions (Pang et Lillian, 2008) (Danescu-Niculescu et al., 2009)
Recherche de personnes (experts) (Macdonald et Ounis, 2008) (Deng et al., 2008)
2) Exploitation des contenus sociaux pour améliorer la RI
Indexation sociale (Zhang et al., 2009) (Bischoff et al ., 2008)
Reformulation de la requête (Koolen et al., 2009) (Bao et al., 2007)
Reclassement de résultats
- Classement basé sur la pertinence sociale
- Classement social personnalisé
(Bao et al., 2007) (Yanbe et al., 2007) (Bender et al., 2008)
(Carmel et al., 2009) (Hecht et al., 2012)
1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
11
2. Etat de l’art
Sources d’évidence Propriétés Modèles Auteurs
Critères sociaux indépendants du temps
• Nombre de : clicks, votes, enregistrement et
recommandation.
Popularité
Importance
Combinaison
linéaire
(Karweg et al., 2011)
• Nombre de: j’aime, j’aime pas,
commentaires sur YouTube.
• Nombre de lecture d’un titre sur Last.fm.
• Social Book Search (ratings, tags, reviews).
Importance
Apprentissage
et
Combinaison
linéaire
(Chelaru et al., 2012)
(Khodaei et al. 2012)
(Buijs et Spruit, 2014)
(Zhang et al., 2016)
• Nombre de retweets. Popularité
Technique
d’apprentissage
(Yang et al., 2012)
(Hong et al., 2011)
Critères sociaux dépendants du temps
• Analyse des signaux sociaux pour classer
l’intérêt des utilisateurs en 5 classes : recent,
ongoing, seasonal, past et random.
Intérêt
temporel
Etude
statistique
(Khodaei et Alonso,
2012)
• Exploiter le clic temporel appelé ClickBuzz
pour mesurer l’intérêt d’un document à
travers le temps.
Buzz dans le
temps
Technique
d’apprentissage
(Inagaki et al., 2010)
1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
12
2. Etat de l’art : Positionnement
1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
I. Exploitation des signaux sociaux issus de plusieurs réseaux sociaux, de
façon individuelle ou groupée sous forme de propriétés (ex. réputation
et popularité);
II. Prise en compte de la temporalité des signaux : date de création de
chaque action sociale ainsi que l’âge de la ressource;
III. Prise en compte de la diversité des signaux au sein d’un document.
IV. Analyser et étudier les nouveaux signaux émotionnels de Facebook
(Facebook Reactions : haha, j’adore, wouah, triste, grrr).
Partie I
Exploitation individuelle et
groupée des signaux sociaux
14
3.1. Hypothèses
1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
1) Signaux Sociaux
Présence Nombre Origine
Signal Social
Impact sur la qualité des résultats de recherche
2) Propriétés sociales
PopularitéRéputation
Quantification
15
3.2. Représentation « sociale » d’un document
Ressource (Document)
- J’aime
- +1
- Partage
- Rating
- ….
Signal mono-valeur
ex. J’aime (nombre de j’aime)
Signal multi-valeurs
ex. Rating (nombre de Rating et la valeur du Rating)
Représentation thématique
• Mots-clés : 𝐷 𝑤={𝑤1, 𝑤2, … 𝑤𝑧}
Représentation sociale
• Signaux sociaux : 𝐷 𝑎={𝑎1, 𝑎2, … 𝑎 𝑚}
1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
𝑃 𝐷 𝑄 = 𝑟𝑎𝑛𝑘 𝑃 𝑫 ∙ 𝑃 𝑄 𝐷)
16
3.3. Importance a priori du document
𝑃 𝑎𝑖
Probabilité a priori du
document D
Modèle thématique
Requête/Contenu
ෑ
𝑎 𝑖∈ 𝐴
𝑃 𝑎𝑖
Unique Plusieurs Propriétés
ෑ
𝑎 𝑖
𝑥∈𝐴
𝑃𝑥 𝑎𝑖
𝑥Rating
Réputation
Popularité
1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
17
3.4. Estimation des probabilités a priori
𝐵𝐴 𝐷 =
𝑚𝑜𝑦 𝑟 ∙ 𝑟 + σ 𝐷′∈𝑅 𝑚𝑜𝑦 𝑟′ ∙ |𝑟′|
𝑟 + σ 𝐷′∈𝑅 |𝑟′|
𝑃 𝑎𝑖 = 𝑅𝑎𝑡𝑖𝑛𝑔 =
1 + log(1 + 𝐵𝐴 𝐷 )
1 + log(1 + σ 𝐷′∈𝑅 𝐵𝐴(𝐷′))
Estimée par maximum de
vraisemblance et un lissage par
Dirichlet
𝑷 𝒂𝒊
𝑃 𝑎𝑖 =
𝐶𝑜𝑢𝑛𝑡(𝑎𝑖, 𝐷)
𝐶𝑜𝑢𝑛𝑡(𝑎., 𝐷)
Moyenne Bayésienne BA (Bayesian Average)
Multi-valeur : RatingMono-valeur
1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
18
3.5. Evaluation : objectifs
1) Impact des signaux sociaux sur la performance de RI
2) Impact de la combinaison des signaux sociaux sous forme de
propriétés sociales
• Cadre d’évaluation :
- Deux collections d’INEX : IMDb et SBS.
- Collecte de signaux sociaux pour chaque document (IMDb et SBS).
Collection Documents Requêtes
IMDb 2011 1.6 millions de films 30
SBS 2015 : Suggestion Track 2.8 millions de livres 208
1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
19
3.5. Evaluation : Collections de test
Contenu Textuel : INEX IMDb 2011
1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
20
3.5. Evaluation : Collections de test
Contenu Textuel : INEX SBS 2015
1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
21
3.5. Evaluation : Collections de test
Contenu Social : 9 données sociales collectées.
DELICIOUS
Bookmark IMDb
WITTER
Tweet IMDb
GOOGLE+
+1 IMDb
Partage
LINKED
IMDb
AMAZON
Tag
Rating
SBS
ACEBOOK
J’aime
Partage
Commentaire
SBS,
IMDb
1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
22
3.5. Evaluation : quantification des propriétés
• Chaque propriété est quantifiée par des signaux sociaux spécifiques,
selon sa nature et sa signification.
1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
0,5681
0,5801
0,59
0,5974
0,6203
nDCG
TotalFacebook Popularité Réputation
TousLesCritères ToutesLesPropriétés
0,4102
0,4264 0,4272 0,4262
0,4509
P@20
TotalFacebook Popularité Réputation
TousLesCritères ToutesLesPropriétés
Propriétés Sociales
+44%
+38%+36%
+34%
+31%
+32%
+25%+26%+25%
+20%
3.5. Evaluation : Résultats sur IMDb
0,3919
0,4113
0,4325
nDCG
Lucene Solr BM25 ML.Hiemstra
0,3122
0,3371 0,3403
P@20
Lucene Solr BM25 ML.Hiemstra
Modèles de base
Facebook
23
1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
0,513
0,5262
0,5121
0,4769
0,5017
0,4621 0,4566
nDCG
J'aime Partage Commentaire Tweet
+1 Bookmark Partage(LIn)
0,362
0,3649
0,3551
0,3512
0,3468
0,3414 0,3432
P@20
J'aime Partage Commentaire Tweet
+1 Bookmark Partage(LIn)
Signaux Sociaux
+6%+7%
+16%
+10%
+18%
+22%
+18%
+11%
+12%
+9% +8%
+7%
+5% +6%
Réputation
Propriétés Sociales
0,1937
0,1953
0,1974 0,1981
0,2004
nDCG
TotalFacebook Popularité Réputation
TousLesCritères ToutesLesPropriétés
0,0791
0,078
0,0801
0,0787
0,0888
P@20
TotalFacebook Popularité Réputation
TousLesCritères ToutesLesPropriétés
+30%
+22%+21%
+20%
+19%
+55%
+41%
+41%
+38%
+43%
0,0689 0,0711 0,0678
0,0559 0,0531
P@20
J'aime Partage Commentaire Rating Tag
Signaux Sociaux
0,1864
0,19
0,1807
0,1748 0,1742
nDCG
J'aime Partage Commentaire Rating Tag
+7%+8%
+11%
+17%
+15%
+23% +27%
3.5. Evaluation : Résultats sur SBS
Modèles de base
0,0487
0,0517
0,05
P@20
Lucene Solr BM25 ML.Hiemstra
0,13
0,1581 0,162
nDCG
Lucene Solr BM25 ML.Hiemstra
Facebook
24
1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
+21%
+11% +5%
Réputation
3.5. Evaluation : Algorithmes de sélection (IMDb)
--- : Fortement sélectionné
--- : Modérément sélectionné
--- : Faiblement sélectionné
25
1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
3.5. Evaluation : Algorithmes de sélection (SBS)
--- : Fortement sélectionné
--- : Modérément sélectionné
--- : Faiblement sélectionné
26
1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
3.6. Constats
27
• Présence de signaux sociaux améliore la RI.
 Signaux Facebook meilleurs que les autres signaux.
 Plus fréquents que les autres signaux.
• Regroupement des signaux par propriété améliore significativement les
résultats par rapport aux autres configurations.
• Limites
- Certains signaux (ex. Partage LinkedIn) n’ont pas été évalués sur SBS.
- La non prise en compte des facteurs temporels (âge de la ressource,
fraîcheur de signaux).
1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
Partie II
Temporalité des signaux
sociaux
29
4.1. Hypothèse : Fraîcheur du signal
1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
Temps
Simple ComptageResource R1
+1
1
1+1
1+1
Comptage biaisé par le tempsResource R1
+1
0.5
0.75+1.5
0.72+1.2
Favoriser les ressources associées à des signaux récents
t1 t2 t3 t4 t5
30
4.2. Fraîcheur du signal
• Signal biaisé par sa date de création
𝐶𝑜𝑢𝑛𝑡𝑡 𝑎
𝑡𝑗,𝑎 𝑖
, 𝐷 = ෍
𝑗=1
𝑘
𝑓 𝑡𝑗,𝑎 𝑖
, 𝐷 𝑓 𝑡𝑗,𝑎 𝑖
, 𝐷 = 𝑒𝑥𝑝 −
∥ 𝑡 𝑎𝑐𝑡𝑢𝑒𝑙 − 𝑡𝑗,𝑎 𝑖
∥2
2𝜎2
• Rating biaisé par sa date de création
𝐵𝐴 𝑡 𝐷 =
𝑚𝑜𝑦 𝑟𝑡 ∙ 𝑟𝑡 + σ 𝐷′∈𝑅 𝑚𝑜𝑦 𝑟𝑡′ ∙ |𝑟𝑡′|
𝑟𝑡 + σ 𝐷′∈𝑅 |𝑟𝑡′|
𝑟𝑡 = 𝑟 ∙ 𝑒𝑥𝑝 −
∥ 𝑡 𝑎𝑐𝑡𝑢𝑒𝑙 − 𝑡 𝑟 ∥2
2𝜎2
1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
31
4.3. Hypothèse : Âge de la ressource
Resource R1 : Âge = 1 mois
188
52
12+1
Resource R2 : Âge = 1 jour
2
1
0+1
Les « vieilles » ressources ont plus de chance d’obtenir plus de signaux que les « récentes »
Normalisation des signaux par l’âge de la ressource
1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
32
4.4. Âge de la ressource
𝐶𝑜𝑢𝑛𝑡𝑡 𝐷
𝑎𝑖, 𝐷 = 𝐶𝑜𝑢𝑛𝑡 𝑎𝑖, 𝐷 ∙ 𝐴(𝐷)
𝐴(𝐷) = 𝑒𝑥𝑝 −
‖𝑡 𝑎𝑐𝑡𝑢𝑒𝑙 − 𝑡 𝐷‖2
2𝜎2
• Normaliser la distribution des signaux par la date de publication de la
ressource (âge de la ressource).
1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
33
4.5. Evaluation : Collection de test
Contenu Social : les données sociales temporelles
IMDb
SBS
1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
4.5. Evaluation : Résultats sur SBS
Sans Prise en Compte du Temps Date du Signal
34
0,0732
P@20
Rating
0,1904
nDCG
Rating
+31%
+12%
0,1864
0,1938
0,1807
0,1748 0,1742
nDCG
J'aime Partage Commentaire Rating Tag
0,0689 0,0711 0,0678
0,0559 0,0531
P@20
J'aime Partage Commentaire Rating Tag
Âge de la ressource
0,0708
0,0796
0,0711 0,0695
0,058
P@20
J'aime Partage Commentaire Rating Tag
0,19
0,2001
0,1882
0,1855
0,1771
nDCG
J'aime Partage Commentaire Rating Tag
+5%
+19%+4%
+12%
+3%
+2%
+5%
+4%
+5%
+2%
1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
4.6. Constats
• Signaux sociaux sensibles au temps
- La fraîcheur du signal Rating « booste » les documents pertinents.
- Les signaux fréquents (Partage, Rating) sont les plus sensibles à l’âge de
la ressource.
• Limite
- Expérimentation du temps associé à un signal limitée au Rating.
35
1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
Partie III
Qualité et diversité des signaux
sociaux
37
5.1. Hypothèse
1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
• La diversité des signaux : indice mesurant l’intérêt d’une ressource au-
delà d’un réseau social ou d’une communauté.
• Nature
• Provenance
• Une ressource dominée par un seul signal doit être défavorisée par rapport
à une ressource ayant une équi-répartition des signaux.
• Evaluation de la diversité en utilisant l’indice de diversité de Shannon.
• L’intérêt (importance) d’une ressource.
38
5.2. Estimation de la diversité des Signaux
𝑃𝑥 𝐷 = ෑ
𝑥 ∈𝑋
𝑃𝑥 𝑎 𝑥 ∙ 𝐷𝑖𝑣𝑒𝑟𝑠𝑖𝑡é 𝑠 𝐷
𝐷𝑖𝑣𝑒𝑟𝑠𝑖𝑡é 𝑠 𝐷 = − ෍
𝑖=1
𝑚
𝑃𝑥(𝑎𝑖
𝑥
) ∙ 𝑙𝑜𝑔 𝑃𝑥 𝑎𝑖
𝑥
1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
39
5.3. Evaluation : Résultats SBS
0,084
0,1945
0,0862
0,197
0,0891
0,1994
0,0915
0,2031
0,0976
0,2148
P@20 nDCG
TotalFacebook Popularité Réputation TousLesCritères ToutesLesPropriétés
+10% +14%
+11%
+6%
+10%+16%
1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
Avec Prise en Compte de la Diversité
40
5.4. Distribution du facteur diversité dans les documents
1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
Documents Non-Pertinents
Documents Pertinents
41
5.5. Analyse quantitative et qualitative des signaux
1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
1) la fréquence moyenne des signaux dans les documents pertinents est plus élevée par
rapport aux documents non-pertinents.
2) les signaux de Facebook capturent la majorité des documents pertinents.
3) 95% de ses actions de partage sont concentrées dans 601 documents pertinents avec une
fréquence moyenne de 67 actions.
Les signaux émotionnels :
Quel impact sur la RI ?
Partie IV
43
6.1. Les signaux émotionnels (Facebook Reactions)
1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
• 300 milliards de réactions (24/02/2017), soit plus de 800 millions par jour.
• La réaction j'adore est la plus populaire.
• La majorité des réactions j'adore étaient durant Noël 2016.
• Les pays où les réactions sont populaires : le Mexique, le Chili, la Grèce,
le Paraguay, les États-Unis (la France 14eme).
44
6.1. Les signaux évènementiels
1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
45
6.2. Questions de recherche
1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
Comment les utilisateurs utilisent-ils ces réactions pour interagir avec
les ressources web ?
1
Comment modéliser ces critères et les prendre en compte dans un
modèle de RI ?
2
Quel est l'impact de ces réactions sur les performances d'un système
de RI ?
3
46
6.3. Réactions dans les médias et les films
1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
• Réactions des utilisateurs sur 10 meilleurs films en 2016 et 4650 articles
publiés sur 10 médias.
47
6.3. Exemple : réactions "haha" et "triste"
1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
48
6.3. Réactions dans les médias et les films
1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
• Analyse du premier reportage (article) publié par chaque média sur
l'attaque du 22 mars 2016 à Bruxelles.
49
6.4. Evaluation : objectifs
1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
1) Étudier l'impact des réactions sociales sur la RI.
2) Corrélation entre la pertinence et les réactions.
Cadre d'expérimentation
• Collection IMDb (30 Requêtes, Qrels, 1.6 millions Documents).
• 1000 premiers documents retournés par chaque requête.
• Collecter des réactions via l'API Facebook et le Parsing.
50
6.5. Réactions prises en compte individuellement
1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
51
6.6. Réactions groupées selon leur signification
1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
52
6.7. Requêtes et réactions (positives et négatives)
1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
6.9. Constats
• Les signaux émotionnels
- La réaction j’adore représente le facteur le plus pertinent.
- Il y a une dépendance entre l’émotion dans la requête et les réactions
à prendre en compte dans le processus de ranking.
• Limites
- Simplicité de la modélisation des réactions.
- Expérimentation sur IMDb : très peu de requêtes négatives qui attirent
des documents avec des réactions négatives.
53
1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales
6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
1.1. Contexte : contradiction textuelle
55
1. Introduction 2. Vue d’ensemble : état de l’art
4. Évaluation expérimentale3. Détection & intensité de contradiction
Contradiction :
Une situation où il est extrêmement improbable que deux phrases soient vraies
lorsqu'elles sont considérées ensemble.
Exemples :
1. Négation : « I love you --- I do not love you »
2. Mots opposés : « hot --- cold , light --- dark »
3. Inadéquations numériques :
« There are 7 wonders of the world --- the number of wonders of the world are 9 »
1.1. Contexte : contradiction textuelle
56
1. Introduction 2. Vue d’ensemble : état de l’art
4. Évaluation expérimentale3. Détection & intensité de contradiction
1.2. Questions de recherche
57
1. Introduction 2. Vue d’ensemble : état de l’art
4. Évaluation expérimentale3. Détection & intensité de contradiction
Comment identifier une contradiction sur un aspect dans les
commentaires?
1
Comment mesurer le degré de contradiction entre les commentaires?2
Quel est l’impact de la prise en compte conjointe de la polarité et du
rating des commentaires sur la mesure de l’intensité de la
contradiction?
3
2. Vue d’ensemble : état de l’art
58
1. Introduction 2. Vue d’ensemble : état de l’art
4. Évaluation expérimentale3. Détection & intensité de contradiction
3.1. Comment détecter une contradiction ?
59
1. Introduction 2. Vue d’ensemble : état de l’art
4. Évaluation expérimentale3. Détection & intensité de contradiction
3.2. Détection d’aspects dans un commentaire
60
1. Introduction 2. Vue d’ensemble : état de l’art
4. Évaluation expérimentale3. Détection & intensité de contradiction
1. Calcul fréquentiel des termes constituant le corpus des commentaires,
2. Catégorisation des termes de chaque commentaire en utilisant Stanford
Parser,
3. Sélection des termes ayant la catégorie nominale,
4. Sélection des noms avec des termes émotionnels dans leur voisinages de
5 mots (en utilisant SentiWordNet),
5. Extraction des termes les plus fréquents (utilisés) dans le corpus parmi
ceux sélectionner dans l’étape précédente. Ces termes seront considérés
comme des aspects.
3.2. Détection d’aspects : Exemple
61
1. Introduction 2. Vue d’ensemble : état de l’art
4. Évaluation expérimentale3. Détection & intensité de contradiction
L’aspect utile est : « lecturer »
3.3. Analyse de sentiments
62
1. Introduction 2. Vue d’ensemble : état de l’art
4. Évaluation expérimentale3. Détection & intensité de contradiction
3.4. Mesure de contradiction
63
1. Introduction 2. Vue d’ensemble : état de l’art
4. Évaluation expérimentale3. Détection & intensité de contradiction
.
- Coordonnées (poli , rati) pour chaque commentaire-aspect cai
- Un commentaire cai aspect est un segment du commentaire contenant un
aspect (5 mots avant et après l’aspect).
3.4. Mesure de contradiction
64
1. Introduction 2. Vue d’ensemble : état de l’art
4. Évaluation expérimentale3. Détection & intensité de contradiction
• Fonction de dispersion (inertie du nuage)
- Distance (poli , rati ) est la distance du point cai du nuage au point centroide
cacentroide , tandis que n est le nombre de points cai du nuage.
- Normalisation des ratings rati :
3.4. Mesure de contradiction
65
1. Introduction 2. Vue d’ensemble : état de l’art
4. Évaluation expérimentale3. Détection & intensité de contradiction
1. Centroide basé sur la moyenne des poli et rati
Les coordonnées (pol, rat) du centroide cacentroide peuvent être calculées de
deux manières différentes :
2. Centroide basé sur la moyenne pondérée des poli et rati
4.1. Objectifs et collection de test
66
1. Introduction 2. Vue d’ensemble : état de l’art
4. Évaluation expérimentale3. Détection & intensité de contradiction
4.2. Les aspects détectés
67
1. Introduction 2. Vue d’ensemble : état de l’art
4. Évaluation expérimentale3. Détection & intensité de contradiction
4.3. Évaluation manuelle « User Study »
68
1. Introduction 2. Vue d’ensemble : état de l’art
4. Évaluation expérimentale3. Détection & intensité de contradiction
4.4. Protocole d’évaluation
69
1. Introduction 2. Vue d’ensemble : état de l’art
4. Évaluation expérimentale3. Détection & intensité de contradiction
4.5. Résultats
70
1. Introduction 2. Vue d’ensemble : état de l’art
4. Évaluation expérimentale3. Détection & intensité de contradiction
Figure 1 – Corrélation entre les jugements de contradiction et les résultats de notre
approche (avec un taux d’erreur de 21% dans la détection de sentiments)
4.5. Résultats
71
1. Introduction 2. Vue d’ensemble : état de l’art
4. Évaluation expérimentale3. Détection & intensité de contradiction
Figure 2 – Corrélation entre les jugements de contradiction et les résultats de notre
approche (avec un taux d’erreur de 0% dans la détection de sentiments)
4.6. Constats
• Estimation de l’intensité de contradiction
- Exploitation conjointe des polarités et des ratings.
- Calcul de centroide de 2 manières (moyenné et pondéré).
• Limites
- Dépendance de la qualité des modèles d’analyse de sentiments et de
détection des aspects.
- Simplicité des modèles de pré-traitements.
- Détection des phrases auxquelles appartient un aspect.
72
1. Introduction 2. Vue d’ensemble : état de l’art
4. Évaluation expérimentale3. Détection & intensité de contradiction
4.7. Prédiction de l’intensité de contradiction
73
1. Introduction 2. Vue d’ensemble : état de l’art
4. Évaluation expérimentale3. Détection & intensité de contradiction
Fig. Processus d’apprentissage automatique
4.7. Prédiction de l’intensité de contradiction
74
1. Introduction 2. Vue d’ensemble : état de l’art
4. Évaluation expérimentale3. Détection & intensité de contradiction
Tableau. Liste des critères exploités
Conclusion
Contributions
1. Modèle d’estimation de l’importance
sociale d’un document.
 Exploitation individuelle et groupée des
signaux (popularité, réputation).
2. Prise en compte de l’aspect temporel
 « Fraîcheur » du signal,
 Normalisation du signal par l’âge de la
ressource.
3. Qualité et diversité des signaux sociaux
 Diversité en termes de nature et
provenance des signaux.
4. Etude des signaux émotionnels
5. Contradiction dans les commentaires
6. Mise en place de collections de test
Publications
1. «Contradiction in Reviews : is it Strong or Low?» à BroDyn
workshop, ECIR 2018
2. «Emotional Social Signals for Search Ranking» à SIGIR 2017
3. «Finding and Quantifying Temporal-Aware Contradiction in
Reviews» à AIRS 2017
4. «Harnessing Ratings and Aspect-Sentiment to Estimate
Contradiction Intensity in Temporal-Related Reviews» à KES 2017
5. «Fresh and Diverse Social Signals : Any Impacts on Search ?» à
ACM SIGIR CHIIR 2017.
6. «Multimodal Social Book Search» à CLEF 2015.
7. «A Priori Relevance Based On Quality and Diversity Of Social
Signals» à ACM SIGIR 2015.
8. «Document Priors Based On Time-Sensitive Social Signals» à
ECIR 2015.
9. «Social Priors to Estimate Relevance of a Resource» à ACM IIiX
2014.
10. «Harnessing Social Signals to Enhance a Search» à ACM/IEEE
WIC 2014.
11. «Détection de contradiction dans les commentaires» à CORIA
2017.
12. «Les Signaux Sociaux Émotionnels : Quel impact sur la RI ?» à
CORIA 2017.
13. «Pertinence a Priori Basée sur la Diversité et la Temporalité des
Signaux Sociaux» à CORIA 2015.
14. «Exploitation de signaux sociaux pour estimer la pertinence a
priori d’une ressource» à CORIA 2014.
15. «RI sociale : intégration de propriétés sociales dans un modèle
de recherche» à CORIA 2013.
http://www.irit.fr/~Ismail.Badache/
https://twitter.com/Ismail_badache
76
Modèle classique
Modèle social

Contenu connexe

Similaire à LES CONTENUS SOCIAUX : Quel impact sur le processus de RI et la quantification de contradiction

Jochems, Gonin et D'Amours - Acfts toronto2017-gtle utnis
Jochems, Gonin et D'Amours - Acfts toronto2017-gtle utnisJochems, Gonin et D'Amours - Acfts toronto2017-gtle utnis
Jochems, Gonin et D'Amours - Acfts toronto2017-gtle utnisS. Jochems UQAM
 
Présentation-R-Barre-Jne 30ans-des-urfist
Présentation-R-Barre-Jne 30ans-des-urfistPrésentation-R-Barre-Jne 30ans-des-urfist
Présentation-R-Barre-Jne 30ans-des-urfistURFIST de Paris
 
De l'identité à la présence
De l'identité à la présenceDe l'identité à la présence
De l'identité à la présenceLouise Merzeau
 
Un modèle de Recherche d'Information Sociale pour l'Accès aux Ressources Bib...
Un modèle de Recherche d'Information Sociale  pour l'Accès aux Ressources Bib...Un modèle de Recherche d'Information Sociale  pour l'Accès aux Ressources Bib...
Un modèle de Recherche d'Information Sociale pour l'Accès aux Ressources Bib...Lamjed Ben Jabeur
 
La recherche et l'évaluation de l'information sur un web recalibré
La recherche et l'évaluation de l'information sur un web recalibréLa recherche et l'évaluation de l'information sur un web recalibré
La recherche et l'évaluation de l'information sur un web recalibréElise Chomienne
 
La connaissance 2.0 en tourisme pour comprendre les comportements touristiques
La connaissance 2.0 en tourisme pour comprendre les comportements touristiquesLa connaissance 2.0 en tourisme pour comprendre les comportements touristiques
La connaissance 2.0 en tourisme pour comprendre les comportements touristiquesfrancoquebecetourisme
 
Identité et réseaux socionumériques : lien social et formes d'expression de soi
Identité et réseaux socionumériques : lien social et formes d'expression de soiIdentité et réseaux socionumériques : lien social et formes d'expression de soi
Identité et réseaux socionumériques : lien social et formes d'expression de soiAlexandre Coutant
 
Journalisme et medias sociaux : les nouvelles formes narratives
Journalisme et medias sociaux : les nouvelles formes narrativesJournalisme et medias sociaux : les nouvelles formes narratives
Journalisme et medias sociaux : les nouvelles formes narrativesUNITEC
 
Comment démocratiser vos études sur les réseaux sociaux ? Un Webinar présenté...
Comment démocratiser vos études sur les réseaux sociaux ? Un Webinar présenté...Comment démocratiser vos études sur les réseaux sociaux ? Un Webinar présenté...
Comment démocratiser vos études sur les réseaux sociaux ? Un Webinar présenté...The Metrics Factory
 
Pourquoi et comment écouter & cartographier le web social pour gérer vos risq...
Pourquoi et comment écouter & cartographier le web social pour gérer vos risq...Pourquoi et comment écouter & cartographier le web social pour gérer vos risq...
Pourquoi et comment écouter & cartographier le web social pour gérer vos risq...SocialMedia Summit
 
Littératie numérique et réseaux sociaux : Enjeux pour l’éducation
Littératie numérique et réseaux sociaux : Enjeux pour l’éducationLittératie numérique et réseaux sociaux : Enjeux pour l’éducation
Littératie numérique et réseaux sociaux : Enjeux pour l’éducationElie ALLOUCHE
 
Act 00051 géomatique participative, qu’est-ce qu’on attend
Act 00051 géomatique participative, qu’est-ce qu’on attendAct 00051 géomatique participative, qu’est-ce qu’on attend
Act 00051 géomatique participative, qu’est-ce qu’on attendACSG - Section Montréal
 
Act 00051 géomatique participative, qu’est-ce qu’on attend
Act 00051 géomatique participative, qu’est-ce qu’on attendAct 00051 géomatique participative, qu’est-ce qu’on attend
Act 00051 géomatique participative, qu’est-ce qu’on attendACSG Section Montréal
 
Étudier les usages du web social
Étudier les usages du web social Étudier les usages du web social
Étudier les usages du web social Alexandre Coutant
 
LINGWAY forum e-marketing/ e-réputation
LINGWAY forum e-marketing/ e-réputationLINGWAY forum e-marketing/ e-réputation
LINGWAY forum e-marketing/ e-réputationLingway
 
Tunis 2.0 : les réseaux sociaux des mouvements politiques
Tunis 2.0 : les réseaux sociaux des mouvements politiquesTunis 2.0 : les réseaux sociaux des mouvements politiques
Tunis 2.0 : les réseaux sociaux des mouvements politiquesAnthony Poncier
 

Similaire à LES CONTENUS SOCIAUX : Quel impact sur le processus de RI et la quantification de contradiction (20)

Big data vs small data
Big data vs small dataBig data vs small data
Big data vs small data
 
Jochems, Gonin et D'Amours - Acfts toronto2017-gtle utnis
Jochems, Gonin et D'Amours - Acfts toronto2017-gtle utnisJochems, Gonin et D'Amours - Acfts toronto2017-gtle utnis
Jochems, Gonin et D'Amours - Acfts toronto2017-gtle utnis
 
Présentation-R-Barre-Jne 30ans-des-urfist
Présentation-R-Barre-Jne 30ans-des-urfistPrésentation-R-Barre-Jne 30ans-des-urfist
Présentation-R-Barre-Jne 30ans-des-urfist
 
De l'identité à la présence
De l'identité à la présenceDe l'identité à la présence
De l'identité à la présence
 
Un modèle de Recherche d'Information Sociale pour l'Accès aux Ressources Bib...
Un modèle de Recherche d'Information Sociale  pour l'Accès aux Ressources Bib...Un modèle de Recherche d'Information Sociale  pour l'Accès aux Ressources Bib...
Un modèle de Recherche d'Information Sociale pour l'Accès aux Ressources Bib...
 
La recherche et l'évaluation de l'information sur un web recalibré
La recherche et l'évaluation de l'information sur un web recalibréLa recherche et l'évaluation de l'information sur un web recalibré
La recherche et l'évaluation de l'information sur un web recalibré
 
CST2
CST2CST2
CST2
 
Évaluation de l’impact et évaluation de l’inclusion sociale : méthode et outi...
Évaluation de l’impact et évaluation de l’inclusion sociale : méthode et outi...Évaluation de l’impact et évaluation de l’inclusion sociale : méthode et outi...
Évaluation de l’impact et évaluation de l’inclusion sociale : méthode et outi...
 
La connaissance 2.0 en tourisme pour comprendre les comportements touristiques
La connaissance 2.0 en tourisme pour comprendre les comportements touristiquesLa connaissance 2.0 en tourisme pour comprendre les comportements touristiques
La connaissance 2.0 en tourisme pour comprendre les comportements touristiques
 
Identité et réseaux socionumériques : lien social et formes d'expression de soi
Identité et réseaux socionumériques : lien social et formes d'expression de soiIdentité et réseaux socionumériques : lien social et formes d'expression de soi
Identité et réseaux socionumériques : lien social et formes d'expression de soi
 
Journalisme et medias sociaux : les nouvelles formes narratives
Journalisme et medias sociaux : les nouvelles formes narrativesJournalisme et medias sociaux : les nouvelles formes narratives
Journalisme et medias sociaux : les nouvelles formes narratives
 
Comment démocratiser vos études sur les réseaux sociaux ? Un Webinar présenté...
Comment démocratiser vos études sur les réseaux sociaux ? Un Webinar présenté...Comment démocratiser vos études sur les réseaux sociaux ? Un Webinar présenté...
Comment démocratiser vos études sur les réseaux sociaux ? Un Webinar présenté...
 
Sfsic17 alexandre coutant
Sfsic17 alexandre coutantSfsic17 alexandre coutant
Sfsic17 alexandre coutant
 
Pourquoi et comment écouter & cartographier le web social pour gérer vos risq...
Pourquoi et comment écouter & cartographier le web social pour gérer vos risq...Pourquoi et comment écouter & cartographier le web social pour gérer vos risq...
Pourquoi et comment écouter & cartographier le web social pour gérer vos risq...
 
Littératie numérique et réseaux sociaux : Enjeux pour l’éducation
Littératie numérique et réseaux sociaux : Enjeux pour l’éducationLittératie numérique et réseaux sociaux : Enjeux pour l’éducation
Littératie numérique et réseaux sociaux : Enjeux pour l’éducation
 
Act 00051 géomatique participative, qu’est-ce qu’on attend
Act 00051 géomatique participative, qu’est-ce qu’on attendAct 00051 géomatique participative, qu’est-ce qu’on attend
Act 00051 géomatique participative, qu’est-ce qu’on attend
 
Act 00051 géomatique participative, qu’est-ce qu’on attend
Act 00051 géomatique participative, qu’est-ce qu’on attendAct 00051 géomatique participative, qu’est-ce qu’on attend
Act 00051 géomatique participative, qu’est-ce qu’on attend
 
Étudier les usages du web social
Étudier les usages du web social Étudier les usages du web social
Étudier les usages du web social
 
LINGWAY forum e-marketing/ e-réputation
LINGWAY forum e-marketing/ e-réputationLINGWAY forum e-marketing/ e-réputation
LINGWAY forum e-marketing/ e-réputation
 
Tunis 2.0 : les réseaux sociaux des mouvements politiques
Tunis 2.0 : les réseaux sociaux des mouvements politiquesTunis 2.0 : les réseaux sociaux des mouvements politiques
Tunis 2.0 : les réseaux sociaux des mouvements politiques
 

Plus de Ismail BADACHE

Predicting Contradiction Intensity: Low, Strong or Very Strong?
Predicting Contradiction Intensity: Low, Strong or Very Strong?Predicting Contradiction Intensity: Low, Strong or Very Strong?
Predicting Contradiction Intensity: Low, Strong or Very Strong?Ismail BADACHE
 
Prédire l’intensité de contradiction dans les commentaires : faible, forte ou...
Prédire l’intensité de contradiction dans les commentaires : faible, forte ou...Prédire l’intensité de contradiction dans les commentaires : faible, forte ou...
Prédire l’intensité de contradiction dans les commentaires : faible, forte ou...Ismail BADACHE
 
Intensité de contradiction dans les commentaires (Séminaire à l'EHESS 04 avri...
Intensité de contradiction dans les commentaires (Séminaire à l'EHESS 04 avri...Intensité de contradiction dans les commentaires (Séminaire à l'EHESS 04 avri...
Intensité de contradiction dans les commentaires (Séminaire à l'EHESS 04 avri...Ismail BADACHE
 
Contradiction in Reviews: is it Strong or Low?
Contradiction in Reviews: is it Strong or Low?Contradiction in Reviews: is it Strong or Low?
Contradiction in Reviews: is it Strong or Low?Ismail BADACHE
 
Emotional Social Signals for Search Ranking
Emotional Social Signals for Search RankingEmotional Social Signals for Search Ranking
Emotional Social Signals for Search RankingIsmail BADACHE
 
Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity i...
Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity i...Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity i...
Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity i...Ismail BADACHE
 
Finding and Quantifying Temporal-Aware Contradiction in Reviews
Finding and Quantifying Temporal-Aware Contradiction in ReviewsFinding and Quantifying Temporal-Aware Contradiction in Reviews
Finding and Quantifying Temporal-Aware Contradiction in ReviewsIsmail BADACHE
 
Détection de contradiction dans les commentaires
Détection de contradiction dans les commentairesDétection de contradiction dans les commentaires
Détection de contradiction dans les commentairesIsmail BADACHE
 
Fresh and Diverse Social Signals: Any Impacts on Search?
Fresh and Diverse Social Signals: Any Impacts on Search?Fresh and Diverse Social Signals: Any Impacts on Search?
Fresh and Diverse Social Signals: Any Impacts on Search?Ismail BADACHE
 
Social Signals: Any Impacts in Search?
Social Signals: Any Impacts in Search?Social Signals: Any Impacts in Search?
Social Signals: Any Impacts in Search?Ismail BADACHE
 
Multimodal Social Book Search
Multimodal Social Book SearchMultimodal Social Book Search
Multimodal Social Book SearchIsmail BADACHE
 
A Priori Relevance Based On Quality and Diversity Of Social Signals
A Priori Relevance Based On Quality and Diversity Of Social SignalsA Priori Relevance Based On Quality and Diversity Of Social Signals
A Priori Relevance Based On Quality and Diversity Of Social SignalsIsmail BADACHE
 
Priors Based On Time-Sensitive Social Signals
Priors Based On Time-Sensitive Social SignalsPriors Based On Time-Sensitive Social Signals
Priors Based On Time-Sensitive Social SignalsIsmail BADACHE
 
Social Networks Statistics 2014
Social Networks Statistics 2014Social Networks Statistics 2014
Social Networks Statistics 2014Ismail BADACHE
 
Social Priors to Estimate Relevance of a Resource
Social Priors to Estimate Relevance of a ResourceSocial Priors to Estimate Relevance of a Resource
Social Priors to Estimate Relevance of a ResourceIsmail BADACHE
 
Harnessing social signals to enhance a search
Harnessing social signals to enhance a searchHarnessing social signals to enhance a search
Harnessing social signals to enhance a searchIsmail BADACHE
 
Poster Recherche d'Information Sociale
Poster Recherche d'Information SocialePoster Recherche d'Information Sociale
Poster Recherche d'Information SocialeIsmail BADACHE
 

Plus de Ismail BADACHE (17)

Predicting Contradiction Intensity: Low, Strong or Very Strong?
Predicting Contradiction Intensity: Low, Strong or Very Strong?Predicting Contradiction Intensity: Low, Strong or Very Strong?
Predicting Contradiction Intensity: Low, Strong or Very Strong?
 
Prédire l’intensité de contradiction dans les commentaires : faible, forte ou...
Prédire l’intensité de contradiction dans les commentaires : faible, forte ou...Prédire l’intensité de contradiction dans les commentaires : faible, forte ou...
Prédire l’intensité de contradiction dans les commentaires : faible, forte ou...
 
Intensité de contradiction dans les commentaires (Séminaire à l'EHESS 04 avri...
Intensité de contradiction dans les commentaires (Séminaire à l'EHESS 04 avri...Intensité de contradiction dans les commentaires (Séminaire à l'EHESS 04 avri...
Intensité de contradiction dans les commentaires (Séminaire à l'EHESS 04 avri...
 
Contradiction in Reviews: is it Strong or Low?
Contradiction in Reviews: is it Strong or Low?Contradiction in Reviews: is it Strong or Low?
Contradiction in Reviews: is it Strong or Low?
 
Emotional Social Signals for Search Ranking
Emotional Social Signals for Search RankingEmotional Social Signals for Search Ranking
Emotional Social Signals for Search Ranking
 
Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity i...
Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity i...Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity i...
Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity i...
 
Finding and Quantifying Temporal-Aware Contradiction in Reviews
Finding and Quantifying Temporal-Aware Contradiction in ReviewsFinding and Quantifying Temporal-Aware Contradiction in Reviews
Finding and Quantifying Temporal-Aware Contradiction in Reviews
 
Détection de contradiction dans les commentaires
Détection de contradiction dans les commentairesDétection de contradiction dans les commentaires
Détection de contradiction dans les commentaires
 
Fresh and Diverse Social Signals: Any Impacts on Search?
Fresh and Diverse Social Signals: Any Impacts on Search?Fresh and Diverse Social Signals: Any Impacts on Search?
Fresh and Diverse Social Signals: Any Impacts on Search?
 
Social Signals: Any Impacts in Search?
Social Signals: Any Impacts in Search?Social Signals: Any Impacts in Search?
Social Signals: Any Impacts in Search?
 
Multimodal Social Book Search
Multimodal Social Book SearchMultimodal Social Book Search
Multimodal Social Book Search
 
A Priori Relevance Based On Quality and Diversity Of Social Signals
A Priori Relevance Based On Quality and Diversity Of Social SignalsA Priori Relevance Based On Quality and Diversity Of Social Signals
A Priori Relevance Based On Quality and Diversity Of Social Signals
 
Priors Based On Time-Sensitive Social Signals
Priors Based On Time-Sensitive Social SignalsPriors Based On Time-Sensitive Social Signals
Priors Based On Time-Sensitive Social Signals
 
Social Networks Statistics 2014
Social Networks Statistics 2014Social Networks Statistics 2014
Social Networks Statistics 2014
 
Social Priors to Estimate Relevance of a Resource
Social Priors to Estimate Relevance of a ResourceSocial Priors to Estimate Relevance of a Resource
Social Priors to Estimate Relevance of a Resource
 
Harnessing social signals to enhance a search
Harnessing social signals to enhance a searchHarnessing social signals to enhance a search
Harnessing social signals to enhance a search
 
Poster Recherche d'Information Sociale
Poster Recherche d'Information SocialePoster Recherche d'Information Sociale
Poster Recherche d'Information Sociale
 

LES CONTENUS SOCIAUX : Quel impact sur le processus de RI et la quantification de contradiction

  • 1. Ismaïl BADACHE LIS UMR 7020 – Université Aix-Marseille LES CONTENUS SOCIAUX Quel impact sur le processus de RI et la quantification de contradiction Séminaire à Lyon LIRIS – Equipe DRIM13 Mars 2018
  • 2. Plan Contexte Etat de l’Art Signaux et Propriétés Sociales Temporalité des Signaux Qualité et Diversité des Signaux 4 1 3 2 5 A) Exploitation des signaux sociaux pour améliorer la RI B) Intensité de contradiction dans les commentaires Signaux émotionnels : quel impact sur la RI ?6 Comment détecter une contradiction ?1 Mesurer l’intensité de contradiction2
  • 3.
  • 4. 4 Réseaux Sociaux : quelques « stats Jan. 2018 » Contenu social par 1 min 70000 Publications 2,3 Millions J’aime ~410 GO de données Facebook Source: blogdumoderateur.com quantcast.com semiocast.com % Partages dans les RS 1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Conclusion5. Qualité et Diversité des Signaux4. Temporalité des Signaux 4 milliards d’internautes 80% sont au moins inscrits dans un réseau social
  • 5. Vidéo Photo Page Web Ressources Web Ressource . . . Réseaux sociaux Bookmark Commentaire/Avis Partage/Recommandation Rating/Votes J’aime/+1 Interactions Signaux Sociaux (Contenus générés par l’utilisateur) 5 Prise en compte
  • 6. Vidéo Photo Page Web Ressources Web Ressource . . . Réseaux sociaux Bookmark Commentaire/Avis Partage/Recommandation Rating/Votes J’aime/+1 Interactions Signaux Sociaux (Contenus générés par l’utilisateur) 6 Modèle de RI Prise en compte Requête Résultats
  • 7. 7 Contexte : RI 1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
  • 8. Vidéo Photo Page Web Ressources Web Ressource . . . Réseaux sociaux Bookmark Commentaire/Avis Partage/Recommandation Rating/Votes J’aime/+1 Interactions Signaux Sociaux (Contenus générés par l’utilisateur) 8 Nature Provenance Signification Temporalité Diversité Rating 5 4 3 2 1 Émotion
  • 9. 9 Questions de recherche Impact de la diversité des signaux sociaux sur les résultats ?3 Comment prendre en compte les signaux sociaux et leur temporalité pour estimer l’importance d’une ressource ? 2 Comment traduire les signaux sociaux en « importance sociale » d’une ressource ? 1 Quel modèle théorique pour combiner la pertinence a priori d’une ressource et sa pertinence thématique ? 4 Est-ce que la qualité du signal est influencée par son réseau social ?5 1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux Les signaux émotionnels : quel impact sur la RI ?6
  • 10. 10 2. Etat de l’art 1) Recherche d’information dans les contenus sociaux Recherche dans les médias sociaux (Moris et al., 2010) (Luo et al., 2012) (Damak et al., 2014) Question-Réponse sociale (Dror et al., 2011) (Hecht et al., 2012) Recherche de conversations (Magnani et al., 2012) (Ould-Amer et al., 2014) Recherche d’opinions (Pang et Lillian, 2008) (Danescu-Niculescu et al., 2009) Recherche de personnes (experts) (Macdonald et Ounis, 2008) (Deng et al., 2008) 2) Exploitation des contenus sociaux pour améliorer la RI Indexation sociale (Zhang et al., 2009) (Bischoff et al ., 2008) Reformulation de la requête (Koolen et al., 2009) (Bao et al., 2007) Reclassement de résultats - Classement basé sur la pertinence sociale - Classement social personnalisé (Bao et al., 2007) (Yanbe et al., 2007) (Bender et al., 2008) (Carmel et al., 2009) (Hecht et al., 2012) 1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
  • 11. 11 2. Etat de l’art Sources d’évidence Propriétés Modèles Auteurs Critères sociaux indépendants du temps • Nombre de : clicks, votes, enregistrement et recommandation. Popularité Importance Combinaison linéaire (Karweg et al., 2011) • Nombre de: j’aime, j’aime pas, commentaires sur YouTube. • Nombre de lecture d’un titre sur Last.fm. • Social Book Search (ratings, tags, reviews). Importance Apprentissage et Combinaison linéaire (Chelaru et al., 2012) (Khodaei et al. 2012) (Buijs et Spruit, 2014) (Zhang et al., 2016) • Nombre de retweets. Popularité Technique d’apprentissage (Yang et al., 2012) (Hong et al., 2011) Critères sociaux dépendants du temps • Analyse des signaux sociaux pour classer l’intérêt des utilisateurs en 5 classes : recent, ongoing, seasonal, past et random. Intérêt temporel Etude statistique (Khodaei et Alonso, 2012) • Exploiter le clic temporel appelé ClickBuzz pour mesurer l’intérêt d’un document à travers le temps. Buzz dans le temps Technique d’apprentissage (Inagaki et al., 2010) 1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
  • 12. 12 2. Etat de l’art : Positionnement 1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux I. Exploitation des signaux sociaux issus de plusieurs réseaux sociaux, de façon individuelle ou groupée sous forme de propriétés (ex. réputation et popularité); II. Prise en compte de la temporalité des signaux : date de création de chaque action sociale ainsi que l’âge de la ressource; III. Prise en compte de la diversité des signaux au sein d’un document. IV. Analyser et étudier les nouveaux signaux émotionnels de Facebook (Facebook Reactions : haha, j’adore, wouah, triste, grrr).
  • 13. Partie I Exploitation individuelle et groupée des signaux sociaux
  • 14. 14 3.1. Hypothèses 1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux 1) Signaux Sociaux Présence Nombre Origine Signal Social Impact sur la qualité des résultats de recherche 2) Propriétés sociales PopularitéRéputation Quantification
  • 15. 15 3.2. Représentation « sociale » d’un document Ressource (Document) - J’aime - +1 - Partage - Rating - …. Signal mono-valeur ex. J’aime (nombre de j’aime) Signal multi-valeurs ex. Rating (nombre de Rating et la valeur du Rating) Représentation thématique • Mots-clés : 𝐷 𝑤={𝑤1, 𝑤2, … 𝑤𝑧} Représentation sociale • Signaux sociaux : 𝐷 𝑎={𝑎1, 𝑎2, … 𝑎 𝑚} 1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
  • 16. 𝑃 𝐷 𝑄 = 𝑟𝑎𝑛𝑘 𝑃 𝑫 ∙ 𝑃 𝑄 𝐷) 16 3.3. Importance a priori du document 𝑃 𝑎𝑖 Probabilité a priori du document D Modèle thématique Requête/Contenu ෑ 𝑎 𝑖∈ 𝐴 𝑃 𝑎𝑖 Unique Plusieurs Propriétés ෑ 𝑎 𝑖 𝑥∈𝐴 𝑃𝑥 𝑎𝑖 𝑥Rating Réputation Popularité 1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
  • 17. 17 3.4. Estimation des probabilités a priori 𝐵𝐴 𝐷 = 𝑚𝑜𝑦 𝑟 ∙ 𝑟 + σ 𝐷′∈𝑅 𝑚𝑜𝑦 𝑟′ ∙ |𝑟′| 𝑟 + σ 𝐷′∈𝑅 |𝑟′| 𝑃 𝑎𝑖 = 𝑅𝑎𝑡𝑖𝑛𝑔 = 1 + log(1 + 𝐵𝐴 𝐷 ) 1 + log(1 + σ 𝐷′∈𝑅 𝐵𝐴(𝐷′)) Estimée par maximum de vraisemblance et un lissage par Dirichlet 𝑷 𝒂𝒊 𝑃 𝑎𝑖 = 𝐶𝑜𝑢𝑛𝑡(𝑎𝑖, 𝐷) 𝐶𝑜𝑢𝑛𝑡(𝑎., 𝐷) Moyenne Bayésienne BA (Bayesian Average) Multi-valeur : RatingMono-valeur 1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
  • 18. 18 3.5. Evaluation : objectifs 1) Impact des signaux sociaux sur la performance de RI 2) Impact de la combinaison des signaux sociaux sous forme de propriétés sociales • Cadre d’évaluation : - Deux collections d’INEX : IMDb et SBS. - Collecte de signaux sociaux pour chaque document (IMDb et SBS). Collection Documents Requêtes IMDb 2011 1.6 millions de films 30 SBS 2015 : Suggestion Track 2.8 millions de livres 208 1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
  • 19. 19 3.5. Evaluation : Collections de test Contenu Textuel : INEX IMDb 2011 1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
  • 20. 20 3.5. Evaluation : Collections de test Contenu Textuel : INEX SBS 2015 1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
  • 21. 21 3.5. Evaluation : Collections de test Contenu Social : 9 données sociales collectées. DELICIOUS Bookmark IMDb WITTER Tweet IMDb GOOGLE+ +1 IMDb Partage LINKED IMDb AMAZON Tag Rating SBS ACEBOOK J’aime Partage Commentaire SBS, IMDb 1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
  • 22. 22 3.5. Evaluation : quantification des propriétés • Chaque propriété est quantifiée par des signaux sociaux spécifiques, selon sa nature et sa signification. 1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
  • 23. 0,5681 0,5801 0,59 0,5974 0,6203 nDCG TotalFacebook Popularité Réputation TousLesCritères ToutesLesPropriétés 0,4102 0,4264 0,4272 0,4262 0,4509 P@20 TotalFacebook Popularité Réputation TousLesCritères ToutesLesPropriétés Propriétés Sociales +44% +38%+36% +34% +31% +32% +25%+26%+25% +20% 3.5. Evaluation : Résultats sur IMDb 0,3919 0,4113 0,4325 nDCG Lucene Solr BM25 ML.Hiemstra 0,3122 0,3371 0,3403 P@20 Lucene Solr BM25 ML.Hiemstra Modèles de base Facebook 23 1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux 0,513 0,5262 0,5121 0,4769 0,5017 0,4621 0,4566 nDCG J'aime Partage Commentaire Tweet +1 Bookmark Partage(LIn) 0,362 0,3649 0,3551 0,3512 0,3468 0,3414 0,3432 P@20 J'aime Partage Commentaire Tweet +1 Bookmark Partage(LIn) Signaux Sociaux +6%+7% +16% +10% +18% +22% +18% +11% +12% +9% +8% +7% +5% +6% Réputation
  • 24. Propriétés Sociales 0,1937 0,1953 0,1974 0,1981 0,2004 nDCG TotalFacebook Popularité Réputation TousLesCritères ToutesLesPropriétés 0,0791 0,078 0,0801 0,0787 0,0888 P@20 TotalFacebook Popularité Réputation TousLesCritères ToutesLesPropriétés +30% +22%+21% +20% +19% +55% +41% +41% +38% +43% 0,0689 0,0711 0,0678 0,0559 0,0531 P@20 J'aime Partage Commentaire Rating Tag Signaux Sociaux 0,1864 0,19 0,1807 0,1748 0,1742 nDCG J'aime Partage Commentaire Rating Tag +7%+8% +11% +17% +15% +23% +27% 3.5. Evaluation : Résultats sur SBS Modèles de base 0,0487 0,0517 0,05 P@20 Lucene Solr BM25 ML.Hiemstra 0,13 0,1581 0,162 nDCG Lucene Solr BM25 ML.Hiemstra Facebook 24 1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux +21% +11% +5% Réputation
  • 25. 3.5. Evaluation : Algorithmes de sélection (IMDb) --- : Fortement sélectionné --- : Modérément sélectionné --- : Faiblement sélectionné 25 1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
  • 26. 3.5. Evaluation : Algorithmes de sélection (SBS) --- : Fortement sélectionné --- : Modérément sélectionné --- : Faiblement sélectionné 26 1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
  • 27. 3.6. Constats 27 • Présence de signaux sociaux améliore la RI.  Signaux Facebook meilleurs que les autres signaux.  Plus fréquents que les autres signaux. • Regroupement des signaux par propriété améliore significativement les résultats par rapport aux autres configurations. • Limites - Certains signaux (ex. Partage LinkedIn) n’ont pas été évalués sur SBS. - La non prise en compte des facteurs temporels (âge de la ressource, fraîcheur de signaux). 1. Contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
  • 28. Partie II Temporalité des signaux sociaux
  • 29. 29 4.1. Hypothèse : Fraîcheur du signal 1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux Temps Simple ComptageResource R1 +1 1 1+1 1+1 Comptage biaisé par le tempsResource R1 +1 0.5 0.75+1.5 0.72+1.2 Favoriser les ressources associées à des signaux récents t1 t2 t3 t4 t5
  • 30. 30 4.2. Fraîcheur du signal • Signal biaisé par sa date de création 𝐶𝑜𝑢𝑛𝑡𝑡 𝑎 𝑡𝑗,𝑎 𝑖 , 𝐷 = ෍ 𝑗=1 𝑘 𝑓 𝑡𝑗,𝑎 𝑖 , 𝐷 𝑓 𝑡𝑗,𝑎 𝑖 , 𝐷 = 𝑒𝑥𝑝 − ∥ 𝑡 𝑎𝑐𝑡𝑢𝑒𝑙 − 𝑡𝑗,𝑎 𝑖 ∥2 2𝜎2 • Rating biaisé par sa date de création 𝐵𝐴 𝑡 𝐷 = 𝑚𝑜𝑦 𝑟𝑡 ∙ 𝑟𝑡 + σ 𝐷′∈𝑅 𝑚𝑜𝑦 𝑟𝑡′ ∙ |𝑟𝑡′| 𝑟𝑡 + σ 𝐷′∈𝑅 |𝑟𝑡′| 𝑟𝑡 = 𝑟 ∙ 𝑒𝑥𝑝 − ∥ 𝑡 𝑎𝑐𝑡𝑢𝑒𝑙 − 𝑡 𝑟 ∥2 2𝜎2 1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
  • 31. 31 4.3. Hypothèse : Âge de la ressource Resource R1 : Âge = 1 mois 188 52 12+1 Resource R2 : Âge = 1 jour 2 1 0+1 Les « vieilles » ressources ont plus de chance d’obtenir plus de signaux que les « récentes » Normalisation des signaux par l’âge de la ressource 1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
  • 32. 32 4.4. Âge de la ressource 𝐶𝑜𝑢𝑛𝑡𝑡 𝐷 𝑎𝑖, 𝐷 = 𝐶𝑜𝑢𝑛𝑡 𝑎𝑖, 𝐷 ∙ 𝐴(𝐷) 𝐴(𝐷) = 𝑒𝑥𝑝 − ‖𝑡 𝑎𝑐𝑡𝑢𝑒𝑙 − 𝑡 𝐷‖2 2𝜎2 • Normaliser la distribution des signaux par la date de publication de la ressource (âge de la ressource). 1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
  • 33. 33 4.5. Evaluation : Collection de test Contenu Social : les données sociales temporelles IMDb SBS 1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
  • 34. 4.5. Evaluation : Résultats sur SBS Sans Prise en Compte du Temps Date du Signal 34 0,0732 P@20 Rating 0,1904 nDCG Rating +31% +12% 0,1864 0,1938 0,1807 0,1748 0,1742 nDCG J'aime Partage Commentaire Rating Tag 0,0689 0,0711 0,0678 0,0559 0,0531 P@20 J'aime Partage Commentaire Rating Tag Âge de la ressource 0,0708 0,0796 0,0711 0,0695 0,058 P@20 J'aime Partage Commentaire Rating Tag 0,19 0,2001 0,1882 0,1855 0,1771 nDCG J'aime Partage Commentaire Rating Tag +5% +19%+4% +12% +3% +2% +5% +4% +5% +2% 1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
  • 35. 4.6. Constats • Signaux sociaux sensibles au temps - La fraîcheur du signal Rating « booste » les documents pertinents. - Les signaux fréquents (Partage, Rating) sont les plus sensibles à l’âge de la ressource. • Limite - Expérimentation du temps associé à un signal limitée au Rating. 35 1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
  • 36. Partie III Qualité et diversité des signaux sociaux
  • 37. 37 5.1. Hypothèse 1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux • La diversité des signaux : indice mesurant l’intérêt d’une ressource au- delà d’un réseau social ou d’une communauté. • Nature • Provenance
  • 38. • Une ressource dominée par un seul signal doit être défavorisée par rapport à une ressource ayant une équi-répartition des signaux. • Evaluation de la diversité en utilisant l’indice de diversité de Shannon. • L’intérêt (importance) d’une ressource. 38 5.2. Estimation de la diversité des Signaux 𝑃𝑥 𝐷 = ෑ 𝑥 ∈𝑋 𝑃𝑥 𝑎 𝑥 ∙ 𝐷𝑖𝑣𝑒𝑟𝑠𝑖𝑡é 𝑠 𝐷 𝐷𝑖𝑣𝑒𝑟𝑠𝑖𝑡é 𝑠 𝐷 = − ෍ 𝑖=1 𝑚 𝑃𝑥(𝑎𝑖 𝑥 ) ∙ 𝑙𝑜𝑔 𝑃𝑥 𝑎𝑖 𝑥 1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
  • 39. 39 5.3. Evaluation : Résultats SBS 0,084 0,1945 0,0862 0,197 0,0891 0,1994 0,0915 0,2031 0,0976 0,2148 P@20 nDCG TotalFacebook Popularité Réputation TousLesCritères ToutesLesPropriétés +10% +14% +11% +6% +10%+16% 1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux Avec Prise en Compte de la Diversité
  • 40. 40 5.4. Distribution du facteur diversité dans les documents 1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux Documents Non-Pertinents Documents Pertinents
  • 41. 41 5.5. Analyse quantitative et qualitative des signaux 1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux 1) la fréquence moyenne des signaux dans les documents pertinents est plus élevée par rapport aux documents non-pertinents. 2) les signaux de Facebook capturent la majorité des documents pertinents. 3) 95% de ses actions de partage sont concentrées dans 601 documents pertinents avec une fréquence moyenne de 67 actions.
  • 42. Les signaux émotionnels : Quel impact sur la RI ? Partie IV
  • 43. 43 6.1. Les signaux émotionnels (Facebook Reactions) 1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux • 300 milliards de réactions (24/02/2017), soit plus de 800 millions par jour. • La réaction j'adore est la plus populaire. • La majorité des réactions j'adore étaient durant Noël 2016. • Les pays où les réactions sont populaires : le Mexique, le Chili, la Grèce, le Paraguay, les États-Unis (la France 14eme).
  • 44. 44 6.1. Les signaux évènementiels 1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
  • 45. 45 6.2. Questions de recherche 1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux Comment les utilisateurs utilisent-ils ces réactions pour interagir avec les ressources web ? 1 Comment modéliser ces critères et les prendre en compte dans un modèle de RI ? 2 Quel est l'impact de ces réactions sur les performances d'un système de RI ? 3
  • 46. 46 6.3. Réactions dans les médias et les films 1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux • Réactions des utilisateurs sur 10 meilleurs films en 2016 et 4650 articles publiés sur 10 médias.
  • 47. 47 6.3. Exemple : réactions "haha" et "triste" 1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
  • 48. 48 6.3. Réactions dans les médias et les films 1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux • Analyse du premier reportage (article) publié par chaque média sur l'attaque du 22 mars 2016 à Bruxelles.
  • 49. 49 6.4. Evaluation : objectifs 1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux 1) Étudier l'impact des réactions sociales sur la RI. 2) Corrélation entre la pertinence et les réactions. Cadre d'expérimentation • Collection IMDb (30 Requêtes, Qrels, 1.6 millions Documents). • 1000 premiers documents retournés par chaque requête. • Collecter des réactions via l'API Facebook et le Parsing.
  • 50. 50 6.5. Réactions prises en compte individuellement 1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
  • 51. 51 6.6. Réactions groupées selon leur signification 1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
  • 52. 52 6.7. Requêtes et réactions (positives et négatives) 1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
  • 53. 6.9. Constats • Les signaux émotionnels - La réaction j’adore représente le facteur le plus pertinent. - Il y a une dépendance entre l’émotion dans la requête et les réactions à prendre en compte dans le processus de ranking. • Limites - Simplicité de la modélisation des réactions. - Expérimentation sur IMDb : très peu de requêtes négatives qui attirent des documents avec des réactions négatives. 53 1. contexte 2. Etat de l’Art 3. Signaux et Propriétés Sociales 6. Signaux Émotionnels5. Qualité et Diversité des Signaux4. Temporalité des Signaux
  • 54.
  • 55. 1.1. Contexte : contradiction textuelle 55 1. Introduction 2. Vue d’ensemble : état de l’art 4. Évaluation expérimentale3. Détection & intensité de contradiction Contradiction : Une situation où il est extrêmement improbable que deux phrases soient vraies lorsqu'elles sont considérées ensemble. Exemples : 1. Négation : « I love you --- I do not love you » 2. Mots opposés : « hot --- cold , light --- dark » 3. Inadéquations numériques : « There are 7 wonders of the world --- the number of wonders of the world are 9 »
  • 56. 1.1. Contexte : contradiction textuelle 56 1. Introduction 2. Vue d’ensemble : état de l’art 4. Évaluation expérimentale3. Détection & intensité de contradiction
  • 57. 1.2. Questions de recherche 57 1. Introduction 2. Vue d’ensemble : état de l’art 4. Évaluation expérimentale3. Détection & intensité de contradiction Comment identifier une contradiction sur un aspect dans les commentaires? 1 Comment mesurer le degré de contradiction entre les commentaires?2 Quel est l’impact de la prise en compte conjointe de la polarité et du rating des commentaires sur la mesure de l’intensité de la contradiction? 3
  • 58. 2. Vue d’ensemble : état de l’art 58 1. Introduction 2. Vue d’ensemble : état de l’art 4. Évaluation expérimentale3. Détection & intensité de contradiction
  • 59. 3.1. Comment détecter une contradiction ? 59 1. Introduction 2. Vue d’ensemble : état de l’art 4. Évaluation expérimentale3. Détection & intensité de contradiction
  • 60. 3.2. Détection d’aspects dans un commentaire 60 1. Introduction 2. Vue d’ensemble : état de l’art 4. Évaluation expérimentale3. Détection & intensité de contradiction 1. Calcul fréquentiel des termes constituant le corpus des commentaires, 2. Catégorisation des termes de chaque commentaire en utilisant Stanford Parser, 3. Sélection des termes ayant la catégorie nominale, 4. Sélection des noms avec des termes émotionnels dans leur voisinages de 5 mots (en utilisant SentiWordNet), 5. Extraction des termes les plus fréquents (utilisés) dans le corpus parmi ceux sélectionner dans l’étape précédente. Ces termes seront considérés comme des aspects.
  • 61. 3.2. Détection d’aspects : Exemple 61 1. Introduction 2. Vue d’ensemble : état de l’art 4. Évaluation expérimentale3. Détection & intensité de contradiction L’aspect utile est : « lecturer »
  • 62. 3.3. Analyse de sentiments 62 1. Introduction 2. Vue d’ensemble : état de l’art 4. Évaluation expérimentale3. Détection & intensité de contradiction
  • 63. 3.4. Mesure de contradiction 63 1. Introduction 2. Vue d’ensemble : état de l’art 4. Évaluation expérimentale3. Détection & intensité de contradiction . - Coordonnées (poli , rati) pour chaque commentaire-aspect cai - Un commentaire cai aspect est un segment du commentaire contenant un aspect (5 mots avant et après l’aspect).
  • 64. 3.4. Mesure de contradiction 64 1. Introduction 2. Vue d’ensemble : état de l’art 4. Évaluation expérimentale3. Détection & intensité de contradiction • Fonction de dispersion (inertie du nuage) - Distance (poli , rati ) est la distance du point cai du nuage au point centroide cacentroide , tandis que n est le nombre de points cai du nuage. - Normalisation des ratings rati :
  • 65. 3.4. Mesure de contradiction 65 1. Introduction 2. Vue d’ensemble : état de l’art 4. Évaluation expérimentale3. Détection & intensité de contradiction 1. Centroide basé sur la moyenne des poli et rati Les coordonnées (pol, rat) du centroide cacentroide peuvent être calculées de deux manières différentes : 2. Centroide basé sur la moyenne pondérée des poli et rati
  • 66. 4.1. Objectifs et collection de test 66 1. Introduction 2. Vue d’ensemble : état de l’art 4. Évaluation expérimentale3. Détection & intensité de contradiction
  • 67. 4.2. Les aspects détectés 67 1. Introduction 2. Vue d’ensemble : état de l’art 4. Évaluation expérimentale3. Détection & intensité de contradiction
  • 68. 4.3. Évaluation manuelle « User Study » 68 1. Introduction 2. Vue d’ensemble : état de l’art 4. Évaluation expérimentale3. Détection & intensité de contradiction
  • 69. 4.4. Protocole d’évaluation 69 1. Introduction 2. Vue d’ensemble : état de l’art 4. Évaluation expérimentale3. Détection & intensité de contradiction
  • 70. 4.5. Résultats 70 1. Introduction 2. Vue d’ensemble : état de l’art 4. Évaluation expérimentale3. Détection & intensité de contradiction Figure 1 – Corrélation entre les jugements de contradiction et les résultats de notre approche (avec un taux d’erreur de 21% dans la détection de sentiments)
  • 71. 4.5. Résultats 71 1. Introduction 2. Vue d’ensemble : état de l’art 4. Évaluation expérimentale3. Détection & intensité de contradiction Figure 2 – Corrélation entre les jugements de contradiction et les résultats de notre approche (avec un taux d’erreur de 0% dans la détection de sentiments)
  • 72. 4.6. Constats • Estimation de l’intensité de contradiction - Exploitation conjointe des polarités et des ratings. - Calcul de centroide de 2 manières (moyenné et pondéré). • Limites - Dépendance de la qualité des modèles d’analyse de sentiments et de détection des aspects. - Simplicité des modèles de pré-traitements. - Détection des phrases auxquelles appartient un aspect. 72 1. Introduction 2. Vue d’ensemble : état de l’art 4. Évaluation expérimentale3. Détection & intensité de contradiction
  • 73. 4.7. Prédiction de l’intensité de contradiction 73 1. Introduction 2. Vue d’ensemble : état de l’art 4. Évaluation expérimentale3. Détection & intensité de contradiction Fig. Processus d’apprentissage automatique
  • 74. 4.7. Prédiction de l’intensité de contradiction 74 1. Introduction 2. Vue d’ensemble : état de l’art 4. Évaluation expérimentale3. Détection & intensité de contradiction Tableau. Liste des critères exploités
  • 75. Conclusion Contributions 1. Modèle d’estimation de l’importance sociale d’un document.  Exploitation individuelle et groupée des signaux (popularité, réputation). 2. Prise en compte de l’aspect temporel  « Fraîcheur » du signal,  Normalisation du signal par l’âge de la ressource. 3. Qualité et diversité des signaux sociaux  Diversité en termes de nature et provenance des signaux. 4. Etude des signaux émotionnels 5. Contradiction dans les commentaires 6. Mise en place de collections de test Publications 1. «Contradiction in Reviews : is it Strong or Low?» à BroDyn workshop, ECIR 2018 2. «Emotional Social Signals for Search Ranking» à SIGIR 2017 3. «Finding and Quantifying Temporal-Aware Contradiction in Reviews» à AIRS 2017 4. «Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity in Temporal-Related Reviews» à KES 2017 5. «Fresh and Diverse Social Signals : Any Impacts on Search ?» à ACM SIGIR CHIIR 2017. 6. «Multimodal Social Book Search» à CLEF 2015. 7. «A Priori Relevance Based On Quality and Diversity Of Social Signals» à ACM SIGIR 2015. 8. «Document Priors Based On Time-Sensitive Social Signals» à ECIR 2015. 9. «Social Priors to Estimate Relevance of a Resource» à ACM IIiX 2014. 10. «Harnessing Social Signals to Enhance a Search» à ACM/IEEE WIC 2014. 11. «Détection de contradiction dans les commentaires» à CORIA 2017. 12. «Les Signaux Sociaux Émotionnels : Quel impact sur la RI ?» à CORIA 2017. 13. «Pertinence a Priori Basée sur la Diversité et la Temporalité des Signaux Sociaux» à CORIA 2015. 14. «Exploitation de signaux sociaux pour estimer la pertinence a priori d’une ressource» à CORIA 2014. 15. «RI sociale : intégration de propriétés sociales dans un modèle de recherche» à CORIA 2013.