Exploitation de signaux sociaux pour estimer la pertinence apriori d’une ressource 
Ismaël BADACHE 
Mohand BOUGHANEM 
2013...
Plan de la présentation 
Introduction 
État de l’art 
Modèle de RI sociale 
Evaluation expérimentale 
4 
1 
3 
Conclusion ...
1.1 Émergence du Web social 
1 
Nombre d’utilisateurs actifs2013 
1,2 
1,4 
1,7 
2,4 
2011 
2012 
2013 
2014 
Nombre d’int...
Vidéo 
Photo 
Page Web 
Ressources Web 
Ressource. . . 
Réseaux sociaux 
Marques 
Commentaires/Avis 
Partages/Recommandes ...
1.2 Questions de recherche 
Quellessontlespropriétéssocialesutilespourévaluerlapertinenceapriorid’uneressource? 
2 
Commen...
2.1 Synthèse des travaux 
4 
Sources d’évidence 
Propriétés 
Modèles 
Auteurs 
Caractéristiquesstructurelles du document 
...
3.1 Modèle de langue 
•UndocumentDpeutêtrereprésentéàlafoisparunensembledemots- clés퐷푚={푚1,푚2,…푚푛}etdescaractéristiquesnon...
3.2 Propriétés sociales utilisées 
Lapopularité푷푺풐풄 
Phénomènesocialquidictequelestleplusconnudanslepublic, estiméeenfonc...
3.3 Estimation de P(푫풔): La combinaison 
•Laformuledelacombinaisondes3propriétéssociales: 
•푃퐹푆표푐(퐷푠),푃푃푆표푐(퐷푠)et푃푅푆표푐(퐷푠)...
Laprobabilitéapriorirelativeàlapopularité/réputation: 
•푥∈{푃푆표푐,푅푆표푐}.cuneconstantepermettantdetraduirelesimplecomptageCou...
•푇={푡푎1,푡푎2,…푡푎푘}ensembledekmoments(date)àlaquelleuneaction aiaétéproduite.Uninstantdetempstreprésenteladateetl’heure(date...
4.1Objectifs de l’evaluation 
10 
1. Introduction 
2. Etat de l’art 
5. Conclusion 
3. Modèle de RI sociale 
4. Evaluation...
4.2Dataset : Contenu textuel 
11 
Champ 
Description 
Statut 
ID 
identifiant du film (le document). 
- 
Title 
le titre d...
4.3Dataset : Contenu social 
12 
ACEBOOK 
J’aime 
Partage 
Commentaire 
Date de la mention 
WITTER 
Tweet 
GOOGLE+ 
Mentio...
4.3Dataset : Contenu social 
13 
•LechampUGCcontientlesdifférentssignauxsociaux. 
Réseausocial 
Signaux sociaux 
Somme 
Mi...
4.4Requêtes et jugement de pertinence 
14 
•Requêtes 
-20 requêtes issues d’INEX IMDb. 
-5 requêtes crées par nous-même. 
...
4.5 Quantification des propriétés sociales 
15 
Propriétés sociales 
Signaux sociaux 
Réseaux sociaux 
Popularité (PSoc) 
...
4.6 Résultats : Signaux sociaux 
16 
0,6414 
0,6586 
0,6507 
0,6048 
0,5979 
0,5965 
0,5921 
0,5866 
0,5748 
0,52 
0,54 
0...
4.7 Résultats : Propriétés sociales 
17 
0,6951 
0,3333 
0,6661 
0,3219 
0,6229 
0,2902 
0,7438 
0,3882 
0,5866 
0,2666 
0...
4.8 Résultats : Comparaison 
18 
Fig4. Comparaison des résultats 
0,3155 
0,3126 
0,2912 
0,2844 
0,267 
0,2697 
0,2701 
0...
4.9 Analyse de corrélation des rangs 
19 
0,1675 
0,1760 
0,2158 
0,2322 
0,2701 
0,2858 
0,2986 
Google +1 
Marque 
Parta...
5. Conclusion 
20 
•Modèle de recherche d’information sociale 
-Evidence thématique (Modèle de langue) 
-Evidence sociale ...
http://www.irit.fr/~Ismail.Badache/
Prochain SlideShare
Chargement dans…5
×

Exploitation de signaux sociaux pour estimer la pertinence a priori d’une ressource

496 vues

Publié le

Dans cet article nous proposons une approche de recherche d’information (RI) qui prend en compte le contenu social associé à une ressource pour mesurer sa pertinence a priori vis-à-vis d’une requête. Nous démontrons comment ces caractéristiques, qui sont sous forme d’actions (signaux sociaux) tels que le nombre de "j’aime" et de "partage", peuvent être combinées pour quantifier des propriétés sociales telles que la popularité et la réputation. Nous proposons de modéliser ces propriétés comme des probabilités a priori que nous intégrons dans un modèle de langue. Nous avons évalué l’efficacité de notre approche sur la collection d’IMDb contenant 32706 documents et leurs caractéristiques sociales collectées sur plusieurs réseaux sociaux. Nos résultats expérimentaux sont très prometteurs et montrent l'intérêt de l'intégration des propriétés sociales dans un modèle de recherche pour améliorer la RI.

Publié dans : Médias sociaux
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
496
Sur SlideShare
0
Issues des intégrations
0
Intégrations
12
Actions
Partages
0
Téléchargements
6
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Exploitation de signaux sociaux pour estimer la pertinence a priori d’une ressource

  1. 1. Exploitation de signaux sociaux pour estimer la pertinence apriori d’une ressource Ismaël BADACHE Mohand BOUGHANEM 2013/2014 CORIA’14
  2. 2. Plan de la présentation Introduction État de l’art Modèle de RI sociale Evaluation expérimentale 4 1 3 Conclusion 2 5
  3. 3. 1.1 Émergence du Web social 1 Nombre d’utilisateurs actifs2013 1,2 1,4 1,7 2,4 2011 2012 2013 2014 Nombre d’internautes Contenu social par 1 minute 41000 Publications 1,8 Millions J’aime ~350 GO de données Facebook Source: blogdumoderateur.com quantcast.com semiocast.com 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale
  4. 4. Vidéo Photo Page Web Ressources Web Ressource. . . Réseaux sociaux Marques Commentaires/Avis Partages/Recommandes Mentions/Votes Like/+1 Interactions Extraction et quantification des propriétés sociales Modèle de RIIncorporationRequêteRéputation 2Résultats Fig1. Schéma de la RI sociale par rapport à notre approche Signaux Sociaux (Source d’évidence) Popularité. . etc.
  5. 5. 1.2 Questions de recherche Quellessontlespropriétéssocialesutilespourévaluerlapertinenceapriorid’uneressource? 2 Commenttraduirelessignauxsociauxenpropriétéssociales? 1 Quelmodèlethéoriquepourcombinerlapertinenceapriorid’uneressourceetsapertinencethématique? 3 3 Quelestl’impactdecespropriétéssocialessurlesperformancesd’unsystèmedeRI? 4 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale
  6. 6. 2.1 Synthèse des travaux 4 Sources d’évidence Propriétés Modèles Auteurs Caractéristiquesstructurelles du document •Liens entrants, sortants (PageRank, HITS). Popularité Autorité Modèle de langue (Brin et Page, 1998) (Kleinberg, 1999) •Types d'URL. Importance (Kraaijet al.,2002) Caractéristiques sociales du document •Nombrede:clicks,votes,enregistrementet recommandation. Popularité Importance Combinaison Linéaire (Karweget al., 2011) •Nombrede:j’aime,j’aimepas, commentairesurYouTubeetnombrede lectured’untitresurLast.fm. Importance Techniqued’apprentissage et Combinaison linéaire (Chelaruet al., 2012) (Khodaeiet al.2012) •Présenced'unlienURLdansuntweet. (Alonso et al., 2010) •Nombrederetweet. Popularité Techniqued’apprentissage (Yang et al., 2012) (Hong et al., 2011) 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale
  7. 7. 3.1 Modèle de langue •UndocumentDpeutêtrereprésentéàlafoisparunensembledemots- clés퐷푚={푚1,푚2,…푚푛}etdescaractéristiquesnon-textuelles. •푃(퐷)estuneprobabilitéestimantlapertinenceapriorid’undocumentindépendammentdesoncontenutextuel. •Dansnotreapproche:undocument(ressource)estreprésentéparunensembledemots-clés퐷푚etunensembledecaractéristiquessociales 퐷푠={푎1,푎2,…푎푚}. Probabilité a priori du document D Modèle textuel Requête/Contenu 푃퐷푄=푟푎푛푘푷푫∙푃푄퐷) 5 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale 푃퐷푄=푟푎푛푘푷푫풔∙푃푄퐷)
  8. 8. 3.2 Propriétés sociales utilisées Lapopularité푷푺풐풄 Phénomènesocialquidictequelestleplusconnudanslepublic, estiméeenfonctiondel’intensitédepartaged’uneressourcedanslesréseauxsociaux. La réputation 푹푺풐풄 Uneopinionsurcetteressource,estiméeàpartirdesactionsrelevantd’activitéssocialesquiportentunsenspositiftelquelej’aimedeFacebook. Lafraîcheur푭푺풐풄 Ladated’uneaction(ex.commentaire,mention,etc.)effectuéesuruneressourcedanslesréseauxsociaux,peutêtreutiliséepourmesurerlafraîcheurdel’information. 6 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale
  9. 9. 3.3 Estimation de P(푫풔): La combinaison •Laformuledelacombinaisondes3propriétéssociales: •푃퐹푆표푐(퐷푠),푃푃푆표푐(퐷푠)et푃푅푆표푐(퐷푠)sontlesprobabilitésapriori d’uneressourcerelativeà푭푺풐풄(Fraîcheur),푷푺풐풄(Popularité)et 푹푺풐풄(Réputation),respectivement. •푃퐹푆표푐⊕푃푆표푐⊕푅푆표푐퐷푠estlaprobabilitédelacombinaisondestroisprobabilitésapriori. 7 푃퐷푠=푃퐹푆표푐⊕푃푆표푐⊕푅푆표푐퐷푠 =푃퐹푆표푐(퐷푠)∙푃푃푆표푐(퐷푠)∙푃푅푆표푐(퐷푠) 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale
  10. 10. Laprobabilitéapriorirelativeàlapopularité/réputation: •푥∈{푃푆표푐,푅푆표푐}.cuneconstantepermettantdetraduirelesimplecomptageCount()endistributiondeprobabilité. •퐶표푢푛푡(푎푖 푥,퐷푠)représentelenombred’apparitiond’uneactionspécifique푎푖 푥danslaressource퐷푠.푎푖 푥désignel’action푎푖exploitéepourmesurerlapropriétéx. 83.4 Estimation de P(푫풔): Popularité et Réputation 푃푥(퐷)=푃푥(퐷푠)= 푎푖 푥∈퐴 푃푥(푎푖 푥)= 푎푖 푥∈퐴 푐∙퐶표푢푛푡(푎푖 푥,퐷푠) 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale
  11. 11. •푇={푡푎1,푡푎2,…푡푎푘}ensembledekmoments(date)àlaquelleuneaction aiaétéproduite.Uninstantdetempstreprésenteladateetl’heure(datetime)del’actioneffectuéeparunutilisateursuruneressource퐷푠. •푇푖푚푒푡푎푖,퐷푠=푡퐴푐푡푢푒푙−푡푎푖estimeletempsécoulédepuisladernièreaction푡푎푖pouruneressource퐷푠. 93.5 Estimation de P(푫풔): Fraîcheur 푃퐹푆표푐(퐷푠)= 푎푖∈퐴 푃퐹푆표푐(푡푎푖)= 푎푖∈퐴 1 푇푖푚푒(푡푎푖,퐷푠) 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale
  12. 12. 4.1Objectifs de l’evaluation 10 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale 1)Etudierl’impactd’intégrationindividuelledechacundessignauxsociauxsurlaperformancedumodèleproposé. 2)Etudierl’impactdelacombinaisoncessignauxsociauxregroupéssousformedepropriétéssociales. •Cadred’évaluation: -Absenced’uncadrestandardpourl’évaluationdanslaRIsociale. -Collecterdessignauxsociauxetmonterl’expérimentation.
  13. 13. 4.2Dataset : Contenu textuel 11 Champ Description Statut ID identifiant du film (le document). - Title le titre du film. indexé Year l’année de sortie du film. indexé Rated classement des films selon le type du contenu. - Released date de réalisation du film. indexé Runtime durée du film. indexé Genre genre de film (Action, Drame, etc.). indexé Director le directeur du projet du film. indexé Writer les écrivains et les scénaristes du film. indexé Actors les acteurs principaux du film. indexé Plot résumé textuel du film. indexé Poster le lien URL de l’affiche du film. - url le lien URL qui mène à la source originale du document. - UGC Les différents signaux sociaux récupérés. - •32706Documents Film en anglais extrait du site IMDb.com 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale
  14. 14. 4.3Dataset : Contenu social 12 ACEBOOK J’aime Partage Commentaire Date de la mention WITTER Tweet GOOGLE+ Mention +1 Partage LINKED DELICIOUS Marquer 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale
  15. 15. 4.3Dataset : Contenu social 13 •LechampUGCcontientlesdifférentssignauxsociaux. Réseausocial Signaux sociaux Somme Min Max Moyenne Facebook J’aime 5056517 0 79693 154 Partage 5778414 0 41618 176 Commentaire 6717573 0 60081 205 Twitter Tweet 1097204 0 22954 33 Google+ +1 139189 0 1368 4 Delicious Marque 32810 0 1033 1 LinkedIn Partage 57545 0 25215 1 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale
  16. 16. 4.4Requêtes et jugement de pertinence 14 •Requêtes -20 requêtes issues d’INEX IMDb. -5 requêtes crées par nous-même. •Jugement de pertinence -12 évaluateurs (23-31 ans). -Jugement des 100 premiers documents retournés. -Echelle d’évaluation à 3 points de pertinence. -Chaque requête est jugée par 3 utilisateurs. -Bon accord Kappa entre les évaluateurs (81,24%). 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale
  17. 17. 4.5 Quantification des propriétés sociales 15 Propriétés sociales Signaux sociaux Réseaux sociaux Popularité (PSoc) Nombre de «Commentaire» Facebook Nombre de «Tweet» Twitter Nombre de «Partage» LinkedIn, Facebook Réputation (RSoc) Nombre de « +1» Google+ Nombre de «J’aime» Facebook Nombre de «Marque» Delicious Fraîcheur (FSoc) Datede la dernière action Facebook •Chaquepropriétéestquantifiéepardessignauxsociauxspécifiques, selonleursnatureetsignification. 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale
  18. 18. 4.6 Résultats : Signaux sociaux 16 0,6414 0,6586 0,6507 0,6048 0,5979 0,5965 0,5921 0,5866 0,5748 0,52 0,54 0,56 0,58 0,6 0,62 0,64 0,66 0,68 nDCG@20 J'aime Partage Commentaire Tweet PlusOne Marque Partage (Lin) ML.Hiemstra BM25 0,3155 0,3126 0,2912 0,2844 0,267 0,2697 0,2701 0,2666 0,2601 0 0,1 0,2 0,3 0,4 MAP Baselines Baselines Fig2. Intégration individuelle des signaux sociaux dans ML.Hiemstra J’aime Partage Commentaire Comment Partage J’aime Tweet +1 Partage Hiemstra BM25 Marque Tweet +1 Marque Partage Hiemstra BM25 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale
  19. 19. 4.7 Résultats : Propriétés sociales 17 0,6951 0,3333 0,6661 0,3219 0,6229 0,2902 0,7438 0,3882 0,5866 0,2666 0,5748 0,2601 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 nDCG@20 MAP Popularité Réputation Fraîcheur Toutes les propriétés ML.Hiemstra BM25 Baselines Baselines Fig3. Intégration de propriétés sociales dans ML.Hiemstra Popularité Réputation Fraîcheur Globale BM25 Hemstra Popularité Réputation Fraîcheur BM25 Globale Hemstra 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale
  20. 20. 4.8 Résultats : Comparaison 18 Fig4. Comparaison des résultats 0,3155 0,3126 0,2912 0,2844 0,267 0,2697 0,2701 0,24 0,26 0,28 0,3 0,32 MAP J'aime Partage Commentaire Tweet PlusOne Marque Partage (Lin) 0,3333 0,3219 0,2902 0,3882 0 0,1 0,2 0,3 0,4 0,5 MAP Popularité Réputation Fraîcheur Toutes les propriétés Popularité Réputation Fraîcheur Globale 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale
  21. 21. 4.9 Analyse de corrélation des rangs 19 0,1675 0,1760 0,2158 0,2322 0,2701 0,2858 0,2986 Google +1 Marque Partages (Lin) Tweet Partage (FB) Commentaire J'aime 0,22 0,52 0,6431 Fraîcheur Réputation Popularité Fig6. Corrélation des propriétés sociales Fig5. Corrélation des signaux sociaux 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale
  22. 22. 5. Conclusion 20 •Modèle de recherche d’information sociale -Evidence thématique (Modèle de langue) -Evidence sociale (Propriétés sociales). •Expérimentation sur une collection IMDb -Amélioration significative par rapport aux modèles textuels. •Perspectives -Evaluation sur d’autres collections. -Intégration d’autres propriétés sociales -Etude approfondie sur l’impact de la propriété temporelle. -Comparer le modèle proposé avec d’autres modèles sociaux. 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale
  23. 23. http://www.irit.fr/~Ismail.Badache/

×