Cet article propose une nouvelle approche, basée sur les réseaux sociaux, pour l'accès aux ressources bibliographiques. Nous introduisons un modèle d'information sociale dont les auteurs sont les principales entités et les relations sont extraites à partir des liens de coauteur et de citation. En effet, ces relations sont pondérées en tenant compte des interactions entre les auteurs et des annotations sociales produites par les utilisateurs. Dans ce modèle, la pertinence d'un document est estimée par combinaison de la pertinence thématique et de la pertinence sociale, qui est à son tour dérivée de l'importance sociale des auteurs associés. Nous évaluons la viabilité de notre modèle sur une collection d'articles scientifiques dont les annotation sociales sont extraites depuis le réseau social académique CiteULike.org. Les résultats obtenus montrent la supériorité des performances de notre modèle par rapport à la recherche d'information traditionnelle.
An Exploratory Study on Using Social Information Networks for Flexible Litera...
Un modèle de Recherche d'Information Sociale pour l'Accès aux Ressources Bibliographiques : Vers un réseau social pondéré
1. Un modèle de Recherche d’Information Sociale
pour l’Accès aux Ressources Bibliographiques:
Vers un réseau social pondéré
Lamjed Ben Jabeur, Lynda Tamine and Mohand Boughanem
IRIT, University of Paul Sabatier, Toulouse
{jabeur,tamine,bougha}@irit.fr
1
2. Un modèle de Recherche d’Information Sociale pour l’Accès aux Ressources Bibliographiques :
Vers un réseau social pondéré
Plan
1. Vers la Recherche d’Information Sociale
2. Modèle générique de la Recherche d’Information Sociale
3. Modèle social pour l’accès aux ressources bibliographiques
4. Evaluation expérimentale
5. Conclusion et perspectives
2
3. 1. Vers la Recherche d’Information Sociale
1.1. La Recherche d’Information Sociale
Requête
SRI
Tag
Commentaire
3 Vers la RIS Modèle générique de RIS Modèle social pour l’accès au RB Evaluation expérimentale Conclusion
4. 1. Vers la Recherche d’Information Sociale
1.1. La Recherche d’Information Sociale
Documents Producteurs
d’information
Recherche d’Information Sociale
Annotations Consumteur
social d’information
R(q,d) R(q,d,G)
4 Vers la RIS Modèle générique de RIS Modèle social pour l’accès au RB Evaluation expérimentale Conclusion
5. 1. Vers la Recherche d’Information Sociale
1.1. La Recherche d’Information Sociale
Intégrer le réseau social dans les processus de recherche
d’information
Explorer le réseau social pour accéder à l’information pertinente
Estimer la pertinence d’un document à partir de son contexte social
Intégrer deux domaines
La recherche d’information
Représenter et comparer les documents et les requêtes
Analyses des réseaux sociaux
Représenter les entités sociales
Estimer la centralité d’un individu
Les documents pertinents sont reliés à des individus importants
5 Vers la RIS Modèle générique de RIS Modèle social pour l’accès au RB Evaluation expérimentale Conclusion
6. 1. Vers la Recherche d’Information Sociale
1.2. Domaines d’applications de la Recherche d’Information Sociale
• Communauté en ligne
Classification [Handcock, 2007] [Wai, 2008] [Li, 2009]
Similarité en membres et groupes [Spertus, 2005]
Production Collaborative
Qualité, autorité (acteurs/contenu) [korfatis, 2006] [Hu, 2007] [Wilkonson, 2007]
Partage et transfert des connaissances [Kang, 2009] [Agostini, 2003] [Hassen, 2002]
Réseaux d’innovation et de créativité [Goyal, 2008]
Systèmes de recommandation sociales
Similarité User/ document [Jamali, 2009] [Ma, 2009] [McDonald, 2009]
Filtrage collaboratif [Konstas, 2009] [Siersdorfer, 2009] [Nakamoto, 2008] [Sen, 2009]
6 Vers la RIS Modèle générique de RIS Modèle social pour l’accès au RB Evaluation expérimentale Conclusion
7. 1. Vers la Recherche d’Information Sociale
1.2. Domaines d’applications de la Recherche d’Information Sociale
Marque-Page Social et Réseaux Sociaux
Suggestion des tags [Budura, 2008] [Heymann, 2008] [Qu, 2008]
Folksonomy [Ding,2009] [Soledad,2009]
La recherche des experts
Modélisation du réseau d’experts [Balog, 2006] [Karimzadehgan, 2009]
Recherche d’experts [Fu,2007] [Zhang,2008]
Recherche des personnes [Artiles, 2008] [Popescu, 2007]
La Recherche Web
Modélisation du réseau d’information sociale [Amer-Yahia, 2007]
Ré-ordonnancement et filtrage social [Jeh, 2002] [Xue, 2007]
Recherche Temps-Réel [Sankaranarayanany, 2009]
Accès aux ressources bibliographiques Mutschke, 2001] [Kirsch, 2006] [Yan, 2009]
7 Vers la RIS Modèle générique de RIS Modèle social pour l’accès au RB Evaluation expérimentale Conclusion
8. 1. Vers la Recherche d’Information Sociale
1.3. Notre contribution
Un modèle générique pour la Recherche d’Information Sociale
Contextes de production et de consommation de l’information
Acteurs, données et relations sociales
Combinaison des facteurs de la pertinence sociale
Un modèle social pour l’accès aux ressources bibliographiques
Topologie du réseau social
Nouvelles entités (utilisateurs et annotations sociales)
Nouvelles relations sociales (citations entre auteures, marque-page…etc.)
Pondérer les relations sociales
Evaluer l'importance scientifique des documents
Appliquer les mesures d'importance sociale sur le réseau social
Comparer les mesures d'importance sociale
8 Vers la RIS Modèle générique de RIS Modèle social pour l’accès au RB Evaluation expérimentale Conclusion
9. 2. Modèle générique pour la Recherche d’Information Sociale
2.1. Le réseau d’information sociale
Acteurs
Auteur, Intégrateur
Utilisateur, Annotateur
Données
Document
Annotation sociale
Relations sociales
Explicites/Implicites
Directes/Indirectes
9 Vers la RIS Modèle générique de RIS Modèle social pour l’accès au RB Evaluation expérimentale Conclusion
10. 2. Modèle générique pour la Recherche d’Information Sociale
2.2. Facteurs d’importance sociale
Pertinence thématique
Distance sociale
Liens et marques-pages reçus
Fraîcheur de l’information
Importance sociale des individus
10 Vers la RIS Modèle générique de RIS Modèle social pour l’accès au RB Evaluation expérimentale Conclusion
11. 2. Modèle générique pour la Recherche d’Information Sociale
2.2. Modèle de Recherche d’Information Sociale
[ D, Q, G, F , R(qi , d j , G)]
D: documents
Q: Requêtes
G: Réseau d’information sociale
F: Modéliser les documents et les requêtes
R(qi,dj,G): Fonction d’ordonnancement, combiner les facteurs
de pertinence sociale
G (V , E )
V A U D T E V V
11 Vers la RIS Modèle générique de RIS Modèle social pour l’accès au RB Evaluation expérimentale Conclusion
12. 3. Modèle social pour l’accès aux ressources bibliographiques
3.1. Réseau d’information sociale des ressources bibliographiques
12 Vers la RIS Modèle générique de RIS Modèle social pour l’accès au RB Evaluation expérimentale Conclusion
13. 3. Modèle social pour l’accès aux ressources bibliographiques
3.2. Extraction du réseau social des auteurs
a1 a3 a4 a6
a2 a1
a2 a4 a5
a3
d1 d2 d3 d4 Coauteur
Citation
Réseau social des auteurs Ga ( A, Ea )
A: Auteurs
Ea: Relations auteur-auteur
Les arcs représentent:
Relation de co-auteur
Relation de citation
13 Vers la RIS Modèle générique de RIS Modèle social pour l’accès au RB Evaluation expérimentale Conclusion
14. 3. Modèle social pour l’accès aux ressources bibliographiques
3.3 Pondérer le réseau social
Relation de coauteur
a1
Similarité et centres d’intérêt commun entre les auteurs
Co(1,2) a2 a4 a5
A(i, j )
Co(i, j )
A(i) a3
A(i,j) documents publiés par ai et aj, A(i) documents publiés par ai
Relation de citation
Influence et transfert des connaissances Ci(1,4)
a1
C (i, j )
Ci (i, j ) a2 a4 a5
C (i)
a3
C(i): citation announced by ai , C(I,j) number of time ai cite aj
14 Vers la RIS Modèle générique de RIS Modèle social pour l’accès au RB Evaluation expérimentale Conclusion
15. 3. Modèle social pour l’accès aux ressources bibliographiques
3.3 Pondérer le réseau social
Relation de publication
L’ affiliation d’un auteur au sujet du document
tf (ti , Ak )
w(ak , d )
ti T tf (ti , A)
T tags assignés au document d, Ak documents publié par ak, A documents
publié par tout coauteur de d.
A
Ak
a1 W(a3,d)
d a3
a2
15 Vers la RIS Modèle générique de RIS Modèle social pour l’accès au RB Evaluation expérimentale Conclusion
16. 3. Modèle social pour l’accès aux ressources bibliographiques
3.4 Importance sociale des auteurs
-
Degree
Activité sociale PR ( p j())k 1 s ,t (u )
Cb (u )x u() u)) yd s ,t (xi )
) (
1 n
PR ( p C (y 1 d e u
k Cc ( k 1
(s ,) )
ut
(k ) k (k )
Popularité
s ,t
d uiuv, v)
(,
i j d i
s uV:eE
j t ji uV j:eC ( pi )
Sociabilité E
vV
vV i 1 ji
Closeness
Proximité | indépendance
Influence
Betweenss
Interdisciplinarité
PageRank
Autorité
Hits Ga ( A, Ea )
Centralité | autorité
16 Vers la RIS Modèle générique de RIS Modèle social pour l’accès au RB Evaluation expérimentale Conclusion
17. 3. Modèle social pour l’accès aux ressources bibliographiques
3.5 Importance sociale des documents
CG(a1)) CG(a3))
ImpG(d)
CG(a2)) CG(a3))
k
ImpG (d ) w(ai , d )CG (ai )
i 1
17 Vers la RIS Modèle générique de RIS Modèle social pour l’accès au RB Evaluation expérimentale Conclusion
18. 3. Modèle social pour l’accès aux ressources bibliographiques
3.6 Combiner la pertinence thématique et sociale
Sélectionner les documents
Résultats
requête SRI
{d, RSV (q,d)}
Combiner les scores
Re l (d ) RSV (q, d ) (1 ) ImpG (d ) 0,1
Pertinence thématique Pertinence sociale
18 Vers la RIS Modèle générique de RIS Modèle social pour l’accès au RB Evaluation expérimentale Conclusion
19. 4. Evaluation experimentale
4.1. Collection des documents et réseau social
Publications ACM SIGIR de 1978 à 2008
2 053 documents
Annotations sociales collectées depuis CiteUlike1
6 352 marque-page et 1 382 tags
Auteurs 2 871
Relations de coauteurs 5 047 A: Coauteur
C: Citation
Relations de citation 45 880 AC : coauteur et/ou citation
Relations de coauteur et/ou citations 52 512
Propriétés du réseau social La composante géante
[1] http://www.citeulike.org
19 Vers la RIS Modèle générique de RIS Modèle social pour l’accès au RB Evaluation expérimentale Conclusion
20. 4. Evaluation experimentale
4.2 Cadre d’évaluation
Requêtes: les 25 tags le plus populaires
Les tags (termes-utilisateur): annoter /indexer les documents
Les popularité des tags est un indicateur de son dans le
contexte social
Hypothèse de pertinence: Documents fortement
marqué par le tag
Tag assigné au document
Tag parmi les 3 tags le plus affecté au document
Mesures
p@5
p@10
20 Vers la RIS Modèle générique de RIS Modèle social pour l’accès au RB Evaluation expérimentale Conclusion
21. 4. Evaluation experimentale
4.3 Modèles de références (baselines)
Modèle BM25:
Pertinence thématique
Sélectionner les documents pertinents
Modèle PR-Docs :
Combiner la pertinence thématique et
l’autorité du document (dans le graph de
citation).
Estimer l’importance scientifique des
documents
Re l (d ) RSV (q, d ) (1 ) PRdocs (d )
Modèle Kirsch:
Combiner la pertinence thématique et
sociale
Estimer la pertinence sociale depuis
l’autorité des auteurs dans le réseau social
de co-auteur. α
Re l (d ) RSV (q, d ) * rd Adjustment de parameter α de PR-Docs
21 Vers la RIS Modèle générique de RIS Modèle social pour l’accès au RB Evaluation expérimentale Conclusion
22. 4. Evaluation experimentale
4.3 Ajustement du modèle sociale
p@5 p@10
Betweeness 0,0211 0,0526
Closeness 0,0421 0,0526
PageRank 0,0211 0,0421
Authority 0,0316 0,0368
Hub 0,0316 0,0579
Réseau social binaire
p@5 p@10
W-Betweeness 0,0316 0,0579
W-Closeness 0,0316 0,0316
W-PageRank 0,0316 0,0421 α
W-Authority 0,0316 0,0368
Ajustement du prametre α
W-Hub 0,0421 0,0632
Réseau social pondéré
22 Vers la RIS Modèle générique de RIS Modèle social pour l’accès au RB Evaluation expérimentale Conclusion
23. 4. Evaluation experimentale
4.4 Evaluation de l’efficacité de notre modèle
Configuration finale
W-Hub p@5 p@10
α=0.9 (SM0.9) +13% +12%
+6% +7%
+31% +53%
Amélioration SM0.9
23 Vers la RIS Modèle générique de RIS Modèle social pour l’accès au RB Evaluation expérimentale Conclusion
24. 5. Conclusion et perspectives
Un modèle social pour l’accès aux ressources
bibliographiques
Inclure les producteurs et les consommateurs de
l’information
Inclure les liens de citation entre les auteurs
Pondérer les relations sociales
Evaluation expérimentale
W-Hub exprime mieux l’importance scientifique
des ressources bibliographiques
La supériorité du model proposé aux modèles
traditionnels de la recherche d’information et
aux modèles comparables
24 Vers la RIS Modèle générique de RIS Modèle social pour l’accès au RB Evaluation expérimentale Conclusion
25. 5. Conclusion and perspectives
Evaluer la qualité des tags et la centralité des
consommateurs de l’information
Intégrer plus des facteurs d’importance sociale
Distance sociale
Popularité et fraicheur de l’information
Apprentissage de ré-ordonnancement avec
l’intégration de plusieurs facteurs d’importance
sociale
Evaluer le modèle sur une grande collection des
articles scientifique issus de différents domaines
de recherche.
25 Vers la RIS Modèle générique de RIS Modèle social pour l’accès au RB Evaluation expérimentale Conclusion