Lamjed Ben Jabeur, Lynda Tamine, Mohand Boughanem.
Intégration des facteurs temps et autorité sociale dans un modèle bayésien de recherche de tweets.
Dans : Conférence francophone en Recherche d'Information et Applications (CORIA 2012), Bordeaux, 21/03/12-23/03/12, LABRI, p. 301-316, 2012 ftp://ftp.irit.fr/IRIT/SIG/BenJabeur_CORIA2012.pdf
Cet article présente une approche sociale pour la recherche d’information dans les
microblogs intégrant diverses sources d’évidence au sein d’un réseau bayésien. Notre contribution
consiste à étendre la notion classique de pertinence, basée sur la similarité textuelle, par
de nouveaux facteurs tels que l’importance sociale des blogueurs et la magnitude temporelle
des microblogs. Dans ce papier, l’importance sociale d’un blogueur est assimilée à son influence
dans le réseau et est évaluée par un score de PageRank déduit sur le réseau de diffusion
des microblogs. Nous proposons d’estimer la magnitude temporelle selon le nombre de voisins
temporels qui incluent les termes de la requête. Afin de valider notre approche, une évaluation
expérimentale à été menée sur la collection de microblogs de référence TREC Tweets2011. Les
résultats montrent que notre modèle présente un gain de 24% par rapport à la médiane des
résultats officiels de TREC Microblog 2011.
Un modèle de Recherche d'Information Sociale pour l'Accès aux Ressources Bib...Lamjed Ben Jabeur
Cet article propose une nouvelle approche, basée sur les réseaux sociaux, pour l'accès aux ressources bibliographiques. Nous introduisons un modèle d'information sociale dont les auteurs sont les principales entités et les relations sont extraites à partir des liens de coauteur et de citation. En effet, ces relations sont pondérées en tenant compte des interactions entre les auteurs et des annotations sociales produites par les utilisateurs. Dans ce modèle, la pertinence d'un document est estimée par combinaison de la pertinence thématique et de la pertinence sociale, qui est à son tour dérivée de l'importance sociale des auteurs associés. Nous évaluons la viabilité de notre modèle sur une collection d'articles scientifiques dont les annotation sociales sont extraites depuis le réseau social académique CiteULike.org. Les résultats obtenus montrent la supériorité des performances de notre modèle par rapport à la recherche d'information traditionnelle.
Uprising microblogs: A Bayesian network retrieval model for tweet searchLamjed Ben Jabeur
Lamjed Ben Jabeur, Lynda Tamine, Mohand Boughanem. Uprising microblogs: A Bayesian network retrieval model for tweet search (regular paper). Dans : ACM Symposium on Applied Computing (SAC 2012), Riva del Garda (Trento), Italy, 26/03/12-30/03/12, mars 2012 http://dx.doi.org/10.1145/2245276.2245459
We investigate in this paper the problem of accessing to real-time information and we propose a Bayesian network
retrieval model for tweet search. The proposed model interprets tweet relevance as a conditional probability and
estimates it using different sources of evidence. In particular, we introduce a social search model that considers, in
addition to text similarity measures, the microblogger’s influence, the time magnitude and the presence of hashtags.
To evaluate our model, we conducted a series of experiments on the TREC Tweets2011 corpus. Experiments with “Arab
Spring” topic set show that both of social and temporal features improve tweet search for different types of queries.
Final results show also that our model outperforms other traditional information retrieval baselines.
Slides about combining semantic web technology with microblogging. Describes motivation, concepts, and experimental implementations. Includes a (very) short intro to semantic web principles.
MICROBLOGGING CONTENT PROPAGATION MODELING USING TOPIC-SPECIFIC BEHAVIORAL FA...Nexgen Technology
TO GET THIS PROJECT COMPLETE SOURCE ON SUPPORT WITH EXECUTION PLEASE CALL BELOW CONTACT DETAILS
MOBILE: 9791938249, 0413-2211159, WEB: WWW.NEXGENPROJECT.COM,WWW.FINALYEAR-IEEEPROJECTS.COM, EMAIL:Praveen@nexgenproject.com
NEXGEN TECHNOLOGY provides total software solutions to its customers. Apsys works closely with the customers to identify their business processes for computerization and help them implement state-of-the-art solutions. By identifying and enhancing their processes through information technology solutions. NEXGEN TECHNOLOGY help it customers optimally use their resources.
Diachronic Analysis of the Italian Language exploiting Google NgramPierpaolo Basile
In this paper, we propose several methods for the diachronic analysis of the Italian language.
We build several models by exploiting Temporal Random Indexing and the Google Ngram dataset for the Italian language.
Each proposed method is evaluated on the ability to automatically identify meaning shift over time.
To this end, we introduce a new dataset built by looking at the etymological information reported in some dictionaries.
UNIBA: Exploiting a Distributional Semantic Model for Disambiguating and Link...Pierpaolo Basile
This presentation describes the participation of the UNIBA team
in the Named Entity rEcognition and Linking (NEEL) Chal-
lenge. We propose a knowledge-based algorithm able to
recognize and link named entities in English tweets. The
approach combines the simple Lesk algorithm with informa-
tion coming from both a distributional semantic model and
usage frequency of Wikipedia concepts. The algorithm per-
forms poorly in the entity recognition, while it achieves good
results in the disambiguation step.
Un modèle de Recherche d'Information Sociale pour l'Accès aux Ressources Bib...Lamjed Ben Jabeur
Cet article propose une nouvelle approche, basée sur les réseaux sociaux, pour l'accès aux ressources bibliographiques. Nous introduisons un modèle d'information sociale dont les auteurs sont les principales entités et les relations sont extraites à partir des liens de coauteur et de citation. En effet, ces relations sont pondérées en tenant compte des interactions entre les auteurs et des annotations sociales produites par les utilisateurs. Dans ce modèle, la pertinence d'un document est estimée par combinaison de la pertinence thématique et de la pertinence sociale, qui est à son tour dérivée de l'importance sociale des auteurs associés. Nous évaluons la viabilité de notre modèle sur une collection d'articles scientifiques dont les annotation sociales sont extraites depuis le réseau social académique CiteULike.org. Les résultats obtenus montrent la supériorité des performances de notre modèle par rapport à la recherche d'information traditionnelle.
Uprising microblogs: A Bayesian network retrieval model for tweet searchLamjed Ben Jabeur
Lamjed Ben Jabeur, Lynda Tamine, Mohand Boughanem. Uprising microblogs: A Bayesian network retrieval model for tweet search (regular paper). Dans : ACM Symposium on Applied Computing (SAC 2012), Riva del Garda (Trento), Italy, 26/03/12-30/03/12, mars 2012 http://dx.doi.org/10.1145/2245276.2245459
We investigate in this paper the problem of accessing to real-time information and we propose a Bayesian network
retrieval model for tweet search. The proposed model interprets tweet relevance as a conditional probability and
estimates it using different sources of evidence. In particular, we introduce a social search model that considers, in
addition to text similarity measures, the microblogger’s influence, the time magnitude and the presence of hashtags.
To evaluate our model, we conducted a series of experiments on the TREC Tweets2011 corpus. Experiments with “Arab
Spring” topic set show that both of social and temporal features improve tweet search for different types of queries.
Final results show also that our model outperforms other traditional information retrieval baselines.
Slides about combining semantic web technology with microblogging. Describes motivation, concepts, and experimental implementations. Includes a (very) short intro to semantic web principles.
MICROBLOGGING CONTENT PROPAGATION MODELING USING TOPIC-SPECIFIC BEHAVIORAL FA...Nexgen Technology
TO GET THIS PROJECT COMPLETE SOURCE ON SUPPORT WITH EXECUTION PLEASE CALL BELOW CONTACT DETAILS
MOBILE: 9791938249, 0413-2211159, WEB: WWW.NEXGENPROJECT.COM,WWW.FINALYEAR-IEEEPROJECTS.COM, EMAIL:Praveen@nexgenproject.com
NEXGEN TECHNOLOGY provides total software solutions to its customers. Apsys works closely with the customers to identify their business processes for computerization and help them implement state-of-the-art solutions. By identifying and enhancing their processes through information technology solutions. NEXGEN TECHNOLOGY help it customers optimally use their resources.
Diachronic Analysis of the Italian Language exploiting Google NgramPierpaolo Basile
In this paper, we propose several methods for the diachronic analysis of the Italian language.
We build several models by exploiting Temporal Random Indexing and the Google Ngram dataset for the Italian language.
Each proposed method is evaluated on the ability to automatically identify meaning shift over time.
To this end, we introduce a new dataset built by looking at the etymological information reported in some dictionaries.
UNIBA: Exploiting a Distributional Semantic Model for Disambiguating and Link...Pierpaolo Basile
This presentation describes the participation of the UNIBA team
in the Named Entity rEcognition and Linking (NEEL) Chal-
lenge. We propose a knowledge-based algorithm able to
recognize and link named entities in English tweets. The
approach combines the simple Lesk algorithm with informa-
tion coming from both a distributional semantic model and
usage frequency of Wikipedia concepts. The algorithm per-
forms poorly in the entity recognition, while it achieves good
results in the disambiguation step.
This document discusses web-scale semantic search and knowledge graphs. It introduces the concept of semantic search, which deals with understanding the meaning of queries, terms, documents and results. This is achieved by linking text to unambiguous concepts or entities. The document then discusses knowledge graphs, which define entities, attributes, types, relations and more, and form the backbone of semantic search. It also covers tasks involved in semantic search like information extraction, entity linking, query understanding and result ranking.
Quels facteurs de pertinence pour la recherche de produits e-commerce ?Lamjed Ben Jabeur
Laure Soulier, Lamjed Ben Jabeur, Paul Mousset, Lynda Tamine. Quels facteurs de pertinence pour la recherche de produits e-commerce ?. Dans : Conférence francophone en Recherche d'Information et Applications (CORIA 2016), Toulouse, 09/03/2016-11/03/2016, Association Francophone de Recherche d'Information et Applications (ARIA), p. 415-430, mars 2016. https://www.irit.fr/publis/SIG/2016_CORIA_SOULIER.pdf
Un moteur de recherche e-commerce vise à fournir un accès rapide et efficace à des produits qui correspondent aux besoins et aux préférences de l'utilisateur parmi une liste de produits similaires ou étroitement liés. Nous avons participé à la campagne d'évaluation « Living Lab for Information Retrieval » qui proposait une tâche de recherche de produits évaluée par des utilisateurs réels lors de scénarios de recherche réelle sur un site de e-commerce. L’évaluation expérimentale a montré des résultats prometteurs de notre modèle. Dans ce papier, nous proposons une analyse des fichiers logs issus de notre modèle afin d'identifier des facteurs d’efficacité liés à la requête et aux produits. L'objectif de cette étude est d'ouvrir des pistes de recherche pour la formalisation de modèles de recherche de produits.
E-commerce product retrieval aims to provide a quick and efficient access to products that fit user’s needs and preferences among a tail of similar or closely related products. We participated to the ``Living Lab for Information Retrieval'' evaluation campaign devoted to a product search task in which real users evaluated participants' retrieval models in real search scenarios on e-commerce websites. The experimental evaluation has shown encouraging results for our proposed model. In this paper, we conduct an analysis of users' feeadback with respect to the clicks obtained by our model. The goal of the paper is therefore to identify the effectiveness factors underlying the user's queries and the retrieved products in order to open perspectives in the formalization of product search models.
Op 7 maart was het Cross Media Cafe - Uit het Lab. Aan welke projecten en innovaties wordt gewerkt in de medialabs? Zowel bij kennisinstellingen als bij bedrijven? Wat komt er op ons af dat onze manier van media consumeren, gebruiken en produceren revolutionair gaat veranderen? Waar werken de “mad scientists” aan? Waar maken de uitvinders zich druk over? En hoe snel vindt het zijn weg naar de markt?
Daarnaast vieren iMMovator en Beeld en Geluid hun nieuwe samenwerking en het daarbij horende nieuwe logo.
Un grupo de amigos llamados Los Goonies encuentran un mapa antiguo en el desván de la casa de uno de los miembros que indica la ubicación de un tesoro enterrado por el pirata Willy el Tuerto. Deciden ir en busca del tesoro para ayudar a la familia de uno de ellos que está pasando por dificultades financieras y evitar la disolución del grupo.
* Inversión total: US$ 84,620
* Préstamo: 70% de US$ 84,620 = US$ 59,234
* Periodo de gracia: 3 meses
* Tasa de interés nominal anual: 16%
* Amortización trimestral
El servicio de la deuda trimestral es:
Interés (16% anual / 4 trimestrales): US$ 59,234 * 0.04 = US$ 2,369.36
Total pago trimestral = Intereses = US$ 2,369.36
El servicio de la deuda trimestral es US$ 2,369.36
El documento proporciona sugerencias para mejorar la calidad y oportunidad de los informes de auditoría. Señala que los informes deben redactarse de manera clara, concisa y objetiva, incluyendo sólo información relevante y verificada, para asegurar una comprensión completa. También destaca la importancia de emitir los informes de manera oportuna para permitir la adopción de acciones correctivas a tiempo.
Este documento presenta una introducción a la identificación de peligros, evaluación de riesgos y gestión del riesgo en el sistema de seguridad y salud ocupacional. Explica métodos cualitativos, semicuantitativos y cuantitativos para el análisis de riesgos, así como conceptos clave como peligro, riesgo, probabilidad y consecuencia. Además, provee lineamientos generales y específicos para realizar un diagnóstico efectivo de las condiciones de riesgo en el lugar de trabajo.
El documento describe el desarrollo del potencial humano como un proceso de mejoramiento de las capacidades de los individuos que componen una organización. Este proceso incluye tres etapas: el diseño de planes de desarrollo, la implementación de programas de capacitación y la evaluación del impacto en el desempeño laboral. Además, explica que la cultura organizacional influye en el comportamiento de las personas y que los directivos pueden definir valores institucionales para fomentar una cultura que motive a los empleados.
Este documento describe qué son las WebQuest y cómo se pueden utilizar como herramienta didáctica en el aula. Explica que las WebQuest son actividades de investigación guiada que usan recursos de Internet y promueven el pensamiento crítico y el trabajo cooperativo. También detalla los diferentes tipos de tareas que se pueden incluir en una WebQuest, como tareas de recopilación, misterio, periodísticas, diseño, creativas y más.
Accès à l’information dans les réseaux sociaux : quelles formes de collaborat...Lamjed Ben Jabeur
Nous présentons dans cet article une analyse exploratoire dans l’objectif d’identifier les patrons de collaboration au sein des réseaux sociaux pour l’accès à l’information. Nous nous focalisons sur le cas de la gestion de crise au travers de la plateforme sociale Twitter. Nous nous appuyons ainsi sur deux types de crises : une catastrophe naturelle (l’ouragan Sandy) et une crise sanitaire (Ebola). Nous proposons une méthodologie en trois étapes qui permet 1) d’analyser les structures de collaboration, 2) d’identifier les thématiques de collaboration et 3) de présenter les réseaux latents de collaboration sur l’ensemble du réseau. Les résultats montrent paradoxalement que le périmètre de la collaboration est réduit, que les sujets sousjacents sont diversifiés et impliquent des utilisateurs qui peuvent être à l’interface de différents sujets.
IRIT at clef 2015: A product search model for head queriesLamjed Ben Jabeur
We describe in this paper our participation in the product search task of LL4IR CLEF 2015 Lab. This task aims to evaluate, with living labs protective point of view,
the retrieval effectiveness over e-commerce search engines. During the online shopping process, users would search for interesting products and quickly access those that fit with their needs among a long tail of similar or closely related products. Our contribution addresses head queries that are frequently submitted on e-commerce Web sites. Head queries usually target featured products with several variations, accessories, and complementary products. We propose a probabilistic model for product search based on the intuition that descriptive fields and the category might fit with the query.
Finaly, we present results obtained during the second round of the product search task.
This document discusses web-scale semantic search and knowledge graphs. It introduces the concept of semantic search, which deals with understanding the meaning of queries, terms, documents and results. This is achieved by linking text to unambiguous concepts or entities. The document then discusses knowledge graphs, which define entities, attributes, types, relations and more, and form the backbone of semantic search. It also covers tasks involved in semantic search like information extraction, entity linking, query understanding and result ranking.
Quels facteurs de pertinence pour la recherche de produits e-commerce ?Lamjed Ben Jabeur
Laure Soulier, Lamjed Ben Jabeur, Paul Mousset, Lynda Tamine. Quels facteurs de pertinence pour la recherche de produits e-commerce ?. Dans : Conférence francophone en Recherche d'Information et Applications (CORIA 2016), Toulouse, 09/03/2016-11/03/2016, Association Francophone de Recherche d'Information et Applications (ARIA), p. 415-430, mars 2016. https://www.irit.fr/publis/SIG/2016_CORIA_SOULIER.pdf
Un moteur de recherche e-commerce vise à fournir un accès rapide et efficace à des produits qui correspondent aux besoins et aux préférences de l'utilisateur parmi une liste de produits similaires ou étroitement liés. Nous avons participé à la campagne d'évaluation « Living Lab for Information Retrieval » qui proposait une tâche de recherche de produits évaluée par des utilisateurs réels lors de scénarios de recherche réelle sur un site de e-commerce. L’évaluation expérimentale a montré des résultats prometteurs de notre modèle. Dans ce papier, nous proposons une analyse des fichiers logs issus de notre modèle afin d'identifier des facteurs d’efficacité liés à la requête et aux produits. L'objectif de cette étude est d'ouvrir des pistes de recherche pour la formalisation de modèles de recherche de produits.
E-commerce product retrieval aims to provide a quick and efficient access to products that fit user’s needs and preferences among a tail of similar or closely related products. We participated to the ``Living Lab for Information Retrieval'' evaluation campaign devoted to a product search task in which real users evaluated participants' retrieval models in real search scenarios on e-commerce websites. The experimental evaluation has shown encouraging results for our proposed model. In this paper, we conduct an analysis of users' feeadback with respect to the clicks obtained by our model. The goal of the paper is therefore to identify the effectiveness factors underlying the user's queries and the retrieved products in order to open perspectives in the formalization of product search models.
Op 7 maart was het Cross Media Cafe - Uit het Lab. Aan welke projecten en innovaties wordt gewerkt in de medialabs? Zowel bij kennisinstellingen als bij bedrijven? Wat komt er op ons af dat onze manier van media consumeren, gebruiken en produceren revolutionair gaat veranderen? Waar werken de “mad scientists” aan? Waar maken de uitvinders zich druk over? En hoe snel vindt het zijn weg naar de markt?
Daarnaast vieren iMMovator en Beeld en Geluid hun nieuwe samenwerking en het daarbij horende nieuwe logo.
Un grupo de amigos llamados Los Goonies encuentran un mapa antiguo en el desván de la casa de uno de los miembros que indica la ubicación de un tesoro enterrado por el pirata Willy el Tuerto. Deciden ir en busca del tesoro para ayudar a la familia de uno de ellos que está pasando por dificultades financieras y evitar la disolución del grupo.
* Inversión total: US$ 84,620
* Préstamo: 70% de US$ 84,620 = US$ 59,234
* Periodo de gracia: 3 meses
* Tasa de interés nominal anual: 16%
* Amortización trimestral
El servicio de la deuda trimestral es:
Interés (16% anual / 4 trimestrales): US$ 59,234 * 0.04 = US$ 2,369.36
Total pago trimestral = Intereses = US$ 2,369.36
El servicio de la deuda trimestral es US$ 2,369.36
El documento proporciona sugerencias para mejorar la calidad y oportunidad de los informes de auditoría. Señala que los informes deben redactarse de manera clara, concisa y objetiva, incluyendo sólo información relevante y verificada, para asegurar una comprensión completa. También destaca la importancia de emitir los informes de manera oportuna para permitir la adopción de acciones correctivas a tiempo.
Este documento presenta una introducción a la identificación de peligros, evaluación de riesgos y gestión del riesgo en el sistema de seguridad y salud ocupacional. Explica métodos cualitativos, semicuantitativos y cuantitativos para el análisis de riesgos, así como conceptos clave como peligro, riesgo, probabilidad y consecuencia. Además, provee lineamientos generales y específicos para realizar un diagnóstico efectivo de las condiciones de riesgo en el lugar de trabajo.
El documento describe el desarrollo del potencial humano como un proceso de mejoramiento de las capacidades de los individuos que componen una organización. Este proceso incluye tres etapas: el diseño de planes de desarrollo, la implementación de programas de capacitación y la evaluación del impacto en el desempeño laboral. Además, explica que la cultura organizacional influye en el comportamiento de las personas y que los directivos pueden definir valores institucionales para fomentar una cultura que motive a los empleados.
Este documento describe qué son las WebQuest y cómo se pueden utilizar como herramienta didáctica en el aula. Explica que las WebQuest son actividades de investigación guiada que usan recursos de Internet y promueven el pensamiento crítico y el trabajo cooperativo. También detalla los diferentes tipos de tareas que se pueden incluir en una WebQuest, como tareas de recopilación, misterio, periodísticas, diseño, creativas y más.
Accès à l’information dans les réseaux sociaux : quelles formes de collaborat...Lamjed Ben Jabeur
Nous présentons dans cet article une analyse exploratoire dans l’objectif d’identifier les patrons de collaboration au sein des réseaux sociaux pour l’accès à l’information. Nous nous focalisons sur le cas de la gestion de crise au travers de la plateforme sociale Twitter. Nous nous appuyons ainsi sur deux types de crises : une catastrophe naturelle (l’ouragan Sandy) et une crise sanitaire (Ebola). Nous proposons une méthodologie en trois étapes qui permet 1) d’analyser les structures de collaboration, 2) d’identifier les thématiques de collaboration et 3) de présenter les réseaux latents de collaboration sur l’ensemble du réseau. Les résultats montrent paradoxalement que le périmètre de la collaboration est réduit, que les sujets sousjacents sont diversifiés et impliquent des utilisateurs qui peuvent être à l’interface de différents sujets.
IRIT at clef 2015: A product search model for head queriesLamjed Ben Jabeur
We describe in this paper our participation in the product search task of LL4IR CLEF 2015 Lab. This task aims to evaluate, with living labs protective point of view,
the retrieval effectiveness over e-commerce search engines. During the online shopping process, users would search for interesting products and quickly access those that fit with their needs among a long tail of similar or closely related products. Our contribution addresses head queries that are frequently submitted on e-commerce Web sites. Head queries usually target featured products with several variations, accessories, and complementary products. We propose a probabilistic model for product search based on the intuition that descriptive fields and the category might fit with the query.
Finaly, we present results obtained during the second round of the product search task.
This document discusses challenges with a data science project including the experimental and unpredictable nature, difficulties with scheduling due to unknown completion times, proposing new products with data and technology limitations, and addressing failures by breaking the work into smaller pieces with increased visibility and producing functional interim results to stay on track.
Leveraging social relevance: Using social networks to enhance literature acce...Lamjed Ben Jabeur
Leveraging social relevance: Using social networks to enhance literature access and microblog search
(Exploitation des réseaux sociaux pour l'accès à la littérature et la recherche des microblogs)
Thesis submitted for the degree of Doctor of Philosophy
Thesis defended on October 8th, 2013
Ph.D: Lamjed Ben Jabeur
Supervisor: Prof. Lynda Tamine, University of Toulouse 3 Paul Sabatier
Advisor: Prof. Mohand Boughanem, University of Toulouse 3 Paul Sabatier
Abstract(EN)
We propose in this work to integrate the social information network in the retrieval process and exploit the social relations between social actors as a source of evidence to measure the relevance of a document in response to a query. Two social information retrieval models have been proposed in different application frameworks: literature access and microblog retrieval. The main contributions of each model are detailed in the following.
* A social information model for flexible literature access
We proposed a generic social information retrieval model for literature access. This model represents scientific papers within a social network and evaluates their importance according to the position of respective authors in the network. Compared to previous approaches, this model incorporates new social entities represented by annotators and social annotations (tags). In addition to co-authorships, this model includes two other types of social relationships: citation and social annotation. Finally, we propose to weight these relationships according to the position of authors in the social network and their mutual collaborations.
* A social model for information retrieval for microblog search
We proposed a microblog retrieval model that evaluates the quality of tweets in two contexts: the social context and temporal context. The quality of a tweet is estimated by the social importance of the corresponding blogger. In particular, blogger's importance is calculated by the applying PageRank algorithm on the network of social influence. With the same aim, the quality of a tweet is evaluated according to its date of publication. Tweets submitted in periods of activity of query terms are then characterized by a greater importance. Finally, we propose to integrate the social importance of blogger and the temporal magnitude tweets as well as other relevance factors using a Bayesian network model.
Résumé (FR)
Nous proposons dans cette thèse d'intégrer le réseau social d'information dans le processus de recherche d'information afin d'utiliser les relations sociales entre les acteurs sociaux comme une source d'évidence pour mesurer la pertinence d'un document en réponse à une requête. Deux modèles de recherche d'information sociale ont été proposés à des cadres applicatifs différents : la recherche d'information bibliographique et la recherche d'information dans les microblogs.
A social model for Literature Access: Towards a weighted social network of au...Lamjed Ben Jabeur
The document proposes a social model for literature access that incorporates a weighted social network of authors. It presents a generic social information retrieval model involving information producers, documents, social annotations and relationships. For literature access specifically, it extracts a social network of authors based on co-authorships and citations. This network is weighted based on factors like co-authorship similarity and influence of citations. Author importance is then computed using measures like PageRank to derive a document's social score. The model is evaluated on ACM SIGIR publications, outperforming baselines that don't incorporate the weighted social network. Future work involves integrating additional social features and evaluating on more datasets.
An Exploratory Study on Using Social Information Networks for Flexible Litera...Lamjed Ben Jabeur
It is well known that the fundamental intellectual problems of information access are the production and consumption of information. In this paper, we investigate the use of social network of information producers (authors) within relations in data (co-authorship and citation) in order to improve the relevance of information access. Relevance is derived from the network by levraging the usual topical similarity between the query and the document with the target author’s authority. We explore various social network based measures for computing social information importance and show how this kind of contextual information can be incorporated within an information access model. We experiment with a collection issued from SIGIR proceedings and show that combining topical, author and citation based evidences can significantly improve retrieval access precision, measured in terms of mean reciprocal rank.
Newsletter SPW Agriculture en province du Luxembourg du 12-06-24BenotGeorges3
Les informations et évènements agricoles en province du Luxembourg et en Wallonie susceptibles de vous intéresser et diffusés par le SPW Agriculture, Direction de la Recherche et du Développement, Service extérieur de Libramont.
Le fichier :
Les newsletters : https://agriculture.wallonie.be/home/recherche-developpement/acteurs-du-developpement-et-de-la-vulgarisation/les-services-exterieurs-de-la-direction-de-la-recherche-et-du-developpement/newsletters-des-services-exterieurs-de-la-vulgarisation/newsletters-du-se-de-libramont.html
Bonne lecture et bienvenue aux activités proposées.
#Agriculture #Wallonie #Newsletter #Recherche #Développement #Vulgarisation #Evènement #Information #Formation #Innovation #Législation #PAC #SPW #ServicepublicdeWallonie
Cycle de Formation Théâtrale 2024 / 2025Billy DEYLORD
Pour la Saison 2024 / 2025, l'association « Le Bateau Ivre » propose un Cycle de formation théâtrale pour particuliers amateurs et professionnels des arts de la scène enfants, adolescents et adultes à l'Espace Saint-Jean de Melun (77). 108 heures de formation, d’octobre 2024 à juin 2025, à travers trois cours hebdomadaires (« Pierrot ou la science de la Scène », « Montage de spectacles », « Le Mime et son Répertoire ») et un stage annuel « Tournez dans un film de cinéma muet ».
Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...M2i Formation
Améliorez l'intégration de vos nouveaux collaborateurs grâce à notre formation flash sur l'onboarding. Découvrez des stratégies éprouvées et des outils pratiques pour transformer l'intégration en une expérience fluide et efficace, et faire de chaque nouvelle recrue un atout pour vos équipes.
Les points abordés lors de la formation :
- Les fondamentaux d'un onboarding réussi
- Les outils et stratégies pour un onboarding efficace
- L'engagement et la culture d'entreprise
- L'onboarding continu et l'amélioration continue
Formation offerte animée à distance avec notre expert Eric Collin
Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...
Intégration des facteurs temps et autorité sociale dans un modèle bayésien de recherche de tweets
1. Intégration des facteurs temps et autorité
sociale dans un modèle bayésien de
recherche de tweets
Lamjed Ben Jabeur, Lynda Tamine et Mohand Boughanem
IRIT, Université Paul Sabatier
2. Modèle bayésien de recherche de tweets
Plan
1. Service de microblogage
2. Recherche des tweets
3. Topologie du réseau bayésien
4. Estimation des probabilités conditionnelles
5. Evaluation expérimentale
6. Conclusion et perspectives
2
3. Service de microblogage
Microblog?
“ Un service de microblogage est à la fois un moyen de
communication et un système de collaboration qui permet le
partage et la diffusion des messages textuels. Il permet aux
utilisateurs de communiquer des informations sur leurs statuts,
”
activités, pensées et opinions [Java et al.2009].
• Article de microblog
– Court (140 caractères)
1 milliards Publications par semaine
– Soumis en temps réel 50 millions Publications par jour
– Motivation sociale 177 million Publications en mars 2011
– Appareil mobile +106 millions Utilisateurs
3
4. Service de microblogage
Tweet, retweet et hashtag ?
“
Jack Dorsey 21 Mars 06 1ier Tweet
inviting coworkers #oilspill
“
Stephen Colbert 21 Juin 2010 Golden Tweet Award 2010
In honor of oil-soaked birds, 'tweets' are now 'gurgles. http://bit.ly/cIhZNf
“
Wendy's 8 Juin 2011 Golden Tweet Award 2011
RT for a good cause. Each Retweet sends 50¢ to help kids in foster care. #TreatItFwd
“
CORIA11 16 mars 2010
CORIA 2011 : Université d'Avignon #CORIA11 http://yfrog.com/h3y
““
MohBoughanem 17 Mars 2010
MohBoughanem CORIA11 17 Mars
@coria2011 bien visualisé, vite trouvé2010
@coria2011 bien visualisé, vite trouvé 4
6. Recherche des tweets
RI dans les microblogs
• Utilisateur submergé par l’énorme quantité des tweets
– Flux soutenu des publications
– Enorme quantité de données
– Diverses sources d’information
Difficulté d'accès aux publications intéressantes
• Les tâches de la RI dans les microblogs
– Recherche de personnes et suggestion des abonnements
– Extraction des tendances
– La recherche d’opinions
– La recherche de tweets
6
7. Recherche des tweets
Recherche de tweets
“ tâche de recherche en temps réel où l'utilisateur souhaite accéder
à l'information la plus récente, mais aussi la plus pertinente à
une requête (Ounis et al., 2011).
”
“ Recherche ad-hoc où le besoin en information est représenté par
une requête à un moment spécifique (Ounis et al., 2011).
”
• Objectifs et utilité
– Obtenir une information crédible et précise
– Accéder aux dernières actualités en temps réel
– Suivre un évènement à distance
– Collecter divers points de vue
7
8. Recherche des tweets
Synthèse des travaux
1. Contexte spatio-temporel
TwitterStand (Sankaranarayanan J. et al, 2009) TweetSieve (Grinev M et al, 2009)
2. Caractéristiques des microblogs
– Abonnements, tweets, retweets, réponses, hashtags, URLs
– Combinaison linéaire (Nagmoti et al., 2010)
– Apprentissage de fonctions d'ordonnancement (Duan Y et
al., 2010)
8
9. Recherche des tweets
Synthèse des travaux
3. La structure du réseau social
– Indegree, Retweet et Mention influence (Cha et al.,
2010).,TweetRank, FollowerRank (Nagmoti et al., 2010).
– Autorité (Kwak et al., 2010)
– Influence (Kwak et al., 2010), TwitterRank (Weng et al., 2010),
Popularité (Duan et al.,2010)
9
10. Recherche des tweets
Contributions
Thématique
• Facteurs de pertinence
– Occurrence des termes
– Magnitude temporelle
– Influence sociale
Temporelle Sociale
• Réseau Bayésien de croyance
(Silva et al., 2000)
10
11. Topologie du réseau bayésien
Requête, termes, configurations
• Nœud requête q 0,1
– événements q q
: ,
• Termes
– l’univers de discours : U k1 , k2 ,..., kn
– variable aléatoire : ki ,1
0
– évènements: ki , ki
– configuration des termes k
exemple : k1 , k 2
k k1 , k2 ), (k1 , k2 ), (k1 , k2 ), (k1 , k2 )
(
11
12. Topologie du réseau bayésien
Tweets
• Nœud tweet t j
– variable aléatoire : t j 0,1
– événements: ti , ti
• Nœuds associés au tweet t j
– évidence thématique : t kj
– évidence temporelle : t oj
– évidence sociale : t sj
12
13. Topologie du réseau bayésien
Périodes, blogueurs
• Nœud Période oe
– variable aléatoire : oe 0,1
– évènements : oe , oe
oe temps (t )
t t
o o
e
2 e
2
• Nœud Blogueur u f
– Variable aléatoire : u f 0,1
– Evénements : u f , u f
13
20. Estimation des probabilités conditionnelles
Période
P(t j | q) P(q | k ) P(t kj | k )P(toj | k ) P(t sj | k ) P(k )
k
P(toj | k ) P(toj | oe ) P(oe | k )
tweets
df ki ,oe
30
20
ki ,on( ki , k ) 1
P(oe | k )
df ki
k1
10
t2
ki ,on( ki , k ) 1 0
1 termes
2 3 4 5
temps
20
21. Estimation des probabilités conditionnelles
Tweet (évidence sociale)
P(t j | q) P(q | k ) P(t kj | k )P(toj | k ) P(t sj | k ) P(k )
k
P(tsj | k ) P(tsj | u f ) P(u f | k ) P(tsj | u f ) P(u f | k )
1
P(t sj | u f )
(u f )
21
22. Estimation de la pertinence
Blogueur
P(t j | q) P(q | k ) P(t kj | k )P(toj | k ) P(t sj | k ) P(k )
k
P(t sj | k ) P(t sj | u f ) P(u f | k )
P(u f | k) P(u f ) Inf (u f )
U3
Calcule de PageRank sur le réseau de retweet
u1
1 Inf Gk 1 (ui )
Inf (ui ) d
G
k
(1 d ) w j ,i u2
U u j ,e ( u j ,ui )E O(u j )
u4
(u j ) (u j )
w j ,i
(u j )
22
23. Évaluation expérimentale
TREC Microblog 2011
• Collection de tweets
Tweets 16 141 812 Blogueurs 5 356 432
Retweets 1 128 179 Relations des retweets 1 060 551
Tweet 1 860 112 Réseau social des retweets: nœuds 5 495 081
Termes 7 781 775 Réseau social des retweets: arcs 1 024 914
Hashtags 455 179 Composante géante 11.12%
Fréquence des termes Hashtags Longueur (termes)
1.5E8 1.5E 7 1.5E 6
0 5 10 0 5 10 0 20
23
Distributions des fréquences, des hashtags et des longueurs des tweets
24. Évaluation expérimentale
TREC Microblog 2011
• Tâche de «Recherche en temps réel » (49 requêtes)
– Tweets les plus récents.
– Tweets postérieurs à la date de la requête.
– Tweets triés par ordre chronologique inverse.
– Tweets édités; Tweets en anglais.
• Classement des systèmes (184 systèmes )
– Type de collection (HTML ou JSON).
– Données externes (Web, blogs…etc.).
– Information antérieur à la date de la requête.
• Mesures d’évaluation
– p@30 (officielle)
– MAP
– ALL Rel, High Rel
24
25. Évaluation expérimentale
Indexation et Filtrage
• Plateforme NESTOR
– Recherche en temps réel
– Détection des mentions, des hashtags et des retweets en
forme déclarative « RT @user »
– Indentification des langues et tokenisation multilingue
– Extraction et analyse des réseaux sociaux
– etc.
• Filtrage des tweets
– Supprimer les tweets dans une langue autre que l’anglais
– Supprimer les retweets et les tweets de conversation
– Supprimer les tweets au-delà de la 30ème position
25
26. Évaluation expérimentale
Modèles de référence
BNTS Notre modèle bayésien de croyance pour le recherche des tweets
BNTS-K Modèle BNTS, composantes temporelle et sociale désactivées
BNTS.KO Modèle BNTS, composante sociale désactivée
BNTS.KS Modèle BNTS, composante temporelle désactivée
Nestor * Notre modèle bayésien fondé sur un réseau d’inférence (Jabeur et al.,2012)
isiFDL * Modèle MRF avec apprentissage d’ordonnancements, 1er système dans le
classement de TREC Microblog 2011 (Metzler et al., 2011)
DFReeKLIM30 * Modèle basé sur la divergence de Kullback-Leibler, 2ème système dans le
classement de TREC Microblog 2011 (Amati et al., 2011)
Disjunctive * Modèle thématique disjonctif basé sur le système de RI Lucene
BM25 Modèle thématique d’Okapi BM25
Seuil à 30 tweets; Seuil automatique; Aucun Seuil ; * Résulats officiels
26
27. Évaluation expérimentale
Paramétrage du modèle
• Importance des fréquences des termes (BNTS.K)
p @ 30
1 tf ki ,t j
0,35
P(t kj | k )
0,3 k ki k t j tf ki ,t j
0,25
0,2
0,15
0,1
0,05
0
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
27
31. Modèle de recherche de tweets
Conclusion et perspectives
• Modèle de recherche de tweets
– Évidence thématique
– Évidence sociale
– Évidence temporelle
• Intégration des facteurs de pertinence dans un réseau
bayésien de croyance
• Gain de 24% par rapport à la médiane TREC‘11
• Perspectives
– Détecter automatiquement la taille de la fenêtre temporelle
– Adapter la combinaison des différentes sources d’évidence
selon la nature de la requête
31