SlideShare une entreprise Scribd logo
1  sur  32
Télécharger pour lire hors ligne
OPINION MINING
Présenter par:
MEGHERBI Nour El Houda
Département D’informatique
Sidi Bel Abbes
INTRODUCTION
 Une opinion peut être définie comme l’expression
des sentiments d’une personne envers une entité.
 En outre, l'e-commerce devient de plus en plus
populaire. Les marchands et les fabricants de
produits permettent aux clients de donner leurs avis
et opinions sur les produits ou services qu'ils ont
vendus (par exemple amazon.com, epinions.com).
De plus, les opinions disponibles sur le Web
influent sur nos choix et décisions.
LA FOUILLE D’OPINION
(Opinion Mining, Sentiment Analysis ou Subjectivity
Analysis)
 est un sous domaine de la fouille de texte.
 Son but étant de ressortir les marques d’opinions et
de sentiments des documents textuels.
LES CATÉGORIES DE CLASSIFICATION
 Il existe deux catégories principales pour classer
l’information textuelle:
• Les Faits
• Les opinions
- Dans le premier cas, il s’agit de descriptions
objectives (énoncé objectif) sur les entités et les
événements dans le monde .
- Dans l’autre cas, il s’agit d’expressions subjectives
d'un individu à propos d'un objet ou d'un sujet
particulier.
LE TEXTE SUBJECTIF
1- C’est quoi la subjectivité:
Est une expression linguistique de quelqu’un :
opinions, avis, sentiments, émotions, évaluations,
croyances ou jugements personnel [40].
 L’étude des textes subjectifs s’est
considérablement développée en directe relation
avec leur accessibilité sur le web.
- Pour favoriser l’expression des internautes, il faut
générer des textes non formatés, non indexés, non
signés, et qui posent des problèmes d’analyse et
de formalisation pour pouvoir être traités .
 L’analyse de sentiment a cependant fait le pari de
faire la différence au niveau d’un document entre
textes subjectifs et textes objectifs.
 Le problème de classification de textes devient
alors crucial :
- Repère d’abord les phrases porteuses d’opinion
(classement objectif/subjectif)
- Puis, attribuer une polarité (positive, négative ou
neutre).
OPINION MINING
 L’opinion Mining est l’exploitation du Web 2.0.
 C’est un domaine qui s’occupe de traitement
d’opinion, de sentiment, et de la subjectivité dans le
texte.
 Il devrait traiter un ensemble de résultats de
recherche pour un cas donné, générer une liste des
attributs (qualité, caractéristiques, etc.) et agréger
des avis sur chacun d’entre eux (mauvais, modéré,
de bonne qualité) .
 Le domaine de la fouille d’opinion peut-être divisé
en trois sous-domaines:
1- L’identification des textes d’opinion : consiste à
identifier et localiser les parties de textes porteuses
d’opinion dans une collection textuelle, c.-à-d.
classer les textes ou les parties de texte selon
(objectifs ou subjectifs).
2- Le résumé d’opinion:
consiste à rendre l’information rapidement et
facilement accessible en mettant en avant les
opinions exprimées et les cibles de ces opinions
présentes dans un texte.
3- L’analyse des sentiments:
est utilisée pour décrire l’analyse automatique de
texte évaluatif et pour la recherche de valeur
prédictive des jugements .
 L’objectif de la classification d’opinion est
d’attribuer une étiquette au texte selon l’opinion
qu’il exprime (positive, négative et neutre).
LES APPROCHES DE DÉTECTION D’OPINIONS :
 Il existe trois types d’approches pour la détection
d’opinions:
• Les approches statistiques :
- (Appelées aussi classification supervisées, approches
basées sur l’apprentissage machine ou encore
approches basées sur corpus).
- Elles sont des techniques d’apprentissage automatique.
- Ces approches regroupent les documents (ou les mots)
dans deux axes de classification, soit dans l’opposition
(subjectif-objectif), soit dans la distinction des opinions
subjectives dans l’opposition (positif-négatif).
• Les approches symboliques :
(Appelées aussi classification non supervisées ou encore
approches basées sur lexique).
- Elles utilisent des dictionnaires de mots subjectifs.
- Ces dictionnaires peuvent être généraux comme par
exemple (General Inquirer, Sentiwordnet, Opinion
Finder, NTU, etc.) ou construit manuellement, soit
généré automatiquement à partir du corpus (les mots
qui contiennent une opinion sont extraits directement du
corpus).
- Dans ces dictionnaires, une polarité est associée à priori
à chacun de ces mots. Il est donné ensuite au document
un score d’opinion égale au nombre total de mots qui
contiennent une opinion présente dans le document.
• Les approches hybrides :
(Appelées aussi classification semi-supervisées).
- Ces approches combinent les points forts des deux
approches précédentes.
- Elles prennent en compte tout le traitement
linguistique des approches symboliques avant de
lancer le processus d'apprentissage comme dans
les approches statistiques.
- La combinaison des approches symboliques et
statistiques a donné des résultats plus précis que
chacune des approches employées séparément.
DOMAINES D’APPLICATION
 Marketing:
• Coté entreprises :
 L’opinion Mining permet au fournisseur d’un produit
ou d’un service d’avoir plus de connaissances sur
les consommateurs, pour anticiper leurs besoins et
leurs attentes afin de tenter d’améliorer la qualité
du produit/service et d’augmenter les profits.
 Le domaine de la fouille d’opinion est devenu un
enjeu majeur pour toute entreprise désireuse de
mieux comprendre ce qui plait et déplait à ses
clients.
• Coté clients:
 Le client peut :
- Donner son opinion.
- S’inspirer des sentiments et opinions d’autres clients
sur le produit auquel il s’intéresse et profiter ainsi
d’une aide à la décision.
- Comparer les produits avant de les acquérir.
- … ect
L’OPINION MINING & LE
E-COMMERCE
 Depuis l’apparition du commerce en ligne (e-
commerce), la plupart des entreprises l’intègrent.
 Ceci explique la grande augmentation de chiffre
d’affaires des sites de vente en ligne.
 Le e-commerce a permis à nombre de sociétés de
toutes tailles d’explorer de nouvelles voies
commerciales. En effet, l’entreprise présente sur
Internet a la possibilité de mieux appréhender les
besoins de ses clients.
PRÉSENTATION DES OUTILS RÉALISÉS
DANS LE DOMAINE DE L’OPINION MINING
• Analyse de la tonalité sur Twitter:
 Twitter est un réseau social, avec un nombre
moyen de 200 millions de messages courts
(tweets) qui ne peuvent pas dépasser 140
caractères envoyés par jour. Twitter permet de
recueillir des opinions spontanées sur une variété
de sujets.
 Nous allons citer quelques services proposant
d’analyser la tonalité des messages partagés sur
Twitter :
1- Sentiment140:
Sentiment140 (anciennement connu sous le nom
"Twitter sentiment")
 est un outil en ligne gratuit qui a été créé par trois
étudiants en computer science de Stanford.
 Sentiment140 permet de découvrir des sentiments
des tweets d'une marque, un produit ou un sujet sur
Twitter.
UTILISATION DE L'OUTIL SENTIMENT140
- Accédez au lien:
http://www.sentiment140.com/
- Tapez dans la boîte de recherche le nom d’un
produit, d'une célébrité ou d'une marque.
exemple « iPhone 4s ».
- Cliquez sur le bouton «Search» comme dans la
figure suivante:
LES RÉSULTATS DÉTAILLÉS POUR LA REQUÊTE «
IPHONE 4S » S’AFFICHE (FIGURE SUIVANTE)
LE SERVICE TWEETFEEL
 est un outil en ligne d’analyse du sentiment sur
Twitter.
- Utilisation de l'outil TweetFeel:
 Accédez au lien: http://www.tweetfeel.com/
 Tapez dans la boîte de recherche le nom d’un
produit, d'une célébrité ou d'une marque exemple «
iPhone 4s » ;
 Cliquez sur le bouton «Search» comme sur la
figure suivante:
- L’interface de TweetFeel.
- Les résultats des tweets portant sur « iPhone
4s » (figure suivante) :
TWITRRATR
 est un outil en ligne gratuit, qui a émergé à partir
d'un projet Startup Weekend.
 Twitrratr fonctionne à partir d’une liste de mots
positifs et d’une liste de mots négatifs.
 Cet outil classe une opinion sur le mot clé de la
requête s’il est capable de le croiser avec un mot
d’une des deux listes. Les mots positifs et négatifs
qui servent à classer les tweets sont surlignés dans
l’interface.
UTILISATION DE L'OUTIL TWITRRATR
 http://twitrratr.com/
CONCLUSION
 Le domaine d’opinion Mining est un nouvel axe de
recherche permettant de faciliter et améliorer la vie quotidienne
en analysant et classifiant les opinions et les sentiments des
internautes.
 Malgré l’existence de quelques travaux dans ce domaine, ils
comportent tous des limites que notre application a pu lever :
 Ils travaillent sur une seule source d’information : ‘twitter’,
 Ils travaillent sur des commentaires de petite taille (tweet) qui
ne peut pas dépasser 140 caractères,
 La plupart des applications classent les commentaires en
deux polarités (positive et négative),
 La plupart des applications donnent le résultat en
pourcentage, sans une représentation graphique,…ect.
RÉFÉRENCES BIBLIOGRAPHIQUES
 Abdelhamid DJEFFAL, (2012). Fouille de données avancée. Cours.
Université Mohamed Khider de Biskra.
 Antonio Machado, (2010). Chapitre2 : Le Web Usage Mining. thèse,
INRIA.
 Cheikh B., (2002). Etat de la connaissance sur le web usage mining
Diplôme d’Etudes Approfondies. Université de Montpellier II.
 Faiza Belbachir, (2010). Expérimentation de fonctions pour la détection
d’opinions dans les blogs. Mémoire de master. Université de Paul
Sabatier, Toulouse.
 Grzegorz DZICZKOWSKI, (2008). Analyse des sentiments : système
autonome d’exploration des opinions exprimées dans les critiques
cinématographique. Thèse de doctorat. L’ECOLE NATIONALE
SUPERIEURE DES MINES, PARIS.
 HACÈNE CHERFI, (2004). Etude et réalisation d’un système d’extraction
de connaissance à partir de textes. Thèse de doctorat. Université de
Henri Poincaré Nancy I.
 Jmal, J., (2012). ResTS : Système de Résumé
Automatique des Textes d’opinions basé sur Twitter et
SentiWorldNet. In Actes de la conférence conjointe JEP-
TALN-RECITAL, volume 3 : RECITAL, pages 233-246,
Gronoble, France.
 Ladeg Hamza, (2012). Modélisation de connaissances du
décideur pour le renforcement du processus KDD. Mémoire de
magister, Ecole nationale supérieure d’informatique (ESI), Alger.
 Nabila Merzoug et Hanane Bessa, (2009), Application du
processus de fouille de données d’usage du web sur les fichiers
logs du site cubba. Mémoire d’ingéniorat. Université de Bordj
Bou Arréridj Algerie.
 Nicolas BÉCHET, (2009). Extraction et regroupement de
descripteurs morpho-syntaxiques pour des processus de Fouille
de Textes. Thèse de doctorat. Univérsité Montpellier II.
 Noureddine MOKHTARI, (2006). Extraction et exploitation
 Fin.
 Merci pour votre attention 

Contenu connexe

Tendances

Analyse de sentiments dans les médias sociaux
Analyse de sentiments dans les médias sociauxAnalyse de sentiments dans les médias sociaux
Analyse de sentiments dans les médias sociauxYacine Yakoubi
 
Sentiment analysis of twitter data
Sentiment analysis of twitter dataSentiment analysis of twitter data
Sentiment analysis of twitter dataBhagyashree Deokar
 
Sentiment Analysis on Twitter
Sentiment Analysis on TwitterSentiment Analysis on Twitter
Sentiment Analysis on TwitterSmritiAgarwal26
 
Twitter sentiment analysis
Twitter sentiment analysisTwitter sentiment analysis
Twitter sentiment analysisRahul Jha
 
Sentiment Analysis in Twitter
Sentiment Analysis in TwitterSentiment Analysis in Twitter
Sentiment Analysis in TwitterAyushi Dalmia
 
Sentiment analysis in twitter using python
Sentiment analysis in twitter using pythonSentiment analysis in twitter using python
Sentiment analysis in twitter using pythonCloudTechnologies
 
Sentiment Analysis Using Twitter
Sentiment Analysis Using TwitterSentiment Analysis Using Twitter
Sentiment Analysis Using Twitterpiya chauhan
 
Sentiment Analysis using Twitter Data
Sentiment Analysis using Twitter DataSentiment Analysis using Twitter Data
Sentiment Analysis using Twitter DataHari Prasad
 
Twitter sentiment analysis
Twitter sentiment analysisTwitter sentiment analysis
Twitter sentiment analysisSunil Kandari
 
Sentiment analysis of Twitter data using python
Sentiment analysis of Twitter data using pythonSentiment analysis of Twitter data using python
Sentiment analysis of Twitter data using pythonHetu Bhavsar
 
Sentiment Analysis on Twitter
Sentiment Analysis on TwitterSentiment Analysis on Twitter
Sentiment Analysis on TwitterSubarno Pal
 
Twitter Sentiment Analysis
Twitter Sentiment AnalysisTwitter Sentiment Analysis
Twitter Sentiment AnalysisAyush Khandelwal
 
Sentiment Analysis
Sentiment Analysis Sentiment Analysis
Sentiment Analysis prnk08
 
Sentiment Analysis in Twitter
Sentiment Analysis in TwitterSentiment Analysis in Twitter
Sentiment Analysis in Twitterprnk08
 
Sentiment analysis in Twitter on Big Data
Sentiment analysis in Twitter on Big DataSentiment analysis in Twitter on Big Data
Sentiment analysis in Twitter on Big DataIswarya M
 
Sentiment Analaysis on Twitter
Sentiment Analaysis on TwitterSentiment Analaysis on Twitter
Sentiment Analaysis on TwitterNitish J Prabhu
 
Cours d'algorithmique distribuée (2010-2011)
Cours d'algorithmique distribuée (2010-2011)Cours d'algorithmique distribuée (2010-2011)
Cours d'algorithmique distribuée (2010-2011)Élodie Descharmes
 
Predicting Tweet Sentiment
Predicting Tweet SentimentPredicting Tweet Sentiment
Predicting Tweet SentimentLucinda Linde
 

Tendances (20)

Analyse de sentiments dans les médias sociaux
Analyse de sentiments dans les médias sociauxAnalyse de sentiments dans les médias sociaux
Analyse de sentiments dans les médias sociaux
 
Sentiment analysis of twitter data
Sentiment analysis of twitter dataSentiment analysis of twitter data
Sentiment analysis of twitter data
 
Sentiment Analysis on Twitter
Sentiment Analysis on TwitterSentiment Analysis on Twitter
Sentiment Analysis on Twitter
 
Twitter sentiment analysis
Twitter sentiment analysisTwitter sentiment analysis
Twitter sentiment analysis
 
Sentiment Analysis in Twitter
Sentiment Analysis in TwitterSentiment Analysis in Twitter
Sentiment Analysis in Twitter
 
Sentiment analysis in twitter using python
Sentiment analysis in twitter using pythonSentiment analysis in twitter using python
Sentiment analysis in twitter using python
 
Analyse de sentiment et classification par approche neuronale en Python et Weka
Analyse de sentiment et classification par approche neuronale en Python et WekaAnalyse de sentiment et classification par approche neuronale en Python et Weka
Analyse de sentiment et classification par approche neuronale en Python et Weka
 
Sentiment Analysis Using Twitter
Sentiment Analysis Using TwitterSentiment Analysis Using Twitter
Sentiment Analysis Using Twitter
 
Sentiment Analysis using Twitter Data
Sentiment Analysis using Twitter DataSentiment Analysis using Twitter Data
Sentiment Analysis using Twitter Data
 
Twitter sentiment analysis
Twitter sentiment analysisTwitter sentiment analysis
Twitter sentiment analysis
 
Sentiment analysis of Twitter data using python
Sentiment analysis of Twitter data using pythonSentiment analysis of Twitter data using python
Sentiment analysis of Twitter data using python
 
Sentiment Analysis on Twitter
Sentiment Analysis on TwitterSentiment Analysis on Twitter
Sentiment Analysis on Twitter
 
Twitter Sentiment Analysis
Twitter Sentiment AnalysisTwitter Sentiment Analysis
Twitter Sentiment Analysis
 
Sentiment Analysis
Sentiment Analysis Sentiment Analysis
Sentiment Analysis
 
Sentiment Analysis in Twitter
Sentiment Analysis in TwitterSentiment Analysis in Twitter
Sentiment Analysis in Twitter
 
Sentiment analysis in Twitter on Big Data
Sentiment analysis in Twitter on Big DataSentiment analysis in Twitter on Big Data
Sentiment analysis in Twitter on Big Data
 
Sentiment Analaysis on Twitter
Sentiment Analaysis on TwitterSentiment Analaysis on Twitter
Sentiment Analaysis on Twitter
 
Cours d'algorithmique distribuée (2010-2011)
Cours d'algorithmique distribuée (2010-2011)Cours d'algorithmique distribuée (2010-2011)
Cours d'algorithmique distribuée (2010-2011)
 
Predicting Tweet Sentiment
Predicting Tweet SentimentPredicting Tweet Sentiment
Predicting Tweet Sentiment
 
Veille informationnelle
Veille informationnelleVeille informationnelle
Veille informationnelle
 

En vedette (7)

Data Mining
Data MiningData Mining
Data Mining
 
Réseaux de neurones
Réseaux de neurones Réseaux de neurones
Réseaux de neurones
 
La détection des spam
La détection des spamLa détection des spam
La détection des spam
 
Les systèmes intelligents
Les systèmes intelligentsLes systèmes intelligents
Les systèmes intelligents
 
La classification des Emails utilisant le modèle MapReduce
La classification des Emails utilisant le modèle MapReduce La classification des Emails utilisant le modèle MapReduce
La classification des Emails utilisant le modèle MapReduce
 
Web sémantique
Web sémantique Web sémantique
Web sémantique
 
Introduction à Hadoop
Introduction à HadoopIntroduction à Hadoop
Introduction à Hadoop
 

Similaire à Opinion Mining

Text mining, sentiment analysis, big data.
Text mining, sentiment analysis, big data.Text mining, sentiment analysis, big data.
Text mining, sentiment analysis, big data.Bruno Teboul
 
Pdj pharma partie lingway
Pdj pharma partie lingwayPdj pharma partie lingway
Pdj pharma partie lingwayLingway
 
Cours de Gestion de la « E- Réputation»
Cours de Gestion de la « E- Réputation» Cours de Gestion de la « E- Réputation»
Cours de Gestion de la « E- Réputation» Babacar LO
 
Comment mettre en place un système de veille et de curation de l'information ...
Comment mettre en place un système de veille et de curation de l'information ...Comment mettre en place un système de veille et de curation de l'information ...
Comment mettre en place un système de veille et de curation de l'information ...CYB@RDECHE
 
Présentation E20 Electrons Associés
Présentation E20 Electrons AssociésPrésentation E20 Electrons Associés
Présentation E20 Electrons Associésfp961
 
Agences de Communication et outils de veille et d’e-Réputation : quelle métho...
Agences de Communication et outils de veille et d’e-Réputation : quelle métho...Agences de Communication et outils de veille et d’e-Réputation : quelle métho...
Agences de Communication et outils de veille et d’e-Réputation : quelle métho...image(&)dialogue
 
Image&dialogue/lingway Reputation day
Image&dialogue/lingway Reputation dayImage&dialogue/lingway Reputation day
Image&dialogue/lingway Reputation dayLingway
 
Ergonomie des IHM web - Notes de cours (3/3)
Ergonomie des IHM web - Notes de cours (3/3)Ergonomie des IHM web - Notes de cours (3/3)
Ergonomie des IHM web - Notes de cours (3/3)ElodieDescharmes
 
Introduction aux médias sociaux sur Internet pour gens d'affaires
Introduction aux médias sociaux sur Internet pour gens d'affairesIntroduction aux médias sociaux sur Internet pour gens d'affaires
Introduction aux médias sociaux sur Internet pour gens d'affairesGestrat Management inc.
 
Atelier sur le e-marketing - ENP de l'Yonne
Atelier sur le e-marketing - ENP de l'YonneAtelier sur le e-marketing - ENP de l'Yonne
Atelier sur le e-marketing - ENP de l'YonneStéphanie DURVILLE
 
Flux d'activité : l'objet du scandale - "Adoption et Réseaux Sociaux d'Entrep...
Flux d'activité : l'objet du scandale - "Adoption et Réseaux Sociaux d'Entrep...Flux d'activité : l'objet du scandale - "Adoption et Réseaux Sociaux d'Entrep...
Flux d'activité : l'objet du scandale - "Adoption et Réseaux Sociaux d'Entrep...Sébastien Blanc
 
Veille et eréputation des collectivités
Veille et  eréputation des collectivitésVeille et  eréputation des collectivités
Veille et eréputation des collectivitésArdesi Midi-Pyrénées
 
LINGWAY forum e-marketing/ e-réputation
LINGWAY forum e-marketing/ e-réputationLINGWAY forum e-marketing/ e-réputation
LINGWAY forum e-marketing/ e-réputationLingway
 
Semo 2.0 atelier lingway
Semo 2.0 atelier lingwaySemo 2.0 atelier lingway
Semo 2.0 atelier lingwayLingway
 
Competitic - Eréputation - numerique en entreprise
Competitic - Eréputation - numerique en entrepriseCompetitic - Eréputation - numerique en entreprise
Competitic - Eréputation - numerique en entrepriseCOMPETITIC
 
Astrolab - Service Social Media Intelligence
Astrolab - Service Social Media Intelligence Astrolab - Service Social Media Intelligence
Astrolab - Service Social Media Intelligence Astrolab Consulting
 
Veille analyse-des-reseaux-sociaux-livre-blanc
Veille analyse-des-reseaux-sociaux-livre-blancVeille analyse-des-reseaux-sociaux-livre-blanc
Veille analyse-des-reseaux-sociaux-livre-blancAlex Suter
 
Présentation socialmention 2
Présentation socialmention 2Présentation socialmention 2
Présentation socialmention 2Noëmie Douard
 
Information et communication
Information et communication Information et communication
Information et communication jihen damerji
 
E-reputation : évolution des pratiques
E-reputation : évolution des pratiquesE-reputation : évolution des pratiques
E-reputation : évolution des pratiquesCamille A
 

Similaire à Opinion Mining (20)

Text mining, sentiment analysis, big data.
Text mining, sentiment analysis, big data.Text mining, sentiment analysis, big data.
Text mining, sentiment analysis, big data.
 
Pdj pharma partie lingway
Pdj pharma partie lingwayPdj pharma partie lingway
Pdj pharma partie lingway
 
Cours de Gestion de la « E- Réputation»
Cours de Gestion de la « E- Réputation» Cours de Gestion de la « E- Réputation»
Cours de Gestion de la « E- Réputation»
 
Comment mettre en place un système de veille et de curation de l'information ...
Comment mettre en place un système de veille et de curation de l'information ...Comment mettre en place un système de veille et de curation de l'information ...
Comment mettre en place un système de veille et de curation de l'information ...
 
Présentation E20 Electrons Associés
Présentation E20 Electrons AssociésPrésentation E20 Electrons Associés
Présentation E20 Electrons Associés
 
Agences de Communication et outils de veille et d’e-Réputation : quelle métho...
Agences de Communication et outils de veille et d’e-Réputation : quelle métho...Agences de Communication et outils de veille et d’e-Réputation : quelle métho...
Agences de Communication et outils de veille et d’e-Réputation : quelle métho...
 
Image&dialogue/lingway Reputation day
Image&dialogue/lingway Reputation dayImage&dialogue/lingway Reputation day
Image&dialogue/lingway Reputation day
 
Ergonomie des IHM web - Notes de cours (3/3)
Ergonomie des IHM web - Notes de cours (3/3)Ergonomie des IHM web - Notes de cours (3/3)
Ergonomie des IHM web - Notes de cours (3/3)
 
Introduction aux médias sociaux sur Internet pour gens d'affaires
Introduction aux médias sociaux sur Internet pour gens d'affairesIntroduction aux médias sociaux sur Internet pour gens d'affaires
Introduction aux médias sociaux sur Internet pour gens d'affaires
 
Atelier sur le e-marketing - ENP de l'Yonne
Atelier sur le e-marketing - ENP de l'YonneAtelier sur le e-marketing - ENP de l'Yonne
Atelier sur le e-marketing - ENP de l'Yonne
 
Flux d'activité : l'objet du scandale - "Adoption et Réseaux Sociaux d'Entrep...
Flux d'activité : l'objet du scandale - "Adoption et Réseaux Sociaux d'Entrep...Flux d'activité : l'objet du scandale - "Adoption et Réseaux Sociaux d'Entrep...
Flux d'activité : l'objet du scandale - "Adoption et Réseaux Sociaux d'Entrep...
 
Veille et eréputation des collectivités
Veille et  eréputation des collectivitésVeille et  eréputation des collectivités
Veille et eréputation des collectivités
 
LINGWAY forum e-marketing/ e-réputation
LINGWAY forum e-marketing/ e-réputationLINGWAY forum e-marketing/ e-réputation
LINGWAY forum e-marketing/ e-réputation
 
Semo 2.0 atelier lingway
Semo 2.0 atelier lingwaySemo 2.0 atelier lingway
Semo 2.0 atelier lingway
 
Competitic - Eréputation - numerique en entreprise
Competitic - Eréputation - numerique en entrepriseCompetitic - Eréputation - numerique en entreprise
Competitic - Eréputation - numerique en entreprise
 
Astrolab - Service Social Media Intelligence
Astrolab - Service Social Media Intelligence Astrolab - Service Social Media Intelligence
Astrolab - Service Social Media Intelligence
 
Veille analyse-des-reseaux-sociaux-livre-blanc
Veille analyse-des-reseaux-sociaux-livre-blancVeille analyse-des-reseaux-sociaux-livre-blanc
Veille analyse-des-reseaux-sociaux-livre-blanc
 
Présentation socialmention 2
Présentation socialmention 2Présentation socialmention 2
Présentation socialmention 2
 
Information et communication
Information et communication Information et communication
Information et communication
 
E-reputation : évolution des pratiques
E-reputation : évolution des pratiquesE-reputation : évolution des pratiques
E-reputation : évolution des pratiques
 

Dernier

BOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleur
BOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleurBOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleur
BOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleuridelewebmestre
 
BOW 2024 - Nouveaux modes de logement pour des veaux de boucherie avec accès ...
BOW 2024 - Nouveaux modes de logement pour des veaux de boucherie avec accès ...BOW 2024 - Nouveaux modes de logement pour des veaux de boucherie avec accès ...
BOW 2024 - Nouveaux modes de logement pour des veaux de boucherie avec accès ...idelewebmestre
 
BOW 2024 - 3 1 - Les infrastructures équestres et le changement climatique
BOW 2024 - 3 1 - Les infrastructures équestres et le changement climatiqueBOW 2024 - 3 1 - Les infrastructures équestres et le changement climatique
BOW 2024 - 3 1 - Les infrastructures équestres et le changement climatiqueidelewebmestre
 
anas transcript 111111111111111111111111
anas transcript 111111111111111111111111anas transcript 111111111111111111111111
anas transcript 111111111111111111111111zaidtaim1214
 
BOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitières
BOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitièresBOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitières
BOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitièresidelewebmestre
 
BOW 2024 - 3-8 - Adaptation des bâtiments d'élevages de volailles au changeme...
BOW 2024 - 3-8 - Adaptation des bâtiments d'élevages de volailles au changeme...BOW 2024 - 3-8 - Adaptation des bâtiments d'élevages de volailles au changeme...
BOW 2024 - 3-8 - Adaptation des bâtiments d'élevages de volailles au changeme...idelewebmestre
 
BOW 2024 - L'enrichissement du milieu des chèvres laitières
BOW 2024 - L'enrichissement du milieu des chèvres laitièresBOW 2024 - L'enrichissement du milieu des chèvres laitières
BOW 2024 - L'enrichissement du milieu des chèvres laitièresidelewebmestre
 
Accompagnement de l'agrivoltaïsme dans le département de la Nièvre
Accompagnement de l'agrivoltaïsme dans le département de la NièvreAccompagnement de l'agrivoltaïsme dans le département de la Nièvre
Accompagnement de l'agrivoltaïsme dans le département de la Nièvreidelewebmestre
 
BOW 2024 - Le bâtiment multicritère porcin
BOW 2024 - Le bâtiment multicritère porcinBOW 2024 - Le bâtiment multicritère porcin
BOW 2024 - Le bâtiment multicritère porcinidelewebmestre
 

Dernier (10)

BOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleur
BOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleurBOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleur
BOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleur
 
BOW 2024 - Nouveaux modes de logement pour des veaux de boucherie avec accès ...
BOW 2024 - Nouveaux modes de logement pour des veaux de boucherie avec accès ...BOW 2024 - Nouveaux modes de logement pour des veaux de boucherie avec accès ...
BOW 2024 - Nouveaux modes de logement pour des veaux de boucherie avec accès ...
 
BOW 2024 - 3 1 - Les infrastructures équestres et le changement climatique
BOW 2024 - 3 1 - Les infrastructures équestres et le changement climatiqueBOW 2024 - 3 1 - Les infrastructures équestres et le changement climatique
BOW 2024 - 3 1 - Les infrastructures équestres et le changement climatique
 
anas transcript 111111111111111111111111
anas transcript 111111111111111111111111anas transcript 111111111111111111111111
anas transcript 111111111111111111111111
 
BOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitières
BOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitièresBOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitières
BOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitières
 
BOW 2024 - 3-8 - Adaptation des bâtiments d'élevages de volailles au changeme...
BOW 2024 - 3-8 - Adaptation des bâtiments d'élevages de volailles au changeme...BOW 2024 - 3-8 - Adaptation des bâtiments d'élevages de volailles au changeme...
BOW 2024 - 3-8 - Adaptation des bâtiments d'élevages de volailles au changeme...
 
BOW 2024 - L'enrichissement du milieu des chèvres laitières
BOW 2024 - L'enrichissement du milieu des chèvres laitièresBOW 2024 - L'enrichissement du milieu des chèvres laitières
BOW 2024 - L'enrichissement du milieu des chèvres laitières
 
Accompagnement de l'agrivoltaïsme dans le département de la Nièvre
Accompagnement de l'agrivoltaïsme dans le département de la NièvreAccompagnement de l'agrivoltaïsme dans le département de la Nièvre
Accompagnement de l'agrivoltaïsme dans le département de la Nièvre
 
BOW 2024 - Le bâtiment multicritère porcin
BOW 2024 - Le bâtiment multicritère porcinBOW 2024 - Le bâtiment multicritère porcin
BOW 2024 - Le bâtiment multicritère porcin
 
Webinaire lésions podales_04.04.2024.pptx
Webinaire lésions podales_04.04.2024.pptxWebinaire lésions podales_04.04.2024.pptx
Webinaire lésions podales_04.04.2024.pptx
 

Opinion Mining

  • 1. OPINION MINING Présenter par: MEGHERBI Nour El Houda Département D’informatique Sidi Bel Abbes
  • 2. INTRODUCTION  Une opinion peut être définie comme l’expression des sentiments d’une personne envers une entité.  En outre, l'e-commerce devient de plus en plus populaire. Les marchands et les fabricants de produits permettent aux clients de donner leurs avis et opinions sur les produits ou services qu'ils ont vendus (par exemple amazon.com, epinions.com). De plus, les opinions disponibles sur le Web influent sur nos choix et décisions.
  • 3. LA FOUILLE D’OPINION (Opinion Mining, Sentiment Analysis ou Subjectivity Analysis)  est un sous domaine de la fouille de texte.  Son but étant de ressortir les marques d’opinions et de sentiments des documents textuels.
  • 4. LES CATÉGORIES DE CLASSIFICATION  Il existe deux catégories principales pour classer l’information textuelle: • Les Faits • Les opinions
  • 5. - Dans le premier cas, il s’agit de descriptions objectives (énoncé objectif) sur les entités et les événements dans le monde . - Dans l’autre cas, il s’agit d’expressions subjectives d'un individu à propos d'un objet ou d'un sujet particulier.
  • 6. LE TEXTE SUBJECTIF 1- C’est quoi la subjectivité: Est une expression linguistique de quelqu’un : opinions, avis, sentiments, émotions, évaluations, croyances ou jugements personnel [40].  L’étude des textes subjectifs s’est considérablement développée en directe relation avec leur accessibilité sur le web. - Pour favoriser l’expression des internautes, il faut générer des textes non formatés, non indexés, non signés, et qui posent des problèmes d’analyse et de formalisation pour pouvoir être traités .
  • 7.  L’analyse de sentiment a cependant fait le pari de faire la différence au niveau d’un document entre textes subjectifs et textes objectifs.  Le problème de classification de textes devient alors crucial : - Repère d’abord les phrases porteuses d’opinion (classement objectif/subjectif) - Puis, attribuer une polarité (positive, négative ou neutre).
  • 8. OPINION MINING  L’opinion Mining est l’exploitation du Web 2.0.  C’est un domaine qui s’occupe de traitement d’opinion, de sentiment, et de la subjectivité dans le texte.  Il devrait traiter un ensemble de résultats de recherche pour un cas donné, générer une liste des attributs (qualité, caractéristiques, etc.) et agréger des avis sur chacun d’entre eux (mauvais, modéré, de bonne qualité) .
  • 9.  Le domaine de la fouille d’opinion peut-être divisé en trois sous-domaines: 1- L’identification des textes d’opinion : consiste à identifier et localiser les parties de textes porteuses d’opinion dans une collection textuelle, c.-à-d. classer les textes ou les parties de texte selon (objectifs ou subjectifs).
  • 10. 2- Le résumé d’opinion: consiste à rendre l’information rapidement et facilement accessible en mettant en avant les opinions exprimées et les cibles de ces opinions présentes dans un texte. 3- L’analyse des sentiments: est utilisée pour décrire l’analyse automatique de texte évaluatif et pour la recherche de valeur prédictive des jugements .
  • 11.  L’objectif de la classification d’opinion est d’attribuer une étiquette au texte selon l’opinion qu’il exprime (positive, négative et neutre).
  • 12. LES APPROCHES DE DÉTECTION D’OPINIONS :  Il existe trois types d’approches pour la détection d’opinions: • Les approches statistiques : - (Appelées aussi classification supervisées, approches basées sur l’apprentissage machine ou encore approches basées sur corpus). - Elles sont des techniques d’apprentissage automatique. - Ces approches regroupent les documents (ou les mots) dans deux axes de classification, soit dans l’opposition (subjectif-objectif), soit dans la distinction des opinions subjectives dans l’opposition (positif-négatif).
  • 13. • Les approches symboliques : (Appelées aussi classification non supervisées ou encore approches basées sur lexique). - Elles utilisent des dictionnaires de mots subjectifs. - Ces dictionnaires peuvent être généraux comme par exemple (General Inquirer, Sentiwordnet, Opinion Finder, NTU, etc.) ou construit manuellement, soit généré automatiquement à partir du corpus (les mots qui contiennent une opinion sont extraits directement du corpus). - Dans ces dictionnaires, une polarité est associée à priori à chacun de ces mots. Il est donné ensuite au document un score d’opinion égale au nombre total de mots qui contiennent une opinion présente dans le document.
  • 14. • Les approches hybrides : (Appelées aussi classification semi-supervisées). - Ces approches combinent les points forts des deux approches précédentes. - Elles prennent en compte tout le traitement linguistique des approches symboliques avant de lancer le processus d'apprentissage comme dans les approches statistiques. - La combinaison des approches symboliques et statistiques a donné des résultats plus précis que chacune des approches employées séparément.
  • 15. DOMAINES D’APPLICATION  Marketing: • Coté entreprises :  L’opinion Mining permet au fournisseur d’un produit ou d’un service d’avoir plus de connaissances sur les consommateurs, pour anticiper leurs besoins et leurs attentes afin de tenter d’améliorer la qualité du produit/service et d’augmenter les profits.  Le domaine de la fouille d’opinion est devenu un enjeu majeur pour toute entreprise désireuse de mieux comprendre ce qui plait et déplait à ses clients.
  • 16. • Coté clients:  Le client peut : - Donner son opinion. - S’inspirer des sentiments et opinions d’autres clients sur le produit auquel il s’intéresse et profiter ainsi d’une aide à la décision. - Comparer les produits avant de les acquérir. - … ect
  • 17. L’OPINION MINING & LE E-COMMERCE  Depuis l’apparition du commerce en ligne (e- commerce), la plupart des entreprises l’intègrent.  Ceci explique la grande augmentation de chiffre d’affaires des sites de vente en ligne.  Le e-commerce a permis à nombre de sociétés de toutes tailles d’explorer de nouvelles voies commerciales. En effet, l’entreprise présente sur Internet a la possibilité de mieux appréhender les besoins de ses clients.
  • 18. PRÉSENTATION DES OUTILS RÉALISÉS DANS LE DOMAINE DE L’OPINION MINING • Analyse de la tonalité sur Twitter:  Twitter est un réseau social, avec un nombre moyen de 200 millions de messages courts (tweets) qui ne peuvent pas dépasser 140 caractères envoyés par jour. Twitter permet de recueillir des opinions spontanées sur une variété de sujets.  Nous allons citer quelques services proposant d’analyser la tonalité des messages partagés sur Twitter :
  • 19. 1- Sentiment140: Sentiment140 (anciennement connu sous le nom "Twitter sentiment")  est un outil en ligne gratuit qui a été créé par trois étudiants en computer science de Stanford.  Sentiment140 permet de découvrir des sentiments des tweets d'une marque, un produit ou un sujet sur Twitter.
  • 20. UTILISATION DE L'OUTIL SENTIMENT140 - Accédez au lien: http://www.sentiment140.com/ - Tapez dans la boîte de recherche le nom d’un produit, d'une célébrité ou d'une marque. exemple « iPhone 4s ». - Cliquez sur le bouton «Search» comme dans la figure suivante:
  • 21.
  • 22. LES RÉSULTATS DÉTAILLÉS POUR LA REQUÊTE « IPHONE 4S » S’AFFICHE (FIGURE SUIVANTE)
  • 23. LE SERVICE TWEETFEEL  est un outil en ligne d’analyse du sentiment sur Twitter. - Utilisation de l'outil TweetFeel:  Accédez au lien: http://www.tweetfeel.com/  Tapez dans la boîte de recherche le nom d’un produit, d'une célébrité ou d'une marque exemple « iPhone 4s » ;  Cliquez sur le bouton «Search» comme sur la figure suivante:
  • 24. - L’interface de TweetFeel. - Les résultats des tweets portant sur « iPhone 4s » (figure suivante) :
  • 25.
  • 26. TWITRRATR  est un outil en ligne gratuit, qui a émergé à partir d'un projet Startup Weekend.  Twitrratr fonctionne à partir d’une liste de mots positifs et d’une liste de mots négatifs.  Cet outil classe une opinion sur le mot clé de la requête s’il est capable de le croiser avec un mot d’une des deux listes. Les mots positifs et négatifs qui servent à classer les tweets sont surlignés dans l’interface.
  • 27. UTILISATION DE L'OUTIL TWITRRATR  http://twitrratr.com/
  • 28.
  • 29. CONCLUSION  Le domaine d’opinion Mining est un nouvel axe de recherche permettant de faciliter et améliorer la vie quotidienne en analysant et classifiant les opinions et les sentiments des internautes.  Malgré l’existence de quelques travaux dans ce domaine, ils comportent tous des limites que notre application a pu lever :  Ils travaillent sur une seule source d’information : ‘twitter’,  Ils travaillent sur des commentaires de petite taille (tweet) qui ne peut pas dépasser 140 caractères,  La plupart des applications classent les commentaires en deux polarités (positive et négative),  La plupart des applications donnent le résultat en pourcentage, sans une représentation graphique,…ect.
  • 30. RÉFÉRENCES BIBLIOGRAPHIQUES  Abdelhamid DJEFFAL, (2012). Fouille de données avancée. Cours. Université Mohamed Khider de Biskra.  Antonio Machado, (2010). Chapitre2 : Le Web Usage Mining. thèse, INRIA.  Cheikh B., (2002). Etat de la connaissance sur le web usage mining Diplôme d’Etudes Approfondies. Université de Montpellier II.  Faiza Belbachir, (2010). Expérimentation de fonctions pour la détection d’opinions dans les blogs. Mémoire de master. Université de Paul Sabatier, Toulouse.  Grzegorz DZICZKOWSKI, (2008). Analyse des sentiments : système autonome d’exploration des opinions exprimées dans les critiques cinématographique. Thèse de doctorat. L’ECOLE NATIONALE SUPERIEURE DES MINES, PARIS.  HACÈNE CHERFI, (2004). Etude et réalisation d’un système d’extraction de connaissance à partir de textes. Thèse de doctorat. Université de Henri Poincaré Nancy I.
  • 31.  Jmal, J., (2012). ResTS : Système de Résumé Automatique des Textes d’opinions basé sur Twitter et SentiWorldNet. In Actes de la conférence conjointe JEP- TALN-RECITAL, volume 3 : RECITAL, pages 233-246, Gronoble, France.  Ladeg Hamza, (2012). Modélisation de connaissances du décideur pour le renforcement du processus KDD. Mémoire de magister, Ecole nationale supérieure d’informatique (ESI), Alger.  Nabila Merzoug et Hanane Bessa, (2009), Application du processus de fouille de données d’usage du web sur les fichiers logs du site cubba. Mémoire d’ingéniorat. Université de Bordj Bou Arréridj Algerie.  Nicolas BÉCHET, (2009). Extraction et regroupement de descripteurs morpho-syntaxiques pour des processus de Fouille de Textes. Thèse de doctorat. Univérsité Montpellier II.  Noureddine MOKHTARI, (2006). Extraction et exploitation
  • 32.  Fin.  Merci pour votre attention 

Notes de l'éditeur

  1. La subjectivité est une expression linguistique de quelqu’un : opinions, avis, sentiments, émotions, évaluations, croyances ou jugements personnel [40].
  2. L’importance de la détection d’opinion est présente dans plusieurs domaines, mais la plus grande application de l’Opinion Mining reste dans le monde du business, et du politique.
  3. Ici, nous présenterons et comparerons les principaux travaux réalisés dans le domaine de la fouille du Web et spécialement sur le réseau social Twitter.