Contenu connexe Similaire à تحلیل احساسات در شبکه های اجتماعی (20) تحلیل احساسات در شبکه های اجتماعی1. شبکه در احساسات تحلیلروش ، اجتماعی هایکاربردها و ها
عزیزی حامدوامرزانی*1
خادمی مریم ،2
1
نرم کامپیوتر مهندسی گروه،افزاردانشکدهفنیو،تهران ،اسالمی آزاد دانشگاه ،جنوب تهران مهندسیایران
2
ریاضی گروه استادیار،کاربردیدانشکدهایران ،تهران ،اسالمی آزاد دانشگاه ،جنوب تهران پایه علوم
1
st_h_azizi@azad.ac.ir , 2
khademi@azad.ac.ir
چکیده–شبکه محبوبیت و گسترشگوناگون اطالعات از ارزشمند منبعی به را مجازی جوامع این ،اخیر سال چند در افراد بین در اجتماعی های
و اجتماعی ،تجاری ،سیاسی.است نموده تبدیل ...نشان اطالعات ایندهندهوسیع دید در و فرد یک احساسات و افکارکشور یک و جامعه ،تر
استمی اطالعات این در کاوش با کهارزشی با بسیار دانش به توانحوزه درگوناگون های.نمود پیدا دستاطالعات از حجم این تحلیل است واضح
متنیکاربران یافته غیرساخت،روش نیازمندمتن بهینه و نوین هایپ و کاویطبیعی زبان ردازشاست.
شبکه در احساسات تحلیل کاربردهای معرفی از پس مقاله این درروش آخرین ،اجتماعی هایراه و هاکارهافارسی زبان در ویژه بهمورد و معرفی
گرفت خواهد قرار بررسی.
واژه کلید-متن ،اجتماعی شبکهپردازش ،کاوی،طبیعی زبانطبقهبندی
1-مقدمه
گاهی و مشترک وجوه داشتن دلیل به جامعه در افراد
ارزششبکه و گذاشته تأثیر یکدیگر روی بر مشترک هایاز ای
آن بین در اعتماد و ارزشایجاد خاصی موضوعات برای ها
می.گردد
سایتهایشبکهاجتماعی هایداده برای مهمی منبعهای
مرباط .هستند کاربران طبیعی رفتار به وطالپروفایل عات،ها
موج پیوندهایودر دآندیدگاه ، هاشده مبادله یا منتشر های
تحلیل برای غنی منابعیبه شبکه گرانمی شمارآینبه تا د
الشاخص و رفتاری ،فکری گوهایکنش دیگر هایکا گریربران
یابند دست.عنوان بهنمگلدر ونه(Golderسال در )2002
مجمداده وعهم هایربه بوط322شده مبادله پیام میلیون4
میلیو ون200کا هزاررف بریسطی را بوک22و بررسی مورد ماه
زمان با وابسته موقتی الگوی به و دادند قرار تحلیل،رفتارهای از
سایت این در دانشجویانیافتند دست اجتماعی شبکه.[1]
شبکهاجتماعی هایفروشگاه واینترنتی هایمنبع به
ارزشزمینه در احساسات کاوش برای مندینظیر گوناگونی هایی
،مشتری با ارتباط مدیریتکاوش ،بازاریابی ،شناسی جامعهافکار
تبدیل ... و سیاست ،عمومیشدهان.درسیده اثبات به حقیقت این
د کهب انشهدستآشبکه از مدهو توییتر نظیر اجتماعی های
فیسبوکروش دیگر به نسبت باالتری ارزش مراتب بههای
افراد از فیزیکی مصاحبه و نظرسنجی مانند عقیده کاوش سنتی
این در زیرا ،دارندشبکه گونهخالص نظرات کاربران ًالمعمو ها
می ارائه را خودعاملی هیچ نوعی به و دهندت آن روی برأثیرگذار
.نیست
بهمی مردم اطالعاتی منبع این وسیلهتصمیمات توانند
صحیحبه توجه با تریافراد دیگر تجربیاتهمین در و کنند اتخاذ
می نیز خدمات یا و محصول صاحبان راستابه توجه با توانند
نظ این تحلیلبهبود را خود کیفیت عقاید و رات.بخشند
واضحاز بخشی حتی یا و تمامی بررسی و خواندن است
وقت کاری کاربران نظرات،است غیرممکن مواقعی در و گیر
عقیده حوزه در بنابراینو ساخت دنبال به پژوهشگران کاوی
نظرات و عقیده خودکار صورت به بتواند که هستند ابزاری بهبود
نوشته به توجه با را کاربرانکند استخراج آنان هاییک و
ذی به کلی وضعیت.بدهد نفعان
آمارها آخرین طبق[2]فیس اجتماعی شبکهزمان از بوک
سال در خود رسمی پیدایش2004توانسته تاکنون44/1
صفحه وارد بار یک حداقل ماهیانه که را فعالی کاربر میلیارد
می خود شخصیکاربران این ،کند جذب دنیا سراسر در را شوند
حدود دقیقه یک در000/41در وضعیت عنوان به را متنی بار
2. فیسمی بوکا بیش دقیقه یک همین در و نویسندز3میلیون
تأئنوشته روی بر را یدمی ثبت کاربران دیگر هایکنند[3].
توییتر اجتماعی شبکه در اماروزانه000نوشته میلیون
به )(توییت33می منتشر کاربران توسط دنیا زنده زبانشودو
فیس با مقایسه در میکروبالگر اینبرای متنی نظر از بوک
پژوهشگران،است برخوردار باالتری اهمیت ازیکیآن دالیل از
نوشته حروف تعداد محدودیتمی کاربران که است ایتوانند
و کنند ارسالاینکه دیگرًالمعمونوشته شبکه این درتوسط ها
برچسب کاربران خودگذاری(#hashtag)تا عوامل این شود می
بر کار پیچیدگی حدودیداده رویمی کاهش را ها.دهد
2-احساسات تحلیل تاریخچه و تعاریف
یک همگی که شده بیان مختلف مقاالت در زیادی تعاریف
تحلیل .دارند را واحد معنایاحساساتعقیده وکاویمعنی به
یک به راجع مردم منفی یا و مثبت احساسات شناخت و کشف
مسأاست محصول یا له[4].
که شکلی به عبارت یک از است عبارت عقیده تعریف اما
قسمت پنج دارای.باشد
است موجودیت یک نام :،شخص ،محصول یک (مانند
)...و خدمات ،شرکت ،رویداد.
از ویژگی یا جنبه یک :است.
:ویژگی به راجع عقیده گرایشمورد در
موجودیتیا و منفی ،مثبت حالت سه تواند می که است
.باشد داشته خنثی
عقیده صاحب :است.
توسط نظر که است زمانی :.است شده بیان
آن همگی وجوداین از یک هر نبود صورت در و بوده ضروروی ها
.شد خواهد رو روبه مشکل با تحلیل کار ،قسمت پنج
سال در حوزه این در کارها اولین از یکی1121توسط
کاربنل[0]شبیه مدل یک از وی ،شد معرفیشده سازی
می که کرد طراحی را کامپیوتریفرد یک سیاسی عقاید توانست
ح اززآمریکا سیاست به توجه با را کار محافظه یا و خواه آزادی ب
دی و شوروی وسیاست گربین هایمدل المللی.نماید سازی
اماعبارتاحساسات تحلیلدر[2]واصطالحعقیدهکاوی
در نیز[2]بار اولین برایبرده نامزبان اگرچه ،شدو شناسی
طبیعی زبان پردازش1
از قبل تا اما دارند تحقیقاتی طوالنی سابقه
سال2000پژوهش میالدیبا رابطه در محدودی بسیار های
.بود پذیرفته صورت احساسات تحلیل
سال در شاخه این در تحقیقات گسترشدالیل اخیر های
هر تقریبا آن کاربرد ًالاو ،دارد مختلفیحوزهمی شامل را ایشود
بهصاحبان ،بازار بودن رقابتی دلیل به صنعت بخش در ویژه
مشتریان نظرات از و نموده تحلیل را بازار ًالکام دارند نیاز مشاغل
این داشتن برای را زیادی هزینه هستند حاضر و باشند آگاه
به ،است تحقیقاتی چالشی حوزه یک ًاثانی دهند انجام اطالعات-
خصوصبه فارسی زبان درپیچیدگی دلیلجای آن خاص های
دارد زیادی کار[8].
و معرفی احساسات تحلیل پرکاربرد حوزه چند ادامه در
.گرفت خواهد قرار بررسی مورد تحقیقات آخرین
2-1-الکترونیک تجارت و بازاریابی
بیشپژوهش ترمی صورت حوزه این در که هاییپذیرد
بازار و تجارت به مربوطراه نهایت در زیرا ،است یابیبه کارها
خواه منتهی سوددهی افزایش و فروش بهبود و افزایشن.شد د
سال در که دیگری تحقیق2011آن در ،گرفت صورت
سایت اطالعات براساسoaToaTفروش بزرگ سایت یک که
تأثیر بررسی به است چین در الکترونیکی محصوالت آنالین
اجتماعی شبکه،اطالعات میزان جنبه سه از فروش شبکه بر
میزان دوم اجتماعی شبکه و فروش شبکه دو بین شده تبادل
است مایل فروشنده به اعتماد ازای به مشتری که باالتری قیمت
و نماید پرداختپیشمی احتمالی خریدار انتخاب بینیپردازد
[1].
محم نیز فارسی زبان درهمکاران و دی[10]راهرا کاری
کا یک نقد درجهتاحساسی واژگان شبکه از استفاده با ال2
که
روش از یکیاین در ،نمودند ارائه است احساسات تحلیل های
پیش مرحله در ابتدا سیستمداده پردازشو کلمات جداسازی با ها
برچسب ،جمالتریشه و سخن اجزای گذاری،کلمات یابی
می استخراج نقدها از نیاز مورد اطالعاتبعد مرحله در .شودبا
ویژگی استخراجویژگی از دسته آن ،نقدها از کاال هایاز که ها
بیش اهمیت کاربران نظرمی مشخص دارند تریویژگی .شوندهای
بهویژگی با مشابه باالیی دقت با آمده دستبوده کاال واقعی های
داده مجموعه احساسی بندی طبقه و،احساسی بار براساس
م صورت متن در موجود واژگانی.پذیرد
شبکه در ًالمعمو، را زیادی اطالعات کاربر ،اجتماعی های
نوشته بر عالوهعالقه عنوان به ، خود هایخصوصیات و مندی
می سیستم وارد شخصی.کنداین درشبکه بین ارتباط با جا
می جستجو موتور و اجتماعیکاال یک جستجوی از پس توان
پیشنها وی به را کاالیی ،کاربر توسطبراساس ًادقیق که داد د
3. عالقهمندیو داشته اظهار خود اجتماعی شبکه در که است هایی
دارد را کالهی خرید قصد کاربر ًالمث .است داده نظر آن مورد در
عالقه عنوان به را رنگی ًالاحتما وخود اجتماعی صفحه در مندی
سیستم ،جستجو موتور در وی جستجوی از پس ،کرده بیان
را کالهیمی پیشنهاد وی بهدیگر و رنگ با ًالکام که دهد
ویژگیبدین .است همسان ،داشته عالقه که هاییمشخص ترتیب
می پیدا افزایش بسیار خرید شانس که است.کند
در[11]دانش روی بر تحقیقاتشهرهای دبیرستان آموزان
که داد نشان نتایج است گرفته انجام رومانی مختلف10درصد
دانششبکه عضو آموزانًاتقریب و هستند اجتماعی های38درصد
آنآگهی تأثیر تحت هاشبکه در تبلیغاتی هایدو اجتماعی های
می خریداری را خدمت یا کاال سه تا.کنند
عده نیز بورس بازار و سهام عرصه درتحلیل از ایگران
عقیده از استفاده با سرمایه،شرکت یک به راجع کاربران کاوی
پیش را آن سهام قیمتمی بینیسایت وب در مثال برای کنند
sentdex.comشبکه در کاربران نظراتبه راجع اجتماعی های
و شود می داده نمایش و شده تحلیل و تجزیه بزرگ های شرکت
تحلیلای از استفاده با بازار گرانپیش اطالعات ندقیق بینیتری
می را.دهند انجام توانند
2-2-جامعه و سیاست
شاخصسیاست عرصه در احساسات تحلیل کاربرد ترین
سال انتخابات به مربوط2012می آمریکا.باشدانتخابات در البته
2008پایین سطح در مشابه تحقیقاتتیم .بود شده انجام تری
تبلیغاتیاستفاده با اوباماشبکه اطالعات ازبه ،اجتماعی های-
با ،آورد بدست را زیادی افراد رأی توانست ،توییتر خصوص
برچسب تعداد از استفادهحاوی ایالت هر در که هایی
#TeamObama tonightدر را وی محبوبیت میزان توانستند بود
آن ،دهند نشان وی رقیب با قیاساطالعات این از استفاده با ها
میتوانسایالت تندهدف هایمنظور بهبیش تبلیغاتترتعیین را
کردههم وآن قالب افکار به توجه با را وی سخنرانی متن چنین
کنند تنظیم شهر[12,13].
شکل1قبل توییتر از استفاده با مختلف های ایالت در اوباما محبوبیت میزان :
انتخابات از
همجداگانه مقاله دو در چنین[14,10]سال در2014و
2010تقریب با توانستند هندی و پاکستانی پژوهشگرانهای
پیش کاربران توییت از استفاده با را انتخابات برنده مختلفبینی
توییت حجم کردن مشخص از پس پاکستانی گروه .کنندهای
پیش عملیات ،نظر موردداده روی بر پردازشو دادند انجام را ها
خوب مدل ،موجود سیاسی حزب سه به توجه بایشبیه راسازی
پیش ،نمودندآن بینیاز استفاده با انتخابات از قبل روز چهار ها
پیش را خود احتمالی برنده و پذیرفت صورت دادگان اینبینی
آن حدس اما ،نمودندًالکام هاآن که حزبی و نشد واقع درستها
پیشبیش برنده از پس توانست بودند کرده بینیکرسی ترینرا ها
.کند خود آن از
هندیسال در ها2014حدود از استفاده با23میلیون
از توییت12حدود با ای شبکه ،کاربر میلیون40لبه میلیون
می که ساختندبا را انتخاباتی هر برنده توانستعقاید به توجه
نوشتهپیش هند در توییتر کاربران هایاصلی ویژگی ،کند بینی
آن سیستمآن تحلیل بودن بالدرنگ هامی لذا ،بود هادر توانستند
به موجود اطالعات به را نتیجه لحظه هردر ،نمایند روزرسانی
پیش نهایتآن بینیبا برابر ًادقیق انتخابات از قبل ماه دو از ها
نتی.بود انتخابات از بعد جه
توا محققان ،جامعه بعد در امانشده وارد متن تحلیل با ستند
شبکه در وی شخصی صفحه اطالعات دیگر و کاربر توسط
فیس اجتماعیمجموع در و زندگی از وی رضایت میزان ،بوک
کنند تحلیل را جامعه یک رضایت میزان[12].
3-اجت شبکه در احساسات تحلیلماعی
شکل در2توسط شده وارد متن احساسات تحلیل مراحل
مراحل این .است شده داده نشان اجتماعی شبکه یک در کاربر
تحلیلگر سیستم یک اجرای کلی اصولاستتشریح با ادامه در .
4. روش ،گام هر عمکلردقرار بررسی مورد آن اجرای مختلف های
.گرفت خواهد
شکل2–اجتماعی شبکه در کاربر احساسات تحلیل مراحل
3-1-ها داده پردازش پیش
مرحله دو در موردنظر متن ،کاربرد برحسب گام این در
آمادهمی سازینگارشی عالئم و لغات براساس جمله ابتدا ،گردد
منقطعکننده3
می تقسیمبرچسب سپس و شودمشخصه گذاری
کلمات دستوری4
.گردد می انجام
ًالمعمونگارشی خاص عالئم براساس جمله شکست اولین
مانند».«(،«;»،«،»،»!«،«؟»،)»:«جمله سپس و پذیرفته صورت
تشکیل کلمات بهمی تقسیم دهنده.گردد
برچسب در امابرچسب انتساب عمل گذاریبه واژگانی های
نشانه و کلماتمی صورت متن تشکیل هایاین واقع در پذیرد
برچسبکلمات نقش هامی مشخص را جمله درحالت در .سازند
روش کلیبرچسب هایمی تقسیم دسته دو به کلمات گذاری-
روش مجموعه اول دسته .گرددقاعده دوم دسته و آماری های
روش در .هستند محوراز احتمالی مجموعه یک آماری های
برچسببرچسب براساس و گردد می انتخاب کلمه یک برای ها-
ضریب مجاور هایمی محاسبه برچسب هر بودن صحیح احتمال
.گردد
روش در ًالمعمواز استفاده با ،محور قاعده غیرآماری های
برچسب در ابهامات رفع به قوانینگذاریمی پرداخته ها،شود
شده داده مدل به آموزش صورت به یا قوانین این مجموعهیا اند
بهسیستم .است گردیده معین دستی صورتحافظه های،محور
نمونه بیشینه احتمال تخمین روش و مارکوف مخفی مدلهایی
روش ازبرچسب هایدر مثال برای .هستند گذاری[12]
برچسبمارکوف مخفی مدل از استفاده با فارسی کلمات زنی
.است شده معرفی
3-2-ویژگی انتخاب
یک در یا و اجتماعی شبکه یک در کاربران که نظراتی
می محصول یک به راجع اینترنتی فروشگاهاست ممکن دهند
،مثبتجنبه یا ویژگی یک به قطبیت این .باشد خنثی یا و منفی
می داده نسبت موضوع یا محصول یک ازکاربری مثال برای .شود
می اجتماعی شبکه درنویسد"موبایل گوشی امروز !دوستان
فوق نمایش صفحه کیفیت خریدم جدیدالعادهآنتن اما دارد ای-
.نیست جالب آن دهی"بحث موضوع مثال این در"موبایل"
ویژگی و استیاجنبهموضوع این های"نمایش صفحه"و
"آنتندهی".است
مهم ازروش ترینهایمی ویژگی انتخابزیر موارد به توان
نمود اشاره[18]:
-متقابل اطالعات روش5
یکی که متقابل اطالعات روش در :
روش ازهر برای ،است سند در ویژگی کردن پیدا آماری های
کلمهxسند هر درyبیش و شده محاسبه مقداریا ترین
م اطالعات عنوان به ،مقادیر آن میانگینمنظور کلمه آن قابل
آن باالترین و شدهمی انتخاب ویژگی عنوان به هاچنان گرددچه
xوyمی صفر را زیر ضابطه مقدار ،باشند مستقل هم از.کند
-روش: Chi-square ( x2)براساس روش اینرابطه،زیر
روش مشابههایمی که است آماری دیگرآزمودن برای تواند
وابستگی میزانبه شده انتخاب کلمه یک،احتمالی ویژگی عنوان
مقایسه با را کار این که رود کار به گروه چند یا یک بینتعداد ی
نمونه واقعینمونه با ،گروه هر در شده مشاهده هایکه هایی
می انتظار ،احتمال یا تئوری مطابقمی انجام ،شوند دیده رود-
.دهد
-سند فراوانی6
:تعداد با برابر ،کلمه هر برای سند فراوانی
آن در کلمه آن که است سندهایی.است شده ظاهر ها
ضابطه این ،آموزش سندهای مجموعه در واحد کلمه هر برای
به ،دارند را آستانه مقدار باالترین که کلماتی و شده محاسبه
می انتخاب ویژگی عنواندادگان حجم برای روش این .شوند
بسیارمقیاس و بوده کارا نیز بزرگپیچیدگی دارای و است پذیر
.است آموزش سندهای تعداد با متناسب خطی
روش البتهدیگری زیاد هایهمانند متعدد مقاالت درنمایه-
سازیمعناییپنهان2
[11]مدل ،مخفیمارکوف[20]،تخصیص
5. دیریکلهپنهان8
[21]بیشآنتروپی ترینمقاله چندین در ... و
.است شده معرفی و استفاده
3-3-طبقهبندیکننده
سکند یکک یا جمله یک قطبیت تعیین جهت اصلی پردازش
می صورت مرحله این درطبقکه بخکش ایکن اصکلی هدف ،پذیرد-
سند یک یا جمله یک بندیبراساسحل راه .است آن قطبیتهکا
دس دو بهو ماشکین یکادگیری بر مبتنی کلی تهواژهتقسکیم نامکه
میان را عملی همان ًادقیق ابزارها .شودمی جامطبقکه ککه دهنکد-
بندیکنندهمتن سنتی کاربردهای در هادارند کاوی،آن دریک جا
طبقه از پس سندمی بندیتوانستدسته بههماننکد مختلف های
طبقه در اما گردد اضافه ... و علمی ،روزشی ،سیاسیبنکدیکننکده
دسته این ًالمعمو احساساتخنثکی و منفی ،مثبت گروه سه به ها
تبدیل.گردد می
طبقه درپیکره از که واژگان بر مبتنی بندیهکای1
و مختلکف
فر یالغت هنگ10
خاصمی استفادهشککل این به کلی روال ،شود
فعل ،اسامی مانند جمله یک در کلمه هر برای که استصفات ،ها
مکی صکورت جسکتجو احساسی واژگان شبکه در ،موجود قیود و-
در واژه آن که صورتی در و گیردبرچسکب ،باشکد موجکود شکبکه
می استخراج آن احساسیاز ککه قطبیتی با متناسب واژه هر ،شود
جملکه هکر بکرای ،گیرد می وزنی ،شده استخراج واژگان شبکهای
وزن مجموع نویسد می اجتماعی شبکه در کاربر کهبه توجه با ها
می محاسبه آن قطبیتبزرگ عددی اگر ،گرددآن باشد صفر از تر
ق جملهمی مثبت طبیتغیراین در و گیرددر منفکی جمله صورت
می گرفته نظرواژه یک وجود .شودتحلیکل سیسکتم یکک در نامکه
مکی ًاحتمک و نیسکت کافی اما است ضروری احساساتدر بایسکت
روش دیگر کنار.شوند برده کار به کننده تکمیل های
درشکل3روش انواع شده تالشطبقکه در که رایجی های-
بندی.شکود داده نمکایش دارد کاربرد متن در عقیده و احساسات
از تکنیک چهار ادامه درپرککاربردروش تکرینطبقکه هکایبنکدی
است شده معرفی[22].
شکل3-بندی طبقه های روش انواع
-پشتیبان بردار ماشین روش11
:SVMرده الگوریتم یک-
سال در که بوده نظارت تحت بندی1110الگوی تشخیص برای
.گرفت قرار استفاده مورد )(دوکالسه دودویی
یکSVMمیمثبت کالس یک ،کند جدا را کالس دو فقط تواند
L1(توسطy = +1می داده نشانمنفی کالس و )شودL2با (که
y = -1می داده نشانیک ،ورودی بردارهای فضای در .)شود
hyperplaneکردن تنظیم باy = 0خطی معادله زیر درتعریف
میشودشکل (همانند4)[22].
شکل4-hyperplaneتوسط شده ساختهSVMنمونه از فاصله بیشترین با-
منفی و مثبت متون های
روش مزایای ازًاخصوص ماشین یادگیری بر مبتنی های
SVMمیتوانایی به توانغیراحسا ًاذات که عباراتی تشخیصسی
هستندمی پیدا احساسی معنای جمله در امابرد نام کنند.هم-
می چنینبه با توانروش کارگیریرا مدل آموزش مختلف های
به.نمود بهینه خوبی
مدل در آن معایب از اما،گسترده هایمیبه توانوقتگیر
مدل آموزش بودنبودن وابسته وطبقه روش اینبندیدامنه به
کرد اشاره[23].
-: تصمیم درختدرخت ساختن برایتصمیم هاییک از گیری
می استفاده غلبه و تصمیم استراتژیمجموعه یک واقع در .شود
آن باید که داریم آموزشتقسیم رامجموعه یک برای .کنیم بندی
آموزشMبرچسب کلمات باکلمه باید شده گذاریtiبرای
تقسیمسپس .شود انتخاب آموزش مجموعه بندیMکهبراساس
ترمtiزیر دو به شده انتخابمی تقسیم مجموعه.شود
زیرمجموعهMi
+
دارایشامل که است کلماتیtiو هستند
زیرمجموعهMi
-
ترم که است اسنادی شاملtiآن در.نیست ها
برای را فرآیند همینMi
+
وMi
-
می تکراررا کار این و کنیم
می ادامهزیرمجموعه یک در موجود اسناد همه که زمانی تا دهیم
کالس ًال(مث کالس یک به متعلقLc)باشندشونداین در که
کالس با برابر گره آن برچسب صورتمتناظرمی اسناد باو شود
6. می برگ به تبدیل گره آننمی تقسیم را آن دیگر و گرددیا کنیم
اینمی ادامه زمانی تا را فرآیند کهدهکلمه دیگر که یمبرای ای
تقسیمزیرمجموعه بندیصورت این در که باشد نداشته وجود ها
می آن روی را برچسبیآن ،بخش آن اسناد اکثریت که گذاریم
قوانین از درخت یک فرآیند این طبق بنابراین .دارند را برچسب
برگ کهکالس با متناظر هابه هستند هادستمی.آید
-س بیزین روشاده12
:روش از یکییادگیری معمول های
از بسیاری آن بودن احتمالی و سادگی دلیلی به و بوده ماشین
دسته در روش این از پژوهشگرانمی استفاده بندی.کنند
مهم ازویژگی تریندر بودن مقاوم و سادگی روش این های
ویژگی مقابلبا روش این .است شده انتخاب نامرتبط های
از استفادهدادهویژگی و آموزش هایتخمین به ،شده انتخاب های
.پردازد می جمله آن قطبیت احتمال
4-فارسی زبان در احساسات تحلیل مشکالت و مسائل
پژوهش از بسیاریتحلیل حوزه در گرفته صورت های
نسبت به و است بوده انگلیسی زبان به معطوف دنیا در عواطف
کم کارهایزبان دیگر در تریان هادر محققان ویژه به ،شده جام
پیچیدگی دلیل به فارسی زبانچالش با ،آن خاصی هایهای
بیش.هستند رو به رو تری
به احساسات تحلیل مشکالت و مسائل مورد چند ادامه در
.است شده ذکر فارسی زبان
-دارد نوشتن فرم چهار یا سه فارسی زبان در حروف از بسیاری
در استثناعات تعداد و.است زیاد کلمات
-هم و مختلف پیشوندهای و پسوند وجودآواها از بعضی چنین
شده فارسی زبان وارد عربی زبان از کهاز بعضی است ممکن ،اند
ًالمث ،نشوند نوشته نیز برخی در و نوشته مواقع"،مسأله ،مسئله
مساله".
-مشکالت از دیگر یکی،فارسی جمع کلمات در فواصل بحث
کلم استه"رنگها"دیگر شکل دو به است ممکن"ها رنگ"و
"رنگها".شود نوشته کاربر توسط
-بیش فارسی زبان در امالیی اشتباهاتمعنای ممکن و بوده تر
کند عوض ًالکام را کلمات[8].
-مشکالت دیگر از،و غیررسمی کلمات از کاربران استفاده
هم .است رسمی نوشتن جای به عامیانهچنیناست ممکن
نوشتههمان را خود هایمی که طورکند تایپ گوید.
5-نتیجهآینده کارهای و گیری
پژوهش آخرین مطالعه براساس شد سعی مقاله این دردر هکا
شکاخص بکر مختصر مروری ،احساسات تحلیل حوزهآن تکرینهکا
.باشد داشته
ازمیانمهمًاخصوصک احساسکات تحلیل در که مباحثی ترین
بیش کار جای فارسی زبان درمی ،دارد را تریرا زیکر مکوارد توان
:برشمرد
-همکواره فارسکی زبکان در کلمکات ریشه کردن پیدا روی بر کار
بیش تحقیق ،است چالش از پر مبحثیباعکث زمینکه ایکن در تکر
طبقه و ویژگی انتخاب دقت افزایش.شد خواهد بندی
-کاربردی و گسترش باابزار شدن ترداده کالن مدیریت های13
می ،دنیا درروش از بسیاری توانزبان در احساسات تشخیص های
ابزارها در را فارسیمانند آن خاص یهدوپ14
پیاده ... وسازی
.نمود
-روش از یکیمدل برای آماری هایاز استفاده کلمات سازی
آماری مدلn-gramمی .استمقیاس بردن باال برای توانپذیری
وروش از یکی ،موازی اجرایدر را فارسی زبان در آن های
نگاشت چارچوب-کاهش10
پیاده.نمود سازی
-میداده ساختار روی بر تحقیق با توانواژه بر مبتنی های،نامه
راه این از یکی داد کاهش را آن در جستجو زمانمی کارهاتواند
پیادهداده پایگاه در سازیهایNoSql12
.باشد
-تادر احساسات تحلیل کاربردهای به راجع پژوهشی هیچ کنون
شبکهدر عقاید تحلیل و سیاست عرصه در اجتماعی های
شبکهعنوان از یکی ،است نگرفته صورت اجتماعی هایهای
می مناسب.باشد شاخه این در پژوهش تواند
مراجع
[1رسانه دانش ارتقای ]شبکه طریق از ایکتاب اجتماعی هایحق مریم ،محورمریم و شناس
شماره ،ششم سال ،رسانه دانش ،خادمی22شماره ،جدید دوره13مرداد ،1313
[2] Statista. Facebook number of monthly active users worldwide
2015; Available from:
http://www.statista.com/statistics/264810/number-of-monthly-
active-facebook-users-worldwide/.
[3] GEOFF. Just One Minute On Facebook
JUNE 11, 2014; Available from: http//:wersm.com/just-one-minute-on-
facebook-infographic/.
[4] Adedoyin-Olowe, M.M.G., Mohamed; Stahl, Frederic, A Survey
of Data Mining Techniques for Social Media Analysis. eprint
arXiv, 2014. 1312.4617.
[5] Carbonell, J.G., Subjective Understanding: Computer Models of
Belief Systems, in PhD thesis. 1979.
[6] Nasukawa, T. and J. Yi, Sentiment analysis: capturing favorability
using natural language processing, in Proceedings of the 2nd
international conference on Knowledge capture. 2003, ACM:
Sanibel Island, FL, USA. p. 70-77.
7. [7] Dave, K., S. Lawrence, and D.M. Pennock, Mining the peanut
gallery: opinion extraction and semantic classification of product
reviews, in Proceedings of the 12th international conference on
World Wide Web. 2003, ACM: Budapest, Hungary.
[8] Mohammad Ehsan Basiri , A.R.n., Nasser Ghassem-Aghaee A
Framework for Sentiment Analysis in Persian. Open Transactions
on Information Processing, 2014. 1(3): p. 1-14.
[9] Stephen.G, M.W., Jure.L, The role of social networks in online
shopping :information passing, price
of trust, and consumer choice. EC '11 Proceedings of the 12th ACM
conference on Electronic commerce
Pages 157-166 .ACM 2011, 2011.
[10],محمدیاحساسی واژگان شبکه از استفاده با کاال نقد در کاوی عقیده,کنفکرانس دومین
سیستمها و صنایع مهندسی ملی.1312.
[11] Fuciu, M., and Hortensia Gorski, Marketing Research Regarding
the Usage of Online Social
Networking Sites by High School Students. Procedia Economics and
Finance 6 2013: p. 482-490.
[12] Lewis, R. US Election 2 0: Twitter is big winner as Obama is re-
elected for second term. Wed, Nov 7, 2012 [cited 2015; Available
from: https://uk.news.yahoo.com/us-election-2012--twitter-is-big-
winner-as-obama-is-re-elected-for-second-term-
07112012.html#3DCuuBb.
[13] S. Chandrasekar, E.C., and A. Ginet, Predicting the US
Presidential Election using Twitter data, in CS 229 Machine
Learning Project report. 2012: Stanford University.
[14] Razzaq, M.A., A.M. Qamar, and H.S.M. Bilal. Prediction and
analysis of Pakistan election 2013 based on sentiment analysis. in
Advances in Social Networks Analysis and Mining (ASONAM),
2014 IEEE/ACM International Conference on. 2014.
[15] Kagan, V., A. Stevens, and V.S. Subrahmanian, Using Twitter
Sentiment to Forecast the 2013 Pakistani Election and the 2014
Indian Election. Intelligent Systems, IEEE, 2015. 30(1): p. 2-5.
[16] Collins, S., et al., Are You Satisfied with Life?: Predicting
Satisfaction with Life from Facebook, in Social Computing,
Behavioral-Cultural Modeling, and Prediction, N. Agarwal, K. Xu,
and N. Osgood, Editors. 2015, Springer International Publishing.
p. 24-33.
[71],عربپنهکان مکدلهای کمک به فارسی واژگان دستوری برچسبزنمکارکوف,سکیزدهمین
ایران کامپیوتر انجمن ساالنه کنفرانس.1382کامپیوتر انجمن ,-:شکریف صنعتی دانشگاه
.کیش جزیره
[18] Liu, B. and L. Zhang, A Survey of Opinion Mining and Sentiment
Analysis, in Mining Text Data, C.C. Aggarwal and C. Zhai,
Editors. 2012, Springer US. p. 415-463.
[19] Poshyvanyk, D., et al. Combining Probabilistic Ranking and
Latent Semantic Indexing for Feature Identification. in Program
Comprehension, 2006. ICPC 2006. 14th IEEE International
Conference on. 2006.
[20] Rustamov, S., E. Mustafayev, and M.A. Clements. Sentiment
analysis using Neuro-Fuzzy and Hidden Markov models of text. in
Southeastcon, 2013 Proceedings of IEEE. 2013.
[21] Shams, M., A. Shakery, and H. Faili. A non-parametric LDA-
based induction method for sentiment analysis. in Artificial
Intelligence and Signal Processing (AISP), 2012 16th CSI
International Symposium on .2012.
[22] Walaa Medhat , A.H., Hoda Korashy, sentiment analysis
algorithms and application: A survey. Ain Shams Engineering
Journal, 2014. 5: p. 1093–1113.
[23] Basiri, M., A. nilchi, and N. Ghassem-Aghaee, A Framework for
Sentiment Analysis in Persian. Open Transactions on Information
Processing, 2014: p. 1-14.
1
Natural Language Processing
2
Sentiment Lexicon
3
Stop words
4
POS Tagging
5
Mutual Information
6
Document Frequency
7
Latent Semantic Indexing (LSI)
8
Latent Dirichlet Allocation (LDA)
9
Corpus
10
Dictionary
11
Support Vector Machin
12
Naive Bayes
13
Big data
14
Apache Hadoop
15
Map Reduce
16
Not Only SQL