SlideShare une entreprise Scribd logo
1  sur  35
Télécharger pour lire hors ligne
‫مدلی برای تحلیل و تولید متن وبلگ‬


            ‫فرزانه سرافراز‬
      ‫استاد راهنما: دکتر شیری‬
       ‫استاد مشاور: دکتر عزمی‬

              ‫بهمن ۵۸۳۱‬
‫پدیدههای زبانی قرن حاضر‬
   ‫گسترده شدن ه جهانی اینترنت و روشهای تبادل اطلعات‬
                                       ‫شبک‬                                  ‫●‬


‫عمومی شدن خدمات کامپیوتری و آشنایی بیشتر مردم با ابزارهای‬                   ‫●‬


                                                             ‫کامپیوتری‬
 ‫استاندارد شدن خطها و زبانهای مختلف برای ه الکترونیکی‬
            ‫مبادل‬                                                           ‫●‬

                                                            ‫یونیکد‬      ‫–‬
                                             ‫اهمیت زبانهای مادری‬        ‫–‬
                                        ‫پیدایش نرمافزارهای محلیشده‬      ‫–‬

 ‫افزایش سریع حجم دادههای نوشتاری و گفتاری زبانهای مختلف‬                     ‫●‬

‫۰۱میلیون پیام کوتاه در ایران (گزارش مخابرات) با ۰۶۱ نویسه در هر کدام‬    ‫–‬
  ‫با افزایش تعداد نویسههای پیام کوتاه به ۰۰۸ نویسه پنج برابر خواهد شد‬   ‫–‬
‫پیامدهای این وضعیت‬

            ‫تأثیر روی واژگان و ویژگیهای ساختی زبانهای مختلف‬          ‫●‬


        ‫فراهم شدن حجم عظیم دادههای زبانی به صورت الکترونیکی‬          ‫●‬

                                  ‫منبع مهم تجزیه و تحلیل زبانی‬   ‫–‬

‫زیاد شدن اهمیت پردازش دادههای زبانی برای دستیابی به سیستمهای‬         ‫●‬


                                           ‫مختلف فنآوری زبان‬
                                     ‫پردازش زبان طبیعی ‪NLP‬‬       ‫–‬
                                     ‫ن شناسی محاسباتی ‪CL‬‬‫زبا‬      ‫–‬
‫پردازش زبان طبیعی (‪)NLP‬‬

                                 ‫زیرشاخ ‌ی‌هوش‌مصنوعی‌و‌زبا ‌شناسی‬
                                       ‫ن‬                      ‫ه‬                     ‫●‬

                   ‫مسأله+‌تولید‌و‌درک‌زبانهای‌طبیعی‌انسان: انگلیسی‌و‌...‬            ‫●‬




                                                   ‫سیست ‌های‌تولید‌زبان‌طبیعی‬
                                                                       ‫م‬        ‫–‬
                                 ‫● اطلعات‌پایگاه‌داد‌ها‌←‌زبان‌طبیعی‌انسان‬
                                                      ‫ه‬
                                                  ‫سیست ‌های‌درک‌زبان‌طبیعی‬
                                                                       ‫م‬        ‫–‬
‫● زبان‌طبیعی‌تولیدشده‌توسط‌انسان‌←‌نمایش‌فرمال‌قابل‌استفاده‌برای‌کامپیوتر‬
‫مسائل اصلی در پردازش زبان طبیعی‬

                                                          ‫تولید گفتار‬    ‫●‬

          ‫تبدیل اشکال مختلف نمایش اطلعات به صوت گفتار طبیعی‬
                      ‫>‬                                              ‫–‬
                                                 ‫● متن به گفتار‬
                                       ‫● نشانههای آوایی به گفتار‬
                        ‫● سایر اشکال نمایش زبانشناسی به گفتار‬
                                                          ‫کاربردها‬   ‫–‬
   ‫● کودکان و دسترسیپذیری برای کسانی که مشکل خواندن دارند‬
                                 ‫● سیستمهای هوشمند مخابراتی‬
           ‫● کاربردهای‌دیگر‌در‌رابط +‌متقابل‌انسان‌و‌کامپیوتر‬
                                   ‫ه‬
‫مسائل اصلی...‬

                                                       ‫بازشناسی‌گفتار‬     ‫●‬

             ‫تشخیص‌گفتاری‌که‌انسان‌تولید‌کرده‌و‌انجام‌عمل‌متناسب‬      ‫–‬


           ‫‪ ‬تبدیل‌گفتار‌به‌متن‌(از‌جمله‌در‌کاربردهای‌دسترس ‌پذیری)‬
                 ‫ی‬
                      ‫‪ ‬کاربردهایی‌مثل‌شمار‌گیری‌خودکار‌تفن‌همراه‬
                                            ‫ه‬
‫‪ ‬تشخیص‌نام‌شهر‌و‌استان‌و‌شماره‌تلفن‌در‌سیست ‌های‌هوشمند‌مخابراتی‬
                    ‫م‬
‫مسائل اصلی...‬

                                  ‫بازیابی اطلعات‬      ‫●‬

‫جس ‌وجو‌به‌دنبال‌اطلعات‌در‌مدارک‌و‌پروند‌ها‬
  ‫ه‬                                      ‫ت‬        ‫–‬
        ‫جس ‌وجو‌به‌دنبال‌خود‌مدارک‌و‌پروند‌ها‬
          ‫ه‬                              ‫ت‬        ‫–‬
  ‫جس ‌وجو‌به‌دنبال‌اطلعات‌متا‌در‌مورد‌مدارک‬
                                         ‫ت‬        ‫–‬
                    ‫جس ‌وجو‌در‌پایگا‌های‌داده‬
                            ‫ه‬            ‫ت‬        ‫–‬
                                           ‫و...‬   ‫–‬
‫مسائل اصلی...‬

                                    ‫پاسخ‌به‌سؤال‬     ‫●‬

                      ‫– نوع‌خاصی‌بازیابی‌اطلعات‬
   ‫– به‌عنوان‌گام‌بعدی‌پس‌از‌موتورهای‌جس ‌وجو‬
       ‫ت‬
                                    ‫– دو‌نوع‌اصلی:‬
                                  ‫‪ ‬دامن +‌محدود‬
                                         ‫ه‬
             ‫– سؤالت‌شکل‌تعری ‌شده‌دارند‬
                      ‫ف‬
              ‫– جس ‌وجو‌در‌پایگاه‌داده‌است‬
                                     ‫ت‬
                                 ‫ه+‌نامحدود‬
                                          ‫‪ ‬دامن‬
                   ‫– هر‌سؤالی‌م ‌توان‌پرسید‬
                             ‫ی‬
‫– جس ‌وجو‌در‌شبک +‌اینترنت‌و‌با‌منابع‌زیاد‬
                        ‫ه‬            ‫ت‬
‫مسائل اصلی...‬

                      ‫خلص ‌سازی‌خودکار‬
                                 ‫ه‬            ‫●‬


               ‫غل ‌یاب‌و‌ویراستار‌خودکار‬
                                    ‫ط‬         ‫●‬

                                  ‫املیی‬   ‫–‬
                                ‫دستوری‬    ‫–‬
            ‫ویرایش‌متون‌در‌چاپ‌و‌نشر‬      ‫–‬
     ‫کم ‌کنند +‌نوشتن/خواندن‌زبان‌خارجی‬
                             ‫که‬           ‫–‬
‫مسائل اصلی...‬

                                                  ‫تولید زبان طبیعی‬      ‫●‬

              ‫برنامههای ساده مثل‌طال ‌بینی‌یا‌نام ‌نگار ‌های‌رسمی‬
                        ‫هی‬                 ‫ع‬                        ‫–‬
                           ‫برنام ‌های‌پیچیده‌مراحل‌بیشتری‌دارند:‬
                                                           ‫ه‬        ‫–‬
 ‫● برنام ‌ریزی‌هوش‌مصنوعی‌برای‌متنی‌که‌قرار‌است‌تولید‌شود‬
                                                       ‫ه‬
                                             ‫● تعیین‌ساختار‌متن‬
                                          ‫● تعیین‌ساختار‌جملت‬
                                 ‫● مربوط‌کردن‌کلمات‌با‌مفاهیم‬
‫● مسائل‌مربوط‌به‌نحو‌(سینتکس)،‌ریخ ‌شناسی‌و‌دستور‌(گرامر)‬
                       ‫ت‬
                      ‫● مسائل‌مربوط‌به‌نقط ‌گذاری‌و‌رس ‌الخط‬
                           ‫م‬             ‫ه‬
‫روشهای اصلی در علوم شناختی‬

‫دو روش اصلی متفاوت برای پردازش زبان طبیعی و به طور خاص تولید‬              ‫●‬


                                                           ‫زبان طبیعی‬
           ‫روش تکوینی یا منطقی (‪)rational or formalist approach‬‬       ‫–‬
                               ‫روش تجربی (‪)empirical approach‬‬         ‫–‬

 ‫در روش تکوینی به دنبال اطلعات تحلیلی هستیم که بدون استفاده از‬            ‫●‬


                                     ‫دادههای تجربی به دست میآیند‬
              ‫در روش تجربی ارزش زیادی به دادههای زبانی میدهیم‬             ‫●‬

                     ‫از نظریهپردازان روش تجربی: نوام چامسکی، ن شناس‬
                           ‫زبا‬                                        ‫–‬
   ‫در سالهای اخیر روش تجربی بین دانشمندان اهمیت زیادی پیدا کرده است‬   ‫–‬
‫نقش پیکره‬

‫مهمترین ابزار مورد نیاز برای حل مسائل مختلف به روش تجربی در حیطه‬   ‫●‬


                    ‫پردازش زبان طبیعی وجود پیکره زبانی بزرگ است‬
    ‫در زبان فارسی با رشد ک ‪N‬ی وبلگهای فارسی چنین پیک ه متنیای در‬
              ‫ر‬                         ‫م‬                          ‫●‬


                                               ‫اینترنت وجود دارد‬
   ‫«وبلگ یک قالب روزنامهنگاری برخط است که به ترتیب زمانی عکس‬       ‫●‬


‫منتشر میشود، مرتب‪ V‬بهروز میشود، و نوع‪ V‬شامل تفکرات و تأملت شخصی،‬
                          ‫ا‬                   ‫ا‬
   ‫زندگی روزمره، مقالت، نظرات دیگران، و پیوند به صفحات وب است.»‬
‫راهحلهای پیشین برای مسائل کلسیک‬
         ‫پردازش زبان و مسائل خاص زبان فارسی‬
                                                           ‫مشکلت فنی و ساختاری‬           ‫●‬

                                               ‫قالبهای گوناگون پروندههای کامپیوتری‬   ‫–‬
                          ‫● زرنگار، کلک، نشر الف، لت>ک، پیدیاف، و‪Q‬رد مایکروسافت‬
‫– حتی نسخههای «فارسیشده»ی مختلف و‪Q‬رد فارسی را یک جور پشتیبانی نمیکنند‬
                                 ‫● تبدیل این قالبها به تصویر برای سازگاری بیشتر‬
                                              ‫برتری قالب ‪( xml‬از جمله صفحات وب)‬      ‫–‬
                      ‫● قالب استاندارد ←‌امکان‌استفاده‌از‌تجزی ‌گرهای‌استاندارد‬
                                      ‫ه‬
                                         ‫● پشتیبانی‌و‌ب ‌روزرسانی‌از‌سوی‌‪w3c‬‬
                                                                  ‫ه‬
                     ‫● تعداد‌زیاد‌کاربران‌که‌هر‌روز‌به‌دامن +‌آنها‌افزوده‌م ‌شود‬
                         ‫ی‬              ‫ه‬
                                 ‫● توانای ‌ها‌و‌امکانات‌زیاد: قابلیت‌نمایش‌و‌چاپ‬
                                                                        ‫ی‬
                        ‫● قابلیت‌حمل‌روی‌کامپیوترها‌و‌سیست ‌عام ‌های‌گوناگون‬
                                      ‫مل‬
‫ی ها و نقاط تمایز وبلگ با سایر‬‫ویژگ‬
            ‫پیکرههای زبانی‬
                                 ‫زبان غیررسمی و محاورهای‬     ‫●‬


                        ‫مفاهیم و موضوعات محدود و تکراری‬      ‫●‬


             ‫وجود شکلک و پیوند به صفحات وب در بین متن‬        ‫●‬


                                        ‫نویسندگان مختلف‬      ‫●‬


    ‫استفاده از سیستمها و نرمافزارهای گوناگون برای حروفچینی‬   ‫●‬


                        ‫کدگذاریهای غیراستاندارد و مختلف‬      ‫●‬


                                      ‫رسمالخطهای متفاوت‬      ‫●‬


                         ‫کلمات خارج از دایره واژگان فارسی‬    ‫●‬
‫استاندارد خط در کامپیوتر‬

                                    ‫نویسه: کوچکترین واحد نوشته‬        ‫●‬

           ‫نویسه «ی» شکلهای اول، وسط، آخر تنها، آخر چسبان دارد:‬
                                                          ‫‪Y‬‬       ‫–‬
                                                 ‫●ی ی ی ی‬
‫استاندارد (منسوخ) ۰۰۹۲ موسسه استاندارد و تحقیقات صنعتی ایران‬          ‫●‬


‫ه اروپا‬
      ‫چندین کدگذاری مختلف برای دربرگرفتن ه ن های اتحادی‬
                  ‫هم زبا‬                                              ‫●‬


                         ‫این کدگذاریها با هم تعارض هم داشتند‬          ‫●‬


                  ‫تحریف دادهها هنگام عبور از ط های مختلف‬
                             ‫محی‬                                      ‫●‬
‫ک‪D‬د‬
                 ‫استاندارد یونی‬

                ‫کد یکتا به هر نویسه؛ مستقل از محیط، برنامه، زبان‬   ‫●‬


‫کار کردن یک وبگاه یا نرمافزار در ط های متعدد بدون ه اضافی‬
      ‫هزین‬              ‫محی‬                                        ‫●‬


                             ‫مورد قبول پیشتازان صنعت کامپیوتر‬      ‫●‬


         ‫استاندارد ۲۴۳۳ موسسه استاندارد و تحقیقات صنعتی ایران‬      ‫●‬
‫ک‪D‬د‬
  ‫استاندارد یونی‬

     ‫مجموعه سه های استاندارد خط فارسی‬
                              ‫نوی‬         ‫●‬

                              ‫کك‬      ‫–‬
                              ‫یي‬      ‫–‬
                               ‫ه‪ Y‬ة‬   ‫–‬
                              ‫۶۵۴‬     ‫–‬

                         ‫فا له بیعرض‬
                                ‫ص‬         ‫●‬

                             ‫خانهها‬   ‫–‬
                             ‫خانهها‬   ‫–‬

                          ‫اتصال مجازی‬     ‫●‬

                            ‫– ه . ش.‬
‫خلصه‪ E‬مراحل کاری‬

                    ‫مع آوری پیکره‬
                                ‫ج‬      ‫●‬


                   ‫استخراج متن خام‬     ‫●‬


                        ‫پیشپردازش‬      ‫●‬


                ‫تحلیل اطلعات زبانی‬     ‫●‬


                           ‫تولید متن‬   ‫●‬


                ‫ارزیابی متن تولیدشده‬   ‫●‬


            ‫بررسی امکانات ه طرح‬
                ‫توسع‬                   ‫●‬
‫جمعآوری پیکره‬

‫روش مطلوب: روشی که تا جای ممکن وبلگهای تصادفی را از روی وب‬                  ‫●‬


                                                            ‫بارگیری کند‬
                                                ‫استفاده از کارگزار پینگ‬     ‫●‬

        ‫هر وبلگ وقتی که بهروز میشود پیغامی به یک کارگزار پینگ میفرستد‬   ‫–‬
       ‫در بازههای زمانی معین فهرست وبلگهای بهروزشده را بارگیری میکنیم‬   ‫–‬

‫بارگیری صفحات مرتبط با دنبال کردن پیوندها و با استفاده از خزنده وب‬          ‫●‬


              ‫جدا کردن وبلگهای فارسی: استفاده از روش مکاشفهای‬               ‫●‬

                                        ‫عه‪ Y‬نویسههای خط فارسی‬   ‫مجمو‬    ‫–‬
                        ‫تمییز از صفحات عربی، اردو، پشتو، کردی، کشمیری‬   ‫–‬
‫استخراج متن خام‬

                ‫دستهبندی صفحات بارگیریشده‬           ‫●‬


 ‫تشخیص انواع برچسبهای بهکار رفته در صفحه‬            ‫●‬


‫تشخیص آشغال از نظر موتور پردازش زبان طبیعی‬          ‫●‬

                                   ‫سرصفحهها‬     ‫–‬
      ‫کدنوشتههای جاوااسکریپت، ایاسپی، پیاچپی‬    ‫–‬
                                        ‫پیوند‬   ‫–‬
                           ‫عبارتهای غیرفارسی‬    ‫–‬
               ‫پروندههای تصویری (شکلکها و...)‬   ‫–‬
‫استخراج متن خام‬

                        ‫پیدا کردن متن هر مطلب و جدا کردن آن از‬       ‫●‬

                                                 ‫عنوان صفحه‬      ‫–‬
                                                 ‫عنوان مطلب‬      ‫–‬
                                                     ‫حاشیهها‬     ‫–‬
                                                 ‫شرح پیوندها‬     ‫–‬
                                                          ‫و...‬   ‫–‬

‫نیاز به روش جداگانه برای هر سرویسدهنده، و حتی هر قالب طراحیشده‬       ‫●‬


‫هدف: بهینه کردن جوابهای درست، بیتوجه به مطلب آشغال تشخیص‬             ‫●‬


                                  ‫داده شده (‪)false negative‬‬
‫پیشپردازش‬

‫تبدیل سه های غیرمجاز به سه های یونیکدی صحیح فارسی‬
                         ‫نوی‬               ‫نوی‬          ‫●‬


                                 ‫حذف نویسه کشـیـده‬      ‫●‬


                                         ‫حذف ‪n‬عراب‬
                                             ‫ا‬          ‫●‬


                        ‫حذف تنوین (شدید‪V‬ا ←‌شدیدا)‬      ‫●‬


                                 ‫حذف ساک ‪ o‬و تشدید‬
                                         ‫ن‬              ‫●‬


                      ‫حذف ء از آخر کلماتی مثل شهداء‬     ‫●‬


                                  ‫یکنواخت کردن ارقام‬    ‫●‬


                        ‫تبدیل رشتههای ه ة هی ه ی به ه‬   ‫●‬
‫پیشپردازش‬

‫حذف فاصله و اضافه کردن فاصلهی مجازی در رشتههای «می »، «بر‬       ‫●‬


         ‫می»، «برمی »، «درمی »، «در می »، «نمی »، و «بی »‬
                                        ‫می روند ←‌م ‌روند‬
                                            ‫ی‬               ‫–‬

‫حذف‌فاصله‌و‌اضافه‌کردن‌فاصل ‌ی‌مجازی‌در‌رشت ‌های‌« ها»،‌«‬
            ‫ه‬                 ‫ه‬                                 ‫●‬

                    ‫های»،‌« هایی»،‌« هایم»،‌« هایت»،‌و...‬
                        ‫چسباندن‌«تر» و‌«ترین» به‌آخر‌کلمات‬      ‫●‬

                                 ‫یکنواخت‌کردن‌نقط ‌گذار ‌ها‬
                                   ‫هی‬                           ‫●‬
‫تحلیل متن‬

                              ‫تشخیص واژه‬       ‫●‬

 ‫تعریف گرافیکی واژه ←‌رس ‌الخ ‌های‌مختلف‬
          ‫مط‬                               ‫–‬
                             ‫● می‌توان‬
                             ‫● شده‌است‬
                                ‫● شد‌ام‬
                                  ‫ه‬
                           ‫● دربرابرباد‬
                  ‫شک ‌های‌مختلف‌نگارش‬‫ل‬     ‫–‬
             ‫● مسوول،‌مسؤول،‌مسئول‬
                          ‫● پاییز،‌پائیز‬
‫واژه‬

               ‫نوع خاص متن مورد بررسی‬              ‫●‬

               ‫منو گرفته، گرفتهتم، گرفتتم‬      ‫–‬
                            ‫غلطای املیی‬        ‫–‬
                   ‫این لینکو، منو برد خونه‬     ‫–‬
                               ‫منو دوستام‬      ‫–‬
‫خودمون، چشمهایشان، بهش، بهاش، براتون‬           ‫–‬
                   ‫برام مسخرست، اوضاش‬          ‫–‬
                             ‫وااااای، اووووه‬   ‫–‬
‫رتبه/بسامد‬
 ‫1‬     ‫و‬   ‫8767‬   ‫8767‬
                                    ‫واژگان را بر حسب تعداد‬        ‫●‬
 ‫2‬    ‫از‬   ‫7605‬   ‫43101‬
 ‫3‬   ‫به‬    ‫6274‬   ‫87141‬      ‫تکرارشان در پیکره مرتب میکنیم‬
 ‫4‬   ‫در‬    ‫1134‬   ‫44271‬
                                                 ‫قانون زیپف:‬
 ‫5‬    ‫را‬   ‫1353‬   ‫55671‬                                           ‫●‬

 ‫6‬   ‫که‬    ‫1043‬   ‫60402‬        ‫حاصل ضرب رتبه در بسامد عدد‬     ‫–‬
 ‫7‬   ‫این‬   ‫3992‬   ‫15902‬
                                                  ‫ثابتی است‬
 ‫8‬   ‫که‬    ‫5452‬   ‫06302‬
 ‫9‬   ‫هم‬    ‫7052‬   ‫36522‬
‫01‬   ‫است‬   ‫2912‬   ‫02912‬
‫رتبه/بسامد‬
            ‫00001‬

                                                          ‫قانون زیپف‬       ‫●‬

                                                       ‫با استفاده از‬
            ‫0001‬                                                       ‫–‬
                                                          ‫۴۰۷۰۱۲‬
‫‪Frequency‬‬




                                                       ‫واژه از پیکره‬
             ‫001‬




              ‫01‬




               ‫1‬
                    ‫01‬   ‫001‬   ‫0001‬   ‫00001‬   ‫000001‬

                               ‫‪Rank‬‬
‫تولید متن‬

    ‫فرض: رفتار گذشته راهنمای خوبی برای چیزی است که در آینده رخ‬             ‫●‬


                                         ‫خواهد داد ←‌مدل‌باثبات‌است‬
                                                    ‫پی ‌بینی‌واژ +‌بعدی‬
                                                         ‫ه‬         ‫ش‬       ‫●‬

                                  ‫تلش‌برای‌تقریب‌زدن‌تابع‌احتمال‌زیر‬   ‫–‬



       ‫(1-‪n| w1,…, wn‬‬
  ‫‪●P)w‬‬


‫برپای +‌اینکه‌مقدار‌زیادی‌به‌مت ‌ها‌نگاه‌کرد‌ایم،‌تخمینی‌از‌احتمال‌رخداد‬
                           ‫ه‬           ‫ن‬                         ‫ه‬         ‫●‬

                                    ‫دنبال ‌های‌مشخص‌از‌واژ‌ها‌داریم‬
                                             ‫ه‬                    ‫ه‬
‫مدل ‪-n‬نگاشتی‬

‫ه متنی را تا جای ممکن بزرگ فرض کنیم‬
                                  ‫مطلوب است ه تاریخچ‬
                                         ‫دنبال‬                           ‫●‬

      ‫ممکن نیست، چون اغلب جملهای میشنویم که تا به حال نشنیدهایم‬      ‫–‬

‫فرض مارکوف: فقط بافت موضعی پیشین بر ژه بعدی اثر میگذارد‬
                  ‫وا‬                                                     ‫●‬


                                                     ‫مدل ‪-n‬نگاشتی‬        ‫●‬

                ‫هر دنباله به طول ‪ n‬از واژگان را یک ‪-n‬نگاشت مینامند‬   ‫–‬

             ‫میخواهیم ‪n‬های ‪ -n‬ت هایمان نسبت‪ V‬بزرگ باشند‬
                        ‫ا‬             ‫نگاش‬                               ‫●‬

                           ‫پیچیدگی محاسباتی (رشد نمایی با رشد ‪)n‬‬     ‫–‬
                                        ‫کوچک شدن ظرفهای نمونه‬        ‫–‬
‫روش تولید‬

   ‫بررسی فرایند تولید با مدل ‪-n‬نگاشتی با ‪n‬های برابر ۰، ۱، ۲، و ۳‬   ‫●‬


                                     ‫استفاده از تخمینگر ‪MLE‬‬        ‫●‬




‫استفاده از قانون لپلس برای قرار دادن یک احتمال کوچک (غیرقابل‬       ‫●‬


                      ‫تنظیم) برای پیشامدهای تاکنونمشاهدهنشده‬
‫نتیجهگیری‬

                                              ‫نگاه به اعداد از دید زبانشناختی‬         ‫●‬

                         ‫مغرب در سه شنبه شانزدهم خرداد ۵۸۳۱ ساعت ۰۰:۰۲‬            ‫–‬

‫با وجود بیقاعدگیهای نحوی دنبالههای نسبت‪ V‬طولنی با ساخت نحوی قابل‬
                        ‫ا‬                                                             ‫●‬


                                            ‫قبول و محتوای یکنواخت تولید شد‬
‫مگر در هر ثانیه چند کلمه میتواند از میان لبان بیرون بریزیم تا بیانگر احساس درون‬   ‫–‬
                              ‫ام بود و هزار نامه هایم به رویاهایشان چنگ میزنند‬
                                                                                  ‫–‬
‫توسعه‪ E‬طرح‬

                                         ‫استفاده از دادگان فارسی‬   ‫●‬


     ‫استفاده از تحلیلگر نحوی تغییریافته برای این نوع خاص پیکره‬     ‫●‬


‫استفاده از تحلیلگر مورفولوژیک تغییریافته برای این نوع خاص پیکره‬    ‫●‬


    ‫ع سازی با یک نرمافزار انتشار وبلگ و انتشار برخط مطالب‬‫مجتم‬      ‫●‬


                      ‫خواندن نظرات دیگران و تولید پاسخ مناسب‬       ‫●‬


        ‫انتشار مطلب جدید در با ه های زمانی معقول متناسب با تعداد‬
                                        ‫ز‬                          ‫●‬


                        ‫بازدیدکنندههای صفحه و محتوای کامنتها‬
‫توسعه‪ E‬طرح‬

                  ‫سرزدن به وبلگهای دیگر، گذاشتن نظر، و تبادل پیوند‬      ‫●‬


  ‫اضافه کردن مطالب منتشرشده روی گ های دیگر و سایتهای خبری‬
                           ‫وبل‬                                          ‫●‬


 ‫مربوط به محتوا به مجموعهی دادههای آموزشی و تولید مطلب هماهنگ و‬
                                                   ‫مربوط به وقایع روز‬
‫استفاده از قالببندیهای ‪ ،html‬شکلک، پیوند، تصویر، و... برای شبیهتر شدن‬   ‫●‬


                 ‫به کارهایی که یک فرد هوشمند وبلگنویس انجام میدهد‬
‫امکان استفاده در حیطههای دیگر‬

                                                                                                 ‫●‬


‫تاریخچهی متن ‪ n‬یکسانی دارند در بارگیر ‪ n‬بازگشتی اجازهی آبونه شدن و پردازش دادهها، و بدون نزدیک‬
                                                       ‫ی‬                        ‫ی‬
 ‫شدن صف دیگر ۶67 -۴-۷-۱قانون زیپف اگر چنین ترکیباتی لزوم‪ V‬ل„‪ V‬به بخش روی جنبههای مختلف‬
                            ‫„ قب‬
                               ‫ا‬
‫برای فعل «دید» یک نمونه را بدون ایجاد میکنند، پیوندهای دائم به حروف اول فهرست وبلگهایی که‬
       ‫کم میکنند و «هی» در زیر یک قالب روزنامهنگاری برخط72 است ولی با فارسی صرف‪ V‬محاسباتی‬
                ‫ا‬
    ‫نگریست از رشتههای « و پشت سر هم که برآیندهای یک راه حل بهکاررفته در انتهای پاراگراف بال‬
‫ی شده حذف حرکتها و دستوری با‬‫بسامد در بازههای ۰۰۰۰۱ کلمهای بشماریم. تعداد وبلگهای بارگیر‬
 ‫تشخیص داد. این منظور، توجه خود تنوین حذف فاصله قبل و سوم به خوبی از همهی علئم نقطهگذاری‬
                                                                ‫را برمیشماریم و فهرست واژگان‬
‫؛)‬
  ‫باد دانه را بگرفت. نوشته دوست داره؟ بایدبگم من و عشقمه...!!!‬   ‫●‬

  ‫وقتی حرفهای مرا بر خواهیم خندید .بیا بی جواب تام خستگیهر روز‬
 ‫ده نفربت گفت هیچ کس دوست داشتنی ترین واژه برای ایجاد میط بدون‬
 ‫اندیشه و به هرجا که خیلی بی تودنیابامن چه آرزو وهزار رویای بی‬
‫تاب وتوان وبال وپرسوخته کنج قفس نانده باشد و مسدود کننده هستیم‬
  ‫میدانیم نا سلمتی خودت از عشقت پاسخ دادمتو اجازه دادی که قلبش‬
  ‫به صرفه است وآهسته بی رحم دردهای زندگی ، نات میدهد افرادی که‬
 ‫نگاه کن . هر زمان درازای هر آینه من اگر با هه جدایی هاست و شش‬
    ‫دفت مثنوی او رویاهای بچه گانهات . میخواهم بگویم خیلی دوستت‬
    ‫دارم................مواظب خودت رپ ایران چطوره ؟؟؟ تنهایی و‬
  ‫گناهم را داری با گریه های متنوعی وجود من نادرجان روخیلی دوسش‬
    ‫دارم گله از امشب بسوزم چونکه میدان آتش آن آشیان دارند. چرا‬
‫مثبت بودن مثل ماه شب را تنها هربار که دعاکنیدمنواون به تونادرم‬
    ‫نوشته شده باید بدست خودم میبینم با تام اندیشه هایت سر بکشم‬
   ‫،جلوتر ازما تام نبودنای تو شدم پس هیچ لظهای هم نبود شگفت بر‬
‫سخره شاه حرون خر گیری بر عهده دارد.کم خوابی ... امروز و خاموشم‬
  ‫مکن درکنارت نیستم امافراموشم مکن نوشته دوست ندارند ؟ سلم..من‬
 ‫کامیار هون راسکال از میزان اشتها را امتحان کردم ، آزاد و ساعت‬
 ‫۶۲:۶۱ لینک کلیک کنید جایزه بگیرید لینک کلیک کنید جایزه بگیرید‬
 ‫لینک ثابت (۰۱)؛ آهای دنیا نگاه میکنی ... کویرم خشک و آرامش با‬
     ‫مژگانت اشارهای کنی . جز امید تو بان و آفرینش صور خیال ،از‬
    ‫سردیه دستام ... من معنا میکنی ... آرزو داشتی مرا میبشیدی .‬
  ‫میدونی چرا وقتی بیشت کل نیست...کل خودش یه عاله دوستت دارم...‬

Contenu connexe

Tendances

اليهود وغير اليهود
اليهود وغير اليهوداليهود وغير اليهود
اليهود وغير اليهودguest87d612
 
GAZA IN THE DARK
GAZA IN THE DARKGAZA IN THE DARK
GAZA IN THE DARKsumayah
 
استراتژی و اهداف کلان فرهنگی
استراتژی و اهداف کلان فرهنگیاستراتژی و اهداف کلان فرهنگی
استراتژی و اهداف کلان فرهنگیguest3e91350
 
گزارش توسعه‌دهندگان بازار در فصل زمستان ۱۳۹۶
گزارش توسعه‌دهندگان بازار در فصل زمستان ۱۳۹۶گزارش توسعه‌دهندگان بازار در فصل زمستان ۱۳۹۶
گزارش توسعه‌دهندگان بازار در فصل زمستان ۱۳۹۶Bazaar Insight
 
گزارش صنعت برنامه‌های موبایل در سال ۱۳۹۵
گزارش صنعت برنامه‌های موبایل در سال ۱۳۹۵گزارش صنعت برنامه‌های موبایل در سال ۱۳۹۵
گزارش صنعت برنامه‌های موبایل در سال ۱۳۹۵Bazaar Insight
 
تقرير حول البوربوينت
تقرير حول البوربوينتتقرير حول البوربوينت
تقرير حول البوربوينتNazek Al-Asfoor
 
التقويم الهجري والميلادي 2021 للاستاذة أمينة علي بن صنعون
التقويم الهجري والميلادي 2021 للاستاذة أمينة علي بن صنعونالتقويم الهجري والميلادي 2021 للاستاذة أمينة علي بن صنعون
التقويم الهجري والميلادي 2021 للاستاذة أمينة علي بن صنعونRandaMousa1
 
التقويم الهجري والميلادي 2021 للأستاذة أمينة علي بن صعنون
التقويم الهجري والميلادي 2021 للأستاذة أمينة علي بن صعنونالتقويم الهجري والميلادي 2021 للأستاذة أمينة علي بن صعنون
التقويم الهجري والميلادي 2021 للأستاذة أمينة علي بن صعنونRandaMousa1
 
Email marketing - بازاریابی ایمیلی
Email marketing - بازاریابی ایمیلیEmail marketing - بازاریابی ایمیلی
Email marketing - بازاریابی ایمیلیAmirhosseinSheikhole1
 
تصميم المواقع الإلكترونية في مصر
تصميم المواقع الإلكترونية في مصرتصميم المواقع الإلكترونية في مصر
تصميم المواقع الإلكترونية في مصرMohamedAbdelBaset37
 
تكميم المعدة
تكميم المعدةتكميم المعدة
تكميم المعدةdrcan015
 
ترجمة الإمام محمد بن عبد الوهاب
ترجمة الإمام محمد بن عبد الوهابترجمة الإمام محمد بن عبد الوهاب
ترجمة الإمام محمد بن عبد الوهابguestc82b1f0
 

Tendances (20)

Doc1 taki
Doc1 takiDoc1 taki
Doc1 taki
 
اليهود وغير اليهود
اليهود وغير اليهوداليهود وغير اليهود
اليهود وغير اليهود
 
9areb alquraan
9areb alquraan9areb alquraan
9areb alquraan
 
GAZA IN THE DARK
GAZA IN THE DARKGAZA IN THE DARK
GAZA IN THE DARK
 
استراتژی و اهداف کلان فرهنگی
استراتژی و اهداف کلان فرهنگیاستراتژی و اهداف کلان فرهنگی
استراتژی و اهداف کلان فرهنگی
 
گزارش توسعه‌دهندگان بازار در فصل زمستان ۱۳۹۶
گزارش توسعه‌دهندگان بازار در فصل زمستان ۱۳۹۶گزارش توسعه‌دهندگان بازار در فصل زمستان ۱۳۹۶
گزارش توسعه‌دهندگان بازار در فصل زمستان ۱۳۹۶
 
Laminar Inviscid
Laminar InviscidLaminar Inviscid
Laminar Inviscid
 
REZA
REZAREZA
REZA
 
Ramadhan
RamadhanRamadhan
Ramadhan
 
گزارش صنعت برنامه‌های موبایل در سال ۱۳۹۵
گزارش صنعت برنامه‌های موبایل در سال ۱۳۹۵گزارش صنعت برنامه‌های موبایل در سال ۱۳۹۵
گزارش صنعت برنامه‌های موبایل در سال ۱۳۹۵
 
تقرير حول البوربوينت
تقرير حول البوربوينتتقرير حول البوربوينت
تقرير حول البوربوينت
 
550
550550
550
 
التقويم الهجري والميلادي 2021 للاستاذة أمينة علي بن صنعون
التقويم الهجري والميلادي 2021 للاستاذة أمينة علي بن صنعونالتقويم الهجري والميلادي 2021 للاستاذة أمينة علي بن صنعون
التقويم الهجري والميلادي 2021 للاستاذة أمينة علي بن صنعون
 
التقويم الهجري والميلادي 2021 للأستاذة أمينة علي بن صعنون
التقويم الهجري والميلادي 2021 للأستاذة أمينة علي بن صعنونالتقويم الهجري والميلادي 2021 للأستاذة أمينة علي بن صعنون
التقويم الهجري والميلادي 2021 للأستاذة أمينة علي بن صعنون
 
Email marketing - بازاریابی ایمیلی
Email marketing - بازاریابی ایمیلیEmail marketing - بازاریابی ایمیلی
Email marketing - بازاریابی ایمیلی
 
تصميم المواقع الإلكترونية في مصر
تصميم المواقع الإلكترونية في مصرتصميم المواقع الإلكترونية في مصر
تصميم المواقع الإلكترونية في مصر
 
تكميم المعدة
تكميم المعدةتكميم المعدة
تكميم المعدة
 
Bi10 li-001
Bi10 li-001Bi10 li-001
Bi10 li-001
 
Stationery campaign
Stationery campaignStationery campaign
Stationery campaign
 
ترجمة الإمام محمد بن عبد الوهاب
ترجمة الإمام محمد بن عبد الوهابترجمة الإمام محمد بن عبد الوهاب
ترجمة الإمام محمد بن عبد الوهاب
 

En vedette

Enquête Doctipharma : Les français et la vente de médicaments sur internet
Enquête Doctipharma : Les français et la vente de médicaments sur internet Enquête Doctipharma : Les français et la vente de médicaments sur internet
Enquête Doctipharma : Les français et la vente de médicaments sur internet Doctipharma
 
ഒരു അണ്‍സര്‍വ്വേ പ്രദേശത്തെ ഭൂപടനിര്‍മ്മാണപരിശ്രമം - കൂരാച്ചുണ്ടു് ഗ്രാമപഞ്ചാ...
ഒരു അണ്‍സര്‍വ്വേ പ്രദേശത്തെ ഭൂപടനിര്‍മ്മാണപരിശ്രമം - കൂരാച്ചുണ്ടു് ഗ്രാമപഞ്ചാ...ഒരു അണ്‍സര്‍വ്വേ പ്രദേശത്തെ ഭൂപടനിര്‍മ്മാണപരിശ്രമം - കൂരാച്ചുണ്ടു് ഗ്രാമപഞ്ചാ...
ഒരു അണ്‍സര്‍വ്വേ പ്രദേശത്തെ ഭൂപടനിര്‍മ്മാണപരിശ്രമം - കൂരാച്ചുണ്ടു് ഗ്രാമപഞ്ചാ...Jaisen Nedumpala
 
Ylen Suomalaiset verkossa 2010 - tutkimuksen esittely
Ylen Suomalaiset verkossa 2010 - tutkimuksen esittelyYlen Suomalaiset verkossa 2010 - tutkimuksen esittely
Ylen Suomalaiset verkossa 2010 - tutkimuksen esittelyYle.fi
 
SharePoint Fest Denver - Is Your SharePoint Really Healthy?
SharePoint Fest Denver - Is Your SharePoint Really Healthy?SharePoint Fest Denver - Is Your SharePoint Really Healthy?
SharePoint Fest Denver - Is Your SharePoint Really Healthy?Richard Harbridge
 
Google analytics konferenz gtm hands on alkan_cem_webalytics
Google analytics konferenz gtm hands on alkan_cem_webalyticsGoogle analytics konferenz gtm hands on alkan_cem_webalytics
Google analytics konferenz gtm hands on alkan_cem_webalyticse-dialog GmbH
 
Depurando Aplicacoes PHP com XDebug e FirePHP II
Depurando Aplicacoes PHP com XDebug e FirePHP IIDepurando Aplicacoes PHP com XDebug e FirePHP II
Depurando Aplicacoes PHP com XDebug e FirePHP IIJefferson Girão
 
Kauno miesto savivaldybės 100 dienų ataskaita
Kauno miesto savivaldybės 100 dienų ataskaitaKauno miesto savivaldybės 100 dienų ataskaita
Kauno miesto savivaldybės 100 dienų ataskaitaKauno_miesto_savivaldybe
 
Presentation_Netinfo_6.2015
Presentation_Netinfo_6.2015Presentation_Netinfo_6.2015
Presentation_Netinfo_6.2015Hristo Hristov
 
Carrot City: The impact of food on the design of cities and buildings - Mark ...
Carrot City: The impact of food on the design of cities and buildings - Mark ...Carrot City: The impact of food on the design of cities and buildings - Mark ...
Carrot City: The impact of food on the design of cities and buildings - Mark ...SBCBreakfastSessions
 
Depurando Aplicações PHP com XDebug e FirePHP - SETI 2008
Depurando Aplicações PHP com XDebug e FirePHP - SETI 2008Depurando Aplicações PHP com XDebug e FirePHP - SETI 2008
Depurando Aplicações PHP com XDebug e FirePHP - SETI 2008Jefferson Girão
 
Catalogue HOP'TOYS Autonomie 2017
Catalogue HOP'TOYS Autonomie 2017Catalogue HOP'TOYS Autonomie 2017
Catalogue HOP'TOYS Autonomie 2017Julien Servy
 
Subsidio i.1 demanda actual
Subsidio i.1 demanda actualSubsidio i.1 demanda actual
Subsidio i.1 demanda actualUpaep Online
 
[KGC 2013] Online Game Security in China
[KGC 2013] Online Game Security in China[KGC 2013] Online Game Security in China
[KGC 2013] Online Game Security in ChinaSeungmin Shin
 
Virtualni svet Second Life
Virtualni svet Second LifeVirtualni svet Second Life
Virtualni svet Second LifeAlja Isakovic
 
صداقت حضرت مسیح موعود علیہ السلام از احادیث
صداقت حضرت مسیح موعود علیہ السلام از احادیثصداقت حضرت مسیح موعود علیہ السلام از احادیث
صداقت حضرت مسیح موعود علیہ السلام از احادیثmuzaffertahir9
 
Describe
DescribeDescribe
Describesilmb
 
Debarras Nice - www.lesasdudebarras06.fr Débarras Nice
Debarras Nice - www.lesasdudebarras06.fr Débarras NiceDebarras Nice - www.lesasdudebarras06.fr Débarras Nice
Debarras Nice - www.lesasdudebarras06.fr Débarras NiceDebarrasNice DebarrasNice
 
Шобанов Константин "Боль и удовольствие в продажах"
Шобанов Константин "Боль и удовольствие в продажах"Шобанов Константин "Боль и удовольствие в продажах"
Шобанов Константин "Боль и удовольствие в продажах"PechaKucha-Cheboksary
 

En vedette (20)

Enquête Doctipharma : Les français et la vente de médicaments sur internet
Enquête Doctipharma : Les français et la vente de médicaments sur internet Enquête Doctipharma : Les français et la vente de médicaments sur internet
Enquête Doctipharma : Les français et la vente de médicaments sur internet
 
ഒരു അണ്‍സര്‍വ്വേ പ്രദേശത്തെ ഭൂപടനിര്‍മ്മാണപരിശ്രമം - കൂരാച്ചുണ്ടു് ഗ്രാമപഞ്ചാ...
ഒരു അണ്‍സര്‍വ്വേ പ്രദേശത്തെ ഭൂപടനിര്‍മ്മാണപരിശ്രമം - കൂരാച്ചുണ്ടു് ഗ്രാമപഞ്ചാ...ഒരു അണ്‍സര്‍വ്വേ പ്രദേശത്തെ ഭൂപടനിര്‍മ്മാണപരിശ്രമം - കൂരാച്ചുണ്ടു് ഗ്രാമപഞ്ചാ...
ഒരു അണ്‍സര്‍വ്വേ പ്രദേശത്തെ ഭൂപടനിര്‍മ്മാണപരിശ്രമം - കൂരാച്ചുണ്ടു് ഗ്രാമപഞ്ചാ...
 
Ylen Suomalaiset verkossa 2010 - tutkimuksen esittely
Ylen Suomalaiset verkossa 2010 - tutkimuksen esittelyYlen Suomalaiset verkossa 2010 - tutkimuksen esittely
Ylen Suomalaiset verkossa 2010 - tutkimuksen esittely
 
SharePoint Fest Denver - Is Your SharePoint Really Healthy?
SharePoint Fest Denver - Is Your SharePoint Really Healthy?SharePoint Fest Denver - Is Your SharePoint Really Healthy?
SharePoint Fest Denver - Is Your SharePoint Really Healthy?
 
Google analytics konferenz gtm hands on alkan_cem_webalytics
Google analytics konferenz gtm hands on alkan_cem_webalyticsGoogle analytics konferenz gtm hands on alkan_cem_webalytics
Google analytics konferenz gtm hands on alkan_cem_webalytics
 
Depurando Aplicacoes PHP com XDebug e FirePHP II
Depurando Aplicacoes PHP com XDebug e FirePHP IIDepurando Aplicacoes PHP com XDebug e FirePHP II
Depurando Aplicacoes PHP com XDebug e FirePHP II
 
Kauno miesto savivaldybės 100 dienų ataskaita
Kauno miesto savivaldybės 100 dienų ataskaitaKauno miesto savivaldybės 100 dienų ataskaita
Kauno miesto savivaldybės 100 dienų ataskaita
 
Presentation_Netinfo_6.2015
Presentation_Netinfo_6.2015Presentation_Netinfo_6.2015
Presentation_Netinfo_6.2015
 
Carrot City: The impact of food on the design of cities and buildings - Mark ...
Carrot City: The impact of food on the design of cities and buildings - Mark ...Carrot City: The impact of food on the design of cities and buildings - Mark ...
Carrot City: The impact of food on the design of cities and buildings - Mark ...
 
Depurando Aplicações PHP com XDebug e FirePHP - SETI 2008
Depurando Aplicações PHP com XDebug e FirePHP - SETI 2008Depurando Aplicações PHP com XDebug e FirePHP - SETI 2008
Depurando Aplicações PHP com XDebug e FirePHP - SETI 2008
 
Catalogue HOP'TOYS Autonomie 2017
Catalogue HOP'TOYS Autonomie 2017Catalogue HOP'TOYS Autonomie 2017
Catalogue HOP'TOYS Autonomie 2017
 
Subsidio i.1 demanda actual
Subsidio i.1 demanda actualSubsidio i.1 demanda actual
Subsidio i.1 demanda actual
 
小黄鸭和鳄鱼
小黄鸭和鳄鱼小黄鸭和鳄鱼
小黄鸭和鳄鱼
 
[KGC 2013] Online Game Security in China
[KGC 2013] Online Game Security in China[KGC 2013] Online Game Security in China
[KGC 2013] Online Game Security in China
 
Evolucija Klijenata
Evolucija KlijenataEvolucija Klijenata
Evolucija Klijenata
 
Virtualni svet Second Life
Virtualni svet Second LifeVirtualni svet Second Life
Virtualni svet Second Life
 
صداقت حضرت مسیح موعود علیہ السلام از احادیث
صداقت حضرت مسیح موعود علیہ السلام از احادیثصداقت حضرت مسیح موعود علیہ السلام از احادیث
صداقت حضرت مسیح موعود علیہ السلام از احادیث
 
Describe
DescribeDescribe
Describe
 
Debarras Nice - www.lesasdudebarras06.fr Débarras Nice
Debarras Nice - www.lesasdudebarras06.fr Débarras NiceDebarras Nice - www.lesasdudebarras06.fr Débarras Nice
Debarras Nice - www.lesasdudebarras06.fr Débarras Nice
 
Шобанов Константин "Боль и удовольствие в продажах"
Шобанов Константин "Боль и удовольствие в продажах"Шобанов Константин "Боль и удовольствие в продажах"
Шобанов Константин "Боль и удовольствие в продажах"
 

Similaire à Defense

اکوسیستم دره سیلیکون
اکوسیستم دره سیلیکوناکوسیستم دره سیلیکون
اکوسیستم دره سیلیکونAmirhosseinSheikhole1
 
گزارش صنعت برنامه‌های موبایل - سال ۱۳۹۷
گزارش صنعت برنامه‌های موبایل - سال ۱۳۹۷گزارش صنعت برنامه‌های موبایل - سال ۱۳۹۷
گزارش صنعت برنامه‌های موبایل - سال ۱۳۹۷Bazaar Insight
 
کمک به بچه های سرطانی
کمک به بچه های سرطانی کمک به بچه های سرطانی
کمک به بچه های سرطانی koodakancharitytehra
 
موکت طرح دار شیک گامان تزیین جاوید
موکت طرح دار شیک گامان تزیین جاویدموکت طرح دار شیک گامان تزیین جاوید
موکت طرح دار شیک گامان تزیین جاویدgamanTazeen javid
 
طراحی نمای مهدکودک
طراحی نمای مهدکودکطراحی نمای مهدکودک
طراحی نمای مهدکودکnamadesign
 
مبادئ صهيونية
مبادئ صهيونيةمبادئ صهيونية
مبادئ صهيونيةguest87d612
 
دكتور عبدالله مديرس
دكتور عبدالله مديرسدكتور عبدالله مديرس
دكتور عبدالله مديرسnouraalbannai
 
گیت کنترل تردد چیست؟
گیت کنترل تردد چیست؟گیت کنترل تردد چیست؟
گیت کنترل تردد چیست؟JahangostarParsRaden
 
نقل اثاث وعفش الامارات
نقل اثاث وعفش الاماراتنقل اثاث وعفش الامارات
نقل اثاث وعفش الاماراتalwadii
 
تعمیرات مبل خانه شیک
تعمیرات مبل خانه شیکتعمیرات مبل خانه شیک
تعمیرات مبل خانه شیکssuser13f12e
 
ابي لا تكن سبب هلاكي
ابي لا تكن سبب هلاكيابي لا تكن سبب هلاكي
ابي لا تكن سبب هلاكيabuomar75
 
طراحی نمای تجاری
طراحی نمای تجاری طراحی نمای تجاری
طراحی نمای تجاری namadesign
 
کمک به بچه‌های سرطانی
کمک به بچه‌های سرطانی کمک به بچه‌های سرطانی
کمک به بچه‌های سرطانی koodakancharitytehra
 
الحاوي في الطب الرازي
الحاوي في الطب الرازيالحاوي في الطب الرازي
الحاوي في الطب الرازيWael Sharba
 
تدريب القيادة والريادة
تدريب القيادة والريادةتدريب القيادة والريادة
تدريب القيادة والريادةLoay Qabajeh
 

Similaire à Defense (20)

Charity
CharityCharity
Charity
 
Charity
CharityCharity
Charity
 
اکوسیستم دره سیلیکون
اکوسیستم دره سیلیکوناکوسیستم دره سیلیکون
اکوسیستم دره سیلیکون
 
گزارش صنعت برنامه‌های موبایل - سال ۱۳۹۷
گزارش صنعت برنامه‌های موبایل - سال ۱۳۹۷گزارش صنعت برنامه‌های موبایل - سال ۱۳۹۷
گزارش صنعت برنامه‌های موبایل - سال ۱۳۹۷
 
کمک به بچه های سرطانی
کمک به بچه های سرطانی کمک به بچه های سرطانی
کمک به بچه های سرطانی
 
موکت طرح دار شیک گامان تزیین جاوید
موکت طرح دار شیک گامان تزیین جاویدموکت طرح دار شیک گامان تزیین جاوید
موکت طرح دار شیک گامان تزیین جاوید
 
طراحی نمای مهدکودک
طراحی نمای مهدکودکطراحی نمای مهدکودک
طراحی نمای مهدکودک
 
مبادئ صهيونية
مبادئ صهيونيةمبادئ صهيونية
مبادئ صهيونية
 
دكتور عبدالله مديرس
دكتور عبدالله مديرسدكتور عبدالله مديرس
دكتور عبدالله مديرس
 
گیت کنترل تردد چیست؟
گیت کنترل تردد چیست؟گیت کنترل تردد چیست؟
گیت کنترل تردد چیست؟
 
نقل اثاث وعفش الامارات
نقل اثاث وعفش الاماراتنقل اثاث وعفش الامارات
نقل اثاث وعفش الامارات
 
موسسه خیریه
موسسه خیریهموسسه خیریه
موسسه خیریه
 
تعمیرات مبل خانه شیک
تعمیرات مبل خانه شیکتعمیرات مبل خانه شیک
تعمیرات مبل خانه شیک
 
ابي لا تكن سبب هلاكي
ابي لا تكن سبب هلاكيابي لا تكن سبب هلاكي
ابي لا تكن سبب هلاكي
 
طراحی نمای تجاری
طراحی نمای تجاری طراحی نمای تجاری
طراحی نمای تجاری
 
کمک به بچه‌های سرطانی
کمک به بچه‌های سرطانی کمک به بچه‌های سرطانی
کمک به بچه‌های سرطانی
 
Presentation1
Presentation1Presentation1
Presentation1
 
Non cash assistance
Non cash assistanceNon cash assistance
Non cash assistance
 
الحاوي في الطب الرازي
الحاوي في الطب الرازيالحاوي في الطب الرازي
الحاوي في الطب الرازي
 
تدريب القيادة والريادة
تدريب القيادة والريادةتدريب القيادة والريادة
تدريب القيادة والريادة
 

Plus de farzanehs

Workshop negations
Workshop negationsWorkshop negations
Workshop negationsfarzanehs
 
Health care special interest-i2b2
Health care  special interest-i2b2Health care  special interest-i2b2
Health care special interest-i2b2farzanehs
 
BioNLP09 Winners
BioNLP09 WinnersBioNLP09 Winners
BioNLP09 Winnersfarzanehs
 
Rosario Hearst
Rosario HearstRosario Hearst
Rosario Hearstfarzanehs
 
Olivia Contradictions
Olivia ContradictionsOlivia Contradictions
Olivia Contradictionsfarzanehs
 

Plus de farzanehs (11)

Workshop negations
Workshop negationsWorkshop negations
Workshop negations
 
Health care special interest-i2b2
Health care  special interest-i2b2Health care  special interest-i2b2
Health care special interest-i2b2
 
Ambiguity
AmbiguityAmbiguity
Ambiguity
 
I2b209
I2b209I2b209
I2b209
 
BioNLP09 Winners
BioNLP09 WinnersBioNLP09 Winners
BioNLP09 Winners
 
Bionlp09
Bionlp09Bionlp09
Bionlp09
 
Rosario Hearst
Rosario HearstRosario Hearst
Rosario Hearst
 
Eoy
EoyEoy
Eoy
 
Six Month
Six MonthSix Month
Six Month
 
Crf
CrfCrf
Crf
 
Olivia Contradictions
Olivia ContradictionsOlivia Contradictions
Olivia Contradictions
 

Defense

  • 1. ‫مدلی برای تحلیل و تولید متن وبلگ‬ ‫فرزانه سرافراز‬ ‫استاد راهنما: دکتر شیری‬ ‫استاد مشاور: دکتر عزمی‬ ‫بهمن ۵۸۳۱‬
  • 2. ‫پدیدههای زبانی قرن حاضر‬ ‫گسترده شدن ه جهانی اینترنت و روشهای تبادل اطلعات‬ ‫شبک‬ ‫●‬ ‫عمومی شدن خدمات کامپیوتری و آشنایی بیشتر مردم با ابزارهای‬ ‫●‬ ‫کامپیوتری‬ ‫استاندارد شدن خطها و زبانهای مختلف برای ه الکترونیکی‬ ‫مبادل‬ ‫●‬ ‫یونیکد‬ ‫–‬ ‫اهمیت زبانهای مادری‬ ‫–‬ ‫پیدایش نرمافزارهای محلیشده‬ ‫–‬ ‫افزایش سریع حجم دادههای نوشتاری و گفتاری زبانهای مختلف‬ ‫●‬ ‫۰۱میلیون پیام کوتاه در ایران (گزارش مخابرات) با ۰۶۱ نویسه در هر کدام‬ ‫–‬ ‫با افزایش تعداد نویسههای پیام کوتاه به ۰۰۸ نویسه پنج برابر خواهد شد‬ ‫–‬
  • 3. ‫پیامدهای این وضعیت‬ ‫تأثیر روی واژگان و ویژگیهای ساختی زبانهای مختلف‬ ‫●‬ ‫فراهم شدن حجم عظیم دادههای زبانی به صورت الکترونیکی‬ ‫●‬ ‫منبع مهم تجزیه و تحلیل زبانی‬ ‫–‬ ‫زیاد شدن اهمیت پردازش دادههای زبانی برای دستیابی به سیستمهای‬ ‫●‬ ‫مختلف فنآوری زبان‬ ‫پردازش زبان طبیعی ‪NLP‬‬ ‫–‬ ‫ن شناسی محاسباتی ‪CL‬‬‫زبا‬ ‫–‬
  • 4. ‫پردازش زبان طبیعی (‪)NLP‬‬ ‫زیرشاخ ‌ی‌هوش‌مصنوعی‌و‌زبا ‌شناسی‬ ‫ن‬ ‫ه‬ ‫●‬ ‫مسأله+‌تولید‌و‌درک‌زبانهای‌طبیعی‌انسان: انگلیسی‌و‌...‬ ‫●‬ ‫سیست ‌های‌تولید‌زبان‌طبیعی‬ ‫م‬ ‫–‬ ‫● اطلعات‌پایگاه‌داد‌ها‌←‌زبان‌طبیعی‌انسان‬ ‫ه‬ ‫سیست ‌های‌درک‌زبان‌طبیعی‬ ‫م‬ ‫–‬ ‫● زبان‌طبیعی‌تولیدشده‌توسط‌انسان‌←‌نمایش‌فرمال‌قابل‌استفاده‌برای‌کامپیوتر‬
  • 5. ‫مسائل اصلی در پردازش زبان طبیعی‬ ‫تولید گفتار‬ ‫●‬ ‫تبدیل اشکال مختلف نمایش اطلعات به صوت گفتار طبیعی‬ ‫>‬ ‫–‬ ‫● متن به گفتار‬ ‫● نشانههای آوایی به گفتار‬ ‫● سایر اشکال نمایش زبانشناسی به گفتار‬ ‫کاربردها‬ ‫–‬ ‫● کودکان و دسترسیپذیری برای کسانی که مشکل خواندن دارند‬ ‫● سیستمهای هوشمند مخابراتی‬ ‫● کاربردهای‌دیگر‌در‌رابط +‌متقابل‌انسان‌و‌کامپیوتر‬ ‫ه‬
  • 6. ‫مسائل اصلی...‬ ‫بازشناسی‌گفتار‬ ‫●‬ ‫تشخیص‌گفتاری‌که‌انسان‌تولید‌کرده‌و‌انجام‌عمل‌متناسب‬ ‫–‬ ‫‪ ‬تبدیل‌گفتار‌به‌متن‌(از‌جمله‌در‌کاربردهای‌دسترس ‌پذیری)‬ ‫ی‬ ‫‪ ‬کاربردهایی‌مثل‌شمار‌گیری‌خودکار‌تفن‌همراه‬ ‫ه‬ ‫‪ ‬تشخیص‌نام‌شهر‌و‌استان‌و‌شماره‌تلفن‌در‌سیست ‌های‌هوشمند‌مخابراتی‬ ‫م‬
  • 7. ‫مسائل اصلی...‬ ‫بازیابی اطلعات‬ ‫●‬ ‫جس ‌وجو‌به‌دنبال‌اطلعات‌در‌مدارک‌و‌پروند‌ها‬ ‫ه‬ ‫ت‬ ‫–‬ ‫جس ‌وجو‌به‌دنبال‌خود‌مدارک‌و‌پروند‌ها‬ ‫ه‬ ‫ت‬ ‫–‬ ‫جس ‌وجو‌به‌دنبال‌اطلعات‌متا‌در‌مورد‌مدارک‬ ‫ت‬ ‫–‬ ‫جس ‌وجو‌در‌پایگا‌های‌داده‬ ‫ه‬ ‫ت‬ ‫–‬ ‫و...‬ ‫–‬
  • 8. ‫مسائل اصلی...‬ ‫پاسخ‌به‌سؤال‬ ‫●‬ ‫– نوع‌خاصی‌بازیابی‌اطلعات‬ ‫– به‌عنوان‌گام‌بعدی‌پس‌از‌موتورهای‌جس ‌وجو‬ ‫ت‬ ‫– دو‌نوع‌اصلی:‬ ‫‪ ‬دامن +‌محدود‬ ‫ه‬ ‫– سؤالت‌شکل‌تعری ‌شده‌دارند‬ ‫ف‬ ‫– جس ‌وجو‌در‌پایگاه‌داده‌است‬ ‫ت‬ ‫ه+‌نامحدود‬ ‫‪ ‬دامن‬ ‫– هر‌سؤالی‌م ‌توان‌پرسید‬ ‫ی‬ ‫– جس ‌وجو‌در‌شبک +‌اینترنت‌و‌با‌منابع‌زیاد‬ ‫ه‬ ‫ت‬
  • 9. ‫مسائل اصلی...‬ ‫خلص ‌سازی‌خودکار‬ ‫ه‬ ‫●‬ ‫غل ‌یاب‌و‌ویراستار‌خودکار‬ ‫ط‬ ‫●‬ ‫املیی‬ ‫–‬ ‫دستوری‬ ‫–‬ ‫ویرایش‌متون‌در‌چاپ‌و‌نشر‬ ‫–‬ ‫کم ‌کنند +‌نوشتن/خواندن‌زبان‌خارجی‬ ‫که‬ ‫–‬
  • 10. ‫مسائل اصلی...‬ ‫تولید زبان طبیعی‬ ‫●‬ ‫برنامههای ساده مثل‌طال ‌بینی‌یا‌نام ‌نگار ‌های‌رسمی‬ ‫هی‬ ‫ع‬ ‫–‬ ‫برنام ‌های‌پیچیده‌مراحل‌بیشتری‌دارند:‬ ‫ه‬ ‫–‬ ‫● برنام ‌ریزی‌هوش‌مصنوعی‌برای‌متنی‌که‌قرار‌است‌تولید‌شود‬ ‫ه‬ ‫● تعیین‌ساختار‌متن‬ ‫● تعیین‌ساختار‌جملت‬ ‫● مربوط‌کردن‌کلمات‌با‌مفاهیم‬ ‫● مسائل‌مربوط‌به‌نحو‌(سینتکس)،‌ریخ ‌شناسی‌و‌دستور‌(گرامر)‬ ‫ت‬ ‫● مسائل‌مربوط‌به‌نقط ‌گذاری‌و‌رس ‌الخط‬ ‫م‬ ‫ه‬
  • 11. ‫روشهای اصلی در علوم شناختی‬ ‫دو روش اصلی متفاوت برای پردازش زبان طبیعی و به طور خاص تولید‬ ‫●‬ ‫زبان طبیعی‬ ‫روش تکوینی یا منطقی (‪)rational or formalist approach‬‬ ‫–‬ ‫روش تجربی (‪)empirical approach‬‬ ‫–‬ ‫در روش تکوینی به دنبال اطلعات تحلیلی هستیم که بدون استفاده از‬ ‫●‬ ‫دادههای تجربی به دست میآیند‬ ‫در روش تجربی ارزش زیادی به دادههای زبانی میدهیم‬ ‫●‬ ‫از نظریهپردازان روش تجربی: نوام چامسکی، ن شناس‬ ‫زبا‬ ‫–‬ ‫در سالهای اخیر روش تجربی بین دانشمندان اهمیت زیادی پیدا کرده است‬ ‫–‬
  • 12. ‫نقش پیکره‬ ‫مهمترین ابزار مورد نیاز برای حل مسائل مختلف به روش تجربی در حیطه‬ ‫●‬ ‫پردازش زبان طبیعی وجود پیکره زبانی بزرگ است‬ ‫در زبان فارسی با رشد ک ‪N‬ی وبلگهای فارسی چنین پیک ه متنیای در‬ ‫ر‬ ‫م‬ ‫●‬ ‫اینترنت وجود دارد‬ ‫«وبلگ یک قالب روزنامهنگاری برخط است که به ترتیب زمانی عکس‬ ‫●‬ ‫منتشر میشود، مرتب‪ V‬بهروز میشود، و نوع‪ V‬شامل تفکرات و تأملت شخصی،‬ ‫ا‬ ‫ا‬ ‫زندگی روزمره، مقالت، نظرات دیگران، و پیوند به صفحات وب است.»‬
  • 13. ‫راهحلهای پیشین برای مسائل کلسیک‬ ‫پردازش زبان و مسائل خاص زبان فارسی‬ ‫مشکلت فنی و ساختاری‬ ‫●‬ ‫قالبهای گوناگون پروندههای کامپیوتری‬ ‫–‬ ‫● زرنگار، کلک، نشر الف، لت>ک، پیدیاف، و‪Q‬رد مایکروسافت‬ ‫– حتی نسخههای «فارسیشده»ی مختلف و‪Q‬رد فارسی را یک جور پشتیبانی نمیکنند‬ ‫● تبدیل این قالبها به تصویر برای سازگاری بیشتر‬ ‫برتری قالب ‪( xml‬از جمله صفحات وب)‬ ‫–‬ ‫● قالب استاندارد ←‌امکان‌استفاده‌از‌تجزی ‌گرهای‌استاندارد‬ ‫ه‬ ‫● پشتیبانی‌و‌ب ‌روزرسانی‌از‌سوی‌‪w3c‬‬ ‫ه‬ ‫● تعداد‌زیاد‌کاربران‌که‌هر‌روز‌به‌دامن +‌آنها‌افزوده‌م ‌شود‬ ‫ی‬ ‫ه‬ ‫● توانای ‌ها‌و‌امکانات‌زیاد: قابلیت‌نمایش‌و‌چاپ‬ ‫ی‬ ‫● قابلیت‌حمل‌روی‌کامپیوترها‌و‌سیست ‌عام ‌های‌گوناگون‬ ‫مل‬
  • 14. ‫ی ها و نقاط تمایز وبلگ با سایر‬‫ویژگ‬ ‫پیکرههای زبانی‬ ‫زبان غیررسمی و محاورهای‬ ‫●‬ ‫مفاهیم و موضوعات محدود و تکراری‬ ‫●‬ ‫وجود شکلک و پیوند به صفحات وب در بین متن‬ ‫●‬ ‫نویسندگان مختلف‬ ‫●‬ ‫استفاده از سیستمها و نرمافزارهای گوناگون برای حروفچینی‬ ‫●‬ ‫کدگذاریهای غیراستاندارد و مختلف‬ ‫●‬ ‫رسمالخطهای متفاوت‬ ‫●‬ ‫کلمات خارج از دایره واژگان فارسی‬ ‫●‬
  • 15. ‫استاندارد خط در کامپیوتر‬ ‫نویسه: کوچکترین واحد نوشته‬ ‫●‬ ‫نویسه «ی» شکلهای اول، وسط، آخر تنها، آخر چسبان دارد:‬ ‫‪Y‬‬ ‫–‬ ‫●ی ی ی ی‬ ‫استاندارد (منسوخ) ۰۰۹۲ موسسه استاندارد و تحقیقات صنعتی ایران‬ ‫●‬ ‫ه اروپا‬ ‫چندین کدگذاری مختلف برای دربرگرفتن ه ن های اتحادی‬ ‫هم زبا‬ ‫●‬ ‫این کدگذاریها با هم تعارض هم داشتند‬ ‫●‬ ‫تحریف دادهها هنگام عبور از ط های مختلف‬ ‫محی‬ ‫●‬
  • 16. ‫ک‪D‬د‬ ‫استاندارد یونی‬ ‫کد یکتا به هر نویسه؛ مستقل از محیط، برنامه، زبان‬ ‫●‬ ‫کار کردن یک وبگاه یا نرمافزار در ط های متعدد بدون ه اضافی‬ ‫هزین‬ ‫محی‬ ‫●‬ ‫مورد قبول پیشتازان صنعت کامپیوتر‬ ‫●‬ ‫استاندارد ۲۴۳۳ موسسه استاندارد و تحقیقات صنعتی ایران‬ ‫●‬
  • 17. ‫ک‪D‬د‬ ‫استاندارد یونی‬ ‫مجموعه سه های استاندارد خط فارسی‬ ‫نوی‬ ‫●‬ ‫کك‬ ‫–‬ ‫یي‬ ‫–‬ ‫ه‪ Y‬ة‬ ‫–‬ ‫۶۵۴‬ ‫–‬ ‫فا له بیعرض‬ ‫ص‬ ‫●‬ ‫خانهها‬ ‫–‬ ‫خانهها‬ ‫–‬ ‫اتصال مجازی‬ ‫●‬ ‫– ه . ش.‬
  • 18. ‫خلصه‪ E‬مراحل کاری‬ ‫مع آوری پیکره‬ ‫ج‬ ‫●‬ ‫استخراج متن خام‬ ‫●‬ ‫پیشپردازش‬ ‫●‬ ‫تحلیل اطلعات زبانی‬ ‫●‬ ‫تولید متن‬ ‫●‬ ‫ارزیابی متن تولیدشده‬ ‫●‬ ‫بررسی امکانات ه طرح‬ ‫توسع‬ ‫●‬
  • 19. ‫جمعآوری پیکره‬ ‫روش مطلوب: روشی که تا جای ممکن وبلگهای تصادفی را از روی وب‬ ‫●‬ ‫بارگیری کند‬ ‫استفاده از کارگزار پینگ‬ ‫●‬ ‫هر وبلگ وقتی که بهروز میشود پیغامی به یک کارگزار پینگ میفرستد‬ ‫–‬ ‫در بازههای زمانی معین فهرست وبلگهای بهروزشده را بارگیری میکنیم‬ ‫–‬ ‫بارگیری صفحات مرتبط با دنبال کردن پیوندها و با استفاده از خزنده وب‬ ‫●‬ ‫جدا کردن وبلگهای فارسی: استفاده از روش مکاشفهای‬ ‫●‬ ‫عه‪ Y‬نویسههای خط فارسی‬ ‫مجمو‬ ‫–‬ ‫تمییز از صفحات عربی، اردو، پشتو، کردی، کشمیری‬ ‫–‬
  • 20. ‫استخراج متن خام‬ ‫دستهبندی صفحات بارگیریشده‬ ‫●‬ ‫تشخیص انواع برچسبهای بهکار رفته در صفحه‬ ‫●‬ ‫تشخیص آشغال از نظر موتور پردازش زبان طبیعی‬ ‫●‬ ‫سرصفحهها‬ ‫–‬ ‫کدنوشتههای جاوااسکریپت، ایاسپی، پیاچپی‬ ‫–‬ ‫پیوند‬ ‫–‬ ‫عبارتهای غیرفارسی‬ ‫–‬ ‫پروندههای تصویری (شکلکها و...)‬ ‫–‬
  • 21. ‫استخراج متن خام‬ ‫پیدا کردن متن هر مطلب و جدا کردن آن از‬ ‫●‬ ‫عنوان صفحه‬ ‫–‬ ‫عنوان مطلب‬ ‫–‬ ‫حاشیهها‬ ‫–‬ ‫شرح پیوندها‬ ‫–‬ ‫و...‬ ‫–‬ ‫نیاز به روش جداگانه برای هر سرویسدهنده، و حتی هر قالب طراحیشده‬ ‫●‬ ‫هدف: بهینه کردن جوابهای درست، بیتوجه به مطلب آشغال تشخیص‬ ‫●‬ ‫داده شده (‪)false negative‬‬
  • 22. ‫پیشپردازش‬ ‫تبدیل سه های غیرمجاز به سه های یونیکدی صحیح فارسی‬ ‫نوی‬ ‫نوی‬ ‫●‬ ‫حذف نویسه کشـیـده‬ ‫●‬ ‫حذف ‪n‬عراب‬ ‫ا‬ ‫●‬ ‫حذف تنوین (شدید‪V‬ا ←‌شدیدا)‬ ‫●‬ ‫حذف ساک ‪ o‬و تشدید‬ ‫ن‬ ‫●‬ ‫حذف ء از آخر کلماتی مثل شهداء‬ ‫●‬ ‫یکنواخت کردن ارقام‬ ‫●‬ ‫تبدیل رشتههای ه ة هی ه ی به ه‬ ‫●‬
  • 23. ‫پیشپردازش‬ ‫حذف فاصله و اضافه کردن فاصلهی مجازی در رشتههای «می »، «بر‬ ‫●‬ ‫می»، «برمی »، «درمی »، «در می »، «نمی »، و «بی »‬ ‫می روند ←‌م ‌روند‬ ‫ی‬ ‫–‬ ‫حذف‌فاصله‌و‌اضافه‌کردن‌فاصل ‌ی‌مجازی‌در‌رشت ‌های‌« ها»،‌«‬ ‫ه‬ ‫ه‬ ‫●‬ ‫های»،‌« هایی»،‌« هایم»،‌« هایت»،‌و...‬ ‫چسباندن‌«تر» و‌«ترین» به‌آخر‌کلمات‬ ‫●‬ ‫یکنواخت‌کردن‌نقط ‌گذار ‌ها‬ ‫هی‬ ‫●‬
  • 24. ‫تحلیل متن‬ ‫تشخیص واژه‬ ‫●‬ ‫تعریف گرافیکی واژه ←‌رس ‌الخ ‌های‌مختلف‬ ‫مط‬ ‫–‬ ‫● می‌توان‬ ‫● شده‌است‬ ‫● شد‌ام‬ ‫ه‬ ‫● دربرابرباد‬ ‫شک ‌های‌مختلف‌نگارش‬‫ل‬ ‫–‬ ‫● مسوول،‌مسؤول،‌مسئول‬ ‫● پاییز،‌پائیز‬
  • 25. ‫واژه‬ ‫نوع خاص متن مورد بررسی‬ ‫●‬ ‫منو گرفته، گرفتهتم، گرفتتم‬ ‫–‬ ‫غلطای املیی‬ ‫–‬ ‫این لینکو، منو برد خونه‬ ‫–‬ ‫منو دوستام‬ ‫–‬ ‫خودمون، چشمهایشان، بهش، بهاش، براتون‬ ‫–‬ ‫برام مسخرست، اوضاش‬ ‫–‬ ‫وااااای، اووووه‬ ‫–‬
  • 26. ‫رتبه/بسامد‬ ‫1‬ ‫و‬ ‫8767‬ ‫8767‬ ‫واژگان را بر حسب تعداد‬ ‫●‬ ‫2‬ ‫از‬ ‫7605‬ ‫43101‬ ‫3‬ ‫به‬ ‫6274‬ ‫87141‬ ‫تکرارشان در پیکره مرتب میکنیم‬ ‫4‬ ‫در‬ ‫1134‬ ‫44271‬ ‫قانون زیپف:‬ ‫5‬ ‫را‬ ‫1353‬ ‫55671‬ ‫●‬ ‫6‬ ‫که‬ ‫1043‬ ‫60402‬ ‫حاصل ضرب رتبه در بسامد عدد‬ ‫–‬ ‫7‬ ‫این‬ ‫3992‬ ‫15902‬ ‫ثابتی است‬ ‫8‬ ‫که‬ ‫5452‬ ‫06302‬ ‫9‬ ‫هم‬ ‫7052‬ ‫36522‬ ‫01‬ ‫است‬ ‫2912‬ ‫02912‬
  • 27. ‫رتبه/بسامد‬ ‫00001‬ ‫قانون زیپف‬ ‫●‬ ‫با استفاده از‬ ‫0001‬ ‫–‬ ‫۴۰۷۰۱۲‬ ‫‪Frequency‬‬ ‫واژه از پیکره‬ ‫001‬ ‫01‬ ‫1‬ ‫01‬ ‫001‬ ‫0001‬ ‫00001‬ ‫000001‬ ‫‪Rank‬‬
  • 28. ‫تولید متن‬ ‫فرض: رفتار گذشته راهنمای خوبی برای چیزی است که در آینده رخ‬ ‫●‬ ‫خواهد داد ←‌مدل‌باثبات‌است‬ ‫پی ‌بینی‌واژ +‌بعدی‬ ‫ه‬ ‫ش‬ ‫●‬ ‫تلش‌برای‌تقریب‌زدن‌تابع‌احتمال‌زیر‬ ‫–‬ ‫(1-‪n| w1,…, wn‬‬ ‫‪●P)w‬‬ ‫برپای +‌اینکه‌مقدار‌زیادی‌به‌مت ‌ها‌نگاه‌کرد‌ایم،‌تخمینی‌از‌احتمال‌رخداد‬ ‫ه‬ ‫ن‬ ‫ه‬ ‫●‬ ‫دنبال ‌های‌مشخص‌از‌واژ‌ها‌داریم‬ ‫ه‬ ‫ه‬
  • 29. ‫مدل ‪-n‬نگاشتی‬ ‫ه متنی را تا جای ممکن بزرگ فرض کنیم‬ ‫مطلوب است ه تاریخچ‬ ‫دنبال‬ ‫●‬ ‫ممکن نیست، چون اغلب جملهای میشنویم که تا به حال نشنیدهایم‬ ‫–‬ ‫فرض مارکوف: فقط بافت موضعی پیشین بر ژه بعدی اثر میگذارد‬ ‫وا‬ ‫●‬ ‫مدل ‪-n‬نگاشتی‬ ‫●‬ ‫هر دنباله به طول ‪ n‬از واژگان را یک ‪-n‬نگاشت مینامند‬ ‫–‬ ‫میخواهیم ‪n‬های ‪ -n‬ت هایمان نسبت‪ V‬بزرگ باشند‬ ‫ا‬ ‫نگاش‬ ‫●‬ ‫پیچیدگی محاسباتی (رشد نمایی با رشد ‪)n‬‬ ‫–‬ ‫کوچک شدن ظرفهای نمونه‬ ‫–‬
  • 30. ‫روش تولید‬ ‫بررسی فرایند تولید با مدل ‪-n‬نگاشتی با ‪n‬های برابر ۰، ۱، ۲، و ۳‬ ‫●‬ ‫استفاده از تخمینگر ‪MLE‬‬ ‫●‬ ‫استفاده از قانون لپلس برای قرار دادن یک احتمال کوچک (غیرقابل‬ ‫●‬ ‫تنظیم) برای پیشامدهای تاکنونمشاهدهنشده‬
  • 31. ‫نتیجهگیری‬ ‫نگاه به اعداد از دید زبانشناختی‬ ‫●‬ ‫مغرب در سه شنبه شانزدهم خرداد ۵۸۳۱ ساعت ۰۰:۰۲‬ ‫–‬ ‫با وجود بیقاعدگیهای نحوی دنبالههای نسبت‪ V‬طولنی با ساخت نحوی قابل‬ ‫ا‬ ‫●‬ ‫قبول و محتوای یکنواخت تولید شد‬ ‫مگر در هر ثانیه چند کلمه میتواند از میان لبان بیرون بریزیم تا بیانگر احساس درون‬ ‫–‬ ‫ام بود و هزار نامه هایم به رویاهایشان چنگ میزنند‬ ‫–‬
  • 32. ‫توسعه‪ E‬طرح‬ ‫استفاده از دادگان فارسی‬ ‫●‬ ‫استفاده از تحلیلگر نحوی تغییریافته برای این نوع خاص پیکره‬ ‫●‬ ‫استفاده از تحلیلگر مورفولوژیک تغییریافته برای این نوع خاص پیکره‬ ‫●‬ ‫ع سازی با یک نرمافزار انتشار وبلگ و انتشار برخط مطالب‬‫مجتم‬ ‫●‬ ‫خواندن نظرات دیگران و تولید پاسخ مناسب‬ ‫●‬ ‫انتشار مطلب جدید در با ه های زمانی معقول متناسب با تعداد‬ ‫ز‬ ‫●‬ ‫بازدیدکنندههای صفحه و محتوای کامنتها‬
  • 33. ‫توسعه‪ E‬طرح‬ ‫سرزدن به وبلگهای دیگر، گذاشتن نظر، و تبادل پیوند‬ ‫●‬ ‫اضافه کردن مطالب منتشرشده روی گ های دیگر و سایتهای خبری‬ ‫وبل‬ ‫●‬ ‫مربوط به محتوا به مجموعهی دادههای آموزشی و تولید مطلب هماهنگ و‬ ‫مربوط به وقایع روز‬ ‫استفاده از قالببندیهای ‪ ،html‬شکلک، پیوند، تصویر، و... برای شبیهتر شدن‬ ‫●‬ ‫به کارهایی که یک فرد هوشمند وبلگنویس انجام میدهد‬
  • 34. ‫امکان استفاده در حیطههای دیگر‬ ‫●‬ ‫تاریخچهی متن ‪ n‬یکسانی دارند در بارگیر ‪ n‬بازگشتی اجازهی آبونه شدن و پردازش دادهها، و بدون نزدیک‬ ‫ی‬ ‫ی‬ ‫شدن صف دیگر ۶67 -۴-۷-۱قانون زیپف اگر چنین ترکیباتی لزوم‪ V‬ل„‪ V‬به بخش روی جنبههای مختلف‬ ‫„ قب‬ ‫ا‬ ‫برای فعل «دید» یک نمونه را بدون ایجاد میکنند، پیوندهای دائم به حروف اول فهرست وبلگهایی که‬ ‫کم میکنند و «هی» در زیر یک قالب روزنامهنگاری برخط72 است ولی با فارسی صرف‪ V‬محاسباتی‬ ‫ا‬ ‫نگریست از رشتههای « و پشت سر هم که برآیندهای یک راه حل بهکاررفته در انتهای پاراگراف بال‬ ‫ی شده حذف حرکتها و دستوری با‬‫بسامد در بازههای ۰۰۰۰۱ کلمهای بشماریم. تعداد وبلگهای بارگیر‬ ‫تشخیص داد. این منظور، توجه خود تنوین حذف فاصله قبل و سوم به خوبی از همهی علئم نقطهگذاری‬ ‫را برمیشماریم و فهرست واژگان‬
  • 35. ‫؛)‬ ‫باد دانه را بگرفت. نوشته دوست داره؟ بایدبگم من و عشقمه...!!!‬ ‫●‬ ‫وقتی حرفهای مرا بر خواهیم خندید .بیا بی جواب تام خستگیهر روز‬ ‫ده نفربت گفت هیچ کس دوست داشتنی ترین واژه برای ایجاد میط بدون‬ ‫اندیشه و به هرجا که خیلی بی تودنیابامن چه آرزو وهزار رویای بی‬ ‫تاب وتوان وبال وپرسوخته کنج قفس نانده باشد و مسدود کننده هستیم‬ ‫میدانیم نا سلمتی خودت از عشقت پاسخ دادمتو اجازه دادی که قلبش‬ ‫به صرفه است وآهسته بی رحم دردهای زندگی ، نات میدهد افرادی که‬ ‫نگاه کن . هر زمان درازای هر آینه من اگر با هه جدایی هاست و شش‬ ‫دفت مثنوی او رویاهای بچه گانهات . میخواهم بگویم خیلی دوستت‬ ‫دارم................مواظب خودت رپ ایران چطوره ؟؟؟ تنهایی و‬ ‫گناهم را داری با گریه های متنوعی وجود من نادرجان روخیلی دوسش‬ ‫دارم گله از امشب بسوزم چونکه میدان آتش آن آشیان دارند. چرا‬ ‫مثبت بودن مثل ماه شب را تنها هربار که دعاکنیدمنواون به تونادرم‬ ‫نوشته شده باید بدست خودم میبینم با تام اندیشه هایت سر بکشم‬ ‫،جلوتر ازما تام نبودنای تو شدم پس هیچ لظهای هم نبود شگفت بر‬ ‫سخره شاه حرون خر گیری بر عهده دارد.کم خوابی ... امروز و خاموشم‬ ‫مکن درکنارت نیستم امافراموشم مکن نوشته دوست ندارند ؟ سلم..من‬ ‫کامیار هون راسکال از میزان اشتها را امتحان کردم ، آزاد و ساعت‬ ‫۶۲:۶۱ لینک کلیک کنید جایزه بگیرید لینک کلیک کنید جایزه بگیرید‬ ‫لینک ثابت (۰۱)؛ آهای دنیا نگاه میکنی ... کویرم خشک و آرامش با‬ ‫مژگانت اشارهای کنی . جز امید تو بان و آفرینش صور خیال ،از‬ ‫سردیه دستام ... من معنا میکنی ... آرزو داشتی مرا میبشیدی .‬ ‫میدونی چرا وقتی بیشت کل نیست...کل خودش یه عاله دوستت دارم...‬