SlideShare une entreprise Scribd logo
1  sur  50
‫ارائه الگوریتمی برای وب معنایی مبتنی بر‬
                ‫آنتولوژی‬




            ‫ارائه کننده : اسماعيل اکبري‬
             ‫استاد راهنما: دکتر فتحیان‬
‫مقدمه‬    ‫1‬
                         ‫مراجع‬
                                                ‫مقدمه‬




    ‫پیشنهادات‬
      ‫آتی‬                   ‫ساختار‬
                            ‫فهرست‬
                                                   ‫وب‬
                             ‫مطالب‬
                              ‫کلی‬                 ‫معنایی‬




             ‫الگوریتم‬                ‫آنتولوژی‬
            ‫ها و نتایج‬
               ‫های‬
            ‫پیشنهادی‬
‫2‬
‫وب معنایی‬        ‫2‬


                         ‫مقدمه‬                 ‫ظهور‬
     ‫مراجع‬



                                                      ‫اصول‬
‫پیشنهادات‬                           ‫وب‬
  ‫آتی‬           ‫فهرست‬              ‫معنایی‬
                ‫مطالب‬

                                               ‫چارچوب‬
     ‫الگوریتم‬
       ‫های‬              ‫آنتولوژی‬
     ‫پیشنهادی‬
‫3‬
‫ظهور وب معنایی‬   ‫2.1‬


                                                                             ‫ح‬
                                                                        ‫جم‬
                                                                   ‫زی‬
                                   ‫تف‬                         ‫اد‬
                           ‫ی‬   ‫س‬                         ‫دا‬
                        ‫ر،‬                          ‫ده‬
                ‫ر‬   ‫ا‬
        ‫ب‬   ‫زیا‬                                                              ‫داده ساخت‬
    ‫ی‬
                                                                               ‫نیافته‬
                                        ‫ی،‬
                                         ‫بند‬
                                        ‫سته اب‬
                                          ‫تخ‬
                                             ‫د ان‬                                    ‫ل درک‬
                                                                                          ‫اب‬   ‫ق‬
               ‫ب‬
             ‫اع‬                                                    ‫چرا‬
            ‫ث‬
                                                                   ‫نه؟‬




‫4‬
‫ظهور وب معنایی‬                 ‫2.1‬

       ‫چرا کامپیوترها نمی توانند این کار را برای ما انجام دهند؟‬        ‫‪‬‬
                      ‫• یکی از دلیلش این است که صفحات وب شامل‬
                                  ‫‪ o‬اطلعاتی راجع به خودشان‬
                                ‫‪ o‬اطلعاتی راجع به محتویاتشان‬
    ‫‪ o‬اطلعاتی راجع به موضوعی که حاوی مطلب در مورد آن هستند‬
                                                       ‫‪ o‬و ...‬
                                                            ‫نیستند.‬
                      ‫مثال: جستجوی کتاب ‪ TCP/IP‬در یک کتابخانه‬          ‫‪‬‬




‫5‬
‫ظهور وب معنایی‬                    ‫2.1‬

             ‫این دقیقا همان وضعیتی است که در وب نحوی با آن روبرو هستیم.‬            ‫‪‬‬
‫نتيجه اينکه وب به عنوان ابزاري براي تبادل اطلعات بين افراد توسعه يافته است‬         ‫‪‬‬
                                                              ‫تا براي ماشين ها.‬
‫بيه عنوان پياميد آين، محتواي معناييي، کيه معنيي اطلعات درون ييک صفحه وب‬            ‫‪‬‬
           ‫است، به گونه اي کد شده است که تنها براي انسان قابل استفاده است.‬
‫عبارت وب معنا یی بیانگر این ديدگاه است که کامپيوترها نيز بتوانند مانند انسان‬       ‫‪‬‬
                    ‫داده هاي روي وب را پيدا کرده، خوانده، درک و استفاده کنند.‬
‫هدف وب معنايي توسعه استانداردها و تکنولوژي هاي تواناسازي است که براي‬               ‫‪‬‬
     ‫کمک به ماشين ها به منظور فهم بيشتر اطلعات روي وب طراحي شده اند.‬
‫اصول وب معنایی‬                 ‫2.2‬


                         ‫مقدمه‬              ‫ظهور‬
     ‫مراجع‬




                                    ‫وب‬             ‫اصول‬
‫پیشنهادات‬
  ‫آتی‬           ‫فهرست‬              ‫معنایی‬
                ‫مطالب‬

                                            ‫چارچوب‬

     ‫الگوریتم‬
       ‫های‬              ‫آنتولوژی‬
     ‫پیشنهادی‬
‫7‬
‫اصول وب معنایی‬                     ‫2.2‬

              ‫اصل1: هر چیزی می تواند توسط ‪ URI‬ها شناسایی شود‬               ‫‪‬‬
‫• به افراد، مکان ها و چيزها در دنياي فيزيکي مي توان در وب معنايي بوسيله‬
                                        ‫شناسه هاي گوناگون رجوع کرد‬




‫8‬
‫اصول وب معنایی‬                   ‫2.2‬

          ‫اصل2: منابع و لينک ها مي توانند داراي نوع باشند‬    ‫‪‬‬




    ‫وب کنونی‬                       ‫وب معنایی‬


‫9‬
‫اصول وب معنایی‬                 ‫2.2‬

               ‫اصل3: تکامل پشتيباني مي شود .‬    ‫‪‬‬




     ‫اطلعات‬              ‫اطلعات‬
       ‫کنونی‬              ‫قدیمی‬



‫01‬
‫2.3 چارچوب وب معنایی‬


                         ‫مقدمه‬                ‫ظهور‬
     ‫مراجع‬




‫پیشنهادات‬                           ‫وب‬               ‫اصول‬
  ‫آتی‬           ‫فهرست‬              ‫معنایی‬
                ‫مطالب‬


                                            ‫چارچوب‬
     ‫الگوریتم‬
       ‫های‬              ‫آنتولوژی‬
     ‫پیشنهادی‬
‫11‬
‫2.3 چارچوب وب معنایی‬

         ‫مراحل زیر مسیری را نشان می دهد که وب معنایی در پیش گرفته است:‬              ‫‪‬‬
               ‫فراهم کردن ‪ syntax‬مشترک برای جملت قابل فهم توسط ماشین‬           ‫.1‬
                                     ‫ساختن لغات )‪ (vocabularies‬مشترک‬           ‫.2‬
                                           ‫توافق بر روی یک زبان منطقی‬          ‫.3‬
                                      ‫استفاده از زبان برا ی تبادل اثبات ها‬     ‫.4‬
‫آقای برنرزلی مخترع وب کنونی و نیز وب معنایی یک ساختار لیه ای را برای وب‬             ‫‪‬‬
  ‫معنایی پیشنهاد کرد. این ساختار مراحلی که در بال لیست شد را منعکس می کند.‬


                                                                ‫تکنولوژی های‬
                                                                 ‫تکمیل نشده‬
                                                                 ‫وب معنایی‬

                                                               ‫تکنولوژی های‬
                                                               ‫تکمیل شده وب‬
                                                                  ‫معنایی‬

                                                                 ‫تکنولوژی‬
                                                                 ‫های وب‬
‫3. آنتولوژی‬
                       ‫مقدمه‬

  ‫مراجع‬



                                    ‫وب‬
             ‫فهرست‬                 ‫معنایی‬
             ‫مطالب‬                             ‫نگاشت‬
‫پیشنهادات‬
  ‫آتی‬
                               ‫آنتولوژی‬
            ‫الگوریتم‬                             ‫ادغام‬
              ‫های‬
            ‫پیشنهادی‬

                                      ‫انطباق‬
‫31‬
‫3. آنتولوژی‬

‫آنتولوژي ها در حوزه هاي مختلف علوم کامپيوتر مانند هوش مصنوعي، نمايش‬             ‫‪‬‬
‫دانش، پردازش زبان طبيعي، وب معنايي، مهندسي نرم افزار و... استفاده شده‬
‫اند. بنابرايين ايين انتظار وجود دارد کيه تعرييف هاي مختلفيي از آين وجود داشته‬
                                                                       ‫باشد.‬

‫اوشولد و جاسپر بيان مي کنند که اگرچه يک آنتولوژي ممکن است فرمت هاي‬              ‫‪‬‬
                                   ‫مختلفي به خود بگيرد اما در هر حال شامل:‬
‫مجموعه اي از اصطلحات، توصيفي از معني آنها، ویژگی ها و بيان اينکه‬         ‫•‬
                           ‫چگونه اين اصطلحات با هم ارتباط دارند، است.‬

‫کنسرسيوم‪ W3C‬پيشنهاد مي کند که آنتولوژي ها بايد شامل توصيفاتي براي عناصر‬         ‫‪‬‬
                                                                  ‫زير باشند:‬
                                   ‫• کل س ها )يا چيزها( در حوزه مورد نظر‬
                                                 ‫• ارتباطات بين اين چيزها‬
                 ‫• مشخصات يا ويژگي هايي که اين چيزها بايد داشته باشند.‬
‫41‬
‫3. آنتولوژی‬

                                             ‫یک آنتولوژی نمونه‬   ‫‪‬‬




‫در آنتولوژي همه روابط دنياي واقعي مي تواند وجود داشته‬
                        ‫باشد‬
‫3. آنتولوژی‬

‫یک آنتولوژی نمونه‬   ‫‪‬‬




     ‫‪: Name‬‬
      ‫‪String‬‬
‫3. آنتولوژی‬

                                  ‫آنتولوژی هسته وب معنایی را تشکیل می دهد.‬      ‫‪‬‬
                        ‫آنتولوژی پیاده سازی عملی وب معنایی را به عهده دارد.‬     ‫‪‬‬
                                                           ‫واسطه گری آنتولوژی‬   ‫‪‬‬
                                              ‫• به دنبال شناسايي شباهت ها‬
                                           ‫• غلبه بر اختلفات بين آنتولوژي ها‬
‫• بيه منظور اسيتفاده مجدد و بيه اشتراک گذاري آنهيا بيين سييستم هيا و برنامه‬
                                     ‫هايي است که از آنها استفاده مي کنند.‬
                                          ‫واسطه گري آنتولوژي به سه زير حوزه‬     ‫‪‬‬
                                                           ‫• نگاشت آنتولوژي‬
                                                            ‫• ادغام آنتولوژي‬
                                                       ‫• انطباق آنتولوژي‬
                                                               ‫تقسيم مي شود.‬
‫يک بحث اصلي در همه اين رويکردها، شنا سايي و تعي ين همپوشا ني بين‬                ‫‪‬‬
            ‫مفاهيم، روابط، ويژگي ها و نمونه ها در آنتولوژي هاي مختلف است.‬
‫3.1 نگاشت آنتولوژی‬
                       ‫مقدمه‬

  ‫مراجع‬



                                    ‫وب‬
             ‫فهرست‬                 ‫معنایی‬
             ‫مطالب‬                             ‫نگاشت‬
‫پیشنهادات‬
  ‫آتی‬
                               ‫آنتولوژی‬
            ‫الگوریتم‬                             ‫ادغام‬
              ‫های‬
            ‫پیشنهادی‬

                                      ‫انطباق‬
‫81‬
‫3.1 نگاشت آنتولوژی‬

‫نگاشيت آنتولوژيي بيه دنبال نمايشي تناظرهاي يافتيه شده بيين آنتولوژيي هاست‬
                                          ‫ي‬                                  ‫‪‬‬
                                                     ‫)خروجی شکل زیر(.‬
                                                                   ‫نگاش‬
        ‫1‪O‬‬
                                                                     ‫ت‬
                    ‫ورود‬                         ‫خروج‬
                               ‫کشف نگاشت‬
                      ‫ی‬                             ‫ی‬
        ‫2‪O‬‬

                                                           ‫قواعد‬
                                                          ‫نگاشت‬
                                                  ‫استفاده از آنتولوژی واسط‬       ‫‪‬‬
                                                   ‫آنتولوژی واسط ترکیبی از‬       ‫‪‬‬
                                                   ‫• آنتولوژی های ورودی‬
                                                 ‫• قواعد )پل های( نگاشت‬
‫ادغام آنتولوژی‬     ‫3.2‬
                       ‫مقدمه‬

  ‫مراجع‬



                                    ‫وب‬
             ‫فهرست‬                 ‫معنایی‬
             ‫مطالب‬                             ‫نگاشت‬
‫پیشنهادات‬
  ‫آتی‬
                               ‫آنتولوژی‬
            ‫الگوریتم‬                             ‫ادغام‬
              ‫های‬
            ‫پیشنهادی‬

                                      ‫انطباق‬
‫02‬
‫ادغام آنتولوژی‬            ‫3.2‬

‫ادغام آنتولوژي سعي در ايجاد يک آنتولوژي جديد با ادغام کردن آنتولوژي هاي‬     ‫‪‬‬
                                                             ‫موجود دارد.‬
                                                                ‫دو رویکرد‬   ‫‪‬‬
                             ‫جایگزینی آنتولوژی های ورودی با آنتولوژی جدید‬   ‫‪‬‬
                                                ‫برای مثال الگوریتم ‪PROMPT‬‬   ‫‪‬‬



  ‫1‪O‬‬
              ‫ورود‬                         ‫خروج‬
                            ‫ادغام‬
                ‫ی‬                             ‫ی‬
  ‫2‪O‬‬
‫ادغام آنتولوژی‬                 ‫3.2‬
            ‫در روش دوم آنتولوژي هاي اوليه با يک آنتولوژي جديد جايگزين نمي شوند .‬      ‫‪‬‬
‫بلکه يک آنتولوژي پل ايجاد مي شود که آنتولوژي هاي اوليه را به عنوان ورودي مي گيرد و‬    ‫‪‬‬
                         ‫ادغام بين آنتولوژي ها را با استفاده قواعد پل نشيان مي دهد.‬
                                                   ‫برای نمونه الگوریتم ‪Onto-Merge‬‬     ‫‪‬‬


                                   ‫آنتولوژی پل‬



                         ‫1‪O‬‬                       ‫2‪O‬‬




                  ‫آنتولوژی‬       ‫قواعد پل‬                 ‫آنتولوژی‬
                   ‫ورودی‬                                   ‫ورودی‬
‫انطباق آنتولوژی‬         ‫3.3‬
                       ‫مقدمه‬

  ‫مراجع‬



                                    ‫وب‬
             ‫فهرست‬                 ‫معنایی‬
             ‫مطالب‬                                 ‫نگاشت‬
‫پیشنهادات‬
  ‫آتی‬
                               ‫آنتولوژی‬
            ‫الگوریتم‬                                 ‫ادغام‬
              ‫های‬
            ‫پیشنهادی‬

                                          ‫انطباق‬
‫32‬
‫انطباق آنتولوژی‬              ‫3.3‬

                                             ‫کشف تناظر بين آنتولوژي ها‬    ‫‪‬‬
‫نتيجيه عميل انطباق، شناسيايي شباهيت بيين موجودييت هاي آنتولوژي هاي داده‬   ‫‪‬‬
                                                              ‫شده است.‬
‫اين موجوديت ها کل س )مفهوم(، ويژگي هاي کل س )ویژگی های داده ای( و‬         ‫‪‬‬
                          ‫روابط بين دو کل س )ویژگی های شی ای( هستند.‬
‫3.4 الگوریتم های سه حوزه آنتولوژی‬
                                                       ‫واسطه گري‬
                                                        ‫آنتولوژي‬




   ‫ادغام آنتولوژي‬                                       ‫انطباق آنتولوژي‬
                                                                                                       ‫نگاشت آنتولوژي‬




             ‫ايجاد آنتولوژي جديد‬
                                      ‫ترکيبي‬                               ‫معنايي‬              ‫نحوي‬
                                                     ‫ساختاري‬
‫استفاده از قواعد‬
    ‫نگاشت‬




                                                                                     ‫‪n-gram‬‬      ‫فاصله ويرايش‬   ‫پسوند‬   ‫پيشوند‬



                                                                            ‫منبع زبان شناختي‬
                                                 ‫منبع زبان شناختي خاص‬
                                                                                ‫عمومي‬




                                   ‫الگوريتم هاي مختلف واسطه گري آنتولوژي‬
‫3.4 الگوریتم های سه حوزه آنتولوژی‬
‫3.4 الگوریتم های سه حوزه آنتولوژی‬
‫3.4 الگوریتم های سه حوزه آنتولوژی‬
‫4. الگوریتم های پیشنهادی‬
                              ‫مراجع‬
                                                         ‫وب‬
                                                        ‫معنایی‬



     ‫پیشنهادات‬
       ‫آتی‬                       ‫ساختار‬
                                 ‫فهرست‬
                                                            ‫وب‬
                                  ‫مطالب‬
                                   ‫کلی‬                     ‫معنایی‬



                   ‫الگوریتم‬
                     ‫های‬
                   ‫پیشنهادی‬
 ‫ترکیبی‬                                      ‫آنتولوژی‬
                 ‫ساختاری‬        ‫+‪MLMA‬‬

‫92‬
‫‪+MLMA‬‬         ‫4.1 الگوریتم‬

                                                     ‫دارای سه فاز است.‬     ‫‪‬‬
                                                               ‫فاز اول:‬    ‫‪‬‬


             ‫]‪[LEVENSHTEIN‬‬
‫1‪O‬‬
     ‫ورودی‬                         ‫خروجی اولیه‬
              ‫]‪[WORDNET‬‬                           ‫] ماتریس شباهت معنایی[‬
‫2‪O‬‬


                                                            ‫نرمال سازی‬


                                  ‫اعمال آستانه‬
              ‫]وضعیت اولیه 0‪[st‬‬                  ‫] ماتریس شباهت اولیه ‪[L‬‬
                                      ‫54.0= ‪th‬‬
‫‪+MLMA‬‬      ‫4.1 الگوریتم‬

                                                                            ‫فاز دوم‬   ‫‪‬‬




‫]وضعیت اولیه 0‪[st‬‬
                                                         ‫ایجاد وضعیت های کاندید‬




‫= ‪v = ( Map0−1.L) / k‬‬
 ‫‪n‬‬   ‫‪m‬‬                      ‫‪n‬‬    ‫‪m‬‬                          ‫محاسبه نمره ‪v‬‬
‫.‪∑∑ Map0−1 (i, j ).L(i, j ) / ∑∑ Map0−1 (i, j ) ≥ th‬‬
‫1= ‪i =1 j‬‬                  ‫1= ‪i =1 j‬‬
‫‪+MLMA‬‬       ‫4.1 الگوریتم‬

                                                                    ‫فاز سوم:‬   ‫‪‬‬
‫فيلتر کردن تعدادي از همسايه هاي ايجاد شده بوسيله نگهداري حد بالی ‪ %x‬از‬         ‫‪‬‬
                                    ‫وضعيت هايي که بیشترین مقدار ‪ v‬را دارند.‬
‫الگوريتم معيار شباهت سطح بعدي را )که يک معيار شباهت ساختاري است( به‬            ‫‪‬‬
   ‫وضعيت هاي باقيمانده اعمال مي شود تا بهترين وضعيت از بين آنها بدست آيد.‬



                                                          ‫‪+MLMA‬‬     ‫مشکلت‬      ‫‪‬‬
              ‫ايجاد وضعيت هاي همسايه بسيار زياد و در عين حال تصادفي‬       ‫•‬
           ‫ايجاد وضعيت هاي همسايه زيادي که از وضعيت اوليه بدتر هستند‬      ‫•‬
                   ‫در نظر نگرفتن وضعيت اوليه به عنوان يک وضعيت کانديد‬     ‫•‬
‫وضعييت هاي همسيايه داراي 1+‪ k‬ييا 1-‪ k‬جفيت موجودييت منطبق شده‬              ‫•‬
‫هستند که وضعيت هاي با 1+‪ k‬جفت همواره از وضعيت اوليه بدتر اند )‪k‬‬
                                              ‫تعداد نگاشت های یافته شده(.‬
‫‪+MLMA‬‬      ‫4.1 الگوریتم‬

                         ‫‪: +MLMA‬‬ ‫بهبود‬   ‫‪‬‬
‫فرض کنيد تعداد 1+‪ n‬عدد داده شده است.‬     ‫‪‬‬
‫‪+MLMA‬‬          ‫4.1 الگوریتم‬

                                                                ‫‪: +MLMA‬‬   ‫بهبود‬   ‫‪‬‬




                                                          ‫0‪st‬‬ ‫تبدیل 0 به 1 در‬     ‫‪‬‬
                                                                  ‫تبدیل 1 به 0‬    ‫‪‬‬
                                                             ‫بزرگتر از 0‪v‬‬    ‫•‬
                                             ‫کوچکتر از 0‪ v‬و بزرگتر از ‪th‬‬     ‫•‬

‫براي اينکه بزرگترين مقادير ‪ v‬را بدست آوريم بايد کوچکترين مقادير بزرگتر از‬         ‫‪‬‬
                                                 ‫آستانه را به 0 تبدیل کنیم.‬
‫‪+MLMA‬‬   ‫4.1 الگوریتم‬

             ‫مثال:‬   ‫‪‬‬
‫‪n×m× p‬‬




                                                          ‫4.1 الگوریتم ‪+MLMA‬‬

                                                                    ‫ارزیابی الگوریتم:‬   ‫‪‬‬
         ‫فرض ميي کنييم بدسيت آوردن هير وضعييت همسيايه از روي وضعييت اوليه و‬             ‫‪‬‬
                                      ‫محاسبه نمره ‪ V‬آن نيازمند ‪ p‬واحد زماني است.‬
         ‫فرض کنييم کيه وضعييت هاي همسيايه در آراييه هاي بيتيي ذخيره شوند و برای‬         ‫‪‬‬
                                      ‫ذخيره هر نمره به بيت حافظه نياز داشته باشد.‬

             ‫‪n×m× p‬‬                           ‫‪+MLMA‬‬
             ‫‪3× p‬‬




                                                             ‫ان‬
                                           ‫نسخه بهبود‬




                                                               ‫زم‬
                                                  ‫یافته‬


  ‫) 4 ‪((n 2 × m 2 ) + (n × m × p)) = O(n‬‬      ‫‪+MLMA‬‬
                                                               ‫ظ‬‫ه ح اف‬
  ‫) 2 ‪(3 × n × m) + (3 × p) = O(n‬‬          ‫نسخه بهبود‬
                                                  ‫یافته‬
+MLMA ‫4.1 الگوریتم‬
                                                     Neighbor Search    Improved Neighbor Search
            x103
                      25


Time Units            20

                      15

                      10

                            5

                            0
                                    10    20    30       40      50     60      70       80        90   100
                                                                 Dimension


         ‫مقايسه پيچيدگي زماني جستجوي همسايه و نسخه بهبود يافته‬
                                    ‫آن‬
                                                     Neighbor Search    Improved Neighbor Search
                            x106
                            14
                            12
      Memory Usage (Byte)




                            10
                                8
                                6
                                4
                                2
                                0
                                     10    20   30        40      50     60      70      80        90   100
                                                                  Dimension



                            ‫مقايسه حافظه مصرفی جستجوي همسايه و نسخه بهبود يافته‬
                                                       ‫آن‬
‫4.2 الگوریتم ساختاری‬

                                        ‫دارای سه فاز است.‬    ‫‪‬‬
                                                  ‫فاز اول:‬   ‫‪‬‬



‫1‪O‬‬   ‫] ماتریس همسایگی1[‬                  ‫] لیست پیوندی1[‬



     ‫] ماتریس همسایگی2[‬                  ‫] لیست پیوندی2[‬
‫2‪O‬‬




                             ‫بهبود‬
     ‫] ماتریس شباهت نهایی[‬           ‫] ماتریس شباهت اولیه[‬
‫4.2 الگوریتم ساختاری‬
‫4.2 الگوریتم ساختاری‬

     'superclass) ،'equivalent ‫ يا‬is-a' (subclass'   ‫تشکیل ماتریس همسایه بر اسا س روابط‬        
                                                                                'disjoint' ‫و‬

                                                                   0   1 0 0 1 0 1 0 0 0
              B1               B2
                                                                   1   0 1 1 0 0 0 0 0 0
                                                                                         
                                                                   0   1 0 0 0 0 0 0 0 0
                                                                                         
                                                                   0   1 0 0 0 0 0 0 0 0
                      B
                                                                   1   0 0 0 0 1 1 0 0 0
                                                        Neighbor =                       
                                                                   0   0 0 0 1 0 0 0 0 0
                                                                   1   0 0 0 1 0 0 1 1 1 
                      A                                                                  
                                                                   0   0 0 0 0 0 1 0 1 0
                                                                                         
                                                                   0   0 0 0 0 0 1 1 0 0
              D                C         C1                        0
                                                                       0 0 0 0 0 1 0 0 0


D1            D2          D3
‫4.2 الگوریتم ساختاری‬
                                              ‫بدست آوردن ماتریس شباهت اولیه‬                          
                              3 1 1 3    
  Linked _ list ( Node( A)) = 3 3 5 1
                              
                                          
                                          
                              5 3 3 2 2 1
                                         

                                2 1 3         
  Linked _ list ( Node( A' )) = 3 4 1 4
                                
                                               
                                               
                                4 5 2 4 1
                                              
                                               


p = 2 × commonChars (CharSequence1, CharSequence2)
                                                     length(CharSequence1) + length(CharSequence2)
‫4.2 الگوریتم ساختاری‬

                                               ‫بهبود ماتریس شباهت اولیه بدست آمده:‬      ‫‪‬‬
‫اگر دو ند از آنتولوژي مبدأ و مقصد با هم شبيه بودند ميزان شباهت همسايه هاي آنها‬      ‫•‬
                                    ‫به اندازه يک مقدار داده شده افزايش مي يابد.‬
‫اگير دو نيد از آنتولوژيي هاي مبدأ و مقصيد داراي همسيايه شيبيه بيه هيم باشند ميزان‬   ‫•‬
                                            ‫شباهت آنها به اندازه افزايش مي يابد.‬
‫اگر دو ند از آنتولوژي مبدأ و مقصد داراي ويژگي نوع داده اي مشترک باشند، ميزان‬        ‫•‬
                          ‫شباهت آنها براي يک داده شده به اندازه افزايش مي يابد.‬
                                                                    ‫ارزیابی الگوریتم‬    ‫‪‬‬
                                   ‫‪# correct _ found _ alignmnets‬‬
                     ‫= ‪precision‬‬
                                        ‫‪# found _ alignments‬‬

                                ‫‪# correct _ found _ alignmnets‬‬
                     ‫= ‪Recall‬‬
                                    ‫‪# existing _ alignments‬‬
                                      ‫‪2 × Precision × Recall‬‬
                    ‫= ‪F − Measure‬‬
                                        ‫‪Precision + Recall‬‬
‫4.2 الگوریتم ساختاری‬
‫4.3 الگوریتم ترکیبی‬

‫1‪O‬‬    ‫] ماتریس شباهت ساختاری[‬

                                ‫وزن دهی‬
‫2‪O‬‬      ‫] ماتریس شباهت نحوی[‬




                                   ‫] ماتریس شباهت نهایی[‬




     ‫] ماتریس شباهت مفاهیم[‬



      ‫] ماتریس شباهت روابط[‬



     ‫] ماتریس شباهت ویژگی ها[‬
‫4.3 الگوریتم ترکیبی‬
                                                                                             :‫شباهت نحوی‬    
                 Lexical _ Similarity ( s, t ) = 1 − dis tan ce( s, t )
                                                                          max_ len( s, t )


                          s =" Part Of "
                         t ="is _ part _ of "                                                       :‫مثال‬   
                         bag _ of _ words ( s) = {" Part", "Of "}
                         bag _ of _ words (t ) = {"is", " part", "of "}



                         bags _ of _ words ( s ) = {}
                         bags _ of _ words (t ) = {" is"}




                                     Levenshtein _ distance("", "is" ) 
Lexical _ similarity ( s, t ) = 1 − 
                                                                        = 1 − 2 = 0.80
                                                                        
                                              max(7,10)                        10
‫4.3 الگوریتم ترکیبی‬
                                                                                             ‫ترکیب نتایج:‬   ‫‪‬‬
                                                                                         ‫• شباهت کل س:‬
‫‪NamedClasses _ Similarity = α × Lexical _ NC _ Matrix + β × Structural _ Matrix‬‬
                                                                                  ‫‪α +β‬‬


                                                                 ‫شباهت ویژگی های شی و داده:‬            ‫•‬
                                                                    ‫‪ o‬افزایش به اندازه بایا س‬
‫4.3 الگوریتم ترکیبی‬

                                                           ‫ارزیابی الگوریتم‬          ‫‪‬‬




‫همانگونه که جدول پائین نشان مي دهد الگوريتم داراي مقادير ‪ precision‬و ‪ recall‬ي‬    ‫‪‬‬
‫بهتر از الگوريتم هاي ‪ MapPSO ،GeRoMe‬و ‪ SPIDER‬است و ‪ recall‬ي بهتر از هميه آنها‬
                                                                         ‫دارد.‬
‫پیشنهادات آتی‬            ‫5.‬

       ‫ترکیب الگوريتم ساختاري پيشنهادي با الگوریتم های نحوی و معنایی دیگر.‬     ‫‪‬‬
‫ارائه الگوريتم هايي براي انطباق آنتولوژي به زبان فارسي و انطباق آنتولوژي بين‬   ‫‪‬‬
                                                ‫زبان فارسي و زبان انگليسي.‬
                 ‫معرفی و توسعه ابزارهايي براي وب معنايي در زبان فارسي .‬        ‫‪‬‬
‫6. مراجع‬
1.    D. Fensel, "Ontologies: A Silver Bullet for Knowledge Management and Electronic Commerce", Springer, New
      York, USA, 2001.

2.    J. Davies, D. Fensel, and F. V. Harmelen, (Eds), "Towards the Semantic Web: Ontology Driven Knowledge
      Management", John Wiley & Sons, New York, 2003.

3.    G. Stumme, A. Hotho, and B. Berendt, "Semantic Web Mining State of the art and future directions", Web
      Semantics: Science, Services and Agents on the World Wide Web, 4 (2006), pp. 124–143.

4.    K. K. Breitman, M. A. Casanova, and W. Truszkowski, "Semantic Web: Concepts, Technologies and
      Applications", Springer Verlag, 2007.

5.    N. F. Noy, and M. A. Musen, "PROMPT: Algorithm and tool for automated ontology merging and alignment", in
      Proc. 17th Natl. Conf. On Artificial Intelligence (AAAI2000), Austin, Texas, USA, 2000.

6.    T. B. Passin, "Explorer’s Guide to the Semantic Web", Manning Publications Co: USA, 2004.

7.    T. Berners-Lee, "Weaving the web: The Original Design and Ultimate Destiny of the World Wide Web by Its
      Inventor", New York: HarperCollins, 2000.

8.    T. Pedersen, and S. Patwardhan, "WordNet::Similarity – Measuring the Relatedness of Concepts", In
      Proceedings of 19th National Conference on AI, San Jose, CA, 2004.

9.    http://www.w3.org/2001/sw/.

10.   www.w3.org/2001/sw/Activity.

11.   R. S. Cost, et al, "ItTALKS: A Case Study in the Semantic Web and DAML", SWWS'01: The First Semantic Web
      Working Symposium, 2001.
‫با تشکر‬



‫05‬

Contenu connexe

En vedette

Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
 
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them wellGood Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Saba Software
 

En vedette (20)

Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 
ChatGPT webinar slides
ChatGPT webinar slidesChatGPT webinar slides
ChatGPT webinar slides
 
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike RoutesMore than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
 
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
 
Barbie - Brand Strategy Presentation
Barbie - Brand Strategy PresentationBarbie - Brand Strategy Presentation
Barbie - Brand Strategy Presentation
 
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them wellGood Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
 

Ontology matching

  • 1. ‫ارائه الگوریتمی برای وب معنایی مبتنی بر‬ ‫آنتولوژی‬ ‫ارائه کننده : اسماعيل اکبري‬ ‫استاد راهنما: دکتر فتحیان‬
  • 2. ‫مقدمه‬ ‫1‬ ‫مراجع‬ ‫مقدمه‬ ‫پیشنهادات‬ ‫آتی‬ ‫ساختار‬ ‫فهرست‬ ‫وب‬ ‫مطالب‬ ‫کلی‬ ‫معنایی‬ ‫الگوریتم‬ ‫آنتولوژی‬ ‫ها و نتایج‬ ‫های‬ ‫پیشنهادی‬ ‫2‬
  • 3. ‫وب معنایی‬ ‫2‬ ‫مقدمه‬ ‫ظهور‬ ‫مراجع‬ ‫اصول‬ ‫پیشنهادات‬ ‫وب‬ ‫آتی‬ ‫فهرست‬ ‫معنایی‬ ‫مطالب‬ ‫چارچوب‬ ‫الگوریتم‬ ‫های‬ ‫آنتولوژی‬ ‫پیشنهادی‬ ‫3‬
  • 4. ‫ظهور وب معنایی‬ ‫2.1‬ ‫ح‬ ‫جم‬ ‫زی‬ ‫تف‬ ‫اد‬ ‫ی‬ ‫س‬ ‫دا‬ ‫ر،‬ ‫ده‬ ‫ر‬ ‫ا‬ ‫ب‬ ‫زیا‬ ‫داده ساخت‬ ‫ی‬ ‫نیافته‬ ‫ی،‬ ‫بند‬ ‫سته اب‬ ‫تخ‬ ‫د ان‬ ‫ل درک‬ ‫اب‬ ‫ق‬ ‫ب‬ ‫اع‬ ‫چرا‬ ‫ث‬ ‫نه؟‬ ‫4‬
  • 5. ‫ظهور وب معنایی‬ ‫2.1‬ ‫چرا کامپیوترها نمی توانند این کار را برای ما انجام دهند؟‬ ‫‪‬‬ ‫• یکی از دلیلش این است که صفحات وب شامل‬ ‫‪ o‬اطلعاتی راجع به خودشان‬ ‫‪ o‬اطلعاتی راجع به محتویاتشان‬ ‫‪ o‬اطلعاتی راجع به موضوعی که حاوی مطلب در مورد آن هستند‬ ‫‪ o‬و ...‬ ‫نیستند.‬ ‫مثال: جستجوی کتاب ‪ TCP/IP‬در یک کتابخانه‬ ‫‪‬‬ ‫5‬
  • 6. ‫ظهور وب معنایی‬ ‫2.1‬ ‫این دقیقا همان وضعیتی است که در وب نحوی با آن روبرو هستیم.‬ ‫‪‬‬ ‫نتيجه اينکه وب به عنوان ابزاري براي تبادل اطلعات بين افراد توسعه يافته است‬ ‫‪‬‬ ‫تا براي ماشين ها.‬ ‫بيه عنوان پياميد آين، محتواي معناييي، کيه معنيي اطلعات درون ييک صفحه وب‬ ‫‪‬‬ ‫است، به گونه اي کد شده است که تنها براي انسان قابل استفاده است.‬ ‫عبارت وب معنا یی بیانگر این ديدگاه است که کامپيوترها نيز بتوانند مانند انسان‬ ‫‪‬‬ ‫داده هاي روي وب را پيدا کرده، خوانده، درک و استفاده کنند.‬ ‫هدف وب معنايي توسعه استانداردها و تکنولوژي هاي تواناسازي است که براي‬ ‫‪‬‬ ‫کمک به ماشين ها به منظور فهم بيشتر اطلعات روي وب طراحي شده اند.‬
  • 7. ‫اصول وب معنایی‬ ‫2.2‬ ‫مقدمه‬ ‫ظهور‬ ‫مراجع‬ ‫وب‬ ‫اصول‬ ‫پیشنهادات‬ ‫آتی‬ ‫فهرست‬ ‫معنایی‬ ‫مطالب‬ ‫چارچوب‬ ‫الگوریتم‬ ‫های‬ ‫آنتولوژی‬ ‫پیشنهادی‬ ‫7‬
  • 8. ‫اصول وب معنایی‬ ‫2.2‬ ‫اصل1: هر چیزی می تواند توسط ‪ URI‬ها شناسایی شود‬ ‫‪‬‬ ‫• به افراد، مکان ها و چيزها در دنياي فيزيکي مي توان در وب معنايي بوسيله‬ ‫شناسه هاي گوناگون رجوع کرد‬ ‫8‬
  • 9. ‫اصول وب معنایی‬ ‫2.2‬ ‫اصل2: منابع و لينک ها مي توانند داراي نوع باشند‬ ‫‪‬‬ ‫وب کنونی‬ ‫وب معنایی‬ ‫9‬
  • 10. ‫اصول وب معنایی‬ ‫2.2‬ ‫اصل3: تکامل پشتيباني مي شود .‬ ‫‪‬‬ ‫اطلعات‬ ‫اطلعات‬ ‫کنونی‬ ‫قدیمی‬ ‫01‬
  • 11. ‫2.3 چارچوب وب معنایی‬ ‫مقدمه‬ ‫ظهور‬ ‫مراجع‬ ‫پیشنهادات‬ ‫وب‬ ‫اصول‬ ‫آتی‬ ‫فهرست‬ ‫معنایی‬ ‫مطالب‬ ‫چارچوب‬ ‫الگوریتم‬ ‫های‬ ‫آنتولوژی‬ ‫پیشنهادی‬ ‫11‬
  • 12. ‫2.3 چارچوب وب معنایی‬ ‫مراحل زیر مسیری را نشان می دهد که وب معنایی در پیش گرفته است:‬ ‫‪‬‬ ‫فراهم کردن ‪ syntax‬مشترک برای جملت قابل فهم توسط ماشین‬ ‫.1‬ ‫ساختن لغات )‪ (vocabularies‬مشترک‬ ‫.2‬ ‫توافق بر روی یک زبان منطقی‬ ‫.3‬ ‫استفاده از زبان برا ی تبادل اثبات ها‬ ‫.4‬ ‫آقای برنرزلی مخترع وب کنونی و نیز وب معنایی یک ساختار لیه ای را برای وب‬ ‫‪‬‬ ‫معنایی پیشنهاد کرد. این ساختار مراحلی که در بال لیست شد را منعکس می کند.‬ ‫تکنولوژی های‬ ‫تکمیل نشده‬ ‫وب معنایی‬ ‫تکنولوژی های‬ ‫تکمیل شده وب‬ ‫معنایی‬ ‫تکنولوژی‬ ‫های وب‬
  • 13. ‫3. آنتولوژی‬ ‫مقدمه‬ ‫مراجع‬ ‫وب‬ ‫فهرست‬ ‫معنایی‬ ‫مطالب‬ ‫نگاشت‬ ‫پیشنهادات‬ ‫آتی‬ ‫آنتولوژی‬ ‫الگوریتم‬ ‫ادغام‬ ‫های‬ ‫پیشنهادی‬ ‫انطباق‬ ‫31‬
  • 14. ‫3. آنتولوژی‬ ‫آنتولوژي ها در حوزه هاي مختلف علوم کامپيوتر مانند هوش مصنوعي، نمايش‬ ‫‪‬‬ ‫دانش، پردازش زبان طبيعي، وب معنايي، مهندسي نرم افزار و... استفاده شده‬ ‫اند. بنابرايين ايين انتظار وجود دارد کيه تعرييف هاي مختلفيي از آين وجود داشته‬ ‫باشد.‬ ‫اوشولد و جاسپر بيان مي کنند که اگرچه يک آنتولوژي ممکن است فرمت هاي‬ ‫‪‬‬ ‫مختلفي به خود بگيرد اما در هر حال شامل:‬ ‫مجموعه اي از اصطلحات، توصيفي از معني آنها، ویژگی ها و بيان اينکه‬ ‫•‬ ‫چگونه اين اصطلحات با هم ارتباط دارند، است.‬ ‫کنسرسيوم‪ W3C‬پيشنهاد مي کند که آنتولوژي ها بايد شامل توصيفاتي براي عناصر‬ ‫‪‬‬ ‫زير باشند:‬ ‫• کل س ها )يا چيزها( در حوزه مورد نظر‬ ‫• ارتباطات بين اين چيزها‬ ‫• مشخصات يا ويژگي هايي که اين چيزها بايد داشته باشند.‬ ‫41‬
  • 15. ‫3. آنتولوژی‬ ‫یک آنتولوژی نمونه‬ ‫‪‬‬ ‫در آنتولوژي همه روابط دنياي واقعي مي تواند وجود داشته‬ ‫باشد‬
  • 16. ‫3. آنتولوژی‬ ‫یک آنتولوژی نمونه‬ ‫‪‬‬ ‫‪: Name‬‬ ‫‪String‬‬
  • 17. ‫3. آنتولوژی‬ ‫آنتولوژی هسته وب معنایی را تشکیل می دهد.‬ ‫‪‬‬ ‫آنتولوژی پیاده سازی عملی وب معنایی را به عهده دارد.‬ ‫‪‬‬ ‫واسطه گری آنتولوژی‬ ‫‪‬‬ ‫• به دنبال شناسايي شباهت ها‬ ‫• غلبه بر اختلفات بين آنتولوژي ها‬ ‫• بيه منظور اسيتفاده مجدد و بيه اشتراک گذاري آنهيا بيين سييستم هيا و برنامه‬ ‫هايي است که از آنها استفاده مي کنند.‬ ‫واسطه گري آنتولوژي به سه زير حوزه‬ ‫‪‬‬ ‫• نگاشت آنتولوژي‬ ‫• ادغام آنتولوژي‬ ‫• انطباق آنتولوژي‬ ‫تقسيم مي شود.‬ ‫يک بحث اصلي در همه اين رويکردها، شنا سايي و تعي ين همپوشا ني بين‬ ‫‪‬‬ ‫مفاهيم، روابط، ويژگي ها و نمونه ها در آنتولوژي هاي مختلف است.‬
  • 18. ‫3.1 نگاشت آنتولوژی‬ ‫مقدمه‬ ‫مراجع‬ ‫وب‬ ‫فهرست‬ ‫معنایی‬ ‫مطالب‬ ‫نگاشت‬ ‫پیشنهادات‬ ‫آتی‬ ‫آنتولوژی‬ ‫الگوریتم‬ ‫ادغام‬ ‫های‬ ‫پیشنهادی‬ ‫انطباق‬ ‫81‬
  • 19. ‫3.1 نگاشت آنتولوژی‬ ‫نگاشيت آنتولوژيي بيه دنبال نمايشي تناظرهاي يافتيه شده بيين آنتولوژيي هاست‬ ‫ي‬ ‫‪‬‬ ‫)خروجی شکل زیر(.‬ ‫نگاش‬ ‫1‪O‬‬ ‫ت‬ ‫ورود‬ ‫خروج‬ ‫کشف نگاشت‬ ‫ی‬ ‫ی‬ ‫2‪O‬‬ ‫قواعد‬ ‫نگاشت‬ ‫استفاده از آنتولوژی واسط‬ ‫‪‬‬ ‫آنتولوژی واسط ترکیبی از‬ ‫‪‬‬ ‫• آنتولوژی های ورودی‬ ‫• قواعد )پل های( نگاشت‬
  • 20. ‫ادغام آنتولوژی‬ ‫3.2‬ ‫مقدمه‬ ‫مراجع‬ ‫وب‬ ‫فهرست‬ ‫معنایی‬ ‫مطالب‬ ‫نگاشت‬ ‫پیشنهادات‬ ‫آتی‬ ‫آنتولوژی‬ ‫الگوریتم‬ ‫ادغام‬ ‫های‬ ‫پیشنهادی‬ ‫انطباق‬ ‫02‬
  • 21. ‫ادغام آنتولوژی‬ ‫3.2‬ ‫ادغام آنتولوژي سعي در ايجاد يک آنتولوژي جديد با ادغام کردن آنتولوژي هاي‬ ‫‪‬‬ ‫موجود دارد.‬ ‫دو رویکرد‬ ‫‪‬‬ ‫جایگزینی آنتولوژی های ورودی با آنتولوژی جدید‬ ‫‪‬‬ ‫برای مثال الگوریتم ‪PROMPT‬‬ ‫‪‬‬ ‫1‪O‬‬ ‫ورود‬ ‫خروج‬ ‫ادغام‬ ‫ی‬ ‫ی‬ ‫2‪O‬‬
  • 22. ‫ادغام آنتولوژی‬ ‫3.2‬ ‫در روش دوم آنتولوژي هاي اوليه با يک آنتولوژي جديد جايگزين نمي شوند .‬ ‫‪‬‬ ‫بلکه يک آنتولوژي پل ايجاد مي شود که آنتولوژي هاي اوليه را به عنوان ورودي مي گيرد و‬ ‫‪‬‬ ‫ادغام بين آنتولوژي ها را با استفاده قواعد پل نشيان مي دهد.‬ ‫برای نمونه الگوریتم ‪Onto-Merge‬‬ ‫‪‬‬ ‫آنتولوژی پل‬ ‫1‪O‬‬ ‫2‪O‬‬ ‫آنتولوژی‬ ‫قواعد پل‬ ‫آنتولوژی‬ ‫ورودی‬ ‫ورودی‬
  • 23. ‫انطباق آنتولوژی‬ ‫3.3‬ ‫مقدمه‬ ‫مراجع‬ ‫وب‬ ‫فهرست‬ ‫معنایی‬ ‫مطالب‬ ‫نگاشت‬ ‫پیشنهادات‬ ‫آتی‬ ‫آنتولوژی‬ ‫الگوریتم‬ ‫ادغام‬ ‫های‬ ‫پیشنهادی‬ ‫انطباق‬ ‫32‬
  • 24. ‫انطباق آنتولوژی‬ ‫3.3‬ ‫کشف تناظر بين آنتولوژي ها‬ ‫‪‬‬ ‫نتيجيه عميل انطباق، شناسيايي شباهيت بيين موجودييت هاي آنتولوژي هاي داده‬ ‫‪‬‬ ‫شده است.‬ ‫اين موجوديت ها کل س )مفهوم(، ويژگي هاي کل س )ویژگی های داده ای( و‬ ‫‪‬‬ ‫روابط بين دو کل س )ویژگی های شی ای( هستند.‬
  • 25. ‫3.4 الگوریتم های سه حوزه آنتولوژی‬ ‫واسطه گري‬ ‫آنتولوژي‬ ‫ادغام آنتولوژي‬ ‫انطباق آنتولوژي‬ ‫نگاشت آنتولوژي‬ ‫ايجاد آنتولوژي جديد‬ ‫ترکيبي‬ ‫معنايي‬ ‫نحوي‬ ‫ساختاري‬ ‫استفاده از قواعد‬ ‫نگاشت‬ ‫‪n-gram‬‬ ‫فاصله ويرايش‬ ‫پسوند‬ ‫پيشوند‬ ‫منبع زبان شناختي‬ ‫منبع زبان شناختي خاص‬ ‫عمومي‬ ‫الگوريتم هاي مختلف واسطه گري آنتولوژي‬
  • 26. ‫3.4 الگوریتم های سه حوزه آنتولوژی‬
  • 27. ‫3.4 الگوریتم های سه حوزه آنتولوژی‬
  • 28. ‫3.4 الگوریتم های سه حوزه آنتولوژی‬
  • 29. ‫4. الگوریتم های پیشنهادی‬ ‫مراجع‬ ‫وب‬ ‫معنایی‬ ‫پیشنهادات‬ ‫آتی‬ ‫ساختار‬ ‫فهرست‬ ‫وب‬ ‫مطالب‬ ‫کلی‬ ‫معنایی‬ ‫الگوریتم‬ ‫های‬ ‫پیشنهادی‬ ‫ترکیبی‬ ‫آنتولوژی‬ ‫ساختاری‬ ‫+‪MLMA‬‬ ‫92‬
  • 30. ‫‪+MLMA‬‬ ‫4.1 الگوریتم‬ ‫دارای سه فاز است.‬ ‫‪‬‬ ‫فاز اول:‬ ‫‪‬‬ ‫]‪[LEVENSHTEIN‬‬ ‫1‪O‬‬ ‫ورودی‬ ‫خروجی اولیه‬ ‫]‪[WORDNET‬‬ ‫] ماتریس شباهت معنایی[‬ ‫2‪O‬‬ ‫نرمال سازی‬ ‫اعمال آستانه‬ ‫]وضعیت اولیه 0‪[st‬‬ ‫] ماتریس شباهت اولیه ‪[L‬‬ ‫54.0= ‪th‬‬
  • 31. ‫‪+MLMA‬‬ ‫4.1 الگوریتم‬ ‫فاز دوم‬ ‫‪‬‬ ‫]وضعیت اولیه 0‪[st‬‬ ‫ایجاد وضعیت های کاندید‬ ‫= ‪v = ( Map0−1.L) / k‬‬ ‫‪n‬‬ ‫‪m‬‬ ‫‪n‬‬ ‫‪m‬‬ ‫محاسبه نمره ‪v‬‬ ‫.‪∑∑ Map0−1 (i, j ).L(i, j ) / ∑∑ Map0−1 (i, j ) ≥ th‬‬ ‫1= ‪i =1 j‬‬ ‫1= ‪i =1 j‬‬
  • 32. ‫‪+MLMA‬‬ ‫4.1 الگوریتم‬ ‫فاز سوم:‬ ‫‪‬‬ ‫فيلتر کردن تعدادي از همسايه هاي ايجاد شده بوسيله نگهداري حد بالی ‪ %x‬از‬ ‫‪‬‬ ‫وضعيت هايي که بیشترین مقدار ‪ v‬را دارند.‬ ‫الگوريتم معيار شباهت سطح بعدي را )که يک معيار شباهت ساختاري است( به‬ ‫‪‬‬ ‫وضعيت هاي باقيمانده اعمال مي شود تا بهترين وضعيت از بين آنها بدست آيد.‬ ‫‪+MLMA‬‬ ‫مشکلت‬ ‫‪‬‬ ‫ايجاد وضعيت هاي همسايه بسيار زياد و در عين حال تصادفي‬ ‫•‬ ‫ايجاد وضعيت هاي همسايه زيادي که از وضعيت اوليه بدتر هستند‬ ‫•‬ ‫در نظر نگرفتن وضعيت اوليه به عنوان يک وضعيت کانديد‬ ‫•‬ ‫وضعييت هاي همسيايه داراي 1+‪ k‬ييا 1-‪ k‬جفيت موجودييت منطبق شده‬ ‫•‬ ‫هستند که وضعيت هاي با 1+‪ k‬جفت همواره از وضعيت اوليه بدتر اند )‪k‬‬ ‫تعداد نگاشت های یافته شده(.‬
  • 33. ‫‪+MLMA‬‬ ‫4.1 الگوریتم‬ ‫‪: +MLMA‬‬ ‫بهبود‬ ‫‪‬‬ ‫فرض کنيد تعداد 1+‪ n‬عدد داده شده است.‬ ‫‪‬‬
  • 34. ‫‪+MLMA‬‬ ‫4.1 الگوریتم‬ ‫‪: +MLMA‬‬ ‫بهبود‬ ‫‪‬‬ ‫0‪st‬‬ ‫تبدیل 0 به 1 در‬ ‫‪‬‬ ‫تبدیل 1 به 0‬ ‫‪‬‬ ‫بزرگتر از 0‪v‬‬ ‫•‬ ‫کوچکتر از 0‪ v‬و بزرگتر از ‪th‬‬ ‫•‬ ‫براي اينکه بزرگترين مقادير ‪ v‬را بدست آوريم بايد کوچکترين مقادير بزرگتر از‬ ‫‪‬‬ ‫آستانه را به 0 تبدیل کنیم.‬
  • 35. ‫‪+MLMA‬‬ ‫4.1 الگوریتم‬ ‫مثال:‬ ‫‪‬‬
  • 36. ‫‪n×m× p‬‬ ‫4.1 الگوریتم ‪+MLMA‬‬ ‫ارزیابی الگوریتم:‬ ‫‪‬‬ ‫فرض ميي کنييم بدسيت آوردن هير وضعييت همسيايه از روي وضعييت اوليه و‬ ‫‪‬‬ ‫محاسبه نمره ‪ V‬آن نيازمند ‪ p‬واحد زماني است.‬ ‫فرض کنييم کيه وضعييت هاي همسيايه در آراييه هاي بيتيي ذخيره شوند و برای‬ ‫‪‬‬ ‫ذخيره هر نمره به بيت حافظه نياز داشته باشد.‬ ‫‪n×m× p‬‬ ‫‪+MLMA‬‬ ‫‪3× p‬‬ ‫ان‬ ‫نسخه بهبود‬ ‫زم‬ ‫یافته‬ ‫) 4 ‪((n 2 × m 2 ) + (n × m × p)) = O(n‬‬ ‫‪+MLMA‬‬ ‫ظ‬‫ه ح اف‬ ‫) 2 ‪(3 × n × m) + (3 × p) = O(n‬‬ ‫نسخه بهبود‬ ‫یافته‬
  • 37. +MLMA ‫4.1 الگوریتم‬ Neighbor Search Improved Neighbor Search x103 25 Time Units 20 15 10 5 0 10 20 30 40 50 60 70 80 90 100 Dimension ‫مقايسه پيچيدگي زماني جستجوي همسايه و نسخه بهبود يافته‬ ‫آن‬ Neighbor Search Improved Neighbor Search x106 14 12 Memory Usage (Byte) 10 8 6 4 2 0 10 20 30 40 50 60 70 80 90 100 Dimension ‫مقايسه حافظه مصرفی جستجوي همسايه و نسخه بهبود يافته‬ ‫آن‬
  • 38. ‫4.2 الگوریتم ساختاری‬ ‫دارای سه فاز است.‬ ‫‪‬‬ ‫فاز اول:‬ ‫‪‬‬ ‫1‪O‬‬ ‫] ماتریس همسایگی1[‬ ‫] لیست پیوندی1[‬ ‫] ماتریس همسایگی2[‬ ‫] لیست پیوندی2[‬ ‫2‪O‬‬ ‫بهبود‬ ‫] ماتریس شباهت نهایی[‬ ‫] ماتریس شباهت اولیه[‬
  • 40. ‫4.2 الگوریتم ساختاری‬ 'superclass) ،'equivalent ‫ يا‬is-a' (subclass' ‫تشکیل ماتریس همسایه بر اسا س روابط‬  'disjoint' ‫و‬ 0 1 0 0 1 0 1 0 0 0 B1 B2 1 0 1 1 0 0 0 0 0 0   0 1 0 0 0 0 0 0 0 0   0 1 0 0 0 0 0 0 0 0 B 1 0 0 0 0 1 1 0 0 0 Neighbor =   0 0 0 0 1 0 0 0 0 0 1 0 0 0 1 0 0 1 1 1  A   0 0 0 0 0 0 1 0 1 0   0 0 0 0 0 0 1 1 0 0 D C C1 0  0 0 0 0 0 1 0 0 0 D1 D2 D3
  • 41. ‫4.2 الگوریتم ساختاری‬ ‫بدست آوردن ماتریس شباهت اولیه‬  3 1 1 3  Linked _ list ( Node( A)) = 3 3 5 1    5 3 3 2 2 1   2 1 3  Linked _ list ( Node( A' )) = 3 4 1 4    4 5 2 4 1    p = 2 × commonChars (CharSequence1, CharSequence2) length(CharSequence1) + length(CharSequence2)
  • 42. ‫4.2 الگوریتم ساختاری‬ ‫بهبود ماتریس شباهت اولیه بدست آمده:‬ ‫‪‬‬ ‫اگر دو ند از آنتولوژي مبدأ و مقصد با هم شبيه بودند ميزان شباهت همسايه هاي آنها‬ ‫•‬ ‫به اندازه يک مقدار داده شده افزايش مي يابد.‬ ‫اگير دو نيد از آنتولوژيي هاي مبدأ و مقصيد داراي همسيايه شيبيه بيه هيم باشند ميزان‬ ‫•‬ ‫شباهت آنها به اندازه افزايش مي يابد.‬ ‫اگر دو ند از آنتولوژي مبدأ و مقصد داراي ويژگي نوع داده اي مشترک باشند، ميزان‬ ‫•‬ ‫شباهت آنها براي يک داده شده به اندازه افزايش مي يابد.‬ ‫ارزیابی الگوریتم‬ ‫‪‬‬ ‫‪# correct _ found _ alignmnets‬‬ ‫= ‪precision‬‬ ‫‪# found _ alignments‬‬ ‫‪# correct _ found _ alignmnets‬‬ ‫= ‪Recall‬‬ ‫‪# existing _ alignments‬‬ ‫‪2 × Precision × Recall‬‬ ‫= ‪F − Measure‬‬ ‫‪Precision + Recall‬‬
  • 44. ‫4.3 الگوریتم ترکیبی‬ ‫1‪O‬‬ ‫] ماتریس شباهت ساختاری[‬ ‫وزن دهی‬ ‫2‪O‬‬ ‫] ماتریس شباهت نحوی[‬ ‫] ماتریس شباهت نهایی[‬ ‫] ماتریس شباهت مفاهیم[‬ ‫] ماتریس شباهت روابط[‬ ‫] ماتریس شباهت ویژگی ها[‬
  • 45. ‫4.3 الگوریتم ترکیبی‬ :‫شباهت نحوی‬  Lexical _ Similarity ( s, t ) = 1 − dis tan ce( s, t ) max_ len( s, t ) s =" Part Of " t ="is _ part _ of " :‫مثال‬  bag _ of _ words ( s) = {" Part", "Of "} bag _ of _ words (t ) = {"is", " part", "of "} bags _ of _ words ( s ) = {} bags _ of _ words (t ) = {" is"}  Levenshtein _ distance("", "is" )  Lexical _ similarity ( s, t ) = 1 −    = 1 − 2 = 0.80   max(7,10)  10
  • 46. ‫4.3 الگوریتم ترکیبی‬ ‫ترکیب نتایج:‬ ‫‪‬‬ ‫• شباهت کل س:‬ ‫‪NamedClasses _ Similarity = α × Lexical _ NC _ Matrix + β × Structural _ Matrix‬‬ ‫‪α +β‬‬ ‫شباهت ویژگی های شی و داده:‬ ‫•‬ ‫‪ o‬افزایش به اندازه بایا س‬
  • 47. ‫4.3 الگوریتم ترکیبی‬ ‫ارزیابی الگوریتم‬ ‫‪‬‬ ‫همانگونه که جدول پائین نشان مي دهد الگوريتم داراي مقادير ‪ precision‬و ‪ recall‬ي‬ ‫‪‬‬ ‫بهتر از الگوريتم هاي ‪ MapPSO ،GeRoMe‬و ‪ SPIDER‬است و ‪ recall‬ي بهتر از هميه آنها‬ ‫دارد.‬
  • 48. ‫پیشنهادات آتی‬ ‫5.‬ ‫ترکیب الگوريتم ساختاري پيشنهادي با الگوریتم های نحوی و معنایی دیگر.‬ ‫‪‬‬ ‫ارائه الگوريتم هايي براي انطباق آنتولوژي به زبان فارسي و انطباق آنتولوژي بين‬ ‫‪‬‬ ‫زبان فارسي و زبان انگليسي.‬ ‫معرفی و توسعه ابزارهايي براي وب معنايي در زبان فارسي .‬ ‫‪‬‬
  • 49. ‫6. مراجع‬ 1. D. Fensel, "Ontologies: A Silver Bullet for Knowledge Management and Electronic Commerce", Springer, New York, USA, 2001. 2. J. Davies, D. Fensel, and F. V. Harmelen, (Eds), "Towards the Semantic Web: Ontology Driven Knowledge Management", John Wiley & Sons, New York, 2003. 3. G. Stumme, A. Hotho, and B. Berendt, "Semantic Web Mining State of the art and future directions", Web Semantics: Science, Services and Agents on the World Wide Web, 4 (2006), pp. 124–143. 4. K. K. Breitman, M. A. Casanova, and W. Truszkowski, "Semantic Web: Concepts, Technologies and Applications", Springer Verlag, 2007. 5. N. F. Noy, and M. A. Musen, "PROMPT: Algorithm and tool for automated ontology merging and alignment", in Proc. 17th Natl. Conf. On Artificial Intelligence (AAAI2000), Austin, Texas, USA, 2000. 6. T. B. Passin, "Explorer’s Guide to the Semantic Web", Manning Publications Co: USA, 2004. 7. T. Berners-Lee, "Weaving the web: The Original Design and Ultimate Destiny of the World Wide Web by Its Inventor", New York: HarperCollins, 2000. 8. T. Pedersen, and S. Patwardhan, "WordNet::Similarity – Measuring the Relatedness of Concepts", In Proceedings of 19th National Conference on AI, San Jose, CA, 2004. 9. http://www.w3.org/2001/sw/. 10. www.w3.org/2001/sw/Activity. 11. R. S. Cost, et al, "ItTALKS: A Case Study in the Semantic Web and DAML", SWWS'01: The First Semantic Web Working Symposium, 2001.