دانشگاه تهران
چکیده: (109 مشاهده)
یافتن یک بازنمایی معنایی غنی با ابعاد کم برای متون طولانی یکی از چالشهای اساسی در فعالیتهای مختلف پردازش زبان طبیعی به شمار میرود. این بازنمایی باید اطلاعات معنایی و نحوی متن را در برگرفته و همچنین بر حسب وظیفه مد نظر ارتباط و تشابه متون را در ابعاد کم مدلسازی کند. در این مقاله تلاش بر آن است تا با بهرهگیری از نظریه ساختار بلاغی و شبکههای عصبی عمیق چالشهای مطرح شده مرتفع گردد. نظریه ساختار بلاغی با ارائه یک ساختار سلسله مراتبی به توصیف اهمیت عبارات موجود در متن و روابط بین آنها میپردازد. در اینجا تأثیر بهکارگیری این ساختار درختی بر دو وظیفه بازیابی اطلاعات و تحلیل احساسات بررسی شدهاست. در وظیفه بازیابی اطلاعات، جهت مدلسازی وابستگی معنایی بین مستندات، یادگیری بازنمایی سند توسط شبکههای عصبی بازگشتی عمیق دوقلو صورت پذیرفت. بطوریکه ذخیره و بازیابی مستندات متنی تسهیل گردد. این شبکه از دو زیرشبکه بازگشتی عمیق تشکیل شدهاست. این شبکههای بازگشتی، مبتنی بر ساختار درختی حاصل از تجزیه متن توسط نظریه ساختار بلاغی میباشند. این متدلوژی بر روی دو مجموعه داده خبری شامل اخبار بیبیسی و همچنین زیرمجموعهای از دادگان رویترز مورد ارزیابی قرار گرفت. نتایج نشان میدهد بازنمایی ارائه شده توسط این ساختار، کارآیی بالاتری از بازنماییهای سنتی مبتنی بر سبد کلمه دارد. این رویکرد کارایی را به میزان ۶٪ بر روی مجموعه داده بیبیسی و ۳٪ بر روی مجموعه داده رویترز نسبت به بهترین روش کلاسیک بهبود دادهاست. در وظیفه تحلیل احساسات، در ابتدا به کمک شبکه عصبی بازگشتی عمیق مبتنی بر درخت ساختار بلاغی به ایجاد بازنمایی و در نهایت دستهبندی احساسات نظرات افراد پرداخته شد. سپس سایر اطلاعات موجود در درخت جهت بهبود مدل مورد استفاده قرار گرفت. این اطلاعات شامل آگاهی از اهمیت هر بخش از متن با استفاده از درخت ساختار بلاغی میباشد. با تشخیص بخشهای مرکزی متن و اعمال مکانیزم توجه بر آن در شبکه عمیق بازگشتی بازنمایی غنیتری برای متن ایجاد میگردد. این بازنمایی کارایی مدل تحلیل احساسات را بر روی دادگان اینترنتی نظرات بینندگان فیلم در مقایسه با روشهای پایه به میزان ۳٪ افزایش داده است. نتایج حاصل از این بررسی، بهبود بازنمایی متن با استفاده از شبکههای عمیق مبتنی بر نظریه ساختار بلاغی را نشان میدهد. بهبود بازنمایی به کمک ساختاردهی متن غیر ساختار یافته بر روی زبانهای دیگر از جمله زبان فارسی میتواند مورد راستی آزمایی قرار بگیرد.
شمارهی مقاله: 12
نوع مطالعه:
پژوهشي |
موضوع مقاله:
مقالات پردازش متن دریافت: 1398/2/8 | پذیرش: 1400/9/15 | انتشار: 1402/5/22 | انتشار الکترونیک: 1402/5/22