رفع ابهام معنایی واژگان مبهم فارسی با مدل موضوعی LDA

مسعودی, بابک; راحتی, سعید

**************************** نشریه علمی «پردازش علائم و داده‌ها» با مجوز رسمی از کمیسیون نشریات وزارت علوم، تحقیقات و فناوری، صاحب امتیاز: پژوهشگاه توسعه فناوری‌های پیشرفته ****************************

Signal and Data Processing Journal A scientific journal officially licensed by the Commission for Scientific Publications of the (MSRT). Publisher: Research Ceter for Developmen of Technologies

EN FA

دوره 12، شماره 4 - ( 12-1394 ) جلد 12 شماره 4 صفحات 125-117 | برگشت به فهرست نسخه ها

Mendeley

Zotero

RefWorks

rahati ghochani S. farsi word sense disambiguation with LDA Topic model . JSDP 2016; 12 (4) :117-125
URL: http://jsdp.rcisp.ac.ir/article-1-58-fa.html

مسعودی بابک، راحتی سعید. رفع ابهام معنایی واژگان مبهم فارسی با مدل موضوعی LDA . پردازش علائم و داده‌ها. 1394; 12 (4) :117-125

URL: http://jsdp.rcisp.ac.ir/article-1-58-fa.html

رفع ابهام معنایی واژگان مبهم فارسی با مدل موضوعی LDA

بابک مسعودی^*، سعید راحتی

گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه پیام نور زابل، سیستان و بلوچستان، ایران

چکیده: (9134 مشاهده)

ابهام زدایی از واژگان مبهم و دارای معانی متعدد موضوع مهمی در حوزه ی پردازش زبان های طبیعی می باشد. در این مقاله، مدلی برای رفع ابهام از واژگان مبهم فارسی بر اساس استخراج ویژگی های جدید پیشنهاد شده است. برای ایجاد این مدل دو دسته ویژگی واژگان و نشانه های همراه واژه مبهم و ویژگی هایی که با بکار بردن روش های مدل سازی موضوع بدست می آید، استفاده شده است. یک مدل موضوعی، مدلی آماری برای استخراج چکیده موضوعات موجود در اسناد یک پیکره است. در مقاله حاضر ما از روش بدون سرپرستی تخصیص پنهان دریکله(LDA) برای این منظور استفاده کرده‌ایم. نتایج آزمایشات برای چهار واژه مبهم پر تکرار در زبان فارسی که ازپیکره پژوهشکده پردازش هوشمند علائم استخراج شد، دقّت حدود 97.67% را نشان می‌دهد که بیان‌گر مؤثر بودن این روش در یافتن معنی مناسب واژگان مبهم است.

واژه‌های کلیدی: تخصیص پنهان دریکله، چند معنایی، رفع ابهام معنایی، مدل سازی موضوع

متن کامل [PDF 1822 kb] (4029 دریافت)

نوع مطالعه: پژوهشي | موضوع مقاله: مقالات پردازش متن
دریافت: 1392/3/13 | پذیرش: 1394/10/16 | انتشار: 1394/12/24 | انتشار الکترونیک: 1394/12/24

ارسال پیام به نویسنده مسئول

بازنشر اطلاعات
	این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.