URL: http://jsdp.rcisp.ac.ir/article-1-58-fa.html
ابهام زدایی از واژگان مبهم و دارای معانی متعدد موضوع مهمی در حوزه ی پردازش زبان های طبیعی می باشد. در این مقاله، مدلی برای رفع ابهام از واژگان مبهم فارسی بر اساس استخراج ویژگی های جدید پیشنهاد شده است. برای ایجاد این مدل دو دسته ویژگی واژگان و نشانه های همراه واژه مبهم و ویژگی هایی که با بکار بردن روش های مدل سازی موضوع بدست می آید، استفاده شده است. یک مدل موضوعی، مدلی آماری برای استخراج چکیده موضوعات موجود در اسناد یک پیکره است. در مقاله حاضر ما از روش بدون سرپرستی تخصیص پنهان دریکله(LDA) برای این منظور استفاده کردهایم. نتایج آزمایشات برای چهار واژه مبهم پر تکرار در زبان فارسی که ازپیکره پژوهشکده پردازش هوشمند علائم استخراج شد، دقّت حدود 97.67% را نشان میدهد که بیانگر مؤثر بودن این روش در یافتن معنی مناسب واژگان مبهم است.