TY - JOUR T1 - farsi word sense disambiguation with LDA Topic model TT - رفع ابهام معنایی واژگان مبهم فارسی با مدل موضوعی LDA JF - jsdp JO - jsdp VL - 12 IS - 4 UR - http://jsdp.rcisp.ac.ir/article-1-58-fa.html Y1 - 2016 SP - 117 EP - 125 KW - Latent Dirichlet Allocation(LDA) KW - Topic Model KW - Maximum Entropy KW - Word Sense Disambiguation N2 - ابهام زدایی از واژگان مبهم و دارای معانی متعدد موضوع مهمی در حوزه ی پردازش زبان های طبیعی می باشد. در این مقاله، مدلی برای رفع ابهام از واژگان مبهم فارسی بر اساس استخراج ویژگی های جدید پیشنهاد شده است. برای ایجاد این مدل دو دسته ویژگی واژگان و نشانه های همراه واژه مبهم و ویژگی هایی که با بکار بردن روش های مدل سازی موضوع بدست می آید، استفاده شده است. یک مدل موضوعی، مدلی آماری برای استخراج چکیده موضوعات موجود در اسناد یک پیکره است. در مقاله حاضر ما از روش بدون سرپرستی تخصیص پنهان دریکله(LDA) برای این منظور استفاده کرده‌ایم. نتایج آزمایشات برای چهار واژه مبهم پر تکرار در زبان فارسی که ازپیکره پژوهشکده پردازش هوشمند علائم استخراج شد، دقّت حدود 97.67% را نشان می‌دهد که بیان‌گر مؤثر بودن این روش در یافتن معنی مناسب واژگان مبهم است. M3 ER -