Signal and Data Processing
پردازش علائم و دادهها
JSDP
Engineering & Technology
http://jsdp.rcisp.ac.ir
1
admin
2538-4201
2538-421X
10.52547/jsdp
1
8888
fa
jalali
1394
12
1
gregorian
2016
3
1
12
4
online
1
fulltext
fa
رفع ابهام معنایی واژگان مبهم فارسی با مدل موضوعی LDA
farsi word sense disambiguation with LDA Topic model
مقالات پردازش متن
Paper
پژوهشي
Research
<p></p>
<p><a name="up">ابهام زدایی از واژگان مبهم و دارای معانی متعدد موضوع مهمی در حوزه ی پردازش زبان های طبیعی می باشد. در این مقاله، مدلی برای رفع ابهام از واژگان مبهم فارسی بر اساس استخراج ویژگی های جدید پیشنهاد شده است. برای ایجاد این مدل دو دسته ویژگی واژگان و نشانه های همراه واژه مبهم و ویژگی هایی که با بکار بردن روش های مدل سازی موضوع بدست می آید، استفاده شده است. یک مدل موضوعی، مدلی آماری برای استخراج چکیده موضوعات موجود در اسناد یک پیکره است. در مقاله حاضر ما از روش بدون سرپرستی تخصیص پنهان دریکله(LDA) برای این منظور استفاده کردهایم. نتایج آزمایشات برای چهار واژه مبهم پر تکرار در زبان فارسی که ازپیکره پژوهشکده پردازش هوشمند علائم استخراج شد، دقّت حدود 97.67% را نشان میدهد که بیانگر مؤثر بودن این روش در یافتن معنی مناسب واژگان مبهم است. </a></p>
<p></p>
<p>Word sense disambiguation is the task of identifying the correct sense for the word in a given context among a finite set of possible sense. In this paper a model for farsi word sense disambiguation is presented. The model use two group of features: first, all word and stop words around target word and topic models as second features. We extract topics from a farsi corpus with Latent Dirichlet Allocation (LDA) model. The system with a maximum entropy model achieved 97.67% precision for 4 high frequently farsi homograph words</p>
تخصیص پنهان دریکله, چند معنایی , رفع ابهام معنایی, مدل سازی موضوع
Latent Dirichlet Allocation(LDA), Topic Model, Maximum Entropy, Word Sense Disambiguation
117
125
http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-318-1&slc_lang=fa&sid=1
بابک
مسعودی
babakmasoudi282@yahoo.com
10031947532846002476
10031947532846002476
Yes
گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه پیام نور زابل، سیستان و بلوچستان، ایران
saeid
rahati ghochani
سعید
راحتی
RahatiMshdiau.ac.ir
10031947532846002477
10031947532846002477
No
دانشگاه آزاد اسلامی واحد مشهد