دوره 11، شماره 2 - ( 12-1393 )                   جلد 11 شماره 2 صفحات 80-71 | برگشت به فهرست نسخه ها

XML English Abstract Print


چکیده:   (7323 مشاهده)
سامانه‌های مبتنی بر داده به راحتی می‌توانند به سایر زبان‌ها یا دامنه‌ها منتقل شوند. استفاده از این رویکرد در تجزیه وابستگی منجر به ارائه روش‌های مبتنی داده شد که تنها نیازمند پیکره‌ای حاوی جملات و درخت وابستگی متناظر با آن به عنوان داده آموزشی است. الگوریتم‌های طراحی شده برای تجزیه وابستگی با وجود صحت بالا در زبان انگلیسی، بر روی دسته‌ای از زبان‌ها با افت صحت مواجه می‌شوند که دلیل این امر را می‌توان در پر رنگ‌تر بودن عامل بی‌ترتیبی و غنای ساخت‌واژی آنها دانست. این بدان معناست که سامانه‌های مبتنی بر داده نیازمند انتخاب خصوصیات و تنظیم دقیق پارامترها به منظور رسیدن به کارایی بهینه هستند. زبان فارسی که به تازگی پیکره وابستگی برای آن طراحی شده است جزو زبان‌هایی است که دو عامل بی‌ترتیبی و غنای ساخت‌واژی را داراست. در این مقاله سعی شده که عوامل تأثیرگذار بر کاهش صحت تجزیه وابستگی در زبان فارسی شناسایی و راهکارهایی برای بهبود صحت آن ارائه شود.
متن کامل [PDF 2016 kb]   (1731 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: مقالات پردازش متن
دریافت: 1392/3/24 | پذیرش: 1393/9/15 | انتشار: 1394/1/2 | انتشار الکترونیک: 1394/1/2

بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.