چکیده: (7552 مشاهده)
سامانههای مبتنی بر داده به راحتی میتوانند به سایر زبانها یا دامنهها منتقل شوند. استفاده از این رویکرد در تجزیه وابستگی منجر به ارائه روشهای مبتنی داده شد که تنها نیازمند پیکرهای حاوی جملات و درخت وابستگی متناظر با آن به عنوان داده آموزشی است. الگوریتمهای طراحی شده برای تجزیه وابستگی با وجود صحت بالا در زبان انگلیسی، بر روی دستهای از زبانها با افت صحت مواجه میشوند که دلیل این امر را میتوان در پر رنگتر بودن عامل بیترتیبی و غنای ساختواژی آنها دانست. این بدان معناست که سامانههای مبتنی بر داده نیازمند انتخاب خصوصیات و تنظیم دقیق پارامترها به منظور رسیدن به کارایی بهینه هستند.
زبان فارسی که به تازگی پیکره وابستگی برای آن طراحی شده است جزو زبانهایی است که دو عامل بیترتیبی و غنای ساختواژی را داراست. در این مقاله سعی شده که عوامل تأثیرگذار بر کاهش صحت تجزیه وابستگی در زبان فارسی شناسایی و راهکارهایی برای بهبود صحت آن ارائه شود.
نوع مطالعه:
پژوهشي |
موضوع مقاله:
مقالات پردازش متن دریافت: 1392/3/24 | پذیرش: 1393/9/15 | انتشار: 1394/1/2 | انتشار الکترونیک: 1394/1/2