دوره 13، شماره 4 - ( 12-1395 )                   جلد 13 شماره 4 صفحات 132-121 | برگشت به فهرست نسخه ها


XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Ghayoomi M. A Comparative Study on the Impact of Part-of-Speech Tagging on Parsing for the Persian Language Processing. JSDP 2017; 13 (4) :121-132
URL: http://jsdp.rcisp.ac.ir/article-1-300-fa.html
قیومی مسعود. بررسی مقایسه‌ای تأثیر برچسب‌زنی مقولات دستوری بر تجزیه در پردازش خودکار زبان فارسی . پردازش علائم و داده‌ها. 1395; 13 (4) :121-132

URL: http://jsdp.rcisp.ac.ir/article-1-300-fa.html


پژوهشکده زبانشناسی، پژوهشگاه علوم انسانی و مطالعات فرهنگی، تهران، ایران
چکیده:   (5064 مشاهده)

در این مقاله، به بررسی جایگاه برچسبزنی مقولات دستوری در تجزیه نحوی خودکار جملات فارسی پرداخته خواهد شد. به همین منظور، تأثیر کیفیت برچسبزنی مقولات دستوری و همچنین تأثیرگذاری میزان اطلاعات موجود در مقولات دستوری بر کارایی تجزیه خودکار جملات مورد مطالعه قرار خواهد گرفت. بهمنظور انجام این دو بررسی، سه سناریو برای تجزیه جملات ارائه شده و مقایسه میشود. در سناریو ۱، تجزیهگر ابتدا داده ورودی را برچسبزنی کرده و سپس جمله را تجزیه میکند. در سناریو ۲، از یک برچسبزن خارج از تجزیهگر و در سناریو ۳ از برچسب معیار واژهها برای تجزیه جملات استفاده میشود. در این بررسی، معیارهای ارزیابی متفاوت مورد استفاده قرار میگیرد تا میزان این تأثیرگذاری از ابعاد مختلف نشان داده شود. نتایج حاصل از آزمایشات نشان میدهد که کیفیت و میزان اطلاعات در مقولات دستوری واژه بر کارایی تجزیهگر تأثیر مستقیم دارد. کیفیت بالای برچسب مقولات دستوری سبب کاهش خطای تجزیهگر و افزایش کارایی آن میگردد. همچنین عدم وجود اطلاعات صرفیـنحوی تأثیر منفی بسزایی بر کارایی تجزیهگر دارد که این تأثیرگذاری در مقایسه با کیفیت برچسب مقولات دستوری بسیار بیشتر است.

متن کامل [PDF 1822 kb]   (1298 دریافت)    
نوع مطالعه: كاربردي | موضوع مقاله: مقالات پردازش متن
دریافت: 1393/9/22 | پذیرش: 1395/1/23 | انتشار: 1396/3/16 | انتشار الکترونیک: 1396/3/16

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA

ارسال پیام به نویسنده مسئول


بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.

کلیه حقوق این تارنما متعلق به فصل‌نامة علمی - پژوهشی پردازش علائم و داده‌ها است.