دوره 13، شماره 4 - ( 12-1395 )                   جلد 13 شماره 4 صفحات 132-121 | برگشت به فهرست نسخه ها


XML English Abstract Print


پژوهشکده زبانشناسی، پژوهشگاه علوم انسانی و مطالعات فرهنگی، تهران، ایران
چکیده:   (5066 مشاهده)

در این مقاله، به بررسی جایگاه برچسبزنی مقولات دستوری در تجزیه نحوی خودکار جملات فارسی پرداخته خواهد شد. به همین منظور، تأثیر کیفیت برچسبزنی مقولات دستوری و همچنین تأثیرگذاری میزان اطلاعات موجود در مقولات دستوری بر کارایی تجزیه خودکار جملات مورد مطالعه قرار خواهد گرفت. بهمنظور انجام این دو بررسی، سه سناریو برای تجزیه جملات ارائه شده و مقایسه میشود. در سناریو ۱، تجزیهگر ابتدا داده ورودی را برچسبزنی کرده و سپس جمله را تجزیه میکند. در سناریو ۲، از یک برچسبزن خارج از تجزیهگر و در سناریو ۳ از برچسب معیار واژهها برای تجزیه جملات استفاده میشود. در این بررسی، معیارهای ارزیابی متفاوت مورد استفاده قرار میگیرد تا میزان این تأثیرگذاری از ابعاد مختلف نشان داده شود. نتایج حاصل از آزمایشات نشان میدهد که کیفیت و میزان اطلاعات در مقولات دستوری واژه بر کارایی تجزیهگر تأثیر مستقیم دارد. کیفیت بالای برچسب مقولات دستوری سبب کاهش خطای تجزیهگر و افزایش کارایی آن میگردد. همچنین عدم وجود اطلاعات صرفیـنحوی تأثیر منفی بسزایی بر کارایی تجزیهگر دارد که این تأثیرگذاری در مقایسه با کیفیت برچسب مقولات دستوری بسیار بیشتر است.

متن کامل [PDF 1822 kb]   (1301 دریافت)    
نوع مطالعه: كاربردي | موضوع مقاله: مقالات پردازش متن
دریافت: 1393/9/22 | پذیرش: 1395/1/23 | انتشار: 1396/3/16 | انتشار الکترونیک: 1396/3/16

بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.