در این مقاله، به بررسی جایگاه برچسبزنی مقولات دستوری در تجزیه نحوی خودکار جملات فارسی پرداخته خواهد شد. به همین منظور، تأثیر کیفیت برچسبزنی مقولات دستوری و همچنین تأثیرگذاری میزان اطلاعات موجود در مقولات دستوری بر کارایی تجزیه خودکار جملات مورد مطالعه قرار خواهد گرفت. بهمنظور انجام این دو بررسی، سه سناریو برای تجزیه جملات ارائه شده و مقایسه میشود. در سناریو ۱، تجزیهگر ابتدا داده ورودی را برچسبزنی کرده و سپس جمله را تجزیه میکند. در سناریو ۲، از یک برچسبزن خارج از تجزیهگر و در سناریو ۳ از برچسب معیار واژهها برای تجزیه جملات استفاده میشود. در این بررسی، معیارهای ارزیابی متفاوت مورد استفاده قرار میگیرد تا میزان این تأثیرگذاری از ابعاد مختلف نشان داده شود. نتایج حاصل از آزمایشات نشان میدهد که کیفیت و میزان اطلاعات در مقولات دستوری واژه بر کارایی تجزیهگر تأثیر مستقیم دارد. کیفیت بالای برچسب مقولات دستوری سبب کاهش خطای تجزیهگر و افزایش کارایی آن میگردد. همچنین عدم وجود اطلاعات صرفیـنحوی تأثیر منفی بسزایی بر کارایی تجزیهگر دارد که این تأثیرگذاری در مقایسه با کیفیت برچسب مقولات دستوری بسیار بیشتر است.
بازنشر اطلاعات | |
![]() |
این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است. |