دوره 13، شماره 2 - ( 6-1395 )                   جلد 13 شماره 2 صفحات 137-121 | برگشت به فهرست نسخه ها

XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Dehghan M H, Faili H. Generating the Persian Constituency Treebank in an Automatic Converting Method. JSDP 2016; 13 (2) :121-137
URL: http://jsdp.rcisp.ac.ir/article-1-336-fa.html
دهقان محمد حسین، فیلی هشام. تولید درخت بانک سازه‌ای زبان فارسی به روش تبدیل خودکار. پردازش علائم و داده‌ها. 1395; 13 (2) :121-137

URL: http://jsdp.rcisp.ac.ir/article-1-336-fa.html


دانشگاه تهران
چکیده:   (6448 مشاهده)

درخت بانک از مهم­ترین و پرکاربردترین منابع مورد استفاده در زمینه پردازش زبان طبیعی است. دو نوع از پرکاربردترین درخت بانک­ها، درخت بانک وابستگی و درخت بانک سازه­ای است. با توجه به نبود درخت بانک سازه­ای با حجم بزرگ در زبان فارسی در این مقاله به بررسی روشی ارائه شده در تبدیل درخت بانک وابستگی به سازه­ای می­پردازیم. سپس مشکلات این روش را در زبان فارسی و انگلیسی بررسی و با ارائه راهکارهایی کیفیت تبدیل را بهبود می‌بخشیم. اولین راهکار، تصحیح مکان اتصال سازه‌ها در درخت سازه‌ای به ازای هر رابطه‌ی وابستگی است. راهکار دوم، انجام مکاشفه‌ای به صورت پس‌پردازش و بر روی خروجیِ ساختار سازه‌ای این روش است که، کیفیت نهایی درخت‌های سازه‌ای را بهبود می‌بخشد. نتایج حاصل از آزمایش‌ها نشان می­دهد که، روش تبدیل با کمک راهکارهای ارائه شده حدود 85/25 درصد در زبان فارسی و 39/4 درصد در زبان انگلیسی دارای کیفیت بالاتری نسبت به حالتی است که از راهکارهای پیشنهادی استفاده نشود. در ادامه با کمک روش تبدیل و درخت بانک وابستگی موجود در زبان فارسی، یک درخت بانک سازهای تولید کرده و به کمک آن تجزیهگری سازهای را آموزش دادهایم. کیفیت تجزیه‌گر آموزش داده شده با استفاده از درخت بانک حاصل از روش تبدیل و راهکارهای پیشنهادی این پژوهش نسبت به حالتی که از راهکارهای پیشنهادی استفاده نشود، بهبودی 21 درصدی را نشان می‌دهد.

متن کامل [PDF 2628 kb]   (1913 دریافت)    
نوع مطالعه: كاربردي | موضوع مقاله: مقالات پردازش متن
دریافت: 1393/12/2 | پذیرش: 1395/3/26 | انتشار: 1395/6/28 | انتشار الکترونیک: 1395/6/28

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA

ارسال پیام به نویسنده مسئول


بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.

کلیه حقوق این تارنما متعلق به فصل‌نامة علمی - پژوهشی پردازش علائم و داده‌ها است.