دوره 12، شماره 3 - ( 9-1394 )                   جلد 12 شماره 3 صفحات 14-3 | برگشت به فهرست نسخه ها

XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Mirzababaei B, Faili H. A real-world spell checker using context-sensitive features. JSDP 2015; 12 (3) :3-14
URL: http://jsdp.rcisp.ac.ir/article-1-218-fa.html
میرزابابایی بهزاد، فیلی هشام. ارائه یک رتبه‌بند برای خطایاب معنایی با استفاده از ویژگی‌های حساس به متن. پردازش علائم و داده‌ها 1394; 12 (3) :14-3

URL: http://jsdp.rcisp.ac.ir/article-1-218-fa.html


دانشگاه تهران
چکیده:   (6393 مشاهده)

در عصر فناوری، روزانه حجم زیادی از سند­های الکترونیکی تولید می­شود. از آنجا که این سند­ها توسط افراد مختلف تولید می­شود دارای خطاهایی هستند. وجود خطاها باعث کاهش کیفیت سند­ها می­شود، بنابراین وجود ابزارهای خطایاب باعث افزایش کیفیت می­شود. یکی از انواع خطاها، خطای معنایی حساس به متن است. همانطور که از نام این آن برمی­آید، برای تشخیص و تصحیح آن، نیاز به تحلیل اطلاعات موجود در متن است. در این مقاله، یک رتبه­بند متمایزگر مستقل از زبان برای خطایاب­های معنایی حساس به متن ارائه دادیم و از اطلاعات کل متن برای رتبه­بندی استفاده کردیم. این رتبه­بندی توسط ویژگی­های حساس به متن و یک مدل لگاریتم خطی انجام شده است. برای ارزیابی روش، از دو روش مبنای مختلف که یکی بر اساس مترجم ماشینی آماری و دیگری بر اساس مدل زبانی است استفاده کرده­ایم. به منظور ارزیابی سیستم از دو داده­ی آزمون مختلف در زبان فارسی استفاده شده است. این روش باعث بهبود 17% در بازخوانی تشخیص و تصحیح نسبت به روش مبنای مترجم ماشینی آماری شده است.

متن کامل [PDF 1740 kb]   (1479 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: مقالات پردازش متن
دریافت: 1392/12/7 | پذیرش: 1394/6/17 | انتشار: 1394/10/14 | انتشار الکترونیک: 1394/10/14

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA

ارسال پیام به نویسنده مسئول


بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.

کلیه حقوق این تارنما متعلق به فصل‌نامة علمی - پژوهشی پردازش علائم و داده‌ها است.