دوره 14، شماره 2 - ( 6-1396 )                   جلد 14 شماره 2 صفحات 3-24 | برگشت به فهرست نسخه ها



DOI: 10.18869/acadpub.jsdp.14.2.3

XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Maskanati S, Keshavarz A. Online Persian Hand Writing Recognition Using Language Model and Reduction of User Writing Rules. JSDP. 2017; 14 (2) :3-24
URL: http://jsdp.rcisp.ac.ir/article-1-428-fa.html
مسکنتی سلمان، کشاورز احمد. تشخیص دست‌نوشته‌ برخط فارسی با استفاده از مدل زبانی و کاهش قوانین نگارش کاربر. پردازش علائم و داده‌ها. 1396; 14 (2) :3-24

URL: http://jsdp.rcisp.ac.ir/article-1-428-fa.html


استادیار دانشگاه خلیج فارس بوشهر
چکیده:   (255 مشاهده)

پیوسته بودن کلمات فارسی و وجود تنوع بسیار زیاد رسم‌الخط این زبان و همچنین شکل‌های متنوع حروف فارسی بسته به محل قرارگیری‌شان در کلمه، تشخیص دست‌نوشته‌های فارسی را به چالش کشانده‌اند. مهم‌ترین اشکال در اغلب روش‌های بازشناسی بی‌توجهی به بافت جمله است که باعث می‌گردد در مواردی که کلمه‌ی ورودی اشتباه بازشناسی می‌شود، واژه‌ای با ظاهر درست در جمله‌ای نابجا به کار رود. طراحی مدلی که بتواند بافت جمله را به خوبی تحلیل کند مستلزم در اختیار داشتن منابع زبانی حجیمی است که نماینده خوبی از زبان مورد بازشناسی باشند. در این مقاله روش جدیدی برای بازشناسی کلمات برخط فارسی ارائه شده است که با استفاده از بافت جمله سعی در بهبود بازشناسی دارد. فرآیند بازشناسی معرفی شده در این نوشتار به این صورت است که ابتدا علائم و بدنه‌ی زیرکلمات دست‌نوشته‌ی ورودی تفکیک شده و بدنه‌ی هر زیرکلمه و علائم آن مشخص می‌شود. سپس علائم زیرکلمات تشخیص داده شده و بر اساس آن مجموعه‌ای از واژگان به‌عنوان فرضیه در نظر گرفته می‌شوند. به هر فرضیه بر اساس میزان شباهت آن به دست‌نوشته ورودی امتیازی تعلق می‌گیرد و بر اساس امتیاز حاصله محتمل‌ترین فرضیات مشخص می‌شوند. سپس این رویه توسط مدل زبانی برای یافتن فرضیات محتمل‌تر، هدایت می‌شود. نتایج آزمایش‌های به‌عمل‌آمده نشان می‌دهد که کاهش قابل توجهی در نرخ خطای بازشناسی کلمات حاصل شده و کاربر در نگارش ملزم به رعایت محدودیت‌های کمتری است. از طرفی روش پیشنهادی می‌تواند نسبت به روش‌های قبلی با در اختیار داشتن یک پایگاه داده دست‌نویس محدود، صحت مطلوب‌تری ارائه کند. با به‌کارگیری روش ارائه‌شده، دقت بازشناسی در مرحله‌ اولیه در سطح حروف 95.9% و پس از بازشناسی به کمک مدل زبانی دقت بازشناسی به 99.3% ارتقاء یافت. برای بهبود عملکرد الگوریتم، استفاده از الگوریتم یادگیری تقویتی برای تطبیق پذیری الگوریتم با نویسنده به عنوان کار آینده پیشنهاد می گردد.

متن کامل [PDF 8742 kb]   (167 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: مقالات پردازش متن
دریافت: ۱۳۹۴/۷/۴ | پذیرش: ۱۳۹۵/۸/۱۶ | انتشار: ۱۳۹۶/۷/۲۹ | انتشار الکترونیک: ۱۳۹۶/۷/۲۹

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
کد امنیتی را در کادر بنویسید

ارسال پیام به نویسنده مسئول


کلیه حقوق این وب سایت متعلق به فصل‌نامة علمی - پژوهشی پردازش علائم و داده‌ها می باشد.