دوره 9، شماره 1 - ( 6-1391 )                   جلد 9 شماره 1 صفحات 68-59 | برگشت به فهرست نسخه ها

XML English Abstract Print


چکیده:   (3701 مشاهده)

در این مقاله روشی جدید برای بازشناسی برخط حروف مجزای فارسی ارائه شده است که با استخراج چند ویژگی ساده از دنباله نمونه‌برداری شده از حروف و استفاده از دسته‌بندی کننده‌ی ماشین بردار پشتیبان( SVM) نتایج قابل قبولی را ارئه می‌دهد. الگوریتم پیش‌پردازش استفاده شده در این کار امکان یکسان سازی ابعاد ویژگی‌ها به ازای حروف متعدد را فراهم می‌کند تا در مرحله بعدی به منظور بازشناسی به دسته‌بندی کننده ارسال شود. فرآیند بازشناسی در دو مرحله صورت می‌گیرد: در مرحله‌ی اول بدنه‌ی اصلی حرف ورودی (اولین حرکت قلم) پس از استخراج ویژگی با استفاده از دسته‌بندی کننده در قالب یکی از هجده گروه بدنه‌ی اصلی حروف، طبقه‌بندی می‌شود و سپس در مرحله‌ی دوم، موقعیت، تعداد و شکل سایر حرکت‌ها مانند نقطه و سرکش (ریزحرکت‌ها)، نوع حرف نهایی را تعیین می‌کند. به عنوان نمونه برای تشخیص حرف «ت» ابتدا گروه بدنه‌ی «ب، پ، ت، ث» تشخیص داده می‌شود و سپس وجود ریزحرکت «دونقطه» در بالای آن منجر به انتخاب «ت» از این گروه می‌شود. نهایتا در فرآیند پس‌پردازش با استفاده از تطبیق اطلاعات مربوط به بدنه‌ی اصلی و ریزحرکات سیستم به تصحیح خطاهای احتمالی موجود در مراحل قبلی پرداخته و دقت بازشناسی را افزایش می‌دهد به عنوان مثال اگر در مرحله دسته‌بندی بدنه حرف «ل» تشخیص داده شود ولی یک نقطه در بالای آن قرار داشته باشد آنگاه سیستم تشخیص خود را به حرف «ن» تغییر خواهد داد. نتایج تجربی این کار پژوهشی که بر اساس مجموعه‌ داده‌ی Online-TMU صورت گرفته است، متوسط نرخ بازشناسی بدنه‌ی اصلی را 94% نشان می‌دهد و با در نظر گرفتن پس‌پردازش‌ها بر اساس ریزحرکت‌ها این نرخ به حدود 98% می‌رسد.

متن کامل [PDF 1253 kb]   (915 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: مقالات پردازش گفتار
دریافت: 1391/6/31 | پذیرش: 1396/11/30 | انتشار: 1396/11/30 | انتشار الکترونیک: 1396/11/30

بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.