دوره 12، شماره 3 - ( 9-1394 )                   جلد 12 شماره 3 صفحات 29-15 | برگشت به فهرست نسخه ها

XML English Abstract Print


چکیده:   (6494 مشاهده)

در این مقاله یک روش دو مرحلهای برای بازشناسی کلمات دست نوشته فارسی ارائه شده است. در مرحله اول برای افزایش دقت و کاهش بارمحاسباتی، الگوریتمی برای کاهش کلمات فرهنگ لغت قابل مقایسه با کلمه مورد آزمون ارائه شده است. برای این منظور کلمات موجود در فرهنگ لغت توسط الگوریتمهای خوشه بندی ،دسته بندی می شوند. خوشه بندی در این مرحله بر اساس ویژگیهایی که شکل کلی کلمه را توصیف می کنند، می باشد. در مرحله دوم یک روش جدید جهت استخراج ویژگی هیستوگرام گرادیان تصویر کلمه پیشنهاد شده است که این روش پیشنهادی تناظر بین نمونههای مختلف تصاویر یک کلمه دستنوشته را بهتر نشان میدهد. با مقایسه بردار ویژگی نزدیک- K استخراج شده از کلمه ورودی و بردار ویژگی کلمات کاندید (بدست آمده از مرحله اول) در یک طبقه بند ترین همسایه بهترین کاندید برای کلمه ورودی شناسایی می گردد. نتایج پیاده سازی روش پیشنهادی بر روی پایگاه داده "ایران شهر" نشان می دهد که مرحله کاهش فرهنگ لغت و روش جدید جهت استخراج ویژگی هیستوگرام گرادیان، دقت و سرعت سیستم را بطور قابل ملاحظهای هم از لحاظ دقت و تا حدودی از لحاظ سرعت بهبود می بخشد

متن کامل [PDF 2896 kb]   (1948 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: مقالات پردازش متن
دریافت: 1392/3/13 | پذیرش: 1394/6/17 | انتشار: 1394/10/14 | انتشار الکترونیک: 1394/10/14

بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.