دوره 11، شماره 1 - ( 6-1393 )                   جلد 11 شماره 1 صفحات 115-107 | برگشت به فهرست نسخه ها

XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Shirvani P, Vatankhah Khouzani M, yaghmaie K. Persian Text Recognition using n-gram Language Models and Grammatical Refinement . JSDP 2014; 11 (1) :107-115
URL: http://jsdp.rcisp.ac.ir/article-1-135-fa.html
شیروانی پریسا، وطن خواه خوزانی مهرداد، یغمایی خشایار. بازشناسی متون فارسی با استفاده از مدل زبانی n-gram و پالایش گرامری . پردازش علائم و داده‌ها. 1393; 11 (1) :107-115

URL: http://jsdp.rcisp.ac.ir/article-1-135-fa.html


چکیده:   (11478 مشاهده)
بازشناسی متون، در سال‌های اخیر بسیار مورد توجه قرار گرفته است. ارائه الگوریتم‌های بازشناسی برگرفته از ساختار گرامری و معنایی این زبان می‌تواند روش موثری در پردازش‌های دیگر مربوط به خط و زبان فارسی باشد. در این مقاله با استفاده از شاخه علمی پردازش زبان-های طبیعی، یک الگوریتم سه مرحله‌ای به منظور بازشناسی متون فارسی بر مبنای بازشناسی جملات فارسی ارائه می‌شود. این روش شامل مراحل ترکیب زیرکلمات به منظور ساخت کلمات و سپس جملات بالقوه معنی‌دار و در نهایت استفاده از دو مدل زبانی و چند قاعده گرامری به منظور تشخیص جمله صحیح براساس انطباق با گرامر زبان فارسی می‌باشد. آزمایشات متعدد نشان می‌دهد که دقت روش ارائه شده برای مرحله ساخت کلمات و سپس جملات بالقوه معنی‌دار 98 درصد و 85 درصد برای تشخیص جمله صحیح با استفاده از مدل زبانی بایگرام و 88 درصد برای مدل زبانی ترایگرام است.
متن کامل [PDF 1486 kb]   (2888 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: مقالات پردازش متن
دریافت: 1392/4/11 | پذیرش: 1392/10/22 | انتشار: 1393/6/17 | انتشار الکترونیک: 1393/6/17

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA

ارسال پیام به نویسنده مسئول


بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.

کلیه حقوق این تارنما متعلق به فصل‌نامة علمی - پژوهشی پردازش علائم و داده‌ها است.