TY - JOUR T1 - Persian Text Recognition using n-gram Language Models and Grammatical Refinement TT - بازشناسی متون فارسی با استفاده از مدل زبانی n-gram و پالایش گرامری JF - jsdp JO - jsdp VL - 11 IS - 1 UR - http://jsdp.rcisp.ac.ir/article-1-135-fa.html Y1 - 2014 SP - 107 EP - 115 KW - Text recognition KW - Persian KW - Persian language modeling KW - Natural language processing N2 - بازشناسی متون، در سال‌های اخیر بسیار مورد توجه قرار گرفته است. ارائه الگوریتم‌های بازشناسی برگرفته از ساختار گرامری و معنایی این زبان می‌تواند روش موثری در پردازش‌های دیگر مربوط به خط و زبان فارسی باشد. در این مقاله با استفاده از شاخه علمی پردازش زبان-های طبیعی، یک الگوریتم سه مرحله‌ای به منظور بازشناسی متون فارسی بر مبنای بازشناسی جملات فارسی ارائه می‌شود. این روش شامل مراحل ترکیب زیرکلمات به منظور ساخت کلمات و سپس جملات بالقوه معنی‌دار و در نهایت استفاده از دو مدل زبانی و چند قاعده گرامری به منظور تشخیص جمله صحیح براساس انطباق با گرامر زبان فارسی می‌باشد. آزمایشات متعدد نشان می‌دهد که دقت روش ارائه شده برای مرحله ساخت کلمات و سپس جملات بالقوه معنی‌دار 98 درصد و 85 درصد برای تشخیص جمله صحیح با استفاده از مدل زبانی بایگرام و 88 درصد برای مدل زبانی ترایگرام است. M3 ER -