دوره 11، شماره 1 - ( 6-1393 )                   جلد 11 شماره 1 صفحات 107-115 | برگشت به فهرست نسخه ها

XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Shirvani P, Vatankhah Khouzani M, yaghmaie K. Persian Text Recognition using n-gram Language Models and Grammatical Refinement . JSDP. 2014; 11 (1) :107-115
URL: http://jsdp.rcisp.ac.ir/article-1-135-fa.html
شیروانی پریسا، وطن خواه خوزانی مهرداد، یغمایی خشایار. بازشناسی متون فارسی با استفاده از مدل زبانی n-gram و پالایش گرامری . پردازش علائم و داده‌ها. 1393; 11 (1) :107-115

URL: http://jsdp.rcisp.ac.ir/article-1-135-fa.html


کارشناسی ارشد
چکیده:   (5544 مشاهده)
بازشناسی متون، در سال‌های اخیر بسیار مورد توجه قرار گرفته است. ارائه الگوریتم‌های بازشناسی برگرفته از ساختار گرامری و معنایی این زبان می‌تواند روش موثری در پردازش‌های دیگر مربوط به خط و زبان فارسی باشد. در این مقاله با استفاده از شاخه علمی پردازش زبان-های طبیعی، یک الگوریتم سه مرحله‌ای به منظور بازشناسی متون فارسی بر مبنای بازشناسی جملات فارسی ارائه می‌شود. این روش شامل مراحل ترکیب زیرکلمات به منظور ساخت کلمات و سپس جملات بالقوه معنی‌دار و در نهایت استفاده از دو مدل زبانی و چند قاعده گرامری به منظور تشخیص جمله صحیح براساس انطباق با گرامر زبان فارسی می‌باشد. آزمایشات متعدد نشان می‌دهد که دقت روش ارائه شده برای مرحله ساخت کلمات و سپس جملات بالقوه معنی‌دار 98 درصد و 85 درصد برای تشخیص جمله صحیح با استفاده از مدل زبانی بایگرام و 88 درصد برای مدل زبانی ترایگرام است.
متن کامل [PDF 1486 kb]   (1178 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: مقالات پردازش متن
دریافت: ۱۳۹۲/۴/۱۱ | پذیرش: ۱۳۹۲/۱۰/۲۲ | انتشار: ۱۳۹۳/۶/۱۷ | انتشار الکترونیک: ۱۳۹۳/۶/۱۷

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA code

ارسال پیام به نویسنده مسئول


کلیه حقوق این وب سایت متعلق به فصل‌نامة علمی - پژوهشی پردازش علائم و داده‌ها می باشد.