چکیده: (11821 مشاهده)
بازشناسی متون، در سالهای اخیر بسیار مورد توجه قرار گرفته است. ارائه الگوریتمهای بازشناسی برگرفته از ساختار گرامری و معنایی این زبان میتواند روش موثری در پردازشهای دیگر مربوط به خط و زبان فارسی باشد. در این مقاله با استفاده از شاخه علمی پردازش زبان-های طبیعی، یک الگوریتم سه مرحلهای به منظور بازشناسی متون فارسی بر مبنای بازشناسی جملات فارسی ارائه میشود. این روش شامل مراحل ترکیب زیرکلمات به منظور ساخت کلمات و سپس جملات بالقوه معنیدار و در نهایت استفاده از دو مدل زبانی و چند قاعده گرامری به منظور تشخیص جمله صحیح براساس انطباق با گرامر زبان فارسی میباشد. آزمایشات متعدد نشان میدهد که دقت روش ارائه شده برای مرحله ساخت کلمات و سپس جملات بالقوه معنیدار 98 درصد و 85 درصد برای تشخیص جمله صحیح با استفاده از مدل زبانی بایگرام و 88 درصد برای مدل زبانی ترایگرام است.
نوع مطالعه:
پژوهشي |
موضوع مقاله:
مقالات پردازش متن دریافت: 1392/4/11 | پذیرش: 1392/10/22 | انتشار: 1393/6/17 | انتشار الکترونیک: 1393/6/17