دوره 11، شماره 1 - ( 6-1393 )                   جلد 11 شماره 1 صفحات 115-107 | برگشت به فهرست نسخه ها

XML English Abstract Print


چکیده:   (11484 مشاهده)
بازشناسی متون، در سال‌های اخیر بسیار مورد توجه قرار گرفته است. ارائه الگوریتم‌های بازشناسی برگرفته از ساختار گرامری و معنایی این زبان می‌تواند روش موثری در پردازش‌های دیگر مربوط به خط و زبان فارسی باشد. در این مقاله با استفاده از شاخه علمی پردازش زبان-های طبیعی، یک الگوریتم سه مرحله‌ای به منظور بازشناسی متون فارسی بر مبنای بازشناسی جملات فارسی ارائه می‌شود. این روش شامل مراحل ترکیب زیرکلمات به منظور ساخت کلمات و سپس جملات بالقوه معنی‌دار و در نهایت استفاده از دو مدل زبانی و چند قاعده گرامری به منظور تشخیص جمله صحیح براساس انطباق با گرامر زبان فارسی می‌باشد. آزمایشات متعدد نشان می‌دهد که دقت روش ارائه شده برای مرحله ساخت کلمات و سپس جملات بالقوه معنی‌دار 98 درصد و 85 درصد برای تشخیص جمله صحیح با استفاده از مدل زبانی بایگرام و 88 درصد برای مدل زبانی ترایگرام است.
متن کامل [PDF 1486 kb]   (2888 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: مقالات پردازش متن
دریافت: 1392/4/11 | پذیرش: 1392/10/22 | انتشار: 1393/6/17 | انتشار الکترونیک: 1393/6/17

بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.