در مقالۀ حاضر سامانهای هوشمند جهت ویرایش و خطایابی املایی متون فارسی معرفی شدهاست. هدف از طراحی و ایجاد این سامانه، ویرایش متون فارسی برای کاربردهای پردازش زبان طبیعی است. این سامانه بر مبنای یک رویکرد مهندسی قابل توسعه، از سه زیرسامانه تشکیل شدهاست: ویرایشگر متن فارسی معیار، خطایاب املایی خودکار زبان فارسی و ستاکیاب واژگان زبان فارسی. این سه بخش با یکدیگر در تعاملند؛ بدین شکل که ابتدا ستاک واژههای متن شناسایی میشود و در صورت عدم وجود ستاک در فهرست واژههای زبان، واژۀ مذکور به عنوان واژهای نادرست شناسایی خواهدشد و سپس خطایاب خودکار فهرستی از واژههای جایگزین را پیشنهاد خواهدکرد. در زیرسامانۀ ویرایشگر، متن موجود ویرایش شده و متنی یکپارچه که منطبق بر معیارهای مصوب فرهنگستان زبان و ادب فارسی است، به کاربر ارائه خواهد شد. نتایج ارزیابی نشاندهندۀ دقتی بسیار خوب در حدود 95% در ستاکیابی کلمات، 92% در ویرایش و 96% در خطایابی املایی زبان فارسی است.
بازنشر اطلاعات | |
این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است. |