دوره 12، شماره 3 - ( 9-1394 )                   جلد 12 شماره 3 صفحات 121-109 | برگشت به فهرست نسخه ها

XML English Abstract Print


دانشگاه الزهرا(س)
چکیده:   (5826 مشاهده)

با وجود پیشرفت‌های اخیر در حوزه‌ ترجمه‌ ماشینی، این تکنولوژی قادر به ترجمه‌ دقیق متون نیست و گاهی ممکن است ویرایش خروجی آن زمان بیشتری نسبت به ترجمه دستی بگیرد. با این حال با داشتن تخمینی از کیفیت خروجی، کاربران می‌توانند به طور مناسبی با ناکامل بودن این تکنولوژی برخورد کنند. برای کاربردهایی که هدف آنها بالا بردن کیفیت ترجمه‌ ماشینی است، نظیر ترکیب خروجی سامانه‌های ترجمه‌گر مختلف، بازترتیب لیست چند ترجمه‌ بهتر و بازتولید خروجی، لازم است که بدون داشتن ترجمه‌ مرجع تخمینی از درستی خروجی داشته باشیم. هنوز روش کارامدی برای تخمین درستی کلمات خروجی ترجمه‌ ماشینی وجود ندارد. در این مقاله 5 گروه ویژگی جدید در قالب ویژگی‌های مبتنی بر محتوا و مبتنی بر ساختار ارائه شده است. نتایج نشان می‌دهد که ویژگی مبتنی بر محتوا نسبت به بهترین سامانه پایه (2) برتری 63/9 درصدی در CER، 5/8 درصدی در F-measure و 1/5 درصدی در F-measure طبقه منفی داشته است. همچنین ترکیب ویژگی‌های مبتنی بر ساختار ارائه شده، در مقایسه با بهترین سامانه پایه به ترتیب بهبود 59/4، 1/4 و 2 درصدی در معیارهای CER، F-measure و F-measure طبقه منفی ایجاد کرده است.

متن کامل [PDF 2248 kb]   (1493 دریافت)    
نوع مطالعه: كاربردي | موضوع مقاله: مقالات پردازش متن
دریافت: 1392/12/4 | پذیرش: 1394/6/17 | انتشار: 1394/10/14 | انتشار الکترونیک: 1394/10/14

بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.