دوره 16، شماره 2 - ( 6-1398 )                   جلد 16 شماره 2 صفحات 90-77 | برگشت به فهرست نسخه ها


XML English Abstract Print


دانشکدۀ مهندسی برق و کامپیوتر، پردیس دانشکدههای فنی، دانشگاه تهران
چکیده:   (3338 مشاهده)

در این مقاله یک مترجم خودکار متون انگلیسی به فارسی با استفاده از معماری ترکیبی قاعدهمند و آماری ارائه شده است. این معماری ترکیبی به‌منظور بهبود نتایج هر دو مترجم، خروجی مترجم ماشینی قاعدهمند و آماری را ترکیب کرده و سعی می‌کند یک خروجی برتر از هر دو سامانه ایجاد کند. در این راستا از یک رمزگشای یک‌نوا با پیچیدگی زمانی چندجملهای استفاده میشود. مترجمهای ماشینی قاعده‌مند عمل ترجمه را بر اساس مجموعهای از قواعد زبانی انجام میدهند. به‌طور معمول نتایج آنها از نظر ترتیب کلمات و ساختار نحوی، کیفیت بهتری نسبت به نتایج مترجمهای آماری دارند؛ ولی عملکرد این مترجمها در زمینه انتخاب لغات مناسب و روانی ترجمه، ضعیفتر از مترجم‌های ماشینی آماری است. از‌این‌رو در این معماری، ترجمه اولیه به‌وسیله مترجم ماشینی قاعدهمند صورت میگیرد؛ سپس با استفاده از مترجم ماشینی آماری ترجمه آن بهبود داده میشود. به این منظور، ترتیب واژگان در ترجمه نهایی بر اساس ترجمه مترجم ماشینی قاعدهمند صورت میگیرد؛ سپس عمل ترجمه و انتخاب لغات توسط رمزگشای یک‌نوا، با درنظر‌گرفتن ترجمههای نامزدهای ارائه‌شده توسط مترجم قاعدهمند و آماری و همچنین با استفاده از مدل زبانی، انجام میشود. آزمایشهای انجام‌شده نشان میدهند که کیفیت نتایج به‌دست‌آمده از معماری ترکیبی در معیار بلو، به‌طورتقریبی پنج واحد بهتر از نتایج مترجم ماشینی قاعدهمند است. همچنین کیفیت این نتایج نسبت به نتایج مترجم ماشینی آماری در معیار بلو، یک واحد بهتر است.
 

متن کامل [PDF 4044 kb]   (1700 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: مقالات پردازش متن
دریافت: 1396/1/26 | پذیرش: 1398/4/19 | انتشار: 1398/6/26 | انتشار الکترونیک: 1398/6/26

فهرست منابع
1. [1]A. Antonova and A. Misyurev, "Improving the precision of automatically constructed human-oriented translation dictionaries", in Proceedings of the 3rd Workshop on Hybrid Approaches to Translation (HyTra)@ EACL, 2014, pp. 58-66. [DOI:10.3115/v1/W14-1010]
2. [2]H. Béchara, R. Rubino, Y. He, Y. Ma, and J. van Genabith, "An Evaluation of Statistical Post-Editing Systems Applied to RBMT and SMT Systems.," in COLING, 2012, vol. 21, pp. 5-230.
3. [3]A. Birch and M. Osborne, "LRscore for evaluating lexical and reordering quality in MT," in Proceedings of the Joint Fifth Workshop on Stati-stical Machine Translation and MetricsMATR, 2010, pp. 327-332.
4. [4]Y. Chen and A. Eisele, "Hierarchical hybrid translation between english and german," in Proceedings of the 14th Annual Conference of the European Association for Machine Translation, 2010, pp. 90-97.
5. [5]M. R. Costa-Jussa, M. Farrús, J. B. Marino, and J. A. R. Fonollosa, "Study and Comparison of Rule-Based and Statistical Catalan-Spanish Machine Translation Systems.," Comput. informatics, vol. 31, no. 2, pp. 245-270, 2012.
6. [6]G. Doddington, "Automatic evaluation of machine translation quality using n-gram co-occurrence statistics," in Proceedings of the second international conference on Human Language Technology Research, 2002, pp. 138-145. [DOI:10.3115/1289189.1289273]
7. [7]A. Eisele, C. Federmann, H. Uszkoreit, H. Saint-Amand, M. Kay, M. Jellinghaus, S. Hunsicker, T. Herrmann, and Y. Chen, "Hybrid Architectures for Multi-Engine Machine Translation," Proc. Transl. Comput. 30. ASLIB Transl. Comput. Conf. (TATC), 30th, Novemb. 27-28, London, United Kingdom, 2008.
8. [8]C. España Bonet, L. Màrquez Villodre, G. Labaka, A. de Ilarraza Sánchez, and K. Sarasola Gabiola, "Hybrid machine translation guided by a rule-based system," in Machine translation summit XIII: proceedings of the 13th machine translation summit, September 19-23, 2011, Xiamen, China, 2011, pp. 554-561.
9. [9]S. FattanehJabbari and S. M. M. Ziabary, "Developing an open-domain English-Farsi translation system using AFEC: Amirkabir bilingual Farsi-English corpus," in The Fourth Workshop on Computational Approaches to Arabic Script-based Languages, 2012, pp. 17.
10. [10] N. Habash, B. Dorr, and C. Monz, "Symbolic-to-statistical hybridization: extending generation-heavy machine translation," Mach. Transl., vol. 23, no. 1, pp. 23-63, 2009. [DOI:10.1007/s10590-009-9056-7]
11. [11] P. Koehn, "Statistical Significance Tests for Machine Translation Evaluation," in EMNLP, 2004, pp. 388-395.
12. [12] P. Koehn, H. Hoang, A. Birch, C. Callison-Burch, M. Federico, N. Bertoldi, B. Cowan, W. Shen, C. Moran, R. Zens, and others, "Moses: Open source toolkit for statistical machine translation," in Proceedings of the 45th annual meeting of the ACL on interactive poster and demonstration sessions, 2007, pp. 177-180.
13. [13] G. Labaka, C. España-Bonet, L. Màrquez, and K. Sarasola, "A hybrid machine translation architecture guided by syntax," Mach. Transl., vol. 28, no. 2, pp. 91-125, 2014. [DOI:10.1007/s10590-014-9153-0]
14. [14] W. Macherey and F. J. Och, "Consensus translations from multiple machine translation systems." Google Patents, 2012.
15. [15] K. Papineni, S. Roukos, T. Ward, and W.-J. Zhu, "BLEU: a method for automatic evaluation of machine translation," in Proceedings of the 40th annual meeting on association for computational linguistics, 2002, pp. 311-318. [DOI:10.3115/1073083.1073135]
16. [16] E. Park, O. Kwon, K. Kim, and Y. Kim, "A Classification-based Approach for Hybridizing Statistical Machine Translation and Rule-based Machine Translation," pp. 1-9, 2015. [DOI:10.4218/etrij.15.0114.1017]
17. [17] V. M. Sánchez-Cartagena, F. Sánchez-Mart'inez, J. A. Pérez-Ortiz, and others, "Integrating shallow-transfer rules into phrase-based statistical machine translation," 2011.
18. [18] C. Tillmann, S. Vogel, H. Ney, and A. Zubiaga, "A DP based search using monotone alignments in statistical translation," in Proceedings of the eighth conference on European chapter of the Association for Computational Linguistics, 1997, pp. 289-296. [DOI:10.3115/979617.979654]

بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.