دوره 14، شماره 4 - ( 12-1396 )                   جلد 14 شماره 4 صفحات 79-96 | برگشت به فهرست نسخه ها


XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Pouramini A, Ghayoomi M, Naseri A. Converting Dependency Treebank to Constituency Treebank for Persian. JSDP. 2018; 14 (4) :79-96
URL: http://jsdp.rcisp.ac.ir/article-1-492-fa.html
پورامینی احمد، قیومی مسعود، ناصری امینه. تبدیل خودکار درخت‌بانک وابستگی فارسی به درخت‌بانک سازه‌ای . پردازش علائم و داده‌ها. 1396; 14 (4) :79-96

URL: http://jsdp.rcisp.ac.ir/article-1-492-fa.html


داشنگاه صنعتی سیرجان
چکیده:   (729 مشاهده)

درختبانک‌ها به‌طورمعمول به دو شکل مبتنی بر ساختار وابستگی و مبتنی بر ساختار سازهای ایجاد میشوند. هر دوی این ساختارها در حوزه زبان‌شناسی و پردازش زبان طبیعی کاربرد دارند. هم‌اکنون چندین درختبانک وابستگی برای زبان فارسی وجود دارد، اما درختبانک سازه‌ای با حجم بزرگ برای این زبان وجود ندارد. در این مقاله قصد داریم روشی را برای تبدیل یک درخت‌بانک وابستگی به معادل سازهای آن، بر اساس یک الگوریتم موجود ارائه دهیم. الگوریتم مبنا با استفاده از مجموعه‌ای از قواعد تبدیل، زیردرخت‌های سازه‌ای متناظر با یال‌های وابستگی را یافته و با ترکیب آنها ساختار سازهای نهایی را تولید میکند. ما این الگوریتم را بر روی ساختارهای وابستگی زبان فارسی اعمال و ضمن ارائه نتایج، اصلاحاتی را در جهت بهبود کارایی آن ارائه میکنیم. نشان داده می‌شود که پیمایش یال‌های وابستگی در یک جهت خاص بر روی کیفیت الگوریتم تأثیرگذار است. همین‌طور ما اصلاحاتی را در الگورتیم مربوط به تطبیق قواعد و الگوریتم اتصال زیردرخت‌ها ارائه می‌کنیم. این اصلاحات کارایی الگوریتم را به شکل قابل ملاحظه‌ای افزایش می‌دهند. نتایج عملی بهبودی را به اندازه 48/16% نسبت ‌به الگوریتم مبنا نشان می‌دهد.
 

متن کامل [PDF 6511 kb]   (180 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: مقالات پردازش متن
دریافت: ۱۳۹۴/۱۲/۲ | پذیرش: ۱۳۹۶/۸/۳ | انتشار: ۱۳۹۶/۱۲/۲۲ | انتشار الکترونیک: ۱۳۹۶/۱۲/۲۲

فهرست منابع
1. [1] سلطان زاده ف.، بحرانی م. و اسلامی م. "دادگان درخت نحوی شریف: دادگان درخت نحوی ساخت‌سازهای زبان فارسی" مجموعه مقالات سومین همایش زبانشناسی رایانشی ایران، دانشگاه صنعتی شریف، 28-29 آبان، 1393.
2. [2] دهقان، م.،فیلی، ه. "تولید درختبانک سازه‌ای زبان فارسی به روش تبدیل خودکار". پردازش علائم و داده‌ها. جلد ۱۳، شماره ۲، صفحه ۱۲۱-۱۳۷، 1395.
3. [1] Soltanzadeh F, Bahrani M, Eslami M. "A Rule-Based Approach in Converting a Dependency Parse Tree into Phrase Structure Parse Tree for Persian", JSDP. vol. 12 (4), pp. 95-115, 2016.
4. [2] Dehghan M H, Faili H. "Generating the Persian Constituency Treebank in an Automatic Convert-ing Method", JSDP, vol. 13 (2), pp.121-137, 2016.
5. [3] Black, Ezra, et al. "A procedure for quantitatively comparing the syntactic coverage of English grammars." Speech and Natural Language: Proceedings of a Workshop Held at Pacific Grove, California, February 19-22, 1991. [DOI:10.3115/112405.112467]
6. [4] Bhatt, Rajesh, and Fei Xia. "Challenges in converting between treebanks: a case study from the hutb." META-RESEARCH Workshop on Advanced Treebanking. 2012.
7. [5] Collins, Michael, et al. "A statistical parser for Czech." Proceedings of the 37th annual meeting of the Association for Computational Linguistics on Computational Linguistics. Association for Computational Linguistics, 1999. [DOI:10.3115/1034678.1034754]
8. [6] Covington, Michael A. "An empirically motivated reinterpretation of Dependency Grammar." arXiv preprint cmp-lg/9404004, 1994.
9. [7] Ghayoomi, Masood. "Bootstrapping the Develop-ment of an HPSG-based Treebank for Persian." Linguistic Issues in Language Techno-logy vol. 7, no. 1, pp. 1-13. 2012.
10. [8] Ghayoomi, M., & Kuhn, J. "Converting an HPSG-based Treebank into its Parallel Dependency-based Treebank". In LREC, pp. 802-809, 2014.
11. [9] Kaplan, Ronald M. "The formal architecture of lexical-functional grammar." Formal issues in lexical-functional grammar, vol. 47, pp. 7-27, 1995.
12. [10] Klein, A., "From dependency to constituency: Automatic generation of Penn Treebank trees from LFG f-structures", M.S. Thesis , Univer-sity of Heidelberg, Germany, 2009.
13. [11] Marcus, M. P., Marcinkiewicz, M. A., & Santorini, B. "Building a large annotated corpus of English: The Penn Treebank", Computational linguistics, vol. 19, no. 2, pp 313-330, 1993. [DOI:10.21236/ADA273556]
14. [12] Pollard, Carl, and Ivan A. Sag. Head-driven phrase structure grammar. University of Chi-cago Press, 1994.
15. [13] Rasooli, M. S., Kouhestani, M., & Moloodi, A. "Development of a Persian syntactic depend-ency treebank". In Proceedings of the 2013 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, pp. 306-314, 2013.
16. [14] Schabes, Y., Abeille, A., & Joshi, A. K. "Parsing strategies with 'lexicalized' grammars: application to tree adjoining grammars", In Proceedings of the 12th conference on Computational linguistics, Association for Computational Linguistics, vol. 2, pp. 578-583, 1988. [DOI:10.3115/991719.991757]
17. [15] SekineS. & Collins.M. J, The evalb software, 1997. Available: http://cs.nyu.edu/cs/projects/proteus/evalb. [Accessed: 01- Oct- 2017].
18. [16] Seraji, M., Megyesi, B., & Nivre, J. "Bootstrapping a Persian dependency treebank". Linguistic Issues in Language Technology, vol. 7, no. 18, pp 1-10, 2012.
19. [17] Steedman, M. The syntactic process, vol. 24. Cambridge: MIT press, 2000.
20. [18] Wang, Z., & Zong, C. "Phrase structure parsing with dependency structure", In Proceedings of the 23rd International Conference on Computa-tional Linguistics: Posters, Association for Computational Linguistics, pp. 1292-1300, August. 2010.
21. [19] Xia, F., & Palmer, M. "Converting dependency structures to phrase structures", In Proceedings of the first international conference on Human language technology research, Association for Computational Linguistics, pp. 1-5, March. 2001. [DOI:10.3115/1072133.1072147]
22. [20] Xia, F., Rambow, O., Bhatt, R., Palmer, M., & Misra Sharma, D. "Towards a multi-representa-tional treebank", LOT Occasional Series, vol. 12., pp. 159-170, 2008.

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA code

ارسال پیام به نویسنده مسئول


کلیه حقوق این وب سایت متعلق به فصل‌نامة علمی - پژوهشی پردازش علائم و داده‌ها می باشد.