دوره 15، شماره 1 - ( 3-1397 )                   جلد 15 شماره 1 صفحات 102-87 | برگشت به فهرست نسخه ها


XML English Abstract Print


دانشگاه گیلان
چکیده:   (5086 مشاهده)

سامانه‌های پرسش و پاسخ، زیرشاخه‌ای از علوم پردازش زبان طبیعی و بازیابی اطلاعات محسوب می‌شوند که در چند دهه‌ اخیر مورد علاقه زیاد پژوهش‌گران قرار‌گرفته‌اند. با توجه به رشد فزاینده‌ علاقه‌مندی به این زمینه‌ پژوهشی، نیاز به در‌اختیار‌داشتن منابع داده‌ای مناسب برای آن، به‌خوبی احساس می‌شود. تاکنون اغلب پژوهش‌های صورت‌گرفته در رابطه با توسعه‌ پیکره پرسش و پاسخ در زبان انگلیسی بوده است؛ درصورتی‌که در زبان‌های دیگر مانند فارسی، نیاز شدیدی به وجود چنین پیکره‌هایی احساس می‌شود. در این مقاله، مراحل کامل توسعه‌ یک پیکره متنی پرسش و پاسخ با نام رسائل و مسائل در زبان فارسی شرح داده خواهد شد. این پیکره شامل 2,118 سؤال غیرحقیقت و 2,051 سؤال حقیقت بوده که برای هر سؤال، متن سؤال، نوع سؤال، سختی سؤال از نظر پرسشگر و پاسخ‌دهنده، طبقه معنایی پاسخ در سطح درشت‌دانه و ریزدانه، پاسخ دقیق سؤال و شماره صفحه و پاراگراف پاسخ، نشانه‌گذاری شده است. پیکره پیشنهادی برای یادگیری کلیه مؤلفه‌های سامانه‌های پرسش و پاسخ شامل دسته‌بندی سؤال، بازیابی اطلاعات و استخراج پاسخ، مورد‌استفاده می‌تواند قرار‌ گیرد و به‌صورت رایگان در دسترس پژوهش‌گران قرار دارد. در ادامه یک سامانه پرسش و پاسخ بر روی پیکره رسائل و مسائل معرفی می‌شود. نتایج نشان می‌دهد که سامانه پیشنهادی توانسته است به دقت 29/82 و میانگین معکوس رتبه 73/56 درصد دست یابد. می‌توان اظهار کرد که پیکره و سامانه پیشنهادی در نوع خود، نخستین پیکره و سامانه مربوط به پرسش و پاسخ با چنین ویژگی‌هایی برای زبان فارسی است.

متن کامل [PDF 5230 kb]   (2497 دریافت)    
نوع مطالعه: كاربردي | موضوع مقاله: مقالات پردازش متن
دریافت: 1395/12/20 | پذیرش: 1396/12/15 | انتشار: 1397/3/23 | انتشار الکترونیک: 1397/3/23

فهرست منابع
1. [1] حسینی، پدرام و همکاران، "پیکره فارسی تحلیل احساس سِنتی‌پِرس: توسعه یک پیکره تحلیل احساس متنی برای زبان فارسی". سومین کنفرانس زبانشناسی رایانشی, 1393.
2. [1] (Hosseini, P. et al., "Persian Sentiment Analysis Corpus: Developing a textual sentiment corpus for Persia". Third conference on Computational Linguistics, Sharif University of Technology, 2014.)
3. [2] قائمی، هادی، کاهانی، محسن. "دسته‌بندی پرسش‌ها با استفاده از ترکیب دسته‌بندها". پردازش علائم و داده‌ها. ۱۳۹۵; ۱۳ (۳) :۹۹-۱۱۲
4. [2] (Ghaemi, .H, kahani, .M. "Question Classification using nsemble Classifiers ", JSDP, 13 (3), 2016, 99-112) [DOI:10.18869/acadpub.jsdp.13.3.99]
5. [3] AleAhmad, A. et al., "Hamshahri: A standard Persian text collection", Knowledge-Based System-s, 22(5), 2009, pp.382–387. [DOI:10.1016/j.knosys.2009.05.002]
6. [4] Bijankhan, M. et al., "Lessons from building a Per-sian written corpus: Peykare". Language Resourc-es and Evaluation, 45(2), 2010, pp.143–164. [DOI:10.1007/s10579-010-9132-x]
7. [5] Greenwood, M.A., "Open-domain question answering", Foundations and Trends in Informa-tion Retrieval, 2005.
8. [6] Gupta, P. and Gupta, V.,"A survey of text question answering techniques", International Journal of Computer Applications, 53(4), 2012, pp.1–8. [DOI:10.4018/jaec.2012100101]
9. [7] Hirschman, L. and Gaizauskas, R., "Natural language question answering: the view from here", Natural Language Engineering, 7(04), 2000, pp.275–300.
10. [8] Kolomiyets, O. and Moens, M.-F., "A survey on question answering technology from an informa-tion retrieval perspective", Information Sciences, 181(24), 2011, pp.5412–5434. [DOI:10.1016/j.ins.2011.07.047]
11. [9] Lee, G. et al., "SiteQ: Engineering High Performance QA System Using", Lexico-Semantic Pattern Matching and Shallow NLP. In TREC, 2001.
12. [10] Li, X. and Roth, D., "Learning question classifiers", In Proceedings of the 19th interna-tional conference on Computational linguistics., 2002. [DOI:10.3115/1072228.1072378]
13. [11] Li, X. and Roth, D., "Learning question classifiers: the role of semantic information", Natural Language Engineering, 12(03), 2006, pp.229–249. [DOI:10.1017/S1351324905003955]
14. [12] Magnini, B. et al., "Creating the DISEQuA corpus: a test set for multilingual question answering", In Comparative Evaluation of Multilingual Information Access Systems, 2004, pp. 487–500.
15. [13] Manning, C.D., Raghavan, P. and Schütze, H., "Introduction to information retrieval", Cambr-idge university press Cambridge , 2008.
16. [14] Moghaddas, B.B. et al, "Pasokh: A standard corpus for the evaluation of Persian text summarizers". In Computer and Knowledge Engineering (ICCKE), 2013, pp. 471–475. [DOI:10.1109/ICCKE.2013.6682873]
17. [15] Moll, D. and Vicedo, L., "Question Answering in Restricted Domains : An Overview", Computa-tional Linguistics, 2007. [DOI:10.1162/coli.2007.33.1.41]
18. [16] Mollaei, A., Rahati-Quchani, S. and Estaji, A., "Question classification in Persian language based on conditional random fields", 2nd International eConference on Computer and Knowledge Engineering (ICCKE), 2012, pp.295–300.
19. [17] Rasooli, M.S et al., "Development of a Persian syntactic dependency treebank". In Proceedings of the 2013 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, 2013, pp. 306–314.
20. [18] Smith, N.A., Heilman, M. and Hwa, R., "Question generation as a competitive undergraduate course project", In Proceedings of the NSF Workshop on the Question Generation Shared Task and Evaluation Challenge, 2008, pp. 4–6.
21. [19] Tellex, S. et al., "Quantitative evaluation of passage retrieval algorithms for question answering", In Proceedings of the 26th annual international ACM SIGIR conference on Research and development in informaion retrieval, 2003, pp. 41–47. [DOI:10.1145/860435.860445]
22. [20] Tom, D. et al., "TrainQA: a Training Corpus for Corpus-Based Question Answering Systems", In Proc. 8th Int. Conf. on Computational Linguistics and Intelligent Text Processing, 2007, pp. 1–7.
23. [21] Voorhees, E.M., "Building a question answering test collection", ACM SIGIR, 2000. [DOI:10.1145/345508.345577]
24. [22] Voorhees, E.M., "The TREC-8 Question Answering Track Report", In TREC, 1999, pp. 77–82.
25. [23]Yaghoobzadeh, Y. et al., "ISO-TimeML Event Extraction in Persian Text",COLING, 2012, pp.2931-2944.
26. [24]Zhang, D. and Lee, W.S., "Question classification using support vector machines", In Proceedings of the 26th annual international ACM SIGIR conference on Research and development in informaion retrieval, 2003, pp. 26–32. [DOI:10.1145/860435.860443]

بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.