دوره 16، شماره 1 - ( 3-1398 )                   جلد 16 شماره 1 صفحات 20-3 | برگشت به فهرست نسخه ها


XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Reshadat V, HoorAli M, Faili H. A New Method for Improving Computational Cost of Open Information Extraction Systems Using Log-Linear Model. JSDP 2019; 16 (1) :3-20
URL: http://jsdp.rcisp.ac.ir/article-1-681-fa.html
رشادت وحیده، حورعلی مریم، فیلی هشام. بهبود هزینه محاسباتی در سامانه‌های استخراج آزاد اطلاعات با استفاده از مدل لاگ لینیر. پردازش علائم و داده‌ها. 1398; 16 (1) :3-20

URL: http://jsdp.rcisp.ac.ir/article-1-681-fa.html


دانشکده فنی مهندسی میانه، دانشگاه تبریز
چکیده:   (3489 مشاهده)

استخراج اطلاعات شامل توسعه الگوریتم‌­هایی است که به‌صورت خودکار متن غیرساخت‌­یافته را پردازش و پایگاه داده‌­ای از موجودیت­‌ها، روابط و وقایع را تولید می­‌کنند. یکی از مشکلات اساسی استخراج اطلاعات، هزینه بالای محاسباتی این روش‌­ها است. این موضوع در دامنه‌هایی با مقیاس بزرگ نظیر وب اهمیت زیادی دارد. در سال­‌های اخیر رو‌ش‌­های استخراج آزاد اطلاعات زیادی پیشنهاد شده است. این روش‌­ها محدوده وسیعی را از ابزارهای پردازش زبان طبیعی را اعم از سطحی (نظیر برچسب‌­زن اجزای کلام) تا عمیق (نظیر برچسب‌زن نقش معنایی) در برمی‌­گیرند. در این مقاله روشی بهینه­ برای استخراج آزاد اطلاعات نشان داده شده که بر پایه ترکیب مزایای استخراج‌­گرهای سطحی و عمیق و اجتناب از معایب آنها بنا شده است. استخراج‌گر که هسته اصلی روش پیشنهادی است، با استفاده از پارامترهای مؤثر، زیرمجموعه‌­ای را با کارایی بالا با استفاده از یک روش بهینه به کمک مدل لاگ لینیر به‌وجود می­‌آورد که قابل اجرا در مقیاس وب است. این روش با بررسی جمله ورودی و انتساب آن به مناسب­‌ترین استخراج­‌گر باعث استفاده بهینه از زمان و در‌نتیجه، کاهش هزینه محاسباتی شده و علاوه‌بر‌این به‌دقت قابل قبولی نیز دست می­‌یابد. 

متن کامل [PDF 6285 kb]   (1904 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: مقالات پردازش متن
دریافت: 1396/8/18 | پذیرش: 1397/11/6 | انتشار: 1398/3/20 | انتشار الکترونیک: 1398/3/20

فهرست منابع
1. [1] V. Reshadat, M. Hoorali, and H. Faili, "A Hybrid Method for Open Information Extraction Based on Shallow and Deep Linguistic Analysis," Inter-disciplinary Information Sciences, vol. 22, pp. 87-100, 2016. [DOI:10.4036/iis.2016.R.03]
2. [2] J. Piskorski and R. Yangarber, "Information extraction: Past, present and future," in Multi-source, Multilingual Information Extraction and Summarization, ed: Springer, 2013, pp. 23-49. [DOI:10.1007/978-3-642-28569-1_2]
3. [3] نیما مولایی، حسین شیرازی. روش پیشنهادی برای استخراج اطلاعات مورد نیاز از متون نظامی. فصل‌نامه پردازش علائم و داده¬ها. ۱۳۹۱؛ ۹(۱): ۶۷-۸۰
4. [3] N. mollaei, A. Abdolahzadeh, H. A. Shirazi, new approach to extract the required information from military documents. JSDP. 2012; 9 (1): pp.67-80
5. [4] L. Del Corro and R. Gemulla, "ClausIE: clause-based open information extraction," in Procee-dings of the 22nd international conference on World Wide Web, 2013, pp. 355-366. [DOI:10.1145/2488388.2488420]
6. [5] O. Etzioni, M. Banko, S. Soderland, and D. S. Weld, "Open information extraction from the web," Communications of the ACM, vol. 51, pp. 68-74, 2008. [DOI:10.1145/1409360.1409378]
7. [6] O. Etzioni, A. Fader, J. Christensen, S. Soderland, and M. Mausam, "Open Information Extraction: The Second Generation," in IJCAI, 2011, pp. 3-10.
8. [7] F. Wu and D. S. Weld, "Open information extraction using Wikipedia," in Proceedings of the 48th Annual Meeting of the Association for Computational Linguistics, 2010, pp. 118-127.
9. [8] A. Akbik and J. Broß, "Wanderlust: Extracting semantic relations from natural language text using dependency grammar patterns," in WWW Workshop, 2009.
10. [9] A. Akbik ,and A. Löser, "Kraken: N-ary facts in open information extraction," in Proceedings of the Joint Workshop on Automatic Knowledge Base Construction and Web-scale Knowledge Extraction, 2012, pp. 52-56.
11. [10] P. Gamallo, M. Garcia, and S. Fernández-Lanza, "Dependency-based open information extraction," in Proceedings of the Joint Workshop on Unsupervised and Semi-Supervised Learning in NLP, 2012, pp. 10-18.
12. [11] V. Tablan, K. Bontcheva, D. Maynard, and H. Cunningham, "Ollie: on-line learning for information extraction," in Proceedings of the HLT-NAACL 2003 workshop on Software engi-neering and architecture of language techno-logy systems-Volume 8, 2003, pp. 17-24. [DOI:10.3115/1119226.1119229]
13. [12] A. Fader, S. Soderland, and O. Etzioni, "Identify-ing relations for open information extraction," in Proceedings of the Conference on Empirical Methods in Natural Language Process-ing, 2011, pp. 1535-1545.
14. [13] F. Mesquita, J. Schmidek, and D. Barbosa, "Effectiveness and efficiency of open relation ex-traction," in Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing, vol. 500, pp. 447-457, 2013.
15. [14] M. Banko, M. J. Cafarella, S. Soderland, M. Broadhead, and O. Etzioni, "Open information extraction for the web," in IJCAI, 2007, pp. 2670-2676.
16. [15] Y. Merhav, F. Mesquita, D. Barbosa, W. G. Yee, and O. Frieder, "Extracting information networks from the blogosphere," ACM Transactions on the Web (TWEB), vol. 6, p. 11, 2012. [DOI:10.1145/2344416.2344418]
17. [16] L. Qiu and Y. Zhang, "Zore: A syntax-based system for chinese open relation extraction," in Proceedings of EMNLP, 2014. [DOI:10.3115/v1/D14-1201] [PMID]
18. [17] Y.-H. Tseng, L.-H. Lee, S.-Y. Lin, B.-S. Liao, M.-J. Liu, H.-H. Chen, O. Etzioni, and A. Fader, "Chinese open relation extraction for knowledge acquisition," EACL 2014, p. 12, 2014. [DOI:10.3115/v1/E14-4003] [PMCID]
19. [18] P. Gamallo and M. Garcia, "Multilingual open information extraction," in Portuguese Con-ference on Artificial Intelligence, 2015, pp. 711-722. [DOI:10.1007/978-3-319-23485-4_72]
20. [19] C. Castella Xavier, S. de Lima, V. Lúcia, and M. Souza, "Open information extraction based on lexical-syntactic patterns," in Intelligent Systems (BRACIS), 2013 Brazilian Conference on, 2013, pp. 189-194. [DOI:10.1109/BRACIS.2013.39]
21. [20] P. Cimiano ,and J. Wenderoth, "Automatically learning qualia structures from the web," in Proceedings of the ACL-SIGLEX workshop on deep lexical acquisition, 2005, pp. 28-37. [DOI:10.3115/1631850.1631854]
22. [21] M. Schmitz, R. Bart, S. Soderland, and O. Etzioni, "Open language learning for information extraction," in Proceedings of the 2012 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning, 2012, pp. 523-534.
23. [22] N. Nakashole, G. Weikum, and F. Suchanek, "PATTY: a taxonomy of relational patterns with semantic types," in Proceedings of the 2012 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning, 2012, pp. 1135-1145.
24. [23] H. Bast and E. Haussmann, "Open information extraction via contextual sentence decomposi-tion," in Semantic Computing (ICSC), 2013 IEEE Seventh International Conference on, 2013, pp. 154-159. [DOI:10.1109/ICSC.2013.36]
25. [24] H. Bast and E. Haussmann, "More informative open information extraction via simple inference," in Advances in information retrieval, ed: Springer, 2014, pp. 585-590. [DOI:10.1007/978-3-319-06028-6_61]
26. [25] H. Lin, Y. Wang, P. Zhang, W. Wang, Y. Yue, and Z. Lin, "A Rule Based Open Information Extraction Method Using Cascaded Finite-State Transducer," in Pacific-Asia Conference on Knowledge Discovery and Data Mining, 2016, pp. 325-337. [DOI:10.1007/978-3-319-31750-2_26]
27. [26] Y. Xu, M.-Y. Kim, K. Quinn, R. Goebel, and D. Barbosa, "Open Information Extraction with Tree Kernels," in HLT-NAACL, 2013, pp. 868-877.
28. [27] J. Christensen, S. Soderland, and O. Etzioni, "An analysis of open information extraction based on semantic role labeling," in Proceedings of the sixth international conference on Knowledge capture, 2011, pp. 113-120. [DOI:10.1145/1999676.1999697]
29. [28] V. Punyakanok, D. Roth, and W.-t. Yih, "The importance of syntactic parsing and inference in semantic role labeling," Computational Linguistics, vol. 34, pp. 257-287, 2008. [DOI:10.1162/coli.2008.34.2.257]
30. [29]R. Johansson and P. Nugues, "The effect of syntactic representation on semantic role labeling," in Proceedings

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA

ارسال پیام به نویسنده مسئول


بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.

کلیه حقوق این تارنما متعلق به فصل‌نامة علمی - پژوهشی پردازش علائم و داده‌ها است.