دوره 15، شماره 4 - ( 12-1397 )                   جلد 15 شماره 4 صفحات 110-95 | برگشت به فهرست نسخه ها


XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Sharifi A, Mahdavi M. Supervised approach for keyword extraction from Persian documents using lexical chains. JSDP 2019; 15 (4) :95-110
URL: http://jsdp.rcisp.ac.ir/article-1-733-fa.html
شریفی عطیه، مهدوی محمد امین. رویکردی با ناظر در استخراج واژگان کلیدی اسناد فارسی با استفاده از زنجیره‌های لغوی. پردازش علائم و داده‌ها. 1397; 15 (4) :95-110

URL: http://jsdp.rcisp.ac.ir/article-1-733-fa.html


دانشگاه بین‌المللی امام خمینی
چکیده:   (4426 مشاهده)
واژگان کلیدی، واژگان اصلی و کانونی یک متن و مضمون اصلی مطلب هستند. تهیه این واژگان به روش سنّتی نیازمند صرف زمان و هم‌چنین دانش تخصّصی راجع به موضوع متن است. از آن‌جا که واژگان کلیدی کاربردهای فراوانی در به‌کارگیری مستندات الکترونیکی دارند، شناسایی روش‌های خودکار و بهبودیافته برای استخراج این دسته از واژگان همیشه مورد توجه بوده است. رویکرد پژوهش حاضر یک روش باناظر برای استخراج واژگان کلیدی است که در آن با استفاده از زنجیره‌های لغوی واژگان متن، ویژگی‌های جدیدی برای هر واژه استخراج شده ‌است. در ایجاد زنجیره‌های لغوی سعی بر شکل‌گیری روابط بین معنای واژگان بوده‌ایم، از‌این‌رو در مدل ارائه‌شده « فارس‌نت»  نقش مهمی در ایجاد آنها ایفا می‌کند. داده‌ها‌ی مورد ارزیابی در این پژوهش مقالات علمی پژوهشی نشریات فارسی هستند. نتایج به‌دست‌آمده نشان می‌دهد که استفاده از روابط معنایی بین واژگان در کنار ویژگی‌های آماری، عملکرد مناسبی را در استخراج واژگان کلیدی از مقالات نتیجه می‌دهد.
 
متن کامل [PDF 14235 kb]   (1201 دریافت)    
نوع مطالعه: كاربردي | موضوع مقاله: مقالات پردازش متن
دریافت: 1396/9/12 | پذیرش: 1397/2/26 | انتشار: 1397/12/17 | انتشار الکترونیک: 1397/12/17

فهرست منابع
1. [1]J. Wang, J. Liu and C. Wang, "Keyword Extraction Based on PageRank," in Pacific-Asia Conference on Knowledge Discovery and Data Mining. Springer Berlin Heidelberg, 2007.
2. [2]X. Li and F. Song, "Keyphrase Extraction and Grouping Based on Association Rules," in FLAIRS Conference, Hollywood, Florida, 2015.
3. [3] B. Lott, "Survey of keyword extraction techniques," UNM Education, 2012.
4. [4] R. Nelken and S. M. Shieber, "Lexical chaining and word-sense-disambiguation," School of Engineering and Applied Sciences, Harvard University, Cambridge ,Technical Report TR-06-07, MA, 2007.
5. [5] G. Ercan, "Automated text summarization and keyphrase extraction," M.S. thesis, bilkent univer-sity, Ankara, Turkey, 2006.
6. [6] M. Shamsfard, "Towards Semi Automatic Construction of a Lexical Ontology for Persian," in sixth International Conference on Language Resources and Evaluation, Morocco, 2008.
7. [7] M. Galley and K. McKeown, "Improving word sense disambiguation in lexical chaining," IJCAI, vol. 3, pp. 1486-1488, 2003.
8. [8] k. Hasan and v. Ng, "Automatic Keyphrase Extraction: A Survey of the State of the Art," in ACL, 2014. [DOI:10.3115/v1/P14-1119]
9. [9] C. Wu, M. Marchese and J. Jiang, "Machine Learning-Based Keywords Extraction for Scien-tific Literature," Journal of Universal Computer Science, vol. 13, no. 10, pp. 1471-1483, 2007.
10. [10] S. Beliga, "Keyword extraction: a review of methods and approaches," University of Rijeka, Department of Informatics, Rijeka, 2014.
11. [11] S. beliga, A. Mestrovic and S. Martincic, "An overview of graph-based keyword extraction methods and approaches," Journal of information and organizational sciences, vol. 39, no. 1, pp. 1-20, 2015.
12. [12] T. Pay and S. Lucci, "Automatic Keyword Extraction: An Ensemble Method," in 2017 IEEE International Conference on Big Data, Boston, 2017. [DOI:10.1109/BigData.2017.8258552]
13. [13] M. Johansson and P. Lindstrom, "Keyword Extraction using Machine Learning," M.S. thesis, Gothenburg University, Gothenburg, Sweden, 2010.
14. [14] A. Hulth, "Combining machine learning and natural language processing for automatic key-word extraction," Ph.D. dissertation, Stockholm University, Stockholms, Sweden, 2004.
15. [15] Y. HaCohen-kerner, Z. Gross and A. Masa, "Automatic extraction and learning of keyphrases from scientific articles," in International Con-ference on Intelligent Text Processing and Computational Linguistics. Springer Berlin Heidelberg, 2005. [DOI:10.1007/978-3-540-30586-6_74]
16. [16] O. Medelyan and I. H. Witten, "Thesaurus based automatic keyphrase indexing," in Proceedings of the 6th ACM/IEEE-CS joint conference on Digital libraries. ACM, 2006. [DOI:10.1145/1141753.1141819]
17. [17] C. Zhang, H. WANG, Y. LIU, D. WU, Y. LIAO and B. WANG, "Automatic Keyword Extraction from Documents Using Conditional Random Fields," Computational Information Systems, vol. 4, no. 3, pp. 1169-1180, 2008.
18. [18] M. Krapivin, A. Autayeu, M. Ma, E. Blanzieri and N. Segata, "Keyphrases extraction from scientific documents: improving machine learning approa-ches with natural language processing," in International Conference on Asian Digital Lib-raries. Springer Berlin Heidelberg, 2010. [DOI:10.1007/978-3-642-13654-2_12]
19. [19] C. Caragea and F. Bulgarov, "Citation-Enhanced Keyphrase Extraction from Research Papers: A Supervised Approach," in Empirical Methods in Natural Language Processing (EMNLP), Doha, 2014. [DOI:10.3115/v1/D14-1150]
20. [20] O. Alqaryouti, T. A. Farouk, A. R. Nabhan and K. Shaalan, "Graph-Based Keyword Extraction," in Intelligent Natural Language Processing: Trends and Applications, Springer, Cham, 2018, pp. 159-172. [DOI:10.1007/978-3-319-67056-0_9]
21. [21] Z. Liu and P. Liu, "Clustering to Find Exemplar Terms for Keyphrase Extraction," in Proceedings of the 2009 Conference on Empirical Methods in Natural Language Processing, 2009. [DOI:10.3115/1699510.1699544]
22. [22]س. عربی نرئی, م. وحیدی اصل و ب. مینایی بیدگلی, "استخراج واژگان کلیدی جهت طبقه‌بندی متون فارسی," در اولین کنفرانس داده‌کاوی ایران, دانشگاه صنعتی امیرکبیر, 1386.
23. [22] S. Arabi Narei, M.Vahidi Asl and B.Minaei Bidgoli, "Keyword extraction for persian text classification,"in First Iran Data Mining Conf-erence, Amir kabir university ,2007.
24. [23] م. محمدي جنقرا و م. آنالویی, "استخراج واژگان کلیدي اسناد فارسی," در سیزدهمین کنفرانس سالانه انجمن کامپیوتر ایران, جزیره کیش - انجمن کامپیوتر, دانشگاه صنعتی شریف, 1386.
25. [23]M. Mohammadi Janghara and M.Analouei , " keyword extraction from persian documents", in 13th Annual Conference of Computer Society of Iran, kish island- computer society, Sharif Univer-sity of Technology, 2008.
26. [24]ع. احمدی و ط. حسینی خواه, "استخراج واژگان کلیدی یک متن با استفاده از شبکه‌های عصبی," در دهمین کنفرانس بین المللی مهندسی صنایع, دانشگاه امیرکبیر, 1392.
27. [24] A. Ahmadi and T. Hoseinikhah, "Keyword Extraction from a text using Neural Network," in Tenth international industrial engineering con-ference, Amirkabir University, 2014.
28. [25] ف. راد, ح. پروین, آ. دهباشی و ب. مینایی, "ارائه روشی جدید برای شاخص‌گذاری خودکار و استخراج واژگان کلیدی برای بازیابی اطلاعات و خوشه‌بندی متون," نشریه پردازش علائم و داده‌ها, جلد 13, شماره 1, صفحه 100-87 ,1395.
29. [25]F. Rad, H. Parvin, A. Dehbashi, B. Minaei, "A New Method for Automatic Indexing and Extract-ing Keywords for Information Retrieval and Clustering of Texts", Journal of Signal Processing and Data, Volume 13, No. 1, page 87-100, 2017.
30. [26]H. G. Silber and K. F. McCoy, "Efficiently computed lexical chains as an intermediate representation for automatic text summarization," Association for Computational Linguistics, vol. 28, no. 4, pp. 487-496, 2002. [DOI:10.1162/089120102762671954]
31. [27]M. Enss, "An investigation of word sense disambiguation for improving lexical chaining," M.S. thesis, Waterloo University, Waterloo, Canada, 2006.
32. [28]X. Li, "Keyphrase Extraction and Grouping Based on Association Rules," M.S. thesis, Guelph University, Guelph, Canada, 2014.
33. [29]B. Lott, "Survey of keyword extraction tech-niques," December, 2012.
34. [30]S. Beliga, "Keyword extraction: a review of me-thods and approaches," unpublished, 2014.

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA

ارسال پیام به نویسنده مسئول


بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.

کلیه حقوق این تارنما متعلق به فصل‌نامة علمی - پژوهشی پردازش علائم و داده‌ها است.