دوره 19، شماره 4 - ( 12-1401 )                   جلد 19 شماره 4 صفحات 148-137 | برگشت به فهرست نسخه ها

XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Rahimi Z, Homayounpour M M. A New Document Embedding Method for News Classification. JSDP 2023; 19 (4) : 10
URL: http://jsdp.rcisp.ac.ir/article-1-1159-fa.html
رحیمی زهرا، همایونپور محمدمهدی. ارائه روشی جدید برای تعبیه اسناد برای دسته‌بندی متون خبری. پردازش علائم و داده‌ها. 1401; 19 (4) :137-148

URL: http://jsdp.rcisp.ac.ir/article-1-1159-fa.html


دانشگاه صنعتی امیرکبیر
چکیده:   (620 مشاهده)
یکی از کاربردهای مهم در پردازش زبان طبیعی، دستهبندی متون است. برای دسته­بندی متون خبری باید ابتدا آنها را به شیوه مناسبی بازنمایی کرد. روش­های مختلفی برای بازنمایی متن وجود دارد ولی بیشتر آنها روش­هایی همه منظوره هستند و  فقط از اطلاعات هم‌رخدادی محلی و مرتبه اول کلمات برای بازنمایی استفاده می­نمایند. در این مقاله روشی  بی­ناظر برای بازنمایی متون خبری ارائه شده است که از اطلاعات هم‌رخدادی سراسری و اطلاعات موضوعی  برای بازنمایی اسناد استفاده می­نماید. اطلاعات موضوعی علاوه بر اینکه بازنمایی انتزاعی­تری از متن ارائه می­دهد حاوی اطلاعات هم‌رخدادی­های مراتب بالاتر نیز هست. اطلاعات هم‌رخدادی سراسری و موضوعی مکمل یکدیگرند. بنابراین در این مقاله به‌منظور تولید بازنمایی غنی­تری برای دسته­بندی متن، هر دو بکارگرفته شده­اند. روش پیشنهادی بر روی پیکره­های R8  و 20-Newsgruops که از پیکره­های شناخته­شده برای دسته­بندی متون هستند آزمایش شده و با روش­های مختلفی مقایسه گردید. در مقایسه با روش پیشنهادی با سایر روش‌ها افزایش دقتی به میزان افزایش 3%  مشاهده گردید.
شماره‌ی مقاله: 10
متن کامل [PDF 577 kb]   (218 دریافت)    
نوع مطالعه: كاربردي | موضوع مقاله: مقالات پردازش متن
دریافت: 1399/5/11 | پذیرش: 1399/12/18 | انتشار: 1401/12/29 | انتشار الکترونیک: 1401/12/29

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA

ارسال پیام به نویسنده مسئول


بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.

کلیه حقوق این تارنما متعلق به فصل‌نامة علمی - پژوهشی پردازش علائم و داده‌ها است.