دوره 19، شماره 4 - ( 12-1401 )                   جلد 19 شماره 4 صفحات 148-137 | برگشت به فهرست نسخه ها

XML English Abstract Print


دانشگاه صنعتی امیرکبیر
چکیده:   (632 مشاهده)
یکی از کاربردهای مهم در پردازش زبان طبیعی، دستهبندی متون است. برای دسته­بندی متون خبری باید ابتدا آنها را به شیوه مناسبی بازنمایی کرد. روش­های مختلفی برای بازنمایی متن وجود دارد ولی بیشتر آنها روش­هایی همه منظوره هستند و  فقط از اطلاعات هم‌رخدادی محلی و مرتبه اول کلمات برای بازنمایی استفاده می­نمایند. در این مقاله روشی  بی­ناظر برای بازنمایی متون خبری ارائه شده است که از اطلاعات هم‌رخدادی سراسری و اطلاعات موضوعی  برای بازنمایی اسناد استفاده می­نماید. اطلاعات موضوعی علاوه بر اینکه بازنمایی انتزاعی­تری از متن ارائه می­دهد حاوی اطلاعات هم‌رخدادی­های مراتب بالاتر نیز هست. اطلاعات هم‌رخدادی سراسری و موضوعی مکمل یکدیگرند. بنابراین در این مقاله به‌منظور تولید بازنمایی غنی­تری برای دسته­بندی متن، هر دو بکارگرفته شده­اند. روش پیشنهادی بر روی پیکره­های R8  و 20-Newsgruops که از پیکره­های شناخته­شده برای دسته­بندی متون هستند آزمایش شده و با روش­های مختلفی مقایسه گردید. در مقایسه با روش پیشنهادی با سایر روش‌ها افزایش دقتی به میزان افزایش 3%  مشاهده گردید.
شماره‌ی مقاله: 10
متن کامل [PDF 577 kb]   (226 دریافت)    
نوع مطالعه: كاربردي | موضوع مقاله: مقالات پردازش متن
دریافت: 1399/5/11 | پذیرش: 1399/12/18 | انتشار: 1401/12/29 | انتشار الکترونیک: 1401/12/29

بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.