دانشگاه صنعتی امیرکبیر
چکیده: (620 مشاهده)
یکی از کاربردهای مهم در پردازش زبان طبیعی، دستهبندی متون است. برای دستهبندی متون خبری باید ابتدا آنها را به شیوه مناسبی بازنمایی کرد. روشهای مختلفی برای بازنمایی متن وجود دارد ولی بیشتر آنها روشهایی همه منظوره هستند و فقط از اطلاعات همرخدادی محلی و مرتبه اول کلمات برای بازنمایی استفاده مینمایند. در این مقاله روشی بیناظر برای بازنمایی متون خبری ارائه شده است که از اطلاعات همرخدادی سراسری و اطلاعات موضوعی برای بازنمایی اسناد استفاده مینماید. اطلاعات موضوعی علاوه بر اینکه بازنمایی انتزاعیتری از متن ارائه میدهد حاوی اطلاعات همرخدادیهای مراتب بالاتر نیز هست. اطلاعات همرخدادی سراسری و موضوعی مکمل یکدیگرند. بنابراین در این مقاله بهمنظور تولید بازنمایی غنیتری برای دستهبندی متن، هر دو بکارگرفته شدهاند. روش پیشنهادی بر روی پیکرههای R8 و 20-Newsgruops که از پیکرههای شناختهشده برای دستهبندی متون هستند آزمایش شده و با روشهای مختلفی مقایسه گردید. در مقایسه با روش پیشنهادی با سایر روشها افزایش دقتی به میزان افزایش 3% مشاهده گردید.
شمارهی مقاله: 10
نوع مطالعه:
كاربردي |
موضوع مقاله:
مقالات پردازش متن دریافت: 1399/5/11 | پذیرش: 1399/12/18 | انتشار: 1401/12/29 | انتشار الکترونیک: 1401/12/29