آزمایشگاه فناوری وب دانشگاه فردوسی مشهد
چکیده: (9776 مشاهده)
امروزه با رشد چشمگیر اسناد منتشر شده در وب و نیاز اساسی به نگهداری، دستهبندی، بازیابی و پردازش آنها، توجه به پردازش زبان طبیعی و بهرهگیری از ابزارهایی نظیر خلاصهسازهای خودکار و مترجمهای ماشینی بیش از پیش احساس میشود. خلاصهسازی خودکار به عنوان هستهی مرکزی طیف گستردهای از ابزارهای پردازشگر متن مانند سیستمهای تصمیمیار، سیستمهای پاسخ گو، موتورهای جستجو و غیره از سالها پیش مطرح شده و همواره به عنوان یک موضوع مهم مورد بررسی و تحقیق قرار گرفته است. در این مقاله، سامانهای به نام «ایجاز» به منظور خلاصهسازیخودکار تکسندی متون فارسی ارائه شده است.
در پیادهسازی این سامانه، سعی شده است تا از تجربیات مجموعه کارهای مشابه داخلی و خارجی استفاده شود و با ارائه یارامترهای جدید، بر دقت خلاصهساز به میزان قابل توجهی افزوده گردد. همچنین برای اولین بار با بهرهگیری از یک پیکره بزرگ خلاصهسازی و همچنین با استفاده از ابزار ارزیابی استاندارد، روش ارائه شده با سایر روشهای موجود برای متون فارسی به صورت استاندارد مقایسه و ارزیابی شده است. نتایج حاصل از این ارزیابیها قابل توجه میباشد.
نوع مطالعه:
كاربردي |
موضوع مقاله:
مقالات پردازش متن دریافت: 1392/4/10 | پذیرش: 1392/12/6 | انتشار: 1393/6/17 | انتشار الکترونیک: 1393/6/17