چکیده: (14144 مشاهده)
در سالهای اخیر تلاشهای زیادی برای طراحی روشهای یادگیری و خودکار سازی فرایند ساخت هستان نگار انجام شده است. ساخت انواع هستان نگار برای انواع قلمروها و کاربردهای گوناگون فرایندی پرهزینه و زمان بر بوده و خودکارسازی این فرایند گامی مهمی در رفع مشکل اکتساب دانش در سامانههای اطلاعاتی و کاهش هزینه ساخت آنها است. در این مقاله روش نوینی برای یادگیری هوشمند هستان نگار ارائه شده که می توان از آن در کاربردها و حوزههای مختلف استفاده کرد. در این روش نیازی به وجود هستان نگارهای عمومی یا تخصصی اولیه و واژگان معنایی از پیش تعریف شده نیست و پایگاه دانش اولیه آن تنها شامل مجموعهای از متون ورودی است. سامانه یادگیرنده پیشنهادی با شروع از متون ورودی و با استفاده از رهیافت پیشنهادی در این مقاله قادر خواهد بود هستان نگار حوزههای مختلف را استخراج کند. در این روش از ترکیبی از روشهای زبانی، آماری و روشهای یادگیری ماشینی بر اساس روش C-value،TF-IDF، شبکه عصبی نظریه تشدید وفقی و روش تحلیل هم رخدادی استفاده شده است؛ بدین ترتیب که ابتدا اسناد مرتبط با حوزه مورد نظر گردآوری شده است. سپس پردازشهای متون زبان طبیعی روی اسناد انجام شده و واژههای اصلی با استفاده از روش C-value استخراج شده است، آنگاه با استفاده از شبکه عصبی ART اسناد مربوطه خوشه بندی شده و برای هر خوشه با محاسبه وزن واژهها بر اساس روش TF-IDF، واژه کلیدی مناسب استخراج شده است. در پایان با استفاده از روش تحلیل هم رخدادی، سلسله مراتب مفاهیم استخراج شده و هستان نگار مربوطه ساخته شده است. نتایج حاصل شده نشان میدهند که این روش در مقایسه با روشهای مشابه دقت خوبی در یادگیری هستان نگار داشته است.
نوع مطالعه:
پژوهشي |
موضوع مقاله:
مقالات پردازش متن دریافت: 1392/4/7 | پذیرش: 1392/6/3 | انتشار: 1392/6/3 | انتشار الکترونیک: 1392/6/3