TY - JOUR JF - jsdp JO - JSDP VL - 16 IS - 3 PY - 2019 Y1 - 2019/12/01 TI - Feature Extraction and Efficiency Comparison Using Dimension Reduction Methods in Sentiment Analysis Context TT - استخراج ویژگی‌ و بررسی کارآیی روش‌های کاهش بُعد در زمینه تحلیل احساس N2 - امروزه با فراگیر‌شدن دسترسی به اینترنت و به‌خصوص شبکه‌های اجتماعی، امکان به‌اشتراک‎گذاری عقاید و نظرات کاربران فراهم شده است. از سوی دیگر تحلیل احساس و عقاید افراد می‌تواند نقش به‌سزایی در تصمیم‌گیری سازمان‌ها و تولیدکنندگان داشته باشد. از‌این‌‌رو وظیفه تحلیل احساس و یا عقیده‎کاوی به زمینه پژوهشی مهمی در حوزه پردازش زبان طبیعی تبدیل شده است. یکی از چالش‌های استفاده از شیوه‎های یادگیری ماشینی در حوزه پردازش زبان طبیعی، انتخاب و استخراج ویژگی‌های مناسب از میان تعداد زیاد ویژگی‌های اولیه برای دست‌یابی به مدلی با صحت مطلوب است. در این پژوهش دو روش فشرده‌سازی براساس تجزیه‌های ماتریسی SVD و NMF و یک روش بر اساس شبکه‌های عصبی برای استخراج ویژگی‌های مؤثرتر و با تعداد کمتر در زمینه تحلیل احساس در مجموعه‌داده نظرات به زبان فارسی مورد استفاده و تأثیر سطح فشرده‌سازی و اندازه مجموعه‌داده در صحت مدل‎های ایجاد‌شده مورد ارزیابی قرارگرفته شده است. بررسی‌ها نشان می‌دهد که فشرده‌سازی نه‌‌‌تنها از بار محاسباتی و زمانی ایجاد مدل کم می‌کند، بلکه می‌تواند صحت مدل را نیز افزایش دهد. بر طبق نتایج پیاده‌سازی، فشرده‌سازی ویژگی‌ها از 7700 ویژگی اولیه به دوهزار ویژگی با استفاده از شبکه عصبی، نه‌‌تنها باعث کاهش هزینه محاسسباتی و فضای ذخیره‌سازی می‎شود، بلکه می‌تواند صحت مدل را از % 05/77 به % 85/77 افزایش دهد. از سوی دیگر در مجموعه داده کوچک با استفاده از روش SVD نتایج بهتری به‌دست می‎‌آید و با تعداد ویژگی دوهزار می‌توان به صحت % 92/63 در مقابل % 57/63 دست پیدا کرد؛ هم‌چنین آزمایش‌ها حاکی از آن است که فشرده‌سازی با استفاده از شبکه عصبی در صورت بزرگی مجموعه‌داده برای ابعاد پایین مجموعه ویژگی،‌ بسیار بهتر از سایر روش‌ها عمل می‌کند. به‌طوری‌که تنها با یکصد ویژگی استخراج‌شده با استفاده از فشرده‌ساز شبکه عصبی از 7700 ویژگی اولیه می‌توان به صحت قابل قبول % 46/74 در مقابل صحت اولیه % 05/77 با 7700 ویژگی دست یافت. SP - 88 EP - 79 AU - Baradaran, Razieh AU - Golpar-Raboki, Effat AD - Qom University KW - Natural Language Processing KW - Sentiment Analysis KW - Opinion Mining KW - Auto-Encoder KW - Singular Value Decomposition KW - Nonnegative Matrix Factorization UR - http://jsdp.rcisp.ac.ir/article-1-698-fa.html DO - 10.29252/jsdp.16.3.88 ER -