بحرانی پیام، مینایی بیدگلی بهروز، پروین حمید، میرزارضایی میترا، کشاورز احمد. یک سیستم پیشنهادگر محتوا-مشارکتی مبتنی بر خوشهبندی و هستانشناسی. پردازش علائم و دادهها. 1402; 20 (3) :197-224
URL: http://jsdp.rcisp.ac.ir/article-1-1375-fa.html
گروه مهندسی کامپیوتر، واحد نورآباد ممسنی، دانشگاه آزاد اسلامی، نورآباد ممسنی فارس، ایران
چکیده: (242 مشاهده)
سامانههای پیشنهادگر سامانههایی هستند که در گذر زمان یاد میگیرند که هر فرد یا مشتری احتمالاً چه کالا یا قلمی را میپسندد و آن را به او پیشنهاد میدهند. این سامانهها اغلب بر اساس رفتارهای مشابه از دیگر افراد (احتمالاً مشابه) عمل میکنند. بهطور کلی یافتن افراد مشابه، به علت زیاد بودن کاربران، فرایندی بسیار زمانبر و به علت کمبود اطلاعات، نادقیق است. به همین دلیل برخی از روشها، رو به افزایش سرعت آوردهاند. از طرفی، برخی از روشهای دیگر، رو به افزودن اطلاعاتِ اضافه آورده تا در گذر این اطلاعات بتوانند دقت یافتن کاربران مشابه یا همسایه را افزایش دهند. برخی دیگر نیز، به روشهای ترکیبی رو آوردهاند. اخیراً محققان با بهکارگیری روشهای خوشهبندی پایه که بر اساس یافتن شبیهترین کاربران همسایه با کمک خوشهبندی کاربران میباشد، و همچنین استفاده از روشهای محتوا پایه و بعضاً اضافه نمودن هستانشناسی به روشهای محتوا پایه توانستهاند با بهرهگیری از مزایای این روشها، برخی از چالشهای فوق را تا حد قابل قبولی حل نمایند. در سامانه پیشنهادگر ترکیبی پیشنهادی، از یک سامانه دو مرحلهای استفاده کردهایم که در مرحله اول، دو مدل پیشبینیهای خود را انجام داده، سپس در مرحله دوم بهوسیله یک مؤلفه ترکیبگر، نتایج دو بخش مرحله اول با یکدیگر ترکیب شده و نتایج بهدست آمده را بهعنوان نتایج نهایی سامانه به ما ارائه میدهد. در بخش اول، یک سامانه مبتنی بر پرکردن مقادیر گم شده، مقادیر خالی در ماتریس امتیازدهی را پر میکند. برای این مهم، از بین روشهای پرکردن دادههای گم شده، یک روش که با پرکردن مجموعه داده در شرایط بسیار تُنُک سازگار بود را طراحی کرده و سپس آن را به روش خودمان تعمیم دادهایم. در این راستا یک روش مبتنی بر خوشهبندی فاصلهگری ارائه کردهایم. در بخش دوم که خود یک سامانه پیشنهادگر ترکیبی هستانشناسی پایه میباشد، ابتدا به کمک یک خزنده وب، اطلاعات هر قلم را استخراج کرده، سپس در یک هستانشناسی پایه به کمک یک روش پیشنهادی، اقدام به بهبود ساختار هستانشناسی بهوسیله حذف یالهای همسان مینماییم. بدین ترتیب دقت اندازهگیری شباهت معنایی بین اقلام و کاربران در مراحل بعدی افزایش یافته و میزان اثربخشی پیشنهادات ارائه شده بهطور بامعنایی بهبود مییابد. شایان ذکر است این هستانشناسی یک هستانشناسی جامع نیست. درنهایت به کمک یک روش اندازهگیری شباهت ابتکاریِ هستانشناسی پایه، مشابهت قلم-قلمها، کاربر-کاربرها، و کاربر-قلمها را اندازهگیری میکنیم. به کمک این ماتریس مشابهت، کاربرها و قلمها را خوشهبندی کرده و سپس برای هر کاربر، کاربرها و قلمهای شبیه به آن را بهعنوان یک ویژگی جدید در پروفایل کاربر ذخیره مینماییم. این کار به ما کمک میکند که در آینده، سرعت یافتن کاربرهای مشابه و قلمهای مشابه را بالا ببریم. در حقیقت بر اساس این ویژگی، سرعت کل کار را افزایش دادهایم. از آنجایی که ما هدف خود را ساختن سامانهای که یک موازنه بین دو معیار دقت و سرعت را برقرار کند قرار دادهایم، با استفاده از یک مجموعه داده واقعی، از این دو معیار جهت ارزیابی سامانه پیشنهادی استفاده میکنیم. نتایج مقایسهی روش پیشنهادی ما با برخی روشهای مشابه بهروز ارائه شده در این حوزه (با استفاده از یک مجموعه داده یکسان) حاکی از آن است که روش ما از روشهای سریع، کندتر است، اما از آنها دقیقتر میباشد. همچنین این نتایج بیانگر این موضوع است که روش پیشنهادی از روشهای دقیق، سریعتر و کیفیت آن نیز قابل رقابت و یا حتی بهتر است.
شمارهی مقاله: 12
نوع مطالعه:
پژوهشي |
موضوع مقاله:
مقالات پردازش متن دریافت: 1402/2/3 | پذیرش: 1402/10/8 | انتشار: 1402/10/24 | انتشار الکترونیک: 1402/10/24