معیار فاصله، نقشی کلیدی در بسیاری از الگوریتمهای آموزش ماشین و شناسایی آماری الگو دارد؛ بهگونهای که انتخاب تابع فاصله مناسب، تأثیر مستقیمی بر عملکرد این الگوریتمها دارد. در سالهای اخیر، آموزش معیار فاصله با استفاده از نمونههای برچسبدار و یا دیگر اطلاعات موجود، یکی از حوزههای بسیار فعال در حوزه آموزش ماشین شده است. پژوهشها در این راستا، نشان داده است که معیارهای سنجش فاصله مبتنی بر یادگیری، عملکرد بسیار بهتری در مقایسه با معیارهای فاصله مرسوم از قبیل فاصله اقلیدسی دارند. با گسترش این الگوریتمها، نوع مبتنی بر کرنل برخی از این الگوریتمها نیز ارائه شده که در آنها با استفاده از تابع کرنل، نمونهها بهطور غیر صریح به فضای ویژگی جدیدی با ابعاد بالاتر نگاشت یافته و سپس در این فضای ویژگی جدید، معیار فاصله برای کاربرد مورد نظر آموزش داده میشود. برخلاف عملکرد بسیار خوب توابع کرنل در الگوریتمهای مختلف، یکی از مسائلی که در این الگوریتمها وجود دارد، انتخاب کرنل مناسب و یا پارامترهای مناسب برای یک کرنل مشخص است. استفاده از کرنل مرکب به جای استفاده از یک کرنل بهتنهایی، بهترین راه حلی است که تاکنون برای این مسئله ارائه شده است. در فرآیند دستیابی به کرنل مرکب بهینه نیز، استفاده از الگوریتمهای یادگیری اهمیت دارد. در این پژوهش، با ادغام این دو فرآیند یادگیری، ساختارهای نیمه نظارتی متفاوتی برای تعیین وزن کرنلها در یک ترکیب کرنلی ارائه میشود. کرنل مرکب نهایی برای سنجش فاصله دادهها در کاربرد خوشهبندی مورد استفاده واقع میشود. در ساختارهای نیمه نظارتی بررسیشده، سعی بر آن است که در فرآیند بهینهسازی با تعیین تابع هدف مناسب، وزن کرنلها بهگونهای تعیین شود که فاصله زوجهای مشابه کمینه و فاصله زوجهای نامشابه بیشینه شود. بررسی عملکرد این ساختارهای پیشنهادی بر روی داده مصنوعی XOR و همچنین مجموعه دادههای پایگاه داده UCI نشان دهنده مؤثر بودن ساختارهای پیشنهادی است.
بازنشر اطلاعات | |
این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است. |