تحلیل تفکیککننده خطی یکی از روشهای پرکاربرد در حوزه کاهش ابعاد فضای ویژگی و طبقهبندی دادهها بهوسیله بیشینهسازی نسبت پراکندگی بین طبقهها به پراکندگی درون طبقهها است. این روش مبتنی بر معیار فیشر بوده و از تحلیل واریانس برای بیان تفکیکپذیری طبقهها استفاده میکند. مهمترین محدودیت این معیار در مواجهه با دادههای ناهمگن است. برای رفع این محدودیت، استفاده از فواصل توزیعی نظیر معیار چیرنف پیشنهاد شده است. معیار چیرنف با درنظرگرفتن فاصله چیرنف میان دو توزیع داده، قادر به اندازهگیری فواصل میان توابع چگالی احتمال و استخراج ویژگیهایی با بیشترین قابلیت تفکیککنندگی است؛ اما ایراد این روش آن است که چنانچه دو توزیع طبقه دادههای ناهمگن از یکدیگر فاصله کمی داشته باشند، موجب همپوشانی طبقهها در فضای نگاشت شده و باعث افزایش خطای طبقهبندی میشود. این مقاله، با معرفی روش انتخاب نمونه با نام حاشیه بیشینهای به شناسایی نمونههای مرزی و غیرمرزی پرداخته و با بهرهگیری از نمونههای مرزی، ماتریس پراکندگی مطلوبی برای افزایش کارایی تحلیل تفکیککننده خطی ایجاد میکند. در روش پیشنهادی، فرایند انتخاب نمونه همانند یک مسأله بهینهسازی مقید دودویی در نظر گرفته شده و جوابهای مسأله با استفاده از تابع پرکننده بهدست میآیند. عملکرد روش پیشنهادی بر روی دادههای برگرفتهشده از پایگاه داده UCI بهوسیله روش اعتبارسنجی ضربدری دهتایی ارزیابی و با طبقه بندهای سنتی و مرز دانش مقایسه شده است. آزمایشها نشاندهنده برتری روش پیشنهادی از نظر صحت طبقهبندی و زمان محاسبه است.
نوع مطالعه:
پژوهشي |
موضوع مقاله:
مقالات پردازش تصویر دریافت: 1399/3/10 | پذیرش: 1400/9/20 | انتشار: 1401/10/4 | انتشار الکترونیک: 1401/10/4