استادیار گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه پیامنور، تهران، ایران
چکیده: (89 مشاهده)
هدف بخشبندی معنایی، اختصاص برچسب متناسب به مجموعهای از پیکسلهای یک شی در یک تصویر با توجه به مشخصات ظاهری و معنایی آن است. این مسئله یکی از چالش برانگیزترین کارها در علم پردازش تصویر و بینایی ماشین است و در سالهای اخیر بسیار مورد توجه جامعه بینایی ماشین قرار گرفته است. در این مقاله، روشی برای بخشبندی معنایی تصاویر RGB-D بهصورت لایهبهلایه ارائه شدهاست. الگوریتم پیشنهادی، ویژگیهای ظاهری و اطلاعات عمق را در یک مدل میدان تصادفی شرطی (CRF) بدون نظارت یکپارچه میکند و از یک روش برش گراف کمک میگیرد تا یک صحنه را به لایههای منسجم و معنادار تقسیم کند. روش پیشنهادی از برشهای گراف برای بهینهسازی فرایند برچسبگذاری استفاده میکند. در این مقاله برای ارزیابی عملکرد روش پیشنهادی از نظر کمی و کیفی از دو مجموعهداده مختلف استفاده شدهاست که هریک ویژگیهای منحصربهفردی دارند؛ همچنین برای مقایسه روش پیشنهادی نتایج بهدستآمده با هشت روش بخشبندی معنایی نظارتشده و بدون ناظر دیگر مقایسه شدهاند. نتایج آنالیزها نشان میدهد که CRF بدون نظارت میتواند بهاندازه روشهای نظارتشده دقیق باشد و در بسیاری از موارد حتی میتواند بهتر از سایر روشهای بخشبندی عمل کند.
شمارهی مقاله: 3
نوع مطالعه:
پژوهشي |
موضوع مقاله:
مقالات پردازش تصویر دریافت: 1403/9/7 | پذیرش: 1404/4/30 | انتشار: 1404/12/29 | انتشار الکترونیک: 1404/12/29