<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Signal and Data Processing</title>
<title_fa>پردازش علائم و داده‌ها</title_fa>
<short_title>JSDP</short_title>
<subject>Engineering &amp; Technology</subject>
<web_url>http://jsdp.rcisp.ac.ir</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>2538-4201</journal_id_issn>
<journal_id_issn_online>2538-421X</journal_id_issn_online>
<journal_id_pii></journal_id_pii>
<journal_id_doi>10.61882/jsdp</journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid>1</journal_id_sid>
<journal_id_nlai>8888</journal_id_nlai>
<journal_id_science></journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1401</year>
	<month>2</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2022</year>
	<month>5</month>
	<day>1</day>
</pubdate>
<volume>19</volume>
<number>1</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>ارائه یک روش مؤثر برای یادگیری مقاوم متریک در برابر نوفه برچسب</title_fa>
	<title>An Effective Approach for Robust Metric Learning in the Presence of Label Noise</title>
	<subject_fa>مقالات پردازش داده‌های رقمی</subject_fa>
	<subject>Paper</subject>
	<content_type_fa>پژوهشي</content_type_fa>
	<content_type>Research</content_type>
	<abstract_fa>&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-size:12pt&quot;&gt;&lt;span style=&quot;tab-stops:center 240.0pt right 475.0pt&quot;&gt;&lt;span style=&quot;text-autospace:none&quot;&gt;&lt;span style=&quot;direction:rtl&quot;&gt;&lt;span style=&quot;unicode-bidi:embed&quot;&gt;&lt;span new=&quot;&quot; roman=&quot;&quot; style=&quot;font-family:&quot; times=&quot;&quot;&gt;&lt;b&gt;&lt;span lang=&quot;AR-SA&quot; style=&quot;font-size:10.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;تعیین شباهت/ فاصله داده&#8204;ها در بسیاری از الگوریتم&#8204;های یادگیری ماشین، شناسایی الگو و داده&#8204;کاوی کاربرد دارد. در بسیاری از کاربردها، معیارهای عمومی شباهت/فاصله کارایی بالایی ندارد و به&#8204;طورمعمول با استفاده از داده&#8204;ها می&#8204;توان معیار مناسب&#8204;تری را یاد گرفت. داده&#8204;های آموزشی برای این منظور به&#8204;طورمعمول به&#8204;صورت زوج&#8204;های مشابه و نامشابه و یا محدودیت&#8204;های سه&#8204;گانه هستند. در کاربردهای واقعی، این داده&#8204;های آموزشی از طریق اینترنت و به&#8204;طورمعمول با روش&#8204;هایی نظیر &lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;b&gt;&lt;span dir=&quot;LTR&quot; style=&quot;font-size:8.0pt&quot;&gt;&lt;span bold=&quot;&quot; new=&quot;&quot; roman=&quot;&quot; style=&quot;font-family:&quot; times=&quot;&quot;&gt;Crowdsourcing&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;b&gt;&lt;span lang=&quot;AR-SA&quot; style=&quot;font-size:10.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt; جمع&#8204;آوری می&#8204;شود که می&#8204;تواند حاوی نوفه و اطلاعات اشتباه باشد. کارایی روش&#8204;های یادگیری متریک در صورت وجود اطلاعات آموزشی نوفه&#8204;ای و اشتباه به&#8204;شدت افت می&#8204;کند و حتی ممکن است این روش&#8204;ها از معیارهای عمومی فاصله نظیر اقلیدسی نیز بدتر عمل کنند. بنابراین نیاز به مقاوم&#8204;سازی روش&#8204;های یادگیری متریک در برابر نوفه برچسب وجود دارد. در این پژوهش، یک تابع احتمالاتی جدید برای تعیین احتمال نوفه&#8204;ای&#8204;&#8204;بودن برچسب داده&#8204;ها با استفاده از محدودیت&#8204;های سه&#8204;گانه آموزشی ارائه&#8204;شده است که باعث می&#8204;شود، الگوریتم یادگیری متریک بتواند داده&#8204;های پرت و نوفه&#8204;ای را شناسایی کند و تأثیر آن&#8204;ها را فرایند یادگیری کاهش دهد. همچنین نشان داده&#8204; شده است که چگونه از اطلاعات به&#8204;دست&#8204;آمده می&#8204;توان برای افزایش کارایی الگوریتم مبتنی بر متریک (مانند &lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;b&gt;&lt;span dir=&quot;LTR&quot; style=&quot;font-size:8.0pt&quot;&gt;&lt;span bold=&quot;&quot; new=&quot;&quot; roman=&quot;&quot; style=&quot;font-family:&quot; times=&quot;&quot;&gt;kNN&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;b&gt;&lt;span lang=&quot;AR-SA&quot; style=&quot;font-size:10.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;)&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;b&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-size:10.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt; بهره برد و عملکرد آن را به&#8204;طور قابل&#8204;ملاحظه&#8204;ای افزایش داد. &lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;b&gt;&lt;span lang=&quot;AR-SA&quot; style=&quot;font-size:10.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;نتایج آزمایش&#8204;ها بر روی مجموعه&#8204;ای از داده&amp;shy;&#8204;های ساختگی و واقعی، تأیید می&#8204;کند که روش پیشنهادی به&#8204;طور قابل&#8204;ملاحظه&#8204;ای کارایی روش&#8204;های یادگیری متریک را در محیط&#8204;هایی با نوفه برچسب بهبود می&#8204;بخشد و بر روش&#8204;های همتا در مرزهای دانش در سطوح مختلف نوفه برچسب برتری دارد.&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;</abstract_fa>
	<abstract>&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-size:12pt&quot;&gt;&lt;span style=&quot;tab-stops:center 120.0pt right 237.5pt&quot;&gt;&lt;span style=&quot;text-autospace:none&quot;&gt;&lt;span new=&quot;&quot; roman=&quot;&quot; style=&quot;font-family:&quot; times=&quot;&quot;&gt;&lt;b&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt;&lt;span bold=&quot;&quot; new=&quot;&quot; roman=&quot;&quot; style=&quot;font-family:&quot; times=&quot;&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;Many algorithms in machine learning, pattern recognition, and data mining are based on a similarity/distance measure. For instance, the kNN classifier and clustering algorithms such as k-means require a similarity/distance function. Also, in Content-Based Information Retrieval (CBIR) systems, we need to rank the retrieved objects based on the similarity to the query. As generic measures like Euclidean and cosine similarity are not appropriate in many applications, metric learning algorithms have been developed with the aim of learning an optimal distance function from data. These methods often need training data in the form of pair or triplet sets. Nowadays, this training data is popularly obtained via crowdsourcing from the Internet.&amp;nbsp; Therefore, this information may be contaminated with label noise resulting in the poor performance of the learned metric. In some datasets, even it is possible that the learned metrics perform worse than the general ones such as Euclidean. To address this emerging challenge, we present a new robust metric learning algorithm that can identify outliers and label noise simultaneously from training side information. For this purpose, we model the probability distribution of label noise based on information in the training data. The proposed distribution function efficiently assigns the high probability to the data points contaminated with label noise. On the other hand, its value on the normal instances is near zero.&amp;nbsp;Afterward, we weight the training instances according to these probabilities in our metric learning optimization problem. The proposed optimization problem can be solved using available SVM libraries such as LibSVM efficiently. Note that the proposed approach for identifying data with label noise is general and can easily be applied to any existing metric learning algorithms.&amp;nbsp;After the metric learning phase, we utilized both the weights and the learned metric to enhance the accuracy of the metric-based classifier such as kNN. Several experiments are conducted on both real and synthetic datasets. The results confirm that the proposed algorithm enhances the performance of the learned metric in the presence of label noise and considerably outperforms state-of-the-art peer methods at different noise levels.&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;</abstract>
	<keyword_fa>یادگیری متریک مقاوم, نوفه برچسب, داده‌های پرت, معیار فاصله</keyword_fa>
	<keyword>Robust Metric Learning, Label Noise, Outlier, Distance Measure</keyword>
	<start_page>125</start_page>
	<end_page>136</end_page>
	<web_url>http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-1158-1&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>Davood</first_name>
	<middle_name></middle_name>
	<last_name>Zabihzadeh</last_name>
	<suffix></suffix>
	<first_name_fa>داود</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>ذبیح زاده</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>d.zabihzadeh@gmail.com</email>
	<code>100319475328460011010</code>
	<orcid>100319475328460011010</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation>Sabzevar University of New Technology</affiliation>
	<affiliation_fa>دانشگاه حکیم سبزواری</affiliation_fa>
	 </author>


	<author>
	<first_name>Saeed</first_name>
	<middle_name></middle_name>
	<last_name>Zahedi</last_name>
	<suffix></suffix>
	<first_name_fa>سعید</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>زاهدی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>s.zahedi@mail.um.ac.ir</email>
	<code>100319475328460011011</code>
	<orcid>100319475328460011011</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Ferdowsi University of Mashhad</affiliation>
	<affiliation_fa>دانشگاه فردوسی مشهد</affiliation_fa>
	 </author>


	<author>
	<first_name>Reza</first_name>
	<middle_name></middle_name>
	<last_name>Monsefi</last_name>
	<suffix></suffix>
	<first_name_fa>رضا</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>منصفی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>monsefi@um.ac.ir</email>
	<code>100319475328460011012</code>
	<orcid>100319475328460011012</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Ferdowsi University of Mashhad</affiliation>
	<affiliation_fa>دانشگاه فردوسی مشهد</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
