<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Signal and Data Processing</title>
<title_fa>پردازش علائم و داده‌ها</title_fa>
<short_title>JSDP</short_title>
<subject>Engineering &amp; Technology</subject>
<web_url>http://jsdp.rcisp.ac.ir</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>2538-4201</journal_id_issn>
<journal_id_issn_online>2538-421X</journal_id_issn_online>
<journal_id_pii></journal_id_pii>
<journal_id_doi>10.61882/jsdp</journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid>1</journal_id_sid>
<journal_id_nlai>8888</journal_id_nlai>
<journal_id_science></journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1401</year>
	<month>6</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2022</year>
	<month>9</month>
	<day>1</day>
</pubdate>
<volume>19</volume>
<number>2</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>پرکردن داده‌های گمشده در داده‌های سری زمانی چندمتغیره</title_fa>
	<title>Missing Data Imputation in Multivariate Time Series Data</title>
	<subject_fa>مقالات پردازش داده‌های رقمی</subject_fa>
	<subject>Paper</subject>
	<content_type_fa>پژوهشي</content_type_fa>
	<content_type>Research</content_type>
	<abstract_fa>&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-size:12pt&quot;&gt;&lt;span style=&quot;direction:rtl&quot;&gt;&lt;span style=&quot;unicode-bidi:embed&quot;&gt;&lt;span new=&quot;&quot; roman=&quot;&quot; style=&quot;font-family:&quot; times=&quot;&quot;&gt;&lt;b&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-size:10.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;داده&amp;shy;های سری زمانی چندمتغیره در زمینه&#8204;&amp;shy;های مختلف مانند بیوانفورماتیک، زیست&amp;shy;&#8204;شناسی، ژنتیک، نجوم، علوم جغرافیایی و امور مالی&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;b&gt; &lt;/b&gt;&lt;b&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-size:10.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;یافت می&#8204;&amp;shy;شوند. بسیاری از این مجموعه&#8204;داده&amp;shy;&#8204;ها دارای داده گمشده هستند. جایگذاری داده&amp;shy;&#8204;های گمشده سری زمانی چندمتغیره، یکی از مباحث چالش برانگیز است و قبل از فرایند یادگیری یا پیش&amp;shy;بینی سری&amp;shy;&#8204;های زمانی باید با دقت مورد توجه و بررسی قرار گیرد. تحقیقات فراوانی در استفاده از روش&#8204;های مختلف برای جایگذاری داده&#8204;&amp;shy;های گمشده سری زمانی انجام شده &amp;shy;است که به&#8204;طورمعمول شامل روش&#8204;&amp;shy;های تجزیه و تحلیل و مدل&amp;shy;&#8204;سازی&amp;shy;&#8204;های ساده در کاربردهای خاص و یا سری&amp;shy;&#8204;های زمانی تک&#8204;متغیره هستند. در این مقاله یک نسخه بهبود&#8204;یافته از درون&#8204;یابی معکوس فاصله وزن&#8204;دار&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-size:10.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt; &lt;b&gt;برای&lt;/b&gt;&lt;/span&gt;&lt;/span&gt;&lt;b&gt; &lt;/b&gt;&lt;b&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-size:10.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;جایگذاری داده&#8204;&amp;shy;های گمشده پیشنهاد شده&#8204; است. روش درون&#8204;یابی معکوس فاصله وزن&#8204;دار&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-size:10.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt; &lt;b&gt;دو محدودیت اساسی دارد:&lt;/b&gt;&lt;/span&gt;&lt;/span&gt;&lt;b&gt; &lt;/b&gt;&lt;b&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-size:10.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;1) یافتن بهترین نقاط نزدیک&amp;shy;تر به داده&#8204;&amp;shy;های&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;b&gt; &lt;/b&gt;&lt;b&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-size:10.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;گمشده 2) انتخاب توان تأثیر بهینه برای همسایگان داده گمشده. برای بهبود روش درون&#8204;یابی، از&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;b&gt; &lt;/b&gt;&lt;b&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-size:10.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;خوشه&amp;shy;&#8204;بندی &lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;span dir=&quot;LTR&quot; lang=&quot;X-NONE&quot; style=&quot;font-size:10.0pt&quot;&gt;k-means&lt;/span&gt; &lt;b&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-size:10.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;استفاده شده &#8204;است، تا همسایه&#8204;&amp;shy;های با بیشترین شباهت به الگوی داده&amp;shy;ای انتخاب شوند. از آنجا که میزان تأثیر هر یک&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;b&gt; &lt;/b&gt;&lt;b&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-size:10.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;از همسایه&#8204;&amp;shy;ها بر روی داده گمشده متفاوت است، از الگوریتم جستجوی فاخته برای تعیین توان تأثیر همسایگی استفاده می&amp;shy;شود&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;b&gt;&lt;span dir=&quot;LTR&quot; lang=&quot;X-NONE&quot; style=&quot;font-size:10.0pt&quot;&gt;.&lt;/span&gt;&lt;/b&gt;&lt;b&gt; &lt;/b&gt;&lt;b&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-size:10.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;برای ارزیابی عملکرد روش پیشنهادی، از پنج معیار ارزیابی شناخته&#8204;شده &#8204;استفاده می&amp;shy;شود. نتایج تجربی بر روی چهار مجموعه&#8204;داده &lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;span dir=&quot;LTR&quot; lang=&quot;X-NONE&quot; style=&quot;font-size:10.0pt&quot;&gt;UCI&lt;/span&gt; &lt;b&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-size:10.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;با&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;b&gt; &lt;/b&gt;&lt;b&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-size:10.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;درصدهای مختلف گمشدگی مورد بررسی قرار گرفته و در&#8204;مجموع الگوریتم پیشنهادی نسبت به سه روش مقایسه&#8204;&amp;shy;ای دیگر عملکرد بهتر و به&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;b&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-size:10.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;&#8204;&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;b&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-size:10.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;طور میانگین حدود 05/0 خطای &lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;span dir=&quot;LTR&quot; lang=&quot;X-NONE&quot; style=&quot;font-size:10.0pt&quot;&gt;RMSE&lt;/span&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-size:10.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;، &lt;b&gt;04/0 خطای &lt;/b&gt;&lt;/span&gt;&lt;/span&gt;&lt;span dir=&quot;LTR&quot; lang=&quot;X-NONE&quot; style=&quot;font-size:10.0pt&quot;&gt;MAE&lt;/span&gt;&lt;b&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-size:10.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;، 003/0 خطای &lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;span dir=&quot;LTR&quot; lang=&quot;X-NONE&quot; style=&quot;font-size:10.0pt&quot;&gt;MSE&lt;/span&gt;&lt;b&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-size:10.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt; و&amp;nbsp; 5 درصد خطای &lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;span dir=&quot;LTR&quot; lang=&quot;X-NONE&quot; style=&quot;font-size:10.0pt&quot;&gt;MAPE&lt;/span&gt;&lt;b&gt; &lt;/b&gt;&lt;b&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-size:10.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;داشته است. &lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;b&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-size:10.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;میزان همبستگی داده&#8204;های واقعی و مقدار برآورد&#8204;شده در روش پیشنهادی بسیار مطلوب و در حدود 99 درصد است.&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;</abstract_fa>
	<abstract>&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-size:12pt&quot;&gt;&lt;span new=&quot;&quot; roman=&quot;&quot; style=&quot;font-family:&quot; times=&quot;&quot;&gt;&lt;b&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;Multivariate time series data are found in a variety of fields such as bioinformatics, biology, genetics,&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;br&gt;
&lt;b&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;astronomy, geography and finance. Many time series datasets contain missing data. Multivariate&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;br&gt;
&lt;b&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;time series missing data imputation is a challenging topic and needs to be carefully considered before learning &lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;b&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;or &lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;b&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;predicting time series. Frequent researches have been done on the use of different techniques for time series missing data imputation, which usually include simple analytic methods and modeling in specific applications or univariate time series. &lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;/span&gt;&lt;/span&gt;&lt;br&gt;
&lt;span style=&quot;font-size:12pt&quot;&gt;&lt;span new=&quot;&quot; roman=&quot;&quot; style=&quot;font-family:&quot; times=&quot;&quot;&gt;&lt;b&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;In this paper, a hybrid approach to obtain missing data is proposed. An improved version of inverse distance weighting (IDW) interpolation is used to missing data imputation. The IDW interpolation method&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;b&gt; &lt;/b&gt;&lt;b&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;has two major limitations: 1) finding closest points to missing data 2)&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;b&gt; &lt;/b&gt;&lt;b&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;Choosing the optimal effect power for missing data neighbors. Clustering has been used to remove the first constraint and find closest points to the missing data. With the help of clustering, the search radius and the number of input points that are supposed to be used in interpolation calculations are limited and controlled, and it is possible to determine which points are used to determine the value of a missing data.Therefore, most similar data to the missing data are found. In this paper, the k-maens clustering method is used to find similar data. This method has been more accurate than other clustering methods in multivariate time series. &lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;/span&gt;&lt;/span&gt;&lt;br&gt;
&lt;span style=&quot;font-size:12pt&quot;&gt;&lt;span new=&quot;&quot; roman=&quot;&quot; style=&quot;font-family:&quot; times=&quot;&quot;&gt;&lt;b&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;Evolutionary algorithms are used to find the optimal effect power of each data point to remove the second constraint. Considering that each sample within each cluster has a different effect on the estimation of missing data, cuckoo search is used to find the effect on missing data. The cuckoo search algorithm is applied to the data of each cluster, and each data sample that has more similarity with the missing data has more influence, and each data sample that has less similarity has less influence and has less influence in determining the amount of missing data. Among evolutionary algorithms, evolutionary cuckoo search algorithm is used due to&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;b&gt; &lt;/b&gt;&lt;b&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;high convergence speed, much less probability of being trapped in local optimal points, and ability to quickly solve high dimensional optimization problems in multivariate time series problems. &lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;/span&gt;&lt;/span&gt;&lt;br&gt;
&lt;span style=&quot;font-size:12pt&quot;&gt;&lt;span new=&quot;&quot; roman=&quot;&quot; style=&quot;font-family:&quot; times=&quot;&quot;&gt;&lt;b&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;To evaluate the performance of the proposed method, RMS, MAE,&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;b&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;&lt;span style=&quot;position:relative&quot;&gt;&lt;span style=&quot;top:2.0pt&quot;&gt;&lt;img alt=&quot;&quot; id=&quot;_x0000_i1025&quot; o:ole=&quot;&quot; src=&quot;file:///C:UsersGHASED~1.WANAppDataLocalTempmsohtmlclip1�1clip_image001.wmz&quot; style=&quot;width:18.75pt; height:15.75pt&quot; &gt; &lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;b&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;, MSE and MAPE criteria are used. Experimental results are investigated on four UCI datasets with different percentages of missingness and in general, the proposed algorithm performs better than the other three comparative methods with an average RMSE error of 0.05, MAE error of 0.04, MSE error of 0.003, and MAPE error of 5.&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;b&gt; &lt;/b&gt;&lt;b&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;The correlation between the actual data and the estimated value in the proposed method is about 99%.&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;b&gt; &lt;/b&gt;&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;</abstract>
	<keyword_fa>جایگذاری داده‌های گمشده, درون‌یابی IDW, الگوریتم جستجوی فاخته, خوشه‌بندی k‌-means, سری‌های زمانی چندمتغیره</keyword_fa>
	<keyword>Missing Data imputation, IDW Interpolation, Cuckoo Search Algorithm, k-means Clustering, Multivariate Time Series</keyword>
	<start_page>39</start_page>
	<end_page>60</end_page>
	<web_url>http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-815-6&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>Negin</first_name>
	<middle_name></middle_name>
	<last_name>Daneshpour</last_name>
	<suffix></suffix>
	<first_name_fa>نگین</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>دانشپور</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>ndaneshpour@sru.ac.ir</email>
	<code>100319475328460011251</code>
	<orcid>100319475328460011251</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation>Shahid Rajaee Teacher Training University</affiliation>
	<affiliation_fa>دانشکده مهندسی کامپیوتر، دانشگاه تربیت دبیر شهید رجایی</affiliation_fa>
	 </author>


	<author>
	<first_name>Seyedeh fatemeh</first_name>
	<middle_name></middle_name>
	<last_name>mirabolghasemi</last_name>
	<suffix></suffix>
	<first_name_fa>سیده فاطمه</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>میرابوالقاسمی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>fmirabolghasemi@yahoo.com</email>
	<code>100319475328460011252</code>
	<orcid>100319475328460011252</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Shahid Rajaee Teacher Training University</affiliation>
	<affiliation_fa>دانشکده مهندسی کامپیوتر، دانشگاه تربیت دبیر شهید رجایی</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
