<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Signal and Data Processing</title>
<title_fa>پردازش علائم و داده‌ها</title_fa>
<short_title>JSDP</short_title>
<subject>Engineering &amp; Technology</subject>
<web_url>http://jsdp.rcisp.ac.ir</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>2538-4201</journal_id_issn>
<journal_id_issn_online>2538-421X</journal_id_issn_online>
<journal_id_pii></journal_id_pii>
<journal_id_doi>10.66224/jsdp</journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid>1</journal_id_sid>
<journal_id_nlai>8888</journal_id_nlai>
<journal_id_science></journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1391</year>
	<month>6</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2012</year>
	<month>9</month>
	<day>1</day>
</pubdate>
<volume>9</volume>
<number>1</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>روشی جدید در بازشناسی مقاوم گفتار مبتنی بر دادگان مفقود با استفاده از شبکه عصبی دوسویه</title_fa>
	<title>New Approach in Robust Speech Recognition Based on Missing Feature using Bidirectional Neural Network</title>
	<subject_fa>مقالات پردازش گفتار </subject_fa>
	<subject>Paper</subject>
	<content_type_fa>پژوهشي</content_type_fa>
	<content_type>Research</content_type>
	<abstract_fa>&lt;p&gt;&lt;a name=&quot;up&quot; style=&quot;color: rgb(0, 204, 0); font-family: tahoma; text-decoration: none; font-size: 12px; font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: 2; text-align: -webkit-center; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);&quot;&gt;&lt;/a&gt;&lt;/p&gt;

&lt;table border=&quot;0&quot; cellpadding=&quot;0&quot; cellspacing=&quot;0&quot; height=&quot;500&quot; width=&quot;900&quot;&gt;
	&lt;tbody&gt;
		&lt;tr&gt;
			&lt;td bgcolor=&quot;#ffffff&quot; dir=&quot;rtl&quot; style=&quot;color: rgb(0, 0, 0); font-family: tahoma, arial; font-size: 12px;&quot; valign=&quot;top&quot;&gt;
			&lt;table border=&quot;0&quot; cellpadding=&quot;0&quot; cellspacing=&quot;0&quot; width=&quot;100%&quot;&gt;
				&lt;tbody&gt;
					&lt;tr&gt;
						&lt;td style=&quot;color: rgb(0, 0, 0); font-family: tahoma, arial; font-size: 12px;&quot; valign=&quot;top&quot;&gt;
						&lt;table border=&quot;0&quot; cellpadding=&quot;0&quot; cellspacing=&quot;0&quot; dir=&quot;ltr&quot; height=&quot;500&quot; width=&quot;100%&quot;&gt;
							&lt;tbody&gt;
								&lt;tr&gt;
									&lt;td dir=&quot;rtl&quot; style=&quot;color: rgb(0, 0, 0); font-family: tahoma, arial; font-size: 12px;&quot; valign=&quot;top&quot;&gt;
									&lt;table border=&quot;0&quot; cellpadding=&quot;0&quot; cellspacing=&quot;5&quot; width=&quot;100%&quot;&gt;
										&lt;tbody&gt;
											&lt;tr&gt;
												&lt;td style=&quot;color: rgb(0, 0, 0); font-family: tahoma, arial; font-size: 12px;&quot;&gt;
												&lt;center&gt;
												&lt;center&gt;
												&lt;table border=&quot;0&quot; cellpadding=&quot;0&quot; cellspacing=&quot;0&quot; dir=&quot;ltr&quot; height=&quot;30&quot; width=&quot;100%&quot;&gt;
													&lt;tbody&gt;
														&lt;tr&gt;
															&lt;td bgcolor=&quot;#FFFFFF&quot; dir=&quot;rtl&quot; style=&quot;color: rgb(0, 0, 0); font-family: tahoma, arial; font-size: 12px;&quot;&gt;
															&lt;table border=&quot;0&quot; cellpadding=&quot;10&quot; cellspacing=&quot;0&quot; width=&quot;100%&quot;&gt;
																&lt;tbody&gt;
																	&lt;tr&gt;
																		&lt;td style=&quot;color: rgb(0, 0, 0); font-family: tahoma, arial; font-size: 12px;&quot;&gt;
																		&lt;p align=&quot;justify&quot; style=&quot;line-height: 18px;&quot;&gt;&lt;a name=&quot;up&quot; style=&quot;color: rgb(0, 204, 0); font-family: tahoma; text-decoration: none; font-size: 12px; font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: 2; text-align: -webkit-center; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);&quot;&gt;عملکرد سیستم های بازشناسی گفتار زمانی که گفتار توسط نویز تخریب شده باشد، به شدت کاهش می یابد. یکی از روش های رایج برای مقاوم سازی سیستم های بازشناسی گفتار استفاده از روش دادگان مفقود است در این روش مؤلفه&#8204;هایی از نمایش زمانی- فرکانسی گفتار (اسپکتروگرام) که نسبت سیگنال به نویز (SNR) آنها از یک آستانه کمتر است، بعنوان مؤلفه های نامعتبر یا مفقود برچسب دهی می شوند. این مؤلفه ها با استفاده از مؤلفه های معتبر و اطلاعات آماری که نسبت به دادگان تمیز، تخمین زده شده و جایگزین می شوند. در این مقاله الگوی ویژگی های مفقود با دیدگاهی نو به عنوان مسئله جبران سازی دادگان مطرح می شود. به اینصورت که با استفاده از شبکه عصبی دوسویه و انجام یک سری پردازش&#8204;های غیرخطی و دوطرفه (جلوسو و برگشتی) از دانش نهفته در مدل، ناشی از یادگیری هم-زمان گفتار تمیز و نویزی بهره گرفته، بردارهای بازنمایی گفتار در جهت افزایش صحت بازشناسی آواها بهبود می یابند. در این روش نیازی به شناسایی مؤلفه&#8204;های مفقود که یک بحث چالش برانگیز در حوزه بازشناسی مقاوم گفتار مبتنی بر دادگان مفقود است نمی باشد بلکه بازسازی در جهت هرچه شبیه تر شدن تمامی مؤلفه&#8204;ها (خواه معتبر باشد خواه نامعتبر) به مؤلفه&#8204;های گفتار تمیز صورت می گیرد و این یک برتری بسیار چشمگیری است که در این تحقیق حاصل شده است؛ نتایج مقایسه این دو روش نشان می دهد که با استفاده از روش دادگان مفقود، 2/4 درصد بهبود برای صحت بازشناسی گفتار نویزی با نسبت سیگنال به نویز dB0 حاصل شده درحالیکه با استفاده از روش مبتنی بر شبکه عصبی دوسویه، 5/8 درصد بهبود برای همان نسبت سیگنال به نویز به دست آمده است.&lt;/a&gt;&lt;/p&gt;
																		&lt;/td&gt;
																	&lt;/tr&gt;
																&lt;/tbody&gt;
															&lt;/table&gt;
															&lt;/td&gt;
														&lt;/tr&gt;
													&lt;/tbody&gt;
												&lt;/table&gt;
												&lt;/center&gt;
												&lt;/center&gt;
												&lt;/td&gt;
											&lt;/tr&gt;
										&lt;/tbody&gt;
									&lt;/table&gt;
									&lt;/td&gt;
								&lt;/tr&gt;
							&lt;/tbody&gt;
						&lt;/table&gt;
						&lt;/td&gt;
					&lt;/tr&gt;
				&lt;/tbody&gt;
			&lt;/table&gt;
			&lt;/td&gt;
		&lt;/tr&gt;
	&lt;/tbody&gt;
&lt;/table&gt;
</abstract_fa>
	<abstract>&lt;p&gt;&lt;a name=&quot;up&quot; style=&quot;color: rgb(0, 204, 0); font-family: tahoma; text-decoration: none; font-size: 12px; font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: 2; text-align: -webkit-center; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);&quot;&gt;&lt;/a&gt;&lt;/p&gt;

&lt;table border=&quot;0&quot; cellpadding=&quot;0&quot; cellspacing=&quot;0&quot; height=&quot;500&quot; width=&quot;900&quot;&gt;
	&lt;tbody&gt;
		&lt;tr&gt;
			&lt;td bgcolor=&quot;#ffffff&quot; dir=&quot;rtl&quot; style=&quot;color: rgb(0, 0, 0); font-family: tahoma, arial; font-size: 12px;&quot; valign=&quot;top&quot;&gt;
			&lt;table border=&quot;0&quot; cellpadding=&quot;0&quot; cellspacing=&quot;0&quot; width=&quot;100%&quot;&gt;
				&lt;tbody&gt;
					&lt;tr&gt;
						&lt;td style=&quot;color: rgb(0, 0, 0); font-family: tahoma, arial; font-size: 12px;&quot; valign=&quot;top&quot;&gt;
						&lt;table border=&quot;0&quot; cellpadding=&quot;0&quot; cellspacing=&quot;0&quot; dir=&quot;ltr&quot; height=&quot;500&quot; width=&quot;100%&quot;&gt;
							&lt;tbody&gt;
								&lt;tr&gt;
									&lt;td dir=&quot;rtl&quot; style=&quot;color: rgb(0, 0, 0); font-family: tahoma, arial; font-size: 12px;&quot; valign=&quot;top&quot;&gt;
									&lt;table border=&quot;0&quot; cellpadding=&quot;0&quot; cellspacing=&quot;5&quot; width=&quot;100%&quot;&gt;
										&lt;tbody&gt;
											&lt;tr&gt;
												&lt;td style=&quot;color: rgb(0, 0, 0); font-family: tahoma, arial; font-size: 12px;&quot;&gt;
												&lt;center&gt;
												&lt;center&gt;
												&lt;table border=&quot;0&quot; cellpadding=&quot;0&quot; cellspacing=&quot;0&quot; dir=&quot;ltr&quot; height=&quot;30&quot; width=&quot;100%&quot;&gt;
													&lt;tbody&gt;
														&lt;tr&gt;
															&lt;td bgcolor=&quot;#FFFFFF&quot; dir=&quot;ltr&quot; style=&quot;color: rgb(0, 0, 0); font-family: tahoma, arial; font-size: 12px;&quot;&gt;
															&lt;table border=&quot;0&quot; cellpadding=&quot;10&quot; cellspacing=&quot;0&quot; width=&quot;100%&quot;&gt;
																&lt;tbody&gt;
																	&lt;tr&gt;
																		&lt;td style=&quot;color: rgb(0, 0, 0); font-family: tahoma, arial; font-size: 12px;&quot;&gt;
																		&lt;p align=&quot;justify&quot; style=&quot;line-height: 18px;&quot;&gt;&lt;a name=&quot;up&quot; style=&quot;color: rgb(0, 204, 0); font-family: tahoma; text-decoration: none; font-size: 12px; font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: 2; text-align: -webkit-center; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);&quot;&gt;Performance of speech recognition systems is greatly reduced when speech corrupted by noise. One common method for robust speech recognition systems is missing feature methods. In this way, the components in time - frequency representation of signal (Spectrogram) that present low signal to noise ratio (SNR), are tagged as missing and deleted then replaced by remained components and statistical information of clean speech. In this article a new approach of missing features method based on compensation are proposed. A Bidirectional Neural Network (BNN) was developed and implemented in order to modify unreliable components in input feature vectors and improve the overall recognition accuracy. Distorted components in feature vectors were estimated in accordance with the latent knowledge in the hidden layer of the neural network. This knowledge is obtained by training with clean and noisy speech, simultaneously and is mostly induced by reliable and less influenced components by the irrelevant variations in speech signal. In this approach, there is no need to identify missing components that is a challenging issue in the field of robust speech recognition based on missing feature method because reconstruction is done on all components (whether reliable or unreliable), in order to become more similar to the clean speech component. This point is a very significant advantage that has been achieved in this article. Comparing the results of these two methods shows that using Missing feature methods, 4.2% improvement were obtained in the accuracy of speech recognition for noisy signal by SNR=0dB, whereas improvement value increased to 8.5%, using bidirectional neural network for the same signal to noise ratio.&lt;/a&gt;&lt;/p&gt;
																		&lt;/td&gt;
																	&lt;/tr&gt;
																&lt;/tbody&gt;
															&lt;/table&gt;
															&lt;/td&gt;
														&lt;/tr&gt;
													&lt;/tbody&gt;
												&lt;/table&gt;
												&lt;/center&gt;
												&lt;/center&gt;
												&lt;/td&gt;
											&lt;/tr&gt;
										&lt;/tbody&gt;
									&lt;/table&gt;
									&lt;/td&gt;
								&lt;/tr&gt;
							&lt;/tbody&gt;
						&lt;/table&gt;
						&lt;/td&gt;
					&lt;/tr&gt;
				&lt;/tbody&gt;
			&lt;/table&gt;
			&lt;/td&gt;
		&lt;/tr&gt;
	&lt;/tbody&gt;
&lt;/table&gt;
</abstract>
	<keyword_fa>بازشناسی مقاوم گفتار؛ دادگان مفقود؛ شبکه عصبی دوسویه</keyword_fa>
	<keyword>Bidirectional Neural Network, Missing Feature Methods, Robust Speech Recognition, Vector Taylor Series</keyword>
	<start_page>35</start_page>
	<end_page>48</end_page>
	<web_url>http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-1362-1&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>hojat</first_name>
	<middle_name></middle_name>
	<last_name>mohammadnejad</last_name>
	<suffix></suffix>
	<first_name_fa>حجت</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>محمدنژاد</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>hojat.mohammadnejad@gmail.com</email>
	<code>10031947532846004225</code>
	<orcid>10031947532846004225</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation></affiliation>
	<affiliation_fa>پژوهشگاه مخابرات و الکترونیک فجر</affiliation_fa>
	 </author>


	<author>
	<first_name>mansour</first_name>
	<middle_name></middle_name>
	<last_name>vali</last_name>
	<suffix></suffix>
	<first_name_fa>منصور</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>ولی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>mansour.vali@eetd.kntu.ac.ir</email>
	<code>10031947532846004226</code>
	<orcid>10031947532846004226</orcid>
	<coreauthor>No</coreauthor>
	<affiliation></affiliation>
	<affiliation_fa>دانشگاه خواجه نصیر</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
