<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Signal and Data Processing</title>
<title_fa>پردازش علائم و داده‌ها</title_fa>
<short_title>JSDP</short_title>
<subject>Engineering &amp; Technology</subject>
<web_url>http://jsdp.rcisp.ac.ir</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>2538-4201</journal_id_issn>
<journal_id_issn_online>2538-421X</journal_id_issn_online>
<journal_id_pii></journal_id_pii>
<journal_id_doi>10.66224/jsdp</journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid>1</journal_id_sid>
<journal_id_nlai>8888</journal_id_nlai>
<journal_id_science></journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1396</year>
	<month>3</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2017</year>
	<month>6</month>
	<day>1</day>
</pubdate>
<volume>14</volume>
<number>1</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>مدل میکروسکوپی دوگوشی مبتنی بر فیلتر بانک مدولاسیون برای پیش گویی قابلیت فهم گفتار در افراد دارای شنوایی عادی</title_fa>
	<title>Binaural Microscopic Model Based on Modulation Filterbank for the Prediction of Speech Intelligibility in Normal-Hearing Listeners</title>
	<subject_fa>مقالات پردازش گفتار </subject_fa>
	<subject>Paper</subject>
	<content_type_fa>پژوهشي</content_type_fa>
	<content_type>Research</content_type>
	<abstract_fa>&lt;p&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;در این مطالعه، مدل پیش&#8204;گویی قابلیت فهم دوگوشی میکروسکوپی بر مبنای فیلتربانک مدولاسیون ارائه می&#8204;شود. تاکنون در مدل&#8204;های دوگوشی، از معیارهای طیفی مانند &lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:8.0pt;&quot;&gt;STI&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt; و &lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:8.0pt;&quot;&gt;SII&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt; و یا دیگر روابط تحلیلی برای تعیین میزان قابلیت فهم دوگوشی استفاده شده است. در مدل پیشنهادی، بر خلاف تمام مدل&#8204;های پیش&#8204;گویی قابلیت فهم دوگوشی، از بازشناساگر خودکار گفتار در قسمت پایانی به&amp;shy;عنوان واحد تصمیم&#8204;گیری استفاده می&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:8.0pt;&quot;&gt;&#8204;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;شود. یک مزیت استفاده از این روش، امکان تحلیل میزان بازشناسی قسمت&#8204;های کوچک گفتار مانند واج و سیلاب&amp;shy; است. مزیت دیگر این مدل استفاده از پیش&#8204;پردازش&#8204;هایی است که وجود آنها در دستگاه شنوایی انسان به اثبات رسیده است. با استفاده از ماتریس ویژگی پیشنهادی در بازشناساگر گفتار، این مدل دارای پیش&#8204;گویی&amp;shy;&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:8.0pt;&quot;&gt;&#8204;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;های خوبی در حضور یک منبع نوفه ایستان شبه&amp;shy;گفتار است. مقایسه نتایج مدل با نتایج حاصل از آزمایش&#8204;های شنوایی، مقادیر همبستگی بالا و میانگین قدر مطلق خطای پایین را نشان می&#8204;دهد. همچنین، ماتریس&#8204;های ابهام برای همخوان&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:8.0pt;&quot;&gt;&#8204;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;ها همبستگی بالایی را بین پیش&amp;shy;گویی&amp;shy;ها و اندازه&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:8.0pt;&quot;&gt;&#8204;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;گیری&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:8.0pt;&quot;&gt;&#8204;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;ها نشان می&amp;shy;دهد. آستانه ادراک گفتار پیش&#8204;گویی&amp;shy;شده توسط مدل پیشنهادی دارای میانگین قدر مطلق خطای کمتری (6/0 دسیبل) در مقایسه با مدل مبنای &lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:8.0pt;&quot;&gt;BSIM&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt; است.&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;&lt;/p&gt;</abstract_fa>
	<abstract>&lt;p&gt;&lt;strong&gt;In this study, a binaural microscopic model for the prediction of speech intelligibility based on&lt;/strong&gt; &lt;strong&gt;the modulation filter bank is introduced. So far, the spectral criteria such as the &lt;st1:stockticker w:st=&quot;on&quot;&gt;STI&lt;/st1:stockticker&gt; and &lt;st1:stockticker w:st=&quot;on&quot;&gt;SII&lt;/st1:stockticker&gt; or other analytical methods have been used in the binaural models to determine the binaural intelligibility. In the proposed model, unlike all models of binaural intelligibility prediction, an automatic speech recognizer (&lt;st1:stockticker w:st=&quot;on&quot;&gt;ASR&lt;/st1:stockticker&gt;) is used in the back-end as the decision unit. One advantage of using this approach is the possibility of analyzing the recognition rate of small parts of speech such as phonemes and syllables. Another advantage of this model lies in the use of pre-processing that their existence in the human auditory system has been verified. Using the proposed feature matrix in the speech recognizer, this model has good predictions in the presence of one source of stationary speech-shaped noise. Comparing the results of the proposed model with those of listening tests show high correlations and low mean absolute error values. Also, the confusion matrices of the consonants represent high correlation between predictions and measurements. The predicted speech reception threshold by the proposed model has a smaller mean absolute error (0.6 dB) than the baseline model of BSIM. &lt;/strong&gt;&lt;br&gt;
&amp;nbsp;&lt;/p&gt;
</abstract>
	<keyword_fa>پیش‌گویی قابلیت فهم گفتار, مدل‌های دوگوشی, فیلتربانک مدولاسیون, مدل‌های میکروسکوپی, مدل‌های ماکروسکوپی</keyword_fa>
	<keyword>Prediction of Speech Intelligibility, Binaural Models, Modulation Filter bank, Microscopic Models, Macroscopic Models.</keyword>
	<start_page>135</start_page>
	<end_page>151</end_page>
	<web_url>http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-813-1&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>Ali</first_name>
	<middle_name></middle_name>
	<last_name>Fallah</last_name>
	<suffix></suffix>
	<first_name_fa>علی</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>فلاح</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>ali.fallah@tabrizu.ac.ir</email>
	<code>10031947532846005232</code>
	<orcid>10031947532846005232</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>University of Tabriz</affiliation>
	<affiliation_fa>دانشگاه تبریز</affiliation_fa>
	 </author>


	<author>
	<first_name>Masoud</first_name>
	<middle_name></middle_name>
	<last_name>Geravanchizadeh</last_name>
	<suffix></suffix>
	<first_name_fa>مسعود</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>گراوانچی زاده</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>geravanchizadeh@tabrizu.ac.ir</email>
	<code>10031947532846005233</code>
	<orcid>10031947532846005233</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation>University of Tabriz</affiliation>
	<affiliation_fa>دانشگاه تبریز</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
