<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Signal and Data Processing</title>
<title_fa>پردازش علائم و داده‌ها</title_fa>
<short_title>JSDP</short_title>
<subject>Engineering &amp; Technology</subject>
<web_url>http://jsdp.rcisp.ac.ir</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>2538-4201</journal_id_issn>
<journal_id_issn_online>2538-421X</journal_id_issn_online>
<journal_id_pii></journal_id_pii>
<journal_id_doi>10.61882/jsdp</journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid>1</journal_id_sid>
<journal_id_nlai>8888</journal_id_nlai>
<journal_id_science></journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1395</year>
	<month>3</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2016</year>
	<month>6</month>
	<day>1</day>
</pubdate>
<volume>13</volume>
<number>1</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>تخمین سریع ضرایب پیچش در هنجارسازی طول مجرای صوتی با استفاده از امتیاز به دست آمده از مدلسازی تشخیص جنسیت</title_fa>
	<title>Fast estimation of warping factor in the vocal tract length normalization using obtained scores of gender detection modeling</title>
	<subject_fa>مقالات پردازش گفتار </subject_fa>
	<subject>Paper</subject>
	<content_type_fa>پژوهشي</content_type_fa>
	<content_type>Research</content_type>
	<abstract_fa>&lt;p&gt;&lt;strong&gt;یکی از مشکلات&lt;/strong&gt; &lt;strong&gt;عمده&amp;shy;ی&lt;/strong&gt;&lt;strong&gt; سامانه&lt;sub&gt;&amp;shy;&lt;/sub&gt;های خودکار بازشناسی گفتار &lt;/strong&gt;&lt;strong&gt;&lt;span dir=&quot;LTR&quot;&gt;(&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span dir=&quot;LTR&quot;&gt;ASR&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span dir=&quot;LTR&quot;&gt;)&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;، تنوعات موجود&lt;/strong&gt; &lt;strong&gt;در&lt;/strong&gt; &lt;strong&gt;بین&lt;/strong&gt; &lt;strong&gt;گویند&amp;shy;ه&amp;shy;ها، کانال انتقال داده&lt;/strong&gt; &lt;strong&gt;و&lt;/strong&gt; &lt;strong&gt;محیط&lt;/strong&gt; &lt;strong&gt;است&lt;/strong&gt; &lt;strong&gt;که&lt;/strong&gt; &lt;strong&gt;به علت&lt;/strong&gt; &lt;strong&gt;وجود&lt;/strong&gt; &lt;strong&gt;این&lt;/strong&gt; &lt;strong&gt;تنوعات، کارایی&lt;/strong&gt; &lt;strong&gt;این&lt;/strong&gt; &lt;strong&gt;سامانه&#8204;ها در&lt;/strong&gt; &lt;strong&gt;شرایط کاربردی&lt;/strong&gt; &lt;strong&gt;مختلف به&lt;/strong&gt; &lt;strong&gt;شدت&lt;/strong&gt; &lt;strong&gt;تغییر&lt;/strong&gt; &lt;strong&gt;می&#8204;کند. مقاوم&lt;/strong&gt; &lt;strong&gt;سازی&lt;/strong&gt; &lt;strong&gt;سیستم&amp;shy;های بازشناسی جهت مقابله با&lt;/strong&gt; &lt;strong&gt;این&lt;/strong&gt; &lt;strong&gt;تغییرات&lt;/strong&gt; &lt;strong&gt;از&lt;/strong&gt; &lt;strong&gt;جمله&lt;/strong&gt; &lt;strong&gt;مسائل&lt;/strong&gt; &lt;strong&gt;حال&lt;/strong&gt; &lt;strong&gt;حاضر در حوزه بازشناسی گفتار است. از جمله عواملی که باعث کاهش کارایی سیستم&amp;shy;ها می&amp;shy;شود، تمایز مشخصات صوتی آواهای یکسانِ تولید شده از گوینده&amp;shy;های&lt;/strong&gt; &lt;strong&gt;مختلف است. یکی&lt;/strong&gt; &lt;strong&gt;از&lt;/strong&gt; &lt;strong&gt;عوامل&lt;/strong&gt; &lt;strong&gt;اصلی&lt;/strong&gt; &lt;strong&gt;این مشکل&lt;/strong&gt; &lt;strong&gt;ناشی&lt;/strong&gt; &lt;strong&gt;از&lt;/strong&gt; &lt;strong&gt;تفاوت&lt;/strong&gt; &lt;strong&gt;موجود&lt;/strong&gt; &lt;strong&gt;در&lt;/strong&gt; &lt;strong&gt;طول&lt;/strong&gt; &lt;strong&gt;مجرای&lt;/strong&gt; &lt;strong&gt;صوتی (&lt;/strong&gt;&lt;strong&gt;&lt;span dir=&quot;LTR&quot;&gt;VTL&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;)&lt;/strong&gt; &lt;strong&gt;بین گوینده&amp;shy;های&lt;/strong&gt; &lt;strong&gt;مختلف می&#8204;باشد. روش هنجارسازی&lt;/strong&gt; &lt;strong&gt;طول&lt;/strong&gt; &lt;strong&gt;مجرای&lt;/strong&gt; &lt;strong&gt;صوتی (&lt;/strong&gt;&lt;strong&gt;&lt;span dir=&quot;LTR&quot;&gt;VTLN&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;)&lt;/strong&gt; &lt;strong&gt;از&lt;/strong&gt; &lt;strong&gt;روش&amp;shy;های&lt;/strong&gt; &lt;strong&gt;رایج&lt;/strong&gt; &lt;strong&gt;برای&lt;/strong&gt; &lt;strong&gt;رفع این مشکل&lt;/strong&gt; &lt;strong&gt;است که در آن برای هر گوینده یک ضریب پیچش فرکانسی تعیین می&amp;shy;گردد. در این مقاله روش متداول تعیین&lt;/strong&gt; &lt;strong&gt;ضریب&lt;/strong&gt; &lt;strong&gt;پیچش&lt;/strong&gt; &lt;strong&gt;با&lt;/strong&gt; &lt;strong&gt;رویکرد&lt;/strong&gt; &lt;strong&gt;مبتنی&lt;/strong&gt; &lt;strong&gt;بر&lt;/strong&gt; &lt;strong&gt;جستجو&lt;/strong&gt; &lt;strong&gt;در&lt;/strong&gt; &lt;strong&gt;یک&lt;/strong&gt; &lt;strong&gt;سیستم بازشناسی&lt;/strong&gt; &lt;strong&gt;گفتار&lt;/strong&gt; &lt;strong&gt;پیوسته&lt;/strong&gt; &lt;strong&gt;فارسی&lt;/strong&gt; &lt;strong&gt;مبتنی&lt;/strong&gt; &lt;strong&gt;بر&lt;/strong&gt; &lt;strong&gt;مدل&lt;/strong&gt; &lt;strong&gt;مخفی&lt;/strong&gt; &lt;strong&gt;مارکوف&lt;/strong&gt; &lt;strong&gt;معرفی&lt;/strong&gt; &lt;strong&gt;و مشکلات محاسباتی استفاده از این روش شرح داده شده است. در نهایت روشی مبتنی بر رگرسیون خطی از روی امتیازِ محاسبه شده از مدلسازی تشخیص جنسیت جهت تخمین ضرایب پیچش پیشنهاد شده است که منجر به کاهش قابل ملاحظه هزینه محاسباتیِ روش مبتنی بر جستجو می&amp;shy;شود. علاوه بر این، نتایج آزمایشات بر روی دادگان آزمون گفتار تلفنی محاوره&amp;shy;ای، بیانگر بهبود 54/0 درصدی دقت تشخیص کلمه روش پیشنهادی نسبت به روش متداول مبتنی بر جستجو می&amp;shy;باشد.&amp;nbsp;&lt;/strong&gt;&lt;/p&gt;
</abstract_fa>
	<abstract>&lt;p&gt;The performance of automatic speech recognition (ASR) systems is adversely affected by the variations in speakers, audio channels and environmental conditions. Making these systems robust to these variations is still a big challenge. One of the main sources of variations in the speakers is the differences between their Vocal Tract Length (VTL). Vocal Tract Length Normalization (VTLN) is an effective method introduced to cope with this variation. In this method, the speech spectrum of each speaker is frequency warped according to a specific warping factor of that speaker.&amp;nbsp;&lt;span style=&quot;line-height: 1.6em&quot;&gt;In this paper, we first developed the common search-based method to obtain the appropriate warping factor over a HMM-based Persian continuous speech recognition system. Then pointing out the computational cost of search-based method, we proposed a linear regression process for estimating warping factor based on the scores generated by our gender detection system. Experimental results over a Persian conversational speech database shown an improvement about 0.54 percent in word recognition accuracy as well as a significant reduction in computational cost of estimating warping factor, compared to search-based approach.&lt;/span&gt;&lt;/p&gt;
</abstract>
	<keyword_fa>بازشناسی گفتار, هنجارسازی طول مجرای صوتی, تشخیص جنسیت, رگرسیون خطی, ضریب پیچش فرکانسی.</keyword_fa>
	<keyword>speech recognition, Vocal Tract Length Normalization, gender detection, linear regression, warping factor,</keyword>
	<start_page>57</start_page>
	<end_page>70</end_page>
	<web_url>http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-306-2&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>Yasser</first_name>
	<middle_name></middle_name>
	<last_name>Shekofteh</last_name>
	<suffix></suffix>
	<first_name_fa>یاسر</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>شکفته</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>y_shekofteh@yahoo.com</email>
	<code>10031947532846005523</code>
	<orcid>10031947532846005523</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation>rcdat</affiliation>
	<affiliation_fa>پژوهشگاه توسعه فناوری های پیشرفته خواجه نصیرالدین طوسی</affiliation_fa>
	 </author>


	<author>
	<first_name>Hasan</first_name>
	<middle_name></middle_name>
	<last_name>Gholipor</last_name>
	<suffix></suffix>
	<first_name_fa>حسن</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>قلی پور</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>y_shekofteh</email>
	<code>10031947532846005524</code>
	<orcid>10031947532846005524</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>rcdat</affiliation>
	<affiliation_fa>پژوهشگاه توسعه فناوری های پیشرفته خواجه نصیرالدین طوسی</affiliation_fa>
	 </author>


	<author>
	<first_name>M.Mohsen</first_name>
	<middle_name></middle_name>
	<last_name>Goodarzi</last_name>
	<suffix></suffix>
	<first_name_fa>محمدمحسن</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>گودرزی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>y_shekofteh</email>
	<code>10031947532846005525</code>
	<orcid>10031947532846005525</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>rcdat</affiliation>
	<affiliation_fa>پژوهشگاه توسعه فناوری های پیشرفته خواجه نصیرالدین طوسی</affiliation_fa>
	 </author>


	<author>
	<first_name>Jahanshah</first_name>
	<middle_name></middle_name>
	<last_name>kabudian</last_name>
	<suffix></suffix>
	<first_name_fa>جهانشاه</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>کبودیان</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>y_shekofteh</email>
	<code>10031947532846005526</code>
	<orcid>10031947532846005526</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>rcdat</affiliation>
	<affiliation_fa>پژوهشگاه توسعه فناوری های پیشرفته خواجه نصیرالدین طوسی</affiliation_fa>
	 </author>


	<author>
	<first_name>Farshad</first_name>
	<middle_name></middle_name>
	<last_name>Almasganj</last_name>
	<suffix></suffix>
	<first_name_fa>فرشاد</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>الماس‌گنج</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>y_shekofteh</email>
	<code>10031947532846005527</code>
	<orcid>10031947532846005527</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>rcdat</affiliation>
	<affiliation_fa>پژوهشگاه توسعه فناوری های پیشرفته خواجه نصیرالدین طوسی</affiliation_fa>
	 </author>


	<author>
	<first_name>Shaghayegh</first_name>
	<middle_name></middle_name>
	<last_name>Reza</last_name>
	<suffix></suffix>
	<first_name_fa>شقایق</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>رضا</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>y_shekofteh</email>
	<code>10031947532846005528</code>
	<orcid>10031947532846005528</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>rcdat</affiliation>
	<affiliation_fa>پژوهشگاه توسعه فناوری های پیشرفته خواجه نصیرالدین طوسی</affiliation_fa>
	 </author>


	<author>
	<first_name>Iman</first_name>
	<middle_name></middle_name>
	<last_name>Sarraf</last_name>
	<suffix></suffix>
	<first_name_fa>ایمان</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>صراف رضایی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>y_shekofteh</email>
	<code>10031947532846005529</code>
	<orcid>10031947532846005529</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>rcdat</affiliation>
	<affiliation_fa>پژوهشگاه توسعه فناوری های پیشرفته خواجه نصیرالدین طوسی</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
