<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Signal and Data Processing</title>
<title_fa>پردازش علائم و داده‌ها</title_fa>
<short_title>JSDP</short_title>
<subject>Engineering &amp; Technology</subject>
<web_url>http://jsdp.rcisp.ac.ir</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>2538-4201</journal_id_issn>
<journal_id_issn_online>2538-421X</journal_id_issn_online>
<journal_id_pii></journal_id_pii>
<journal_id_doi>10.61882/jsdp</journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid>1</journal_id_sid>
<journal_id_nlai>8888</journal_id_nlai>
<journal_id_science></journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1395</year>
	<month>9</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2016</year>
	<month>12</month>
	<day>1</day>
</pubdate>
<volume>13</volume>
<number>3</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>پایه‌گذاری بستری نو و کارآمد در حوزه بازشناسی گفتار فارسی</title_fa>
	<title></title>
	<subject_fa>مقالات پردازش گفتار </subject_fa>
	<subject>Paper</subject>
	<content_type_fa>پژوهشي</content_type_fa>
	<content_type>Research</content_type>
	<abstract_fa>&lt;p style=&quot;text-align: justify;&quot;&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;برخلاف پیشینۀ سی&#8204;سالۀ پژوهش در حوزۀ بازشناسی گفتار فارسی در ایران و دست&#8204;یافتن به پیشرفت&#8204;های در خور توجه، نتایج عمده کارهای انجام&#8204;شده به&#8204;دلیل عدم وجود بستر یکسان، قابل مقایسه و ارزیابی دقیق نیستند. بستر بیش&#8204;تر شامل سامانۀ بازشناسی و دادگان با تعریف مشخص مجموعه&#8204;های آموزش، توسعه و ارزیابی است. سامانۀ متن&#8204;باز کلدی با وجود نوظهور&#8204;بودن آن ویژگی&#8204;های منحصر&#8204;به&#8204;فردی دارد که در سال&#8204;های اخیر مورد توجه اکثر آزمایشگاه&#8204;های تراز نخست پردازش گفتار دنیا قرار گرفته است و با لحاظ همه جوانب، &amp;nbsp;بهترین انتخاب موجود در راستای پایه&#8204;گذاری این بستر برای تمامی زبان&#8204;ها از جمله زبان فارسی است. در این مقاله پس از بررسی خصوصیات، توانمندی&#8204;ها و اجزای مختلف نرم&#8204;افراز کلدی؛ دادگان فارس&#8204;دات را به&#8204;دلیل ثبت رسمی و قابل دسترس&#8204;بودن آن برای همگان از سراسر دنیا به&#8204;عنوان بخش دیگر این بستر انتخاب کرده و به تأسی از انتخاب انجام&#8204;شده بر روی دادگان &lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:8.0pt;&quot;&gt;TIMIT&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt; &lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;به تعریف مجموعه&#8204;های آموزش، توسعه و ارزیابی می&#8204;پردازیم. در&#8204;نهایت بیش&#8204;تر قریب به اتفاق تکنیک&#8204;ها و روش&#8204;های موجود در کلدی بر روی دادگان فارس&#8204;دات، مطابق تعریف صورت گرفته، مورد آزمایش قرار گرفته&#8204;اند. &lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;بهترین میزان خطای حاصل در بازشناسی واج برای مجموعه توسعه 3/20 درصد و برای مجموعه آزمون 8/19 بوده است. دسترسی به کدهای نوشته در جهت فراهم&#8204;سازی این بستر، در نرم&#8204;افزار کلدی موجود است که با توجه به متن&#8204;باز&#8204;بودن آن، دسترسی به آنها به&#8204;منظور &amp;nbsp;بازسازی نتایج آمده در این مقاله در&#8204;صورت در&#8204;اختیارداشتن دادگان فارس&#8204;دات به&#8204;راحتی قابل انجام است.&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;/p&gt;
</abstract_fa>
	<abstract>&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;strong&gt;Although researches in the field of Persian speech recognition &amp;nbsp;claim&amp;nbsp; a&amp;nbsp; thirty-year-old &amp;nbsp;history in Iran &amp;nbsp;which has achieved considerable progresses, due to the lack of well-defined experimental framework, outcomes from many of these researches are not comparable to each other and their accurate assessment won&amp;rsquo;t be possible. The experimental framework includes ASR toolkit and speech database which consists of training, development and test datasets. In recent years, &amp;nbsp;&amp;nbsp;as a state-of-the-art open-source ASR toolkit; Kaldi has been very well-received and welcomed in the community of the world-ranked speech researchers around the world. considering all aspects, Kaldi is the best option among all of the other ASR toolkits to establish a framework to do research in all languages, including Persian. &lt;/strong&gt;&lt;br&gt;
&lt;strong&gt;In this paper, we chose Fardat as the speech database which is the counterpart of TIMIT for Persian language because not only it has got a standard form &amp;nbsp;but it&amp;rsquo;s also accessible for all researchers around the world. Similar to the recipe on TIMIT database, we defined these three sets on the Farsdat: Training, Development and Test sets. After a survey on Kaldi&amp;rsquo;s components and features, we applied most of state-of-the-art ASR techniques in the Kaldi on the Farsdat based on three sets definition. The best phone error rate on development and test set have been 20.3% and 19.8%. All of the codes and the recipe that was written by author have been submitted to Kaldi repository and they are accessible &amp;nbsp;for free, so all the reported results &amp;nbsp;will be easily replicable if you have access to Farsdat database.&lt;/strong&gt;&lt;/div&gt;
</abstract>
	<keyword_fa>بازشناسی گفتار پیوسته فارسی, دادگان فارس دات, نرم‌افزار متن‌باز کلدی.</keyword_fa>
	<keyword>Persian Continuous Speech Recognition, FarsDat Database, Kaldi Toolkit</keyword>
	<start_page>51</start_page>
	<end_page>62</end_page>
	<web_url>http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-554-1&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>Bagher</first_name>
	<middle_name></middle_name>
	<last_name>BabaAli</last_name>
	<suffix></suffix>
	<first_name_fa>باقر</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>باباعلی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>bagher.babaali@gmail.com</email>
	<code>10031947532846004844</code>
	<orcid>10031947532846004844</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation>University of Tehran</affiliation>
	<affiliation_fa>دانشگاه تهران</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
