<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Signal and Data Processing</title>
<title_fa>پردازش علائم و داده‌ها</title_fa>
<short_title>JSDP</short_title>
<subject>Engineering &amp; Technology</subject>
<web_url>http://jsdp.rcisp.ac.ir</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>2538-4201</journal_id_issn>
<journal_id_issn_online>2538-421X</journal_id_issn_online>
<journal_id_pii></journal_id_pii>
<journal_id_doi>10.61882/jsdp</journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid>1</journal_id_sid>
<journal_id_nlai>8888</journal_id_nlai>
<journal_id_science></journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1399</year>
	<month>8</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2020</year>
	<month>11</month>
	<day>1</day>
</pubdate>
<volume>17</volume>
<number>3</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>بازشناسی خودکار واج‌های فارسی با استفاده از مدل‌سازی واج‌گونه‌ها</title_fa>
	<title>Allophone-based acoustic modeling for Persian phoneme recognition</title>
	<subject_fa>مقالات پردازش گفتار </subject_fa>
	<subject>Paper</subject>
	<content_type_fa>كاربردي</content_type_fa>
	<content_type>Applicable</content_type>
	<abstract_fa>&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;strong&gt;&lt;span style=&quot;font-family:B Nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;یکی از مراحل زیربنایی در بازشناسی خودکار گفتار، بازشناسی واج&#8204;ها و از موانع جدی برای بازشناسی واج&#8204;ها، هم&#8204;تولیدی است. یک روش برای جبران تأثیر هم&#8204;تولیدی، استفاده از مدل&#8204;های وابسته به بافت در بازشناسی واج&#8204;هاست. در این پژوهش، از یک روش زبان&#8204;شناختی برای مدل&#8204;سازی واج&#8204;گونه&#8204;ها استفاده شده است. بدین&#8204;منظور ابتدا قواعد وقوع واج&#8204;گونه&#8204;ها در زبان فارسی استخراج و مشخص شده است که هر واج چه واج&#8204;گونه&#8204;هایی دارد. برای مدل&#8204;سازی و شناسایی واج&#8204;گونه&#8204;ها، یک پیکره واج&#8204;گونه&#8204;ای لازم است که به&#8204;&#8204;منظور تولید آن، از پیکره فارس&#8204;دات کوچک استفاده و برچسب&#8204;گذاری واج&#8204;گونه&#8204;ای آن انجام و از این پیکره&#8204;، برای مدل&#8204;سازی و سپس شناسایی واج&#8204;گونه&#8204;های مختلف گفتار ورودی استفاده شده است. درنهایت، با قرار&#8204;گرفتن هر یک از واج&#8204;گونه&#8204;های شناسایی&#8204;شده در دسته واجی مربوط به خود، بازشناسی واج&#8204;ها از مسیر واج&#8204;گونه&#8204;ها انجام شده است. با این روش، دقت بازشناسی واج&#8204;ها در زبان فارسی در مقایسه با بهترین نتایج گزارش&#8204;شده تاکنون، بهبود قابل&#8204;ملاحظه&#8204;ای نشان داده است.&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:B Nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;/div&gt;</abstract_fa>
	<abstract>&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;strong&gt;Phoneme recognition is one of the fundamental phases of automatic speech recognition. Coarticulation which refers to the integration of sounds, is one of the important obstacles in phoneme recognition. In other words, each phone is influenced and changed by the characteristics of its neighbor phones, and coarticulation is responsible for most of these changes. The idea of modeling the effects of speech context, and using the context-dependent models in phoneme recognition is a method which used to compensate the negative effects of coarticulation. According to this method, if two similar phonemes in speech have different contexts, each of them constitute a separate model. In this research, a linguistic method called allophonic modeling has been used to model context effects in Persian phoneme recognition. For this purpose, in the first phase, the rules required for occurrence of various allophones of each phoneme, are extracted from Persian linguistic resources. So each phoneme is considered as a class, consisting of its various context-dependent forms named allophones. The necessary prerequisites for modeling and identifying allophones, is an allophonic corpus. Since there was no such corpus in Persian language, SMALL FARSDAT corpus has been used. This corpus&lt;/strong&gt;&lt;strong&gt; is segmented and labelled manually for each sentence, word and&lt;/strong&gt; &lt;strong&gt;phoneme.&lt;/strong&gt;&lt;strong&gt; So the phonological and lingual context required for the realization of allophones, is implemented in this corpus. For example, the syllabification has been performed on the corpus and then, for each phoneme, its position (first, middle and end) in the word and syllable is specified using different numeric tags. In the next step, allophonic labeling has been performed by searching for each of the allophonic contexts in the corpus. These allophonic corpus is used to model and recognize the allophones of input speech. Finally, each allophone is assigned to a proper phonemic class so phoneme recognition has been done using allophones. The experimental results show a high accuracy of the proposed method in phenome recognition, indicating a significant improvement comparing with other state-of-the-art methods.&lt;/strong&gt;&lt;/div&gt;</abstract>
	<keyword_fa>بازشناسی خودکار گفتار, بازشناسی خودکار واج, مدل‌های وابسته به بافت, واج, واج‌گونه, هم‌تولیدی</keyword_fa>
	<keyword>automatic speech recognition, automatic phoneme recognition, context-dependent models, phoneme, allophone, coarticulation</keyword>
	<start_page>37</start_page>
	<end_page>54</end_page>
	<web_url>http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-1631-1&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>Tahere</first_name>
	<middle_name></middle_name>
	<last_name>Ahmadi</last_name>
	<suffix></suffix>
	<first_name_fa>طاهره</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>احمدی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>pazhvak.ta@gmail.com</email>
	<code>10031947532846009381</code>
	<orcid>10031947532846009381</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Isfahan university</affiliation>
	<affiliation_fa>دانشکده زبان‌های خارجی، دانشگاه اصفهان</affiliation_fa>
	 </author>


	<author>
	<first_name>Hossein</first_name>
	<middle_name></middle_name>
	<last_name>Karshenas</last_name>
	<suffix></suffix>
	<first_name_fa>حسین</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>کارشناس</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>professor.karshenas@gmail.com</email>
	<code>10031947532846009382</code>
	<orcid>10031947532846009382</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Isfahan university</affiliation>
	<affiliation_fa>دانشکده کامپیوتر، دانشگاه اصفهان</affiliation_fa>
	 </author>


	<author>
	<first_name>Bagher</first_name>
	<middle_name></middle_name>
	<last_name>Babaali</last_name>
	<suffix></suffix>
	<first_name_fa>باقر</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>باباعلی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>bagher.babaali@gmail.com</email>
	<code>10031947532846009383</code>
	<orcid>10031947532846009383</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Tehran university</affiliation>
	<affiliation_fa>دانشکده ریاضی، آمار و علوم کامپیوتر، دانشگاه تهران</affiliation_fa>
	 </author>


	<author>
	<first_name>Batool</first_name>
	<middle_name></middle_name>
	<last_name>Alinejad</last_name>
	<suffix></suffix>
	<first_name_fa>بتول</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>علی‌نژاد</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>batool_alinezhad@yahoo.com</email>
	<code>10031947532846009384</code>
	<orcid>10031947532846009384</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation>Isfahan university</affiliation>
	<affiliation_fa>دانشکده زبان‌های خارجی، دانشگاه اصفهان</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
