<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Signal and Data Processing</title>
<title_fa>پردازش علائم و داده‌ها</title_fa>
<short_title>JSDP</short_title>
<subject>Engineering &amp; Technology</subject>
<web_url>http://jsdp.rcisp.ac.ir</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>2538-4201</journal_id_issn>
<journal_id_issn_online>2538-421X</journal_id_issn_online>
<journal_id_pii></journal_id_pii>
<journal_id_doi>10.61882/jsdp</journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid>1</journal_id_sid>
<journal_id_nlai>8888</journal_id_nlai>
<journal_id_science></journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1395</year>
	<month>12</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2017</year>
	<month>3</month>
	<day>1</day>
</pubdate>
<volume>13</volume>
<number>4</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>ارائه یک روش جدید بازیابی اطلاعات مناسب برای متون حاصل از بازشناسی گفتار</title_fa>
	<title>Introducing a new information retrieval method applicable for speech recognized texts</title>
	<subject_fa>مقالات پردازش متن </subject_fa>
	<subject>Paper</subject>
	<content_type_fa>كاربردي</content_type_fa>
	<content_type>Applicable</content_type>
	<abstract_fa>&lt;p&gt;در این مقاله، یک پیش پردازش روی روش&amp;lrm;های بازیابی اطلاعات، ارائه می شود که برای بازیابی اطلاعات حاصل از متون بازشناسی شده ی گفتاری، مناسب است. این پیش پردازش، به شکل ترکیبی از اصلاح و گسترش پرس&amp;rlm; و جو می &amp;rlm;باشد. ورودی&amp;rlm; های مسئله، اسناد متنی بدست آمده از بازشناسی گفتار و پرس&amp;rlm; و جو می باشد و هدف، یافتن اسناد مرتبط با کلمه پرس &amp;rlm;و جو است. مشکل آن است که متن حاصل از بازشناسی گفتار، همواره دارای درصد خطایی در بازشناسی است که ممکن است منجر به این شود که کلماتی که در واقع مرتبط هستند و به&amp;rlm; علت وقوع خطای بازشناسی دگرگون شده&amp;rlm; اند مرتبط تشخیص داده نشوند. ایده ی روش ارائه شده، تشخیص خطای بازشناسی در کلمات و در نظر گرفتن کلمات مشابه برای آن دسته از کلماتی است که به عنوان خطا تشخیص داده&#8204;شده اند. برای تشخیص کلمه ی خطا، پارامتری به عنوان احتمال خطا در کلمه تعریف می&amp;rlm; شود که بزرگ بودن آن بیانگر امکان بیشتر وقوع خطا در کلمه است. همچنین برای تشخیص کلمات مشابه، ابتدا با استفاده از معیار فاصله لونشتاین، کلمات مشابه اولیه را پیدا می کنیم. سپس احتمال تبدیل این کلمات مشابه به کلمه پرس &amp;rlm;و جوی اصلی، محاسبه می شود. کلمات مشابه معنایی، از بین کلماتی که احتمال تبدیل بیشتری دارند، بر اساس یک سطح آستانه انتخاب می&#8204;شوند. اکنون در الگوریتم بازیابی، علاوه&amp;rlm; بر کلمه اصلی، کلمات مشابه آن نیز در جستجو، مرتبط در نظر گرفته می&amp;rlm; شوند. نتایج پیاده&amp;rlm;سازی&amp;rlm;ها نشان می&amp;rlm;دهد که الگوریتم ارائه&#8204;شده، معیار F را به میزان حداکثر 30&amp;lrm;% بهبود می&#8204;بخشد.&lt;/p&gt;
</abstract_fa>
	<abstract>&lt;p&gt;&lt;strong&gt;In this article a pre-processing method is introduced which is applicable in speech recognized texts retrieval task. We have a text corpus, t generated from a speech recognition system and a query as inputs,&amp;nbsp; to search queries in these documents and find relevant documents. A basic problem in a typical speech recognized text is some error percentage in recognition. This, results erroneously assigning to irrelevant documents.The idea of this proposed method, is to detect error-prone terms and to find similar words for each term. A parameter is defined which calculates the probability for occurring errors in the error-prone words. To recognize similar words for each specific term, based on a criterion called average detection rate (ADR) and levenshtein distance criterion, some candidates are chosen as the initial similar words set. And then, a conversion probability is defined based on the conversion rate (CR) and the noisy channel model (NCM) and the words with higher probability based on a threshold level are selected as the final similar words. In the retrieval process, these words are considered in the search step in addition to the base word.&amp;nbsp; Implementation result shows a significant improvement up to 30% of F-measure in information retrieval method with consideration of this pre-processing.&lt;/strong&gt;&lt;/p&gt;
</abstract>
	<keyword_fa>بازیابی اطلاعات- بازشناسی گفتار- سند- پرس و جو- فاصله لونشتاین </keyword_fa>
	<keyword>Information retrieval, Speech recognition, Document, Query, Levenshtein Distance</keyword>
	<start_page>93</start_page>
	<end_page>108</end_page>
	<web_url>http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-733-2&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>rouhollah</first_name>
	<middle_name></middle_name>
	<last_name>dianat</last_name>
	<suffix></suffix>
	<first_name_fa>روح الله</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>دیانت</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>rdianat@qom.ac.ir</email>
	<code>10031947532846004962</code>
	<orcid>10031947532846004962</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>qom university</affiliation>
	<affiliation_fa>دانشگاه قم</affiliation_fa>
	 </author>


	<author>
	<first_name>morteza ali</first_name>
	<middle_name></middle_name>
	<last_name>ahmadi</last_name>
	<suffix></suffix>
	<first_name_fa>مرتضی علی</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>احمدی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>morteza.ali.ahmadi@gmail.com</email>
	<code>10031947532846004963</code>
	<orcid>10031947532846004963</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation>qom university</affiliation>
	<affiliation_fa>دانشگاه قم</affiliation_fa>
	 </author>


	<author>
	<first_name>yahya</first_name>
	<middle_name></middle_name>
	<last_name>akhlaghi</last_name>
	<suffix></suffix>
	<first_name_fa>یحیی</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>اخلاقی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>yahya.akhlaghi@gmail.com</email>
	<code>10031947532846004964</code>
	<orcid>10031947532846004964</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>khatamolnabiyin university</affiliation>
	<affiliation_fa>دانشگاه خاتم النبیین</affiliation_fa>
	 </author>


	<author>
	<first_name>bagher</first_name>
	<middle_name></middle_name>
	<last_name>babaali</last_name>
	<suffix></suffix>
	<first_name_fa>باقر</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>باباعلی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>babaali@ut.ac.ir</email>
	<code>10031947532846004965</code>
	<orcid>10031947532846004965</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>tehran university</affiliation>
	<affiliation_fa>دانشگاه تهران</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
