<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Signal and Data Processing</title>
<title_fa>پردازش علائم و داده‌ها</title_fa>
<short_title>JSDP</short_title>
<subject>Engineering &amp; Technology</subject>
<web_url>http://jsdp.rcisp.ac.ir</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>2538-4201</journal_id_issn>
<journal_id_issn_online>2538-421X</journal_id_issn_online>
<journal_id_pii></journal_id_pii>
<journal_id_doi>10.61882/jsdp</journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid>1</journal_id_sid>
<journal_id_nlai>8888</journal_id_nlai>
<journal_id_science></journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1394</year>
	<month>9</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2015</year>
	<month>12</month>
	<day>1</day>
</pubdate>
<volume>12</volume>
<number>3</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>تخمین اطمینان خروجی ترجمه ماشینی با استفاده از ویژگی های جدید ساختاری و محتوایی</title_fa>
	<title>Confidence Estimation for Machine Translation using Novel Syntactic and Lexico-semantic Features</title>
	<subject_fa>مقالات پردازش متن </subject_fa>
	<subject>Paper</subject>
	<content_type_fa>كاربردي</content_type_fa>
	<content_type>Applicable</content_type>
	<abstract_fa>&lt;p&gt;با وجود پیشرفت‌های اخیر در حوزه‌ ترجمه‌ ماشینی، این تکنولوژی قادر به ترجمه‌ دقیق متون نیست و گاهی ممکن است ویرایش خروجی آن زمان بیشتری نسبت به ترجمه دستی بگیرد. با این حال با داشتن تخمینی از کیفیت خروجی، کاربران می‌توانند به طور مناسبی با ناکامل بودن این تکنولوژی برخورد کنند. برای کاربردهایی که هدف آنها بالا بردن کیفیت ترجمه‌ ماشینی است، نظیر ترکیب خروجی سامانه‌های ترجمه‌گر مختلف، بازترتیب لیست چند ترجمه‌ بهتر و بازتولید خروجی، لازم است که بدون داشتن ترجمه‌ مرجع تخمینی از درستی خروجی داشته باشیم. هنوز روش کارامدی برای تخمین درستی کلمات خروجی ترجمه‌ ماشینی وجود ندارد. در این مقاله 5 گروه ویژگی جدید در قالب ویژگی‌های مبتنی بر محتوا و مبتنی بر ساختار ارائه شده است. نتایج نشان می‌دهد که ویژگی مبتنی بر محتوا نسبت به بهترین سامانه پایه (2) برتری 63/9 درصدی در CER، 5/8 درصدی در F-measure و 1/5 درصدی در F-measure طبقه منفی داشته است. همچنین ترکیب ویژگی‌های مبتنی بر ساختار ارائه شده، در مقایسه با بهترین سامانه پایه به ترتیب بهبود 59/4، 1/4 و 2 درصدی در معیارهای CER، F-measure و F-measure طبقه منفی ایجاد کرده است.&lt;/p&gt;
</abstract_fa>
	<abstract>&lt;p&gt;Despite machine translation (MT) wide suc-cess over last years, this technology is still not able to exactly translate text so that except for some language pairs in certain domains, post editing its output may take longer time than human translation. Nevertheless by having an estimation of the output quality, users can manage imperfection of this tech-nology. It means we need to estimate the confidence of the output without having any references. Moreover, Confidence Estimation (CE) can be useful for some applications that their goal is to improve machine translation quality such as system combination, regener-ating, pruning, etc. but there is not yet any completely satisfactory method for CE task. We propose 5 groups of syntactic and lexico-semantic features. The results show that the lexico-semantic feature outperforms the best baseline system (2) by 9.63% in CER, 8.5% in F-measure and 5.1% in negative class F-measure. Also by combining proposed syn-tactic features together we reach 4.59% CER reduction, 4.1% F-measure improvement and 2% negative F-measure improvement.&lt;/p&gt;
</abstract>
	<keyword_fa>تخمین اطمینان, ترجمه ماشینی, اطلاعات متقابل, ساختار, محتوا.</keyword_fa>
	<keyword>confidence estimation, machine translation, mutual information, syntax, lexical, semantic.</keyword>
	<start_page>109</start_page>
	<end_page>121</end_page>
	<web_url>http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-482-1&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>Marzieh</first_name>
	<middle_name></middle_name>
	<last_name>Salehi</last_name>
	<suffix></suffix>
	<first_name_fa>مرضیه</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>صالحی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>marzieh.salehi.sh@gmail.com</email>
	<code>10031947532846002176</code>
	<orcid>10031947532846002176</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation>alzahra university</affiliation>
	<affiliation_fa>دانشگاه الزهرا(س)</affiliation_fa>
	 </author>


	<author>
	<first_name>Shahram</first_name>
	<middle_name></middle_name>
	<last_name>Khadivi</last_name>
	<suffix></suffix>
	<first_name_fa>شهرام</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>خدیوی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email></email>
	<code>10031947532846002177</code>
	<orcid>10031947532846002177</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>amirkabir university</affiliation>
	<affiliation_fa>دانشگاه امیرکبیر</affiliation_fa>
	 </author>


	<author>
	<first_name>Nooshin</first_name>
	<middle_name></middle_name>
	<last_name>Riahi</last_name>
	<suffix></suffix>
	<first_name_fa>نوشین</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>ریاحی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email></email>
	<code>10031947532846002178</code>
	<orcid>10031947532846002178</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>alzahra university</affiliation>
	<affiliation_fa>دانشگاه الزهرا(س)</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
