<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Signal and Data Processing</title>
<title_fa>پردازش علائم و داده‌ها</title_fa>
<short_title>JSDP</short_title>
<subject>Engineering &amp; Technology</subject>
<web_url>http://jsdp.rcisp.ac.ir</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>2538-4201</journal_id_issn>
<journal_id_issn_online>2538-421X</journal_id_issn_online>
<journal_id_pii></journal_id_pii>
<journal_id_doi>10.61882/jsdp</journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid>1</journal_id_sid>
<journal_id_nlai>8888</journal_id_nlai>
<journal_id_science></journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1397</year>
	<month>3</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2018</year>
	<month>6</month>
	<day>1</day>
</pubdate>
<volume>15</volume>
<number>1</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>مدل ترجمه عبارت-مرزی با استفاده از برچسب‌های کم‌عمق نحوی
</title_fa>
	<title>Phrase-Boundary Translation Model Using Shallow Syntactic Labels</title>
	<subject_fa>مقالات پردازش متن </subject_fa>
	<subject>Paper</subject>
	<content_type_fa>پژوهشي</content_type_fa>
	<content_type>Research</content_type>
	<abstract_fa>&lt;p dir=&quot;RTL&quot; style=&quot;text-align: justify;&quot;&gt;&lt;strong&gt;&lt;span dir=&quot;RTL&quot;&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;مدل عبارت-مرزی برای ترجمه ماشینی آماری، قواعد را با طبقه کلمات مرزی عبارات پیکره مقصد برچسب می&amp;shy;زند. در این مقاله مدل عبارت-مرزی را با استفاده از برچسب&amp;shy;های کم&#8204;عمق نحوی شامل برچسب &lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:8.0pt;&quot;&gt;POS&lt;/span&gt;&lt;/span&gt;&lt;span dir=&quot;RTL&quot;&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt; و برچسب قطعات توسعه می&amp;shy;دهیم. با اولویت برچسب قطعات، مدل پیشنهادی، غیرپایانه&amp;shy;ها را با برچسب&amp;shy;های کم&#8204;عمق نحوی در مرز عبارات مقصد نام&amp;shy;&#8204;گذاری می&amp;shy;&#8204;کند. در قیاس با مدل &lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&amp;nbsp;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:8.0pt;&quot;&gt;SAMT&lt;/span&gt;&lt;/span&gt;&lt;span dir=&quot;RTL&quot;&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt; که قواعد را با درخت تجزیه نحوی جملات مقصد برچسب می&amp;shy;&#8204;زند، مدل پیشنهادی به تجزیه عمیق نحوی نیاز ندارد. همچنین، هرچه تفاوت ترتیب کلمات زبان مبداء و مقصد ترجمه بیشتر باشد، عبارات تراز&#8204;شده قابل انطباق با درخت تجزیه نحوی، کمتر خواهد بود. تعدادی آزمایش در ترجمه از فارسی و آلمانی به انگلیسی به&#8204;عنوان جفت&#8204;زبان&amp;shy;&#8204;هایی با تفاوت زیاد در ترتیب کلمات انجام شد. در این آزمایش&#8204;ها، مدل عبارت-مرزی پیشنهادی نسبت به مدل &lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:8.0pt;&quot;&gt;SAMT&lt;/span&gt;&lt;/span&gt;&lt;span dir=&quot;RTL&quot;&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt; در حدود 5/0 واحد &lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:8.0pt;&quot;&gt;BLEU&lt;/span&gt;&lt;/span&gt;&lt;span dir=&quot;RTL&quot;&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt; کیفیت ترجمه بهتری به&#8204;دست آورد.&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;/p&gt;
</abstract_fa>
	<abstract>&lt;p style=&quot;text-align: justify;&quot;&gt;&lt;strong&gt;Phrase-boundary model for statistical machine translation labels the rules with classes of boundary words on the target side phrases of training corpus. In this paper, we extend the phrase-boundary model using shallow syntactic labels including POS tags and chunk labels. With the priority of chunk labels, the proposed model names non-terminals with shallow syntactic labels on the boundaries of the target side phrases. In comparison to the base phrase-boundary model, our variant uses phrase labels in addition to word classes. In other words, if there is no chunk label in one boundary, the labeler uses the word POS tag. The boundary labels are concatenated where there is no label for the whole target span. Using chunks as phrase labels, the proposed model generalizes the rules to decrease the model sparseness. The sparseness has more importance in the language pairs with a lot of differences in the word order because they have less number of aligned phrase pairs for extraction of rules. Compared with Syntax Augmented Machine Translation (SAMT) that labels rules with the syntax trees of the target side sentences, the proposed model does not need deep syntactic parsing. Thus, it is applicable even for low-resource languages having no syntactic parser. Some translation experiments are performed from Persian and German to English as the source and target languages with different word orders. In the experiments, our model achieved improvements of about 0.5 point of BLEU over a variant of SAMT.&lt;/strong&gt;&lt;/p&gt;
</abstract>
	<keyword_fa>ترجمه ماشینی آماری, مدل سلسله‌مراتبی, برچسب کلمه, برچسب قطعه</keyword_fa>
	<keyword>Statistical machine translation, Hierarchical models, Word tag, Chunk label</keyword>
	<start_page>115</start_page>
	<end_page>126</end_page>
	<web_url>http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-1013-1&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>Shahram</first_name>
	<middle_name></middle_name>
	<last_name>Salami</last_name>
	<suffix></suffix>
	<first_name_fa>شهرام</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>سلامی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>shsalami@gmail.com</email>
	<code>10031947532846006210</code>
	<orcid>10031947532846006210</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation>Shahid Beheshti University</affiliation>
	<affiliation_fa>دانشگاه شهید بهشتی</affiliation_fa>
	 </author>


	<author>
	<first_name>Mehrnoush</first_name>
	<middle_name></middle_name>
	<last_name>Shamsfard</last_name>
	<suffix></suffix>
	<first_name_fa>مهرنوش</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>شمس فرد</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>m-shams@sbu.ac.ir</email>
	<code>10031947532846006211</code>
	<orcid>10031947532846006211</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Shahid Beheshti University</affiliation>
	<affiliation_fa>دانشگاه شهید بهشتی</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
