<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Signal and Data Processing</title>
<title_fa>پردازش علائم و داده‌ها</title_fa>
<short_title>JSDP</short_title>
<subject>Engineering &amp; Technology</subject>
<web_url>http://jsdp.rcisp.ac.ir</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>2538-4201</journal_id_issn>
<journal_id_issn_online>2538-421X</journal_id_issn_online>
<journal_id_pii></journal_id_pii>
<journal_id_doi>10.61882/jsdp</journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid>1</journal_id_sid>
<journal_id_nlai>8888</journal_id_nlai>
<journal_id_science></journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1396</year>
	<month>12</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2018</year>
	<month>3</month>
	<day>1</day>
</pubdate>
<volume>14</volume>
<number>4</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>تبدیل خودکار درخت‌بانک وابستگی فارسی به درخت‌بانک سازه‌ای
</title_fa>
	<title>Converting Dependency Treebank to Constituency Treebank for Persian</title>
	<subject_fa>مقالات پردازش متن </subject_fa>
	<subject>Paper</subject>
	<content_type_fa>پژوهشي</content_type_fa>
	<content_type>Research</content_type>
	<abstract_fa>&lt;p dir=&quot;RTL&quot;&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;درخت&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;&#8204;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;بانک&#8204;ها به&#8204;طورمعمول به دو شکل مبتنی بر ساختار وابستگی و مبتنی بر ساختار سازه&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;&#8204;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;ای ایجاد می&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;&#8204;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;شوند. هر دوی این ساختارها در حوزه زبان&#8204;شناسی و پردازش زبان طبیعی کاربرد دارند. هم&#8204;&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;&#8204;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;اکنون چندین درخت&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;&#8204;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;بانک وابستگی برای زبان فارسی وجود دارد، اما درخت&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;&#8204;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;بانک&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;&#8204;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt; سازه&#8204;&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;&#8204;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;ای با حجم بزرگ برای این زبان وجود ندارد. در این مقاله قصد داریم روشی را برای تبدیل یک درخت&#8204;بانک وابستگی به معادل سازه&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;&#8204;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;ای آن، بر اساس یک الگوریتم موجود ارائه دهیم. الگوریتم مبنا با استفاده از مجموعه&#8204;ای از قواعد تبدیل، زیردرخت&#8204;های سازه&#8204;ای متناظر با یال&#8204;های وابستگی را یافته و با ترکیب آنها ساختار سازه&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;&#8204;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;ای نهایی را تولید می&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;&#8204;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;کند. ما این الگوریتم را بر روی ساختارهای وابستگی زبان فارسی اعمال و ضمن ارائه نتایج، اصلاحاتی را در جهت بهبود کارایی آن ارائه می&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;&#8204;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;کنیم. نشان داده می&#8204;شود که پیمایش یال&#8204;های وابستگی در یک جهت خاص بر روی کیفیت الگوریتم تأثیرگذار است. همین&#8204;طور ما اصلاحاتی را در الگورتیم مربوط به تطبیق قواعد و الگوریتم اتصال زیردرخت&#8204;ها ارائه می&#8204;کنیم. این اصلاحات کارایی الگوریتم را به شکل قابل ملاحظه&#8204;ای افزایش می&#8204;دهند. نتایج عملی بهبودی را به اندازه 48/16% نسبت &#8204;به الگوریتم مبنا نشان می&#8204;دهد&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;.&lt;/span&gt;&lt;/span&gt;&lt;br&gt;
&amp;nbsp;&lt;/p&gt;
</abstract_fa>
	<abstract>&lt;p&gt;&lt;strong&gt;There are two major types of treebanks: dependency-based and constituency-based. Both of them have applications in natural language processing and computational linguistics. Several dependency treebanks have been developed for Persian. However, there is no available big size constituency treebank for this language. In this paper, we aim to propose an algorithm for automatic conversion of a dependency treebank to a constituency treebank for Persian. Our method is based on an existing method. However, we make modification to enhance its accuracy. The base algorithm constructs a constituency structure according to a set of conversion rules. Each rule maps a dependency relation to a constituency subtree. The constituency structure is built by combining these subtrees. We investigate the effects of the order in which dependency relations are processed on the output constituency structure. We show that the best order depends on the charactersitics of the target language. We also make modification in the algorithm for matching the conversion rules. To match a dependency relation to a conversion rule, we start with detailed infromation and if no match was found, we decrease the details and also change the method for matching. We also make modification in the algorithm used for combining the constituency subtrees. We use statistical data derived from a treebank to find a proper position for attaching a constituency subtree to the projection chain of the head. The expremental results show that these modifications provide an improvement of 16.48% in the accuracy of the conversion algorithm.&lt;/strong&gt;&lt;br&gt;
&amp;nbsp;&lt;br&gt;
&amp;nbsp;&lt;/p&gt;
</abstract>
	<keyword_fa>پردازش زبان طبیعی, پیکره زبانی, درخت‌بانک  وابستگی, درخت‌بانک سازه‌ای</keyword_fa>
	<keyword>Natural  language processing, Treebanks, Dependency structure, Phrase structure</keyword>
	<start_page>79</start_page>
	<end_page>96</end_page>
	<web_url>http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-614-3&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>Ahmad</first_name>
	<middle_name></middle_name>
	<last_name>Pouramini</last_name>
	<suffix></suffix>
	<first_name_fa>احمد</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>پورامینی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>pouramini@gmail.com</email>
	<code>10031947532846006222</code>
	<orcid>10031947532846006222</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation>Sirjan University of Technology</affiliation>
	<affiliation_fa>داشنگاه صنعتی سیرجان</affiliation_fa>
	 </author>


	<author>
	<first_name>Masood</first_name>
	<middle_name></middle_name>
	<last_name>Ghayoomi</last_name>
	<suffix></suffix>
	<first_name_fa>مسعود</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>قیومی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>masood.ghayoomi@gmail.com</email>
	<code>10031947532846006223</code>
	<orcid>10031947532846006223</orcid>
	<coreauthor>No</coreauthor>
	<affiliation></affiliation>
	<affiliation_fa>پژوهشگاه علوم انسانی و مطالعات فرهنگی</affiliation_fa>
	 </author>


	<author>
	<first_name>Amine</first_name>
	<middle_name></middle_name>
	<last_name>Naseri</last_name>
	<suffix></suffix>
	<first_name_fa>امینه</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>ناصری</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>naseri.amine@sirjantech.ac.ir</email>
	<code>10031947532846006224</code>
	<orcid>10031947532846006224</orcid>
	<coreauthor>No</coreauthor>
	<affiliation></affiliation>
	<affiliation_fa>داشنگاه صنعتی سیرجان</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
