<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Signal and Data Processing</title>
<title_fa>پردازش علائم و داده‌ها</title_fa>
<short_title>JSDP</short_title>
<subject>Engineering &amp; Technology</subject>
<web_url>http://jsdp.rcisp.ac.ir</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>2538-4201</journal_id_issn>
<journal_id_issn_online>2538-421X</journal_id_issn_online>
<journal_id_pii></journal_id_pii>
<journal_id_doi>10.61882/jsdp</journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid>1</journal_id_sid>
<journal_id_nlai>8888</journal_id_nlai>
<journal_id_science></journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1394</year>
	<month>9</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2015</year>
	<month>12</month>
	<day>1</day>
</pubdate>
<volume>12</volume>
<number>3</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>تصحیح خودکار خطا در درخت بانک نحوی با استفاده از یادگیری ماشینی انتقال محور</title_fa>
	<title>A machine learning approach for correcting the errors of a Treebank </title>
	<subject_fa>مقالات پردازش گفتار </subject_fa>
	<subject>Paper</subject>
	<content_type_fa>پژوهشي</content_type_fa>
	<content_type>Research</content_type>
	<abstract_fa>&lt;p&gt;درخت بانک یکی از پرکاربردترین منابع در به کارگیری روش های یادگیری باسرپرستی و نیمه سرپرستی در سامانه های پردازش زبان های طبیعی مانند ابزارهای شناسایی گفتار، تحلیلگرهای نحوی و نرم افزارهای مترجم ماشینی است. روش های مختلفی جهت تولید درخت بانک وجود دارد که می توان آن ها را به دو طبقه ی اصلی، روش های تولید دستی و روش های تولید خودکار تقسیم کرد. در هر یک از این روش ها، درخت بانک حاصل دارای خطاهایی هستند که البته میزان این خطاها در روش تولید خودکار به مراتب بیشتر است. وجود خطا در درخت بانک باعث می‌شود که نتوان از آن به عنوان یک منبع مناسب استفاده کرد. در این مقاله یک روش کاملا خودکار ارائه شده است که در آن سعی شده یک درخت بانک که با دستور درخت-پیوندی لغوی برچسب گذاری شده است، اصلاح گردد. روش ارائه شده نوعی روش تشخیص و تصحیح خطا براساس یادگیری انتقال محور است و بر روی یک درخت بانک که پیشتر به روش خودکار تولید شده بود اجرا شد و سبب بهبود آن بانک از 68% به 79% طبق معیار F1 شد.&lt;/p&gt;
</abstract_fa>
	<abstract>&lt;p&gt;The Treebank is one of the most useful resources for supervised or semi-supervised learning in many NLP tasks such as speech recognition, spoken language systems, parsing and machine translation. Treebank can be developded in different ways that could be, generally, categorized in manually and statistical approaches. While the resulted Treebank in each of these methods has the annotation error, one which accomplished by statistical method has much more errors than the other. Error in Treenabanks causes that they are not useful anymore. In this paper an statistical method is proposed which aims to correct the errors in a specific English LTAG-Treebank. The proposed method was applied to a automatically generated Treebank and an improvement from 68% to 79% respect to F-measure is retrieved.&lt;/p&gt;
</abstract>
	<keyword_fa>درخت بانک نحوی, تشخیص و تصحیح خطا, دستور درخت-پیوندی, یادگیری انتقال محور</keyword_fa>
	<keyword></keyword>
	<start_page>99</start_page>
	<end_page>108</end_page>
	<web_url>http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-484-2&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>Farzaneh</first_name>
	<middle_name></middle_name>
	<last_name>Zarei</last_name>
	<suffix></suffix>
	<first_name_fa>فرزانه</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>زارعی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>zareeifarzaneh@gmail.com</email>
	<code>10031947532846002173</code>
	<orcid>10031947532846002173</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation></affiliation>
	<affiliation_fa>دانشگاه تهران</affiliation_fa>
	 </author>


	<author>
	<first_name>Hesham</first_name>
	<middle_name></middle_name>
	<last_name>Faili</last_name>
	<suffix></suffix>
	<first_name_fa>هشام</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>فیلی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>hfaili@ut.ac.ir</email>
	<code>10031947532846002174</code>
	<orcid>10031947532846002174</orcid>
	<coreauthor>No</coreauthor>
	<affiliation></affiliation>
	<affiliation_fa>دانشگاه تهران</affiliation_fa>
	 </author>


	<author>
	<first_name>Maryam</first_name>
	<middle_name></middle_name>
	<last_name>Mirian</last_name>
	<suffix></suffix>
	<first_name_fa>مریم</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>میریان</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>mmirian@ut.ac.ir</email>
	<code>10031947532846002175</code>
	<orcid>10031947532846002175</orcid>
	<coreauthor>No</coreauthor>
	<affiliation></affiliation>
	<affiliation_fa>دانشگاه تهران</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
