<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Signal and Data Processing</title>
<title_fa>پردازش علائم و داده‌ها</title_fa>
<short_title>JSDP</short_title>
<subject>Engineering &amp; Technology</subject>
<web_url>http://jsdp.rcisp.ac.ir</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>2538-4201</journal_id_issn>
<journal_id_issn_online>2538-421X</journal_id_issn_online>
<journal_id_pii></journal_id_pii>
<journal_id_doi>10.61882/jsdp</journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid>1</journal_id_sid>
<journal_id_nlai>8888</journal_id_nlai>
<journal_id_science></journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1396</year>
	<month>12</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2018</year>
	<month>3</month>
	<day>1</day>
</pubdate>
<volume>14</volume>
<number>4</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>بهبود شناسایی موجودیت‌های نامدار فارسی با استفاده از کسره اضافه</title_fa>
	<title>Improving Named Entity Recognition Using Izafe in Farsi</title>
	<subject_fa>مقالات پردازش متن </subject_fa>
	<subject>Paper</subject>
	<content_type_fa>پژوهشي</content_type_fa>
	<content_type>Research</content_type>
	<abstract_fa>&lt;p dir=&quot;RTL&quot;&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;تشخیص موجودیت&#8204;های&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt; نامدار&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt; &lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;فرآیندی است که در آن اسامی اشخاص، مکان&#8204;ها&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;(شهرها، کشورها، دریاها و غیره)&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;، سازمان&#8204;ها(شرکت&#8204;های خصوصی و دولتی، نهادهای بین&#8204;المللی و غیره)&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;،&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt; &lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;تاریخ، واحدهای پولی و درصدها در یک متن شناسایی می&#8204;شوند. تشخیص موجودیت&#8204;های نامدار نقشی اساسی در سامانه&#8204;های پرسش و پاسخ، خلاصه&#8204;سازی، &lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;ترجمه ماشینی، برچسب&#8204;زن نقش معنایی، جستجوی معنایی، استخراج رابطه و شناسایی نقل قول دارند.&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt; در این مقاله ابتدا فرهنگ واژگان موجودیت&#8204;های سازمان، مکان و اشخاص با استفاده از محتوای ویکی&#8204;پدیای فارسی استخراج شد&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;؛ &lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;سپس با استفاده از قواعد، سامانه پیشنهادی توسعه یافت&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;. در ادامه دقت شناسایی موجودیت&#8204;های نامدار با استفاده از کسره اضافه که یکی از ویژگی&#8204;های مهم زبان فارسی است، بهبود داده شد. &lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;جهت ارزیابی سامانه تعداد 42 هزار کلمه از پیکره بی&#8204; جن&#8204;خان به&#8204;صورت دستی برچسب زده شدند و معیار &lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:8.0pt;&quot;&gt;F&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt; 92/81 درصد به&#8204;دست آمد. نتایج حاکی از آن است که با استفاده از کسره اضافه در سامانه&#8204;های تشخیص موجودیت &amp;nbsp;دقت آن&#8204;ها به&#8204;طور قابل ملاحظه&#8204;ای افزایش می&#8204;یابد.&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;br&gt;
&amp;nbsp;&lt;/p&gt;
</abstract_fa>
	<abstract>&lt;p&gt;&lt;strong&gt;Named entity recognition is a process in which the people&amp;rsquo;s names, name of places (cities, countries, seas, etc.) and organizations (public and private companies, international institutions, etc.), date, currency and percentages in a text are identified. Named entity recognition plays an important role in many NLP tasks such as semantic role labeling, question answering, summarization, machine translation, semantic search, and relation extraction and quotation recognition systems. Named entity recognition in the Persian language is far more complex and more difficult than English. In English texts usually proper nouns begin with capital letters and this feature makes it easy to identify named entities, but this feature is absent in Persian language texts. To create a named entity recognition system, generally three methods are being used which include rule-based, machine-learning-based and hybrid methods. Each of these methods has its own advantages and disadvantages. Lack of named entity labeled data is the greatest challenge in Persian text. Because of this problem usually rule-based methods used to extract entities.&lt;/strong&gt;&lt;br&gt;
&lt;strong&gt;In this paper firstly, the dictionary of organizations, places and people were extracted from Wikipedia. Wikipedia is one of the best sources for extracting entities in which more than 200000 Farsi-named entities are known to exist. The proposed algorithm classify each Wikipedia article title by using its categories. Each of Wikipedia titles has several categories that can be used to partially identify the named entity type. Then named entity recognition accuracy (precision) was increased using the rules. These rules can be divided into 3 categories that include morphological rules, adjacency and text patterns. The most important rules are adjacency rules. By using these rules the type of entity with the word nearby each entity (like Mr, Mrs , &amp;hellip;) can be identified. To evaluate the system, 42000 tokens of BijanKhan corpus were manually annotated (labeled). Early F-measure was calculated 78.79 percent. In continue, named entity recognition accuracy (precision) improved using izāfe which is one of the important Persian language features and 81.94 percent for F-measure was achieved. The results showed that using izāfe in named entity recognition systems significantly increases their accuracy.&lt;/strong&gt;&lt;br&gt;
&amp;nbsp;&lt;/p&gt;
</abstract>
	<keyword_fa>تشخیص موجودیت‌های  نامدار پردازش زبان طبیعی, مبتنی بر قاعده, ویکی‌پدیا, کسره اضافه</keyword_fa>
	<keyword> Named Entity Recognition, Natural Language Processing, Rule Based, Wikipedia, Izafe</keyword>
	<start_page>43</start_page>
	<end_page>54</end_page>
	<web_url>http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-806-1&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>mohammad</first_name>
	<middle_name></middle_name>
	<last_name>َAbdoos</last_name>
	<suffix></suffix>
	<first_name_fa>محمد</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>عبدوس</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>mohammadabdous@comp.iust.ac.ir</email>
	<code>10031947532846006002</code>
	<orcid>10031947532846006002</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation></affiliation>
	<affiliation_fa>دانشگاه علم و صنعت ایران و آزمایشگاه پردازش و تحلیل متن شرکت آرمان رایان شریف</affiliation_fa>
	 </author>


	<author>
	<first_name>behrooz</first_name>
	<middle_name></middle_name>
	<last_name>manaei</last_name>
	<suffix></suffix>
	<first_name_fa>بهروز</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>مینایی بیدگلی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>B_minaei@iust.ac.ir</email>
	<code>10031947532846006003</code>
	<orcid>10031947532846006003</orcid>
	<coreauthor>No</coreauthor>
	<affiliation></affiliation>
	<affiliation_fa>دانشگاه علم و صنعت ایران</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
