<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Signal and Data Processing</title>
<title_fa>پردازش علائم و داده‌ها</title_fa>
<short_title>JSDP</short_title>
<subject>Engineering &amp; Technology</subject>
<web_url>http://jsdp.rcisp.ac.ir</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>2538-4201</journal_id_issn>
<journal_id_issn_online>2538-421X</journal_id_issn_online>
<journal_id_pii></journal_id_pii>
<journal_id_doi>10.61882/jsdp</journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid>1</journal_id_sid>
<journal_id_nlai>8888</journal_id_nlai>
<journal_id_science></journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1398</year>
	<month>12</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2020</year>
	<month>3</month>
	<day>1</day>
</pubdate>
<volume>16</volume>
<number>4</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>تشخیص موجودیت‌های نامدار در متون فارسی با استفاده از یادگیری عمیق</title_fa>
	<title>Named Entity Recognition in Persian Text  using Deep Learning</title>
	<subject_fa>مقالات پردازش متن </subject_fa>
	<subject>Paper</subject>
	<content_type_fa>پژوهشي</content_type_fa>
	<content_type>Research</content_type>
	<abstract_fa>&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;strong&gt;&lt;span dir=&quot;RTL&quot;&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;شناسایی موجودیت&#8204;&amp;shy;های نامدار&lt;a href=&quot;#_ftn1&quot; name=&quot;_ftnref1&quot; title=&quot;&quot;&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;strong&gt;&lt;span style=&quot;font-family:times new roman bold,serif;&quot;&gt;&lt;span style=&quot;font-size:8.0pt;&quot;&gt;[1]&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;/span&gt;&lt;/a&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; یکی از فعالیت&#8204;&amp;shy;های زیربنایی در حوزه پردازش زبان طبیعی&lt;a href=&quot;#_ftn2&quot; name=&quot;_ftnref2&quot; title=&quot;&quot;&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;strong&gt;&lt;span style=&quot;font-family:times new roman bold,serif;&quot;&gt;&lt;span style=&quot;font-size:8.0pt;&quot;&gt;[2]&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;/span&gt;&lt;/a&gt; و به&#8204;طور&#8204;کلی زیر&#8204;مجموعه&#8204;&amp;shy;ای از استخراج اطلاعات&lt;a href=&quot;#_ftn3&quot; name=&quot;_ftnref3&quot; title=&quot;&quot;&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;strong&gt;&lt;span style=&quot;font-family:times new roman bold,serif;&quot;&gt;&lt;span style=&quot;font-size:8.0pt;&quot;&gt;[3]&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;/span&gt;&lt;/a&gt; است. در فرآیند شناسایی موجودیت&#8204;&amp;shy;های نامدار به&#8204;دنبال یافتن عناصر اسمی در متن و دسته&amp;shy;&#8204;بندی آنها به رده&#8204;&amp;shy;هایی ازپیش&#8204;&amp;shy;تعیین&amp;shy;&#8204;شده از قبیل اسامی اشخاص، سازمان&amp;shy;&#8204;ها، مکان&#8204;&amp;shy;ها، مذ&lt;span dir=&quot;RTL&quot;&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;ا&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span dir=&quot;RTL&quot;&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;هب، عنوان کتاب&amp;shy;&#8204;ها، عنوان فیلم&amp;shy;ها و غیره هستیم. در این &lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span dir=&quot;RTL&quot;&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;مقاله&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span dir=&quot;RTL&quot;&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt; با بهره&amp;shy;گیری از روش&amp;shy;های نوین در این حوزه مانند استفاده از دو بُردار مختلف بازنمایی معنایی واژگان برمبنای کلمه و حروف تشکیل&#8204;دهنده آن برمبنای شبکه&amp;shy;&#8204;های عصبیو همچنین استفاده از روش&#8204;&amp;shy;های یادگیری عمیق&lt;a href=&quot;#_ftn4&quot; name=&quot;_ftnref4&quot; title=&quot;&quot;&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;strong&gt;&lt;span style=&quot;font-family:times new roman bold,serif;&quot;&gt;&lt;span style=&quot;font-size:8.0pt;&quot;&gt;[4]&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;/span&gt;&lt;/a&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; یک سامانه تشخیص موجودیت&amp;shy;&#8204;های نامدار معرفی می&#8204;شود. همچنین در راستای پژوهش حاضر، یک پیکره برچسب&amp;shy;&#8204;گذاری&amp;shy;شده شامل سه&#8204;هزار چکیده از ویکی&amp;shy;&#8204;پدیای فارسی که شامل نود&#8204;هزار واژه است با استفاده از پانزده برچسب مختلف ارائه می&#8204;شود که گام مهمی در ارتقای پژوهش&#8204;&amp;shy;های آینده این حوزه برداشته &amp;shy;خواهد شد. نتایج حاصل از ارزیابی سامانه پیشنهادی نشان می&amp;shy;&#8204;دهد که می&amp;shy;&#8204;توان با استفاده از داده معرفی&amp;shy;&#8204;شده به دقت 09/72 در معیار &lt;span style=&quot;font-family:times new roman bold,serif;&quot;&gt;&lt;span style=&quot;font-size:8.0pt;&quot;&gt;F&lt;/span&gt;&lt;/span&gt;&lt;span dir=&quot;RTL&quot;&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt; رسید.&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;/div&gt;

&lt;div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;/div&gt;
&lt;hr align=&quot;left&quot; size=&quot;1&quot; width=&quot;33%&quot; &gt;
&lt;div id=&quot;ftn1&quot; style=&quot;text-align: justify;&quot;&gt;&lt;a href=&quot;#_ftnref1&quot; name=&quot;_ftn1&quot; title=&quot;&quot;&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt;[1]&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/a&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt; Named Entity Recognition&lt;/span&gt;&lt;/span&gt;&lt;span dir=&quot;RTL&quot;&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;

&lt;div id=&quot;ftn2&quot; style=&quot;text-align: justify;&quot;&gt;&lt;a href=&quot;#_ftnref2&quot; name=&quot;_ftn2&quot; title=&quot;&quot;&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt;[2]&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/a&gt; &lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt;Natural Language Processing&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;

&lt;div id=&quot;ftn3&quot; style=&quot;text-align: justify;&quot;&gt;&lt;a href=&quot;#_ftnref3&quot; name=&quot;_ftn3&quot; title=&quot;&quot;&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt;[3]&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/a&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt; Information Extraction&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;

&lt;div id=&quot;ftn4&quot; style=&quot;text-align: justify;&quot;&gt;&lt;a href=&quot;#_ftnref4&quot; name=&quot;_ftn4&quot; title=&quot;&quot;&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt;[4]&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/a&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt; Deep Learning&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;
&lt;/div&gt;</abstract_fa>
	<abstract>&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;strong&gt;Named entities recognition is a fundamental task in the field of natural language processing. It is also known as a subset of information extraction. The process of recognizing named entities aims at finding proper nouns in the text and classifying them into predetermined classes such as names of people, organizations, and places. In this paper, we propose a named entity recognizer which benefits from neural network-based approaches for both word representation and entity tagging. &lt;/strong&gt;&lt;br&gt;
&lt;strong&gt;In the word representation part of the proposed model, two different vector representations are used and compared: (1) the semantic representation of words based on their context using word2vec continues skip-gram model, and (2) the semantic representation of words based on their context as well as characters forming them using fasttext. While the former model captures the semantic concepts of words, the latter one considers the morphological similarity of words as well. For the entity identification, a deep Bidirectional Long Short Term Memory (BiLSTM) network is used. Using LSTM model helps to consider the history of text when predicting entities, while the BiLSTM model expands this idea by benefiting from the history from both sides of the context. &lt;/strong&gt;&lt;br&gt;
&lt;strong&gt;Moreover, inline of the present research, an annotated corpus containing 3000 abstracts (90000 tokens) from the Persian Wikipedia is provided. In contrast to the available datasets in the field, which includes up to 7 label types, the new dataset contains 15 different labels, namely person individual, person group, organizations, locations, religions, books, magazines, movies, languages, nationalities, events, jobs, dates, fields, and other. Developing this dataset will be an important step in promoting future research in this field, especially for the tasks such as question answering that need wider range of entity types. The results of the proposed system show that by using the introduced model and the provided data, the system can achieve 72.92 F-measure.&lt;/strong&gt;&lt;/div&gt;</abstract>
	<keyword_fa>تشخیص موجودیت‌های نامدار, پردازش زبان طبیعی, بازنمایی معنایی کلمات, یادگیری عمیق</keyword_fa>
	<keyword>Name entity recognition, natural language processing, word embedding, deep learning</keyword>
	<start_page>93</start_page>
	<end_page>112</end_page>
	<web_url>http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-1467-1&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>Saeedeh</first_name>
	<middle_name></middle_name>
	<last_name>Momtazi</last_name>
	<suffix></suffix>
	<first_name_fa>سعیده</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>ممتازی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>momtazi@aut.ac.ir</email>
	<code>10031947532846008600</code>
	<orcid>10031947532846008600</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation>Amirkabir University of Technology</affiliation>
	<affiliation_fa>دانشگاه صنعتی امیرکبیر</affiliation_fa>
	 </author>


	<author>
	<first_name>Farzaneh</first_name>
	<middle_name></middle_name>
	<last_name>Torabi</last_name>
	<suffix></suffix>
	<first_name_fa>فرزانه</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>ترابی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>f9torabi@gmail.com</email>
	<code>10031947532846008601</code>
	<orcid>10031947532846008601</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Amirkabir University of Technology</affiliation>
	<affiliation_fa>دانشگاه صنعتی امیرکبیر</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
