Signal and Data Processing
پردازش علائم و دادهها
JSDP
Engineering & Technology
http://jsdp.rcisp.ac.ir
1
admin
2538-4201
2538-421X
10.52547/jsdp
1
8888
fa
jalali
1393
6
1
gregorian
2014
9
1
11
1
online
1
fulltext
fa
تشخیص اسامی اشخاص با استفاده از تزریق کلمههای نامزد اسم در میدانهای تصادفی شرطی برای زبان عربی
Extracting person names using name candidate injection in a conditional random field model for Arabic language
مقالات پردازش متن
Paper
پژوهشي
Research
<a name="up">تشخیص و استخراج واحدهای اسمی مانند نام اشخاص، مکانها، تاریخ و ساعت، در دادهکاوی از یک منبع الکترونیکی یا متنی بسیار مفید است. تشخیص درست واحدهای اسمی، یک نیاز مهم در حل مسائلی در حوزههای جدید مانند پاسخگویی به سؤالها، سیستمهای خلاصهسازی، بازیابی اطلاعات، استخراج اطلاعات، ترجمۀ ماشینی، تفسیر ویدئویی و جستجوی معنایی در وب است. بهعلاوه، تشخیص واحدهای اسمی میتواند به ما در حل پیشرفتهترین مسائل پردازش زبان طبیعی همچون رفع ابهام معنایی میان دو نام مشترک از رشتههای متفاوت، پیدا کرد ارجاعها در مقالات علمی، تشخیص وابستگی میان اشخاص و بهبود نتایج پرس و جوهایی شامل اسامی در موتورهای جستجو کمک کند.
در سالهای گذشته تلاش دانشمندان برای انجام عملیات تشخیص واحدهای اسمی برای زبان انگلیسی و دیگر زبانهای اروپایی به نتایج بسیار خوبی منجر شده است، اما برای زبانهایی مانند فارسی و عربی، نتایج مناسب حاصل نشده است. یکی از اصلیترین اهداف عملیات تشخیص واحدهای اسمی، تشخیص اسامی اشخاص است. در این مقاله سامانهای برای تشخیص اسامی با بهکارگیری مفهوم «کلمههای نامزد اسم» در مراحل آموزش و پیشبینیِ مدلی مبتنی بر میدانهای تصادفی شرطی معرفی شده است. بهطورخاص، همراه با توسعۀ این سامانه، پیکرههای متنی استانداردی از روی متون دینی کهن به زبان عربی ساخته شده است. همچنین حاصل کار سامانه بر روی دادههای روزنامهای که توسط محققان دیگر ایجاد شده، بررسی شده است و نتایج بهدست آمده در مقایسه با نتایج سامانههای دیگر روی همان دادهها، نشان میدهد با استفاده از این روش، دقت تشخیص اسامی در متون عربی به مقدار قابل توجهی بالا رفته است.
Named Entity Recognition and Extraction are very important tasks for discovering proper names including persons, locations, date, and time, inside electronic textual resources. Accurate named entity recognition system is an essential utility to resolve fundamental problems in question answering systems, summary extraction, information retrieval and extraction, machine translation, video interpretation and semantic query expansion. Furthermore, named entity recognition can help us in some state-of-art problems such as removing ambiguity between two common names in different fields, finding out citations in scientific articles, recognizing the associations among persons and improving the results of a search engine to search queries containing named entities.
Recently, many researches have been done on named entity recognition for English and other European languages which have led to efficient results whereas the results are not convincing in Arabic, Persian and many of South Asian languages. One of the most necessary and problematic sub-tasks of named entity recognition is the person named extraction. In this article we have introduced a system for person named extraction in Arabic religious texts using "Proper Name candidate injection" by means of Conditional Random Field (CRF) method. Additionally, we have constructed a new corpus from traditional Arabic religious texts. Applying this method, our experiments have significantly achieved more efficient results.
تشخیص واحدهای اسمی, یادگیری ماشین, میدانهای تصادفی شرطی, زبان فارسی, زبان عربی
Name entity recognition, Machine learning, Conditional Random Fields, Persian language, Arabic language
73
85
http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-326-1&slc_lang=fa&sid=1
مجید
عسگری بیدهندی
majid.asgari@gmail.com
10031947532846001131
10031947532846001131
Yes
Behrouz
Minaei-Bidgoli
بهروز
مینایی بیدگلی
b_minaeiiust.ac.ir
10031947532846001132
10031947532846001132
No
دانشگاه علم و صنعت ایران