AU - Rahimi, Zeinab AU - HosseinNejad, Shadi TI - Corpus based coreference resolution for Farsi text PT - JOURNAL ARTICLE TA - jsdp JN - jsdp VO - 17 VI - 1 IP - 1 4099 - http://jsdp.rcisp.ac.ir/article-1-873-fa.html 4100 - http://jsdp.rcisp.ac.ir/article-1-873-fa.pdf SO - jsdp 1 AB  - مرجع‌یابی یا مرجع‌گزینی یا پیدا‌کردن واژگان هم‌مرجع در متن، یکی از وظایف مهم در پردازش زبان طبیعی است که یک بخش عملیاتی مهم در مسائلی مانند خلاصه‌سازی خودکار، پرسش و پاسخ خودکار و استخراج اطلاعات به‌شمار می‌رود. طبق تعاریف زمانی، دو واژه زمانی هم‌مرجع هستند که هر دو به موجودیت واحدی در متن یا جهان حقیقی ارجاع بدهند. تاکنون برای حل این مسأله تلاش‌های متعددی صورت گرفته است که بنابر نتایج این مطالعات، عملیات مرجع‌گزینی را می‌توان با روش‌های متفاوتی مانند روش‌های قاعده‌مند، مبتنی بر قوانین مکاشفه‌ای و روش‌های یادگیری ماشین (بانظارت یا بی‌ناظر) انجام داد. نکته قابل توجه این است که در سال‌های اخیر استفاده از پیکره‌های برچسب‌گذاری‌شده در این زمینه رواج زیادی داشته و منجر به تولید نتایج مناسبی هم شده است. با تکیه بر این موضوع، در پژوهش حاضر، یک پیکره از واژگان هم‌مرجع تولید شده که حدود یک‌میلیون واژه به‌همراه برچسب موجودیت نامدار دارد. در بخش مرجع‌گزینی تمام گروه‌های اسمی، ضمایر و موجودیت‌های نامدار برچسب‌گذاری شده‌اند و برچسب‌های موجودیت نامدار پیکره شامل هفت برچسب است. در پژوهش حاضر با استفاده از این پیکره، یک ابزار مرجع‌گزینی خودکار با استفاده از ماشین بردار پشتیبان تولید شده که دقت آن بر روی داده‌های آزمایش طلایی در حدود شصت درصد است. CP - IRAN IN - Tehran, north Sohrevardi, Bisheh deadend, No 12 LG - eng PB - jsdp PG - 79 PT - Research YR - 2020