AU - Hosseinnejad, Shadi AU - Shekofteh, Yasser AU - Emami Azadi, Tahereh TI - A’laam Corpus: A Standard Corpus of Named Entity for Persian Language PT - JOURNAL ARTICLE TA - jsdp JN - jsdp VO - 14 VI - 3 IP - 3 4099 - http://jsdp.rcisp.ac.ir/article-1-477-fa.html 4100 - http://jsdp.rcisp.ac.ir/article-1-477-fa.pdf SO - jsdp 3 AB  - تشخیص واحدهای اسمی یکی از مسائل مطرح در پردازش زبان طبیعی است. کاربرد عمده شناسایی واحدهای اسمی در سامانه‌های خلاصه‌ساز متون، استخراج اطلاعات، پرسش و پاسخ، ترجمه ماشینی و دسته‌بندی اسناد است. یکی از روش‌های تهیه سامانه تشخیص واحدهای اسمی، استفاده از روش‌های مبتنی بر پیکره است. این مقاله نحوه و مراحل تهیه پیکره اَعلام – یک پیکره استاندارد با برچسب واحدهای اسمی برای زبان فارسی- را شرح می‌دهد. مجموعه تهیه‌شده با داشتن سیزده برچسب واحدهای اسمی و حجم 250 هزار کلمه نیاز سامانه‌های برچسب‌گذاری خودکار در حوزه پردازش زبان طبیعی فارسی را برآورده می‌کند. با استفاده از این پیکره و به‌کارگیری روش یادگیری ماشین میدان تصادفی شرطی، سامانه‌ای برای شناسایی واحدهای اسمی جملات فارسی تهیه شده که دارای دقت 94/92 درصد و فراخوانی 48/78 درصد است. CP - IRAN IN - LG - eng PB - jsdp PG - 127 PT - Applicable YR - 2017