دوره 14، شماره 4 - ( 12-1396 )                   جلد 14 شماره 4 صفحات 43-54 | برگشت به فهرست نسخه ها

XML English Abstract Print


فارغ التحصیل ارشد دانشگاه علم و صنعت ایران و آزمایشگاه پردازش و تحلیل متن شرکت آرمان رایان شریف
چکیده:   (545 مشاهده)

تشخیص موجودیت‌های نامدار فرآیندی است که در آن اسامی اشخاص، مکان‌ها(شهرها، کشورها، دریاها و غیره)، سازمان‌ها(شرکت‌های خصوصی و دولتی، نهادهای بین‌المللی و غیره)، تاریخ، واحدهای پولی و درصدها در یک متن شناسایی می‌شوند. تشخیص موجودیت‌های نامدار نقشی اساسی در سامانه‌های پرسش و پاسخ، خلاصه‌سازی، ترجمه ماشینی، برچسب‌زن نقش معنایی، جستجوی معنایی، استخراج رابطه و شناسایی نقل قول دارند. در این مقاله ابتدا فرهنگ واژگان موجودیت‌های سازمان، مکان و اشخاص با استفاده از محتوای ویکی‌پدیای فارسی استخراج شد؛ سپس با استفاده از قواعد، سامانه پیشنهادی توسعه یافت. در ادامه دقت شناسایی موجودیت‌های نامدار با استفاده از کسره اضافه که یکی از ویژگی‌های مهم زبان فارسی است، بهبود داده شد. جهت ارزیابی سامانه تعداد 42 هزار کلمه از پیکره بی‌ جن‌خان به‌صورت دستی برچسب زده شدند و معیار F 92/81 درصد به‌دست آمد. نتایج حاکی از آن است که با استفاده از کسره اضافه در سامانه‌های تشخیص موجودیت  دقت آن‌ها به‌طور قابل ملاحظه‌ای افزایش می‌یابد.
 

متن کامل [PDF 4769 kb]   (241 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: مقالات پردازش متن
دریافت: ۱۳۹۴/۱۲/۱۱ | پذیرش: ۱۳۹۶/۲/۱۵ | انتشار: ۱۳۹۶/۱۲/۲۲ | انتشار الکترونیک: ۱۳۹۶/۱۲/۲۲

فهرست منابع
1. [۱] اصفهانی سیدعبدالحمید, راحتی قوچانی سعید, جهانگیری نادر.«سیستم شناسایی و طبقه‌بندی اسامی در متون فارسی». فصلنامه پردازش علایم و داده‌ها. شماره 13. 77-78. 1389
2. [2] سادات مرتضوی پونه و شمس‌فرد مهرنوش. «شناسایی موجودیت‌های نامدار در متون فارسی». پانزدهمین کنفرانس بین‌المللی سالانه انجمن کامپیوتر ایران. تهران. انجمن کامپیوتر. مرکز توسعه فناوری نیرو. ۱۳۸۸
3. [1] Esfahani.A, Rahati.S, Jahangiri.N. "Identification and classification names in Persian texts ." Signal and Data Processing Journal ,No 13,78-77, 1389
4. [2] Mortazavi.P, Shamsfard.M."Named Entity Recognition In Persian Texts". 15nd National Computer Society of Iran Conference.tehran. Power Technology Development Center.Tehran. 1388
5. [3] Bijankhan.M, Sheykhzadegan.J, Bahrani.M and Ghayoomi.M. "Lessons from Building a Persian Written Corpus:Peykare." Language Resources and Evaluation.2011. pp. 143-164. [DOI:10.1007/s10579-010-9132-x]
6. [4] Chieu, Hai Leong, and Hwee Tou Ng. "Named entity recognition: a maximum entropy approach using global information." Proceedings of the 19th international conference on Computational linguistics-Volume 1. Association for Computational Linguistics, 2002. [DOI:10.3115/1072228.1072253]
7. [5] Das, Arjun, Debasis Ganguly, and Utpal Garain. "Named Entity Recognition with Word Embeddings and Wikipedia Categories for a Low-Resource Language." ACM Transactions on Asian and Low-Resource Language Information Processing (TALLIP) 16.3 (2017): 18.
8. [6] Elsebai, Ali. "Arabic Proper Names Recognition Using Heuristics." Proceeding of the 9th Annual Post Graduate Symposium on the Convergence of Telecommunications, Networking and Broadcasting (PGNET), ISBN. 2008.
9. [7] B. Farber, D. Freitag et al."Improving NER in Arabic Using a Morphological Tageer". the 6th International Conference on Language Resources and Evaluation,LREC. 2008.
10. [8] Farmakiotou, Dimitra, et al. "Rule-based named entity recognition for Greek financial texts." Proceedings of the Workshop on Computational lexicography and Multimedia Dictionaries (COMLEX 2000). 2000.
11. [9] Grishman R, Sundheim B." Message Understanding Conference-6: A Brief History". InCOLING 1996 Aug 5 (Vol. 96, pp. 466-471).1996
12. [10] Mansouri, Alireza, Lilly Suriani Affendey, and Ali Mamat. "Named entity recognition approaches." International Journal of Computer Science and Network Security 8.2: 339-344. 2008
13. [11] Mikheev, Andrei, Marc Moens, and Claire Grover. "Named entity recognition without gazetteers." Proceedings of the ninth conference on European chapter of the Association for Computational Linguistics. Association for Computational Linguistics, 1999. [DOI:10.3115/977035.977037]
14. [12] Rau, Lisa F. "Extracting company names from text." Artificial Intelligence Applications, 1991. Proceedings., Seventh IEEE Conference on. Vol. 1. IEEE, 1991. [DOI:10.1109/CAIA.1991.120841]
15. [13] Shaalan, Khaled, and Hafsa Raza. "Person name entity recognition for Arabic." Proceedings of the 2007 Workshop on Computational Approaches to Semitic Languages: Common Issues and Resources. Association for Computational Linguistics, 2007. [DOI:10.3115/1654576.1654581]
16. [14] Tjong Kim Sang, Erik F., and Fien De Meulder. "Introduction to the CoNLL-2003 shared task: Language-independent named entity recognition." Proceedings of the seventh conference on Natural language learning at HLT-NAACL 2003-Volume 4. Association for Computational Linguistics, 2003.