دوره 16، شماره 3 - ( 10-1398 )                   جلد 16 شماره 3 صفحات 101-116 | برگشت به فهرست نسخه ها


XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Miri E, Razavi S M, Mehrshad N. Search Space Reduction for Farsi Printed Subwords Recognition by Position of the Points and Signs. JSDP 2019; 16 (3) :116-101
URL: http://jsdp.rcisp.ac.ir/article-1-803-fa.html
میری اسماعیل، رضوی سیدمحمد، مهرشاد ناصر. کاهش فضای جستجو در بازشناسی زیرواژگان تایپی فارسی با استفاده از موقعیت نقاط و علائم. پردازش علائم و داده‌ها. 1398; 16 (3) :116-101

URL: http://jsdp.rcisp.ac.ir/article-1-803-fa.html


گروه الکترونیک، دانشکده مهندسی برق و کامپیوتر، دانشگاه بیرجند
چکیده:   (3136 مشاهده)
در این مقاله با استفاده از روشی ساده، اما کارا سعی شده دامنه جستجوی زیرواژگان به‌شدّت کاهش یابد. در گام آموزش، داده‌های آموزشی بر‌اساس موقعیت علائم گروه‌بندی می‌شوند، در گروههایی که تعداد عناصر بیش از ده زیرواژه است، برای کاهش فضای جستجو با توجه به تعداد عناصر گروه، با استخراج ویژگی‌های سادهای از پروفایلهای افقی و عمودی خوشه‌بندی صورت می‌گیرد. در مرحله بازشناسی در نخستین مرحله با تعیین نسبت پهنا به ارتفاع زیرواژه (با علائم و بیعلائم) و کد موقعیت نقاط و علائم، دامنه جستجو به زیرواژگانی با این کد موقعیت که در محدودهای از نسبت‌های یاد‌شده باشند، محدود می‌شود؛ در‌صورتی‌که تعداد زیرواژگان محدود‌شده در این مرحله کمتر از ده باشد، این محدوده پذیرفته و در غیر اینصورت در مرحله بعد با استخراج ویژگیهای سادهای از پروفایلهای افقی و عمودی فضای جستجو به تعدادی از نزدیکترین خوشهها به این زیرواژه که شرط نسبت پهنا به ارتفاع را نیز ارضا کنند محدود می‌شود. با اعمال روش پیشنهادی این مقاله فضای جستجو تا حد قابل قبولی کاهش یافته است.
متن کامل [PDF 4256 kb]   (2069 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: مقالات پردازش متن
دریافت: 1396/8/2 | پذیرش: 1398/3/29 | انتشار: 1398/10/17 | انتشار الکترونیک: 1398/10/17

فهرست منابع
1. [1] T. Adamek, N. E. Connor, and A. F. Smeaton, "Word matching using single closed contours for indexing Handwritten Historical Documents," International Jurnal of Document Analysis and Recognition, vol. 9, no. 2-4, pp. 153-165, 2007.
2. [2] J. R. Pinales, R. J. Rivas, and M. J. C. Bleda, "Holistic Cursive word recognition based on perceptual features," Pattern Recognition Letters, vol. 28, no. 13, pp. 1600-1609, 1 Oct. 2007.
3. [3] A. Amin, "Recognition of printed arabic text based on global features and decision tree learning techniques," Pattern Recognition, vol. 33, no. 8, pp. 1309-1323, 2000.
4. [4] ابراهیمی، افشین، "استفاده از شکل کلی زیرکلمات چاپی در بازیابی تصویر مستندات و بازشناسی متون فارسی"، رساله دکتری مهندسی برق- الکترونیک، دانشگاه تربیت مدرس، تهران، 1384.
5. [4] A. Ebrahimi, ''Using the holistic form of print subwords in retrieving documentary images and recognizing Persian texts'', Ph.D. dissertation, Electron. Eng., Tarbiat Modares Univ., Tehran, 1384.
6. [5] خسروی، حسین و کبیر، احسان الله، "ارزیابی روش‌های بازشناسی متون فارسی بر مبنای شکل کلی زیرکلمات"، نشریه مهندسی برق و کامپیوتر ایران، جلد 7، شماره4، صص. 280-267، 1388.
7. [5] H. Khosravi, E. Kabir, '' Evaluation of methods for recognizing Persian texts based on the holistic form of subwords,'' Iranian Journal of Electrical and Computer Engineering, vol.7, no.4, pp.267-280, 2005.
8. [6] S. Madhvanath, G. Kim, and V. Govindaraju, "Chain code contour processing for handwritten word recognition," IEEE Transactions on Pattern Recognition and Machine Intelligence, vol. 21, no. 9, pp. 928-932, Sep. 1999.
9. [7] K. Zagoris, K. Ergina, and N. Papamarkos, "A document image retrieval system," Engineering Application of Artificial Intelligence, vol. 23, no. 6, pp. 872-879, 2010.
10. [8] S. Bai, L. Li, and C. L. Tan, "Keyword spotting in document images through word shape coding," in Proc. 10th International Conference on Document Analysis and Recognition, ICDAR'09, pp. 331-335, 26-29 Jul. 2009.
11. [9] L. Li, S. Lu, and C. L. Tan, "A fast keyword-spotting technique," in Proc. 9th Int. Conference on Document Analysis and Recognition, ICDAR'07, pp.68-72, 23-26 Sep. 2007.
12. [10] S. Lu and C. L. Tan, "Document image retrieval through word shape coding," IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 30, no. 11, pp. 1913-1918, Nov. 2008.
13. [11] J. A. Rodriguez-Serrano and F. Perronnin, "Handwritten word spotting using hidden markov models and vocabularies," Pattern Recognition, vol. 42, no. 9, pp. 2106-2116, Sep. 2009.
14. [12] T. M. Rath and R. Manmatha, "Word spotting for historical documents," International Jurnal on Document Analysis and Recognition, Vol. 9, no. 2-4, pp. 139-152, Apr. 2007.
15. [13] Y. Lu and C. L. Tan, "Information retrieval in document image databases," IEEE Transactions on nowledge and Data Engineering, Vol. 16, no. 11, pp. 1398-1410, Nov. 2004.
16. [14] A. Ebrahimi and E. Kabir, "A pictorial dictionary for printed farsi sub words," Pattern Recognition Letters, Vol. 29, no. 5, pp. 656-663, 2008.
17. [15] A. Rehman and T. Saba, "Off - line cursive script recognition: current advances, comparisons and remaining problems," Artificial Intelligence Review, vol. 37, no. 4, pp. 261-288, 2012.
18. [16] S. G. Madhvanath and V. Govindaraju, "The role of holistic paradigms in handwritten word recognition," IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 23, no. 2, pp. 149-164, Feb. 2001.
19. [17] L. M. Lorigo and V. Govindaraju, "Off - line arabic handwriting recognition: a survey," IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 28, no. 5, pp. 712-724, May 2008.
20. [18] S. Mozaffari, K. Faez, V. Märgner and H. Elabed, ''Two-stage lexicon reduction for offline Arabic handwritten word recognition,'' International Journal of Pattern Recognition and Artificial Intelligence, vol. 22, No. 07: pp. 1323-1341, November 2008.
21. [19] H. Davoudi, M. Cheriet and E. Kabir, ''Lexicon reduction of handwritten arabic subwords based on the prominent shape regions,'' International Journal on Document Analysis and Recognition, vol 19, Issue 2, pp 139–153, 2016.
22. [20] برومند، سمیه و ایرانپور مبارکه، مجید، "بازشناسی واژگان دست‌نوشته با ویژگی‌های نوین و کاهش فرهنگ لغت"، ﻣﺠﻠﻪ ﭘﺮدازش ﺑﯿﻨﺎیﯽ و ﺗﺼﻮیﺮ، آماده چاپ، 1396.
23. [20] S. Bromand, M. Iranpurmobaraka," Handwritten words recognion with new features and reducing the dictionary," Machine Vision And Image Processing, unpublished.
24. [21] H. Davoudi, E. Kabir, ''Using compatible shape descriptor for lexicon reduction of printed farsi subwords," International Journal on Document Analysis and Recognition, vol. 19, Issue 2. pp 139-153, 2016.
25. ‌[22] داودی، هما و کبیر، احسان الله، "استفاده از مناطق شاخص زیرواژگان چاپی فارسی برای کاهش فضای جستجو در بازشناسی آنها"، نشریه ‌مهندسی برق و مهندسی کامپیوتر ایران، ب –مهندسی کامپیوتر، سال 12، شماره1، 1393.‌
26. [22] H. Davoudi, E. Kabir, ''Using compatible shape descriptor for lexicon reduction of printed farsi subwords," Iranian Journal of Electrical and Computer Engineering, vol. 12, Issue1., 2014.
27. ‌[23] فتحی، فائقه، استخراج حروف شاخص از زیرواژگان چاپی فارسی، پایان‌نامه کارشناسی ارشد، دانشگاه صنعتی سهند، تبریز، ایران، 1388.‌
28. [23] F. Fathi, " Extraction of index letters from Persian printed subwords", M.S. thesis, Dept. Electron.Eng., Sahand University of Technology, Tabriz, Iran, 2009.
29. ‌[24] علی‌بیگی، محمد، بازشناسی زیرواژگان تایپی فارسی، پایان‌نامه کارشناسی ارشد، دانشگاه بیرجند، بیرجند، ایران، 1389.‌
30. [24] M. Alibaigi, "Persian printed subwords recognition", M.Sc. thesis, Departmet of Electronic Engineering, University of Birjand, Birjand, Iran, 2010.
31. [25] میری، اسماعیل، رضوی، سید محمد و مهرشاد، ناصر، "روشی ساده برای کاهش فضای جستجو در بازشناسی زیرواژگان تایپی فارسی "، نهمین کنفرانس ماشین بینایی و پردازش تصویر ایران، دانشگاه شهید بهشتی، آبان ماه 1394.
32. [25] E. Miri, S.M. Razavi, N. Mehrshad, " A simple method for search space reduction in Persian typed subwords recognition," 9th Conference on Machine Vision and Image Processing conference, Shahid Behshti University, Tehran, 2015.

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA

ارسال پیام به نویسنده مسئول


بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.

کلیه حقوق این تارنما متعلق به فصل‌نامة علمی - پژوهشی پردازش علائم و داده‌ها است.