دوره 14، شماره 2 - ( 6-1396 )                   جلد 14 شماره 2 صفحات 158-141 | برگشت به فهرست نسخه ها


XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Tolou Beidokhti M A, Ahmadyfard A. Document Image Dewarping using geometrical information extracted from document lines. JSDP 2017; 14 (2) :141-158
URL: http://jsdp.rcisp.ac.ir/article-1-406-fa.html
طلوع بیدختی محمد امین، احمدی فرد علیرضا. رفع اعوجاج هندسی متون به‌کمک اطلاعات هندسی خطوط متن . پردازش علائم و داده‌ها. 1396; 14 (2) :141-158

URL: http://jsdp.rcisp.ac.ir/article-1-406-fa.html


دانشگاه صنعتی شاهرود
چکیده:   (4768 مشاهده)

تصاویر سند تهیه‌شده توسط پویش‌گر یا دوربین دیجیتال، همواره با اعوجاج‌های فتومتریک و هندسی همراه هستند. وجود هر دو نوع اعوجاج، باعث کاهش دقت عملکرد نرم‌افزارهای شناسایی نویسه­ها (OCR) می­شوند. در این مقاله روشی نوین جهت رفع اعوجاج‌های هندسی از تصاویر متنی ارائه شده ­است. در روش پیشنهادی به‌منظور تصحیح اعوجاج هندسی، در ابتدا خطوط متن از تصویر استخراج و سپس هر خط متن به ستون­هایی به عرض مساوی شکسته می­شوند. برای هر قطعه استخراج‌شده از یک خط، راستای قطعه به‌نحوی تصحیح می‌شود که حروف موجود در آن قطعه در راستای افقی قرار گیرد. برای این منظور به‌ازای چرخش­های مختلف قطعۀ متن، افکنش افقی تصویر محاسبه می­شود و چرخشی از قطعه که بلندترین قله افکنش را ایجاد کند، راستای تصحیح‌شده آن قطعه در نظر گرفته می‌شود. بر این اساس یک نقطه مرجع که معرف راستای مبنا است، برای هر قطعه­خط هم‌راستا­شده با افق استخراج می‌شود. به‌کمک نقاط مرجع، هر قطعه از خط، انحنای آن خط متن به‌کمک برازش یک تابع درجۀ سه به‌دست می‌آید. درنهایت با استفاده از تخمین تبدیل پرسپکتیو، اعوجاج هندسی هر خط برطرف می‌شود. جهت افزایش پایداری روش پیشنهادی در تخمین انحنای خطوط متن با طول کم، از انحنای خطوط با طول بزرگ­تر مجاور آن خط استفاده شده ‌است. روش­ پیشنهادی بر روی پایگاه­های دادۀ فارسی و انگلیسی پیاده­سازی و با برخی روش‌های هم‌تراز آن مقایسه شده است. نتایج بیان‌گر قدرت و دقّت روش پیشنهادی در رفع اعوجاج هندسی است.
 

متن کامل [PDF 7751 kb]   (1762 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: مقالات پردازش تصویر
دریافت: 1394/5/31 | پذیرش: 1395/12/15 | انتشار: 1396/7/29 | انتشار الکترونیک: 1396/7/29

فهرست منابع
1. [1] ا. بایسته تاشک, ع. احمدی فرد و ح. خسروی, "یک روش دو مرحله ای برای بازشناسی کلمات دست نوشته فارسی به کمک بلوک بندی تطبیقی گرادیان تصویر" ، پردازش علائم و داده ها ، دوره 12،صفحات29-15 ، 1394.
2. [2] ح. حسن پور و ع. رستمی قادی "بهسازی تصویر با کاهش اثر عوامل خرابی بر مولفهی روشنایی و بازتابش تصویر," ، پردازش علائم و داده ها، دوره 9، صفحات23-13 ،1391.
3. [3] س. خسروی راد, "رفع اعوجاجات غیرخطی در تصاویر اسناد فارسی," پایان نامه ی ارشد، دانشگاه صنعتی شاهرود، شاهرود، ایران، 1391.
4. [4] ه. ده بوید, ف. رزازی, و ش. علیرضایی, "ارائه روشی نوین برای کاهش اعوجاج تصویربرداری در تصاویر متنی فارسی تصویربرداری شده توسط دوربین," ششمین کنفرانس ماشین بینایی و پردازش تصاوی، اصفهان، ایران، 1389.
5. [5]م.شامقلی, "رفع اعوجاج و بهبود کیفیت تصاویر اسکن شده از کتب فارسی," پایان نامه کارشناسی ارشد، دانشگاه صنعتی شاهرود، شاهرود ، ایران، 1392.
6. [6] م. ا. طلوع بیدختی و ع. احمدی فرد, "رفع اعوجاج فتومتریک از تصویر اسناد به کمک درون نگاری بهبودیافته," ششمین کنفرانس فناوری اطلاعات و دانش. دانشگاه صنعتی شاهرود، شاهرود، ایران، 1393.
7. [1] E. bayesteh Tashak,A. Ahmadyfard and H. Khosravi "A two-step method for recognizing Persian handwritten words using adaptive divi-sion of gradient image" , JSDP, vol 12,PP 15-29 ,2015.
8. [2] H. Hasanpour and O. Rostami Ghadi " Image enhancment By Reducing the effect of failure factors on Intensity And reflection of the ima-ge"JSDP, vol 9, PP 12-23,2012.
9. [3] S.KhosraviRad, "Nonlinear distortion correct-ion in Persian documentary images" ,M.S. thesis, Shahrood ut, Shahrood ,Iran ,2012.
10. [4] H. Dehboyd, F. Razazi, Sh. Alirezei "Introduc-ing a new method for reducing image distortion in Persian text images captured by the camera" Sixth Conference of the Machine and Image Processing, Esfehan, Iran,2010.
11. [5] M.Shamgholi," Distortion correction and Image enhancement in Persian Books" M.S. thesis, Shahrood ut, Shahrood ,Iran ,2013.
12. [6] M.A. Tolou Beydokhti and A. Ahmadyfard
13. [7] A. Criminisi, I. Reid, and A. Zisserman, "A Plane Measuring Device," University of Oxfo-rd, 1993.
14. [8] B. Gatos, N. Pratikakis, and K. Ntirogiannis, "Segmentation Based Recovery of Arbitrarily Warped Document Images," in Ninth Internat-ional Conference on Document Analy-sis and Recognition (ICDAR), 2007. [DOI:10.1109/ICDAR.2007.4377063]
15. [9] J. Kanai, T. A. Nartker, S. Rice, and G. Nagy, "Performance metrics for document understand-ing systems," in Proceedings of the Second International Conference on Document Analy-sis and Recognition, 1993, pp. 424-427.
16. [10] H. Khosravi and E. Kabir, "A blackboard approach towards integrated Farsi OCR syst-em," International Journal of Document Analy-sis and Recognition (IJDAR), vol. 12, pp. 21-32, 2009. https://doi.org/10.1007/s10032-009-0087-7 [DOI:10.1007/s10032-009-0079-7]
17. [11] J. Liang, D. DeMenthon, and D. Doermann, "Geometric Rectification of Camera-captured Document Images," IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 30, no. 4, pp. 591-605, 2008. [DOI:10.1109/TPAMI.2007.70724] [PMID]
18. [12] L. Likforman-Sulem and F. Claudie, "Extract-ing text lines in handwritten documents by perceptual grouping," in Advances in handwrit-ing and drawing: a multidisciplinary approach, paris, 1994, pp. 117-135.
19. [13] L. Likforman-Sulem, A. Hanimyan, and C. Faure, "A Hough based algorithm for extracting text lines in handwritten documents," in IEEE Proceedings of the Third International Confer-ence onDocument Analysis and Recogn-ition, 1995, pp. 774-777. [DOI:10.1109/ICDAR.1995.602017]
20. [14] A. Masalovitch and L. Mestetskiy, "Usage of continuous skeletal image representation for document images de-warping," in Proceedings of International Workshop on Camera-Based Document Analysis and Recognition, Curitiba, 2007, pp. 45-53.
21. [15] J. Mundy and A. Zisserman, Geometric invar-iance in computer vision. Cambridge, MA : MIT press, 1992, vol. 92.
22. [16] W. Niblack, "An introduction to digital image processing," Strandberg Publishing Company, 1985.
23. [17] A. H. Roger and C. R. Johnson, "Topics in matrix analysis," in Matrix analysis. Cambridge university press, 2012.
24. [18] J. Sauvola and M. Pietikainen, "Adaptive document image binarization," Pattern Recogni-tion, vol. 32, no. 2, pp. 225-236, 2000. [DOI:10.1016/S0031-3203(99)00055-2]
25. [19] F. Shafait and M. Breuel, "Document image dewarping contest," in 2nd Int. Workshop on Camera-Based Document Analysis and Recognition, Curitiba, Brazil, 2007, pp. 181-188.
26. [20] M.Shamgholi, M. H. Khosravi, and S. M. Riazi, "Document Image Dewarping Based on Text Line Detection and Surface Modeling," International Journal of Engineering-Transac-tions C: Aspects, vol. 27, no. 12, p. 1855, 2014.
27. [21] Z. Shi and V. Govindaraju, "Line separation for complex document images using fuzzy runleng-th," in IEEE Proceedings in First International Workshop on Document Image Analysis for Libraries, 2006, pp. 306-312.
28. [22] A. Ulges, C. H. Lampert, and T. Breuel, "Document capture using stereo vision," in ACM Proceedings of the 2004 ACM symposium on Document engineering, 2004, pp. 198-200. [DOI:10.1145/1030397.1030434]
29. [23] T. Wada, H. Ukida, and T. Matsuyama, "Shape from shading with interreflections under proximalLight Source-3D Shape Reconstruc-tion of Unfolded Book Surface From a Scanner Image," in IEEE Proceedings in Fifth Interna-tional Conference on Computer, 1995, pp. 66-71. [DOI:10.1109/ICCV.1995.466805] [PMID]
30. [24] K. Y.Wong, R. G. Casey, and F. M. Wahl, "Document analysis system," IBM journal of research and development, vol. 26, no. 6, pp. 647-656, Nov. 1982. [DOI:10.1147/rd.266.0647]
31. [25] OmniPage. [Online]. http://www.nuance.com

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA

ارسال پیام به نویسنده مسئول


بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.

کلیه حقوق این تارنما متعلق به فصل‌نامة علمی - پژوهشی پردازش علائم و داده‌ها است.