<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Signal and Data Processing</title>
<title_fa>پردازش علائم و داده‌ها</title_fa>
<short_title>JSDP</short_title>
<subject>Engineering &amp; Technology</subject>
<web_url>http://jsdp.rcisp.ac.ir</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>2538-4201</journal_id_issn>
<journal_id_issn_online>2538-421X</journal_id_issn_online>
<journal_id_pii></journal_id_pii>
<journal_id_doi>10.61882/jsdp</journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid>1</journal_id_sid>
<journal_id_nlai>8888</journal_id_nlai>
<journal_id_science></journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1396</year>
	<month>6</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2017</year>
	<month>9</month>
	<day>1</day>
</pubdate>
<volume>14</volume>
<number>2</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>رفع اعوجاج هندسی متون به‌کمک
 اطلاعات هندسی خطوط متن
</title_fa>
	<title>Document Image Dewarping using geometrical information extracted from document lines</title>
	<subject_fa>مقالات پردازش تصویر</subject_fa>
	<subject>Paper</subject>
	<content_type_fa>پژوهشي</content_type_fa>
	<content_type>Research</content_type>
	<abstract_fa>&lt;p dir=&quot;RTL&quot;&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;تصاویر سند تهیه&#8204;شده توسط پویش&#8204;گر یا دوربین دیجیتال، همواره با اعوجاج&#8204;های فتومتریک و هندسی همراه هستند. وجود هر دو نوع اعوجاج، باعث کاهش دقت عملکرد نرم&#8204;افزارهای شناسایی نویسه&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;&amp;shy;&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;ها&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt; &lt;strong&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-size:8.0pt;&quot;&gt;(OCR)&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt; &lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;می&amp;shy;شوند. در این مقاله روشی نوین جهت رفع اعوجاج&#8204;های هندسی&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt; &lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;از تصاویر متنی ارائه شده &amp;shy;است. در روش پیشنهادی به&#8204;منظور تصحیح اعوجاج هندسی، در ابتدا خطوط متن از تصویر استخراج و سپس هر خط متن به ستون&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;&amp;shy;&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;هایی به عرض مساوی شکسته می&amp;shy;شوند. برای هر قطعه استخراج&#8204;شده از یک خط، راستای قطعه به&#8204;نحوی تصحیح می&#8204;شود که حروف موجود در آن قطعه در راستای افقی قرار گیرد. برای این منظور به&#8204;ازای چرخش&amp;shy;های مختلف قطعۀ متن، افکنش افقی تصویر محاسبه می&amp;shy;شود و چرخشی از قطعه که بلندترین قله افکنش را ایجاد کند، راستای تصحیح&#8204;شده آن قطعه در نظر گرفته می&#8204;شود. بر&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt; &lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;این اساس یک نقطه مرجع که معرف راستای مبنا است، برای هر قطعه&amp;shy;خط هم&#8204;راستا&amp;shy;شده با افق استخراج می&#8204;شود. به&#8204;کمک نقاط مرجع، هر قطعه از خط، انحنای آن خط متن به&#8204;کمک برازش یک تابع درجۀ سه به&#8204;دست می&#8204;آید. درنهایت با استفاده از تخمین تبدیل پرسپکتیو، اعوجاج هندسی هر خط برطرف می&#8204;شود. جهت افزایش پایداری روش پیشنهادی در تخمین انحنای خطوط متن با طول کم، از انحنای خطوط با طول بزرگ&amp;shy;تر مجاور آن خط استفاده شده &#8204;است. روش&amp;shy; پیشنهادی بر روی پایگاه&amp;shy;های دادۀ فارسی و انگلیسی پیاده&amp;shy;سازی و با برخی روش&#8204;های هم&#8204;تراز آن مقایسه شده است. نتایج بیان&#8204;گر قدرت و دقّت روش پیشنهادی در رفع اعوجاج هندسی است&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:12.0pt;&quot;&gt;.&lt;/span&gt;&lt;/span&gt;&lt;strong&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;br&gt;
&amp;nbsp;&lt;/p&gt;
</abstract_fa>
	<abstract>&lt;p&gt;&lt;strong&gt;Document images produced by scanners or digital cameras usually have photometric and geometric distortions. If either of these effects distorts document, recognition of words from such a document image using OCR is subject to errors. In this paper we propose a novel approach to significantly remove geometric distortion from document images. In this method first we extract document lines from document using morphological operators. Then, extracted document lines are divided into a number of equal size column strips.&amp;nbsp; &lt;/strong&gt;&lt;br&gt;
&lt;strong&gt;This allows to assume that each segment of line document is not curved. Each extracted document line segment is aligned horizontally. For this purpose, a segment line of document is rotated at different angels and for each rotation horizontal projection is obtained. The rotation angle with maximum peak at the corresponding projection signal is selected to align the line segment, horizontally. In order to estimate the geometrical distortion, for each document line a reference point is extracted from each line segment. These points indicate the position of a document line at starting column of line segments. Using reference points of a document line a polynomial function is fitted to each document line. At the end, geometric distortion for each part of the document is eliminated using a perspective transformation. &lt;/strong&gt;&lt;br&gt;
&lt;strong&gt;This transformation is estimated based on the extracted polynomial function. To increase the stability of the proposed method for short text lines, the curve of adjacent text lines of longer length is used. A post processing stage is required after applying perspective transformation on document patches. Since this transformation is a continuous mapping but it is applied on digital images. To remove this distortion from the result, the consistency of each pixel value with the value of neighboring pixels are considered to correct the value of inconsistence pixels. &lt;/strong&gt;&lt;br&gt;
&lt;strong&gt;The proposed method is implemented on Persian and English databases and has been compared with the existing methods. The results indicate the efficiency and accuracy of the proposed method in elimination of geometric distortions.&lt;/strong&gt;&lt;br&gt;
&amp;nbsp;&lt;/p&gt;
</abstract>
	<keyword_fa>اعوجاج هندسی, پردازش دوبعدی اسناد, تخمین تبدیل پرسپکتیو, نویسه‌خوان نوری</keyword_fa>
	<keyword>Geometric distortion, document processing, perspective Transformation, Optical character recognition (OCR)</keyword>
	<start_page>141</start_page>
	<end_page>158</end_page>
	<web_url>http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-134-2&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>Mohammad Amin</first_name>
	<middle_name></middle_name>
	<last_name>Tolou Beidokhti</last_name>
	<suffix></suffix>
	<first_name_fa>محمد امین</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>طلوع بیدختی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>M.a.Tolou.b@Gmail.com</email>
	<code>10031947532846005485</code>
	<orcid>10031947532846005485</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Shahrood University</affiliation>
	<affiliation_fa>دانشگاه صنعتی شاهرود</affiliation_fa>
	 </author>


	<author>
	<first_name>Alireza</first_name>
	<middle_name></middle_name>
	<last_name>Ahmadyfard</last_name>
	<suffix></suffix>
	<first_name_fa>علیرضا</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>احمدی فرد</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>ahmadyfard@shahroodut.ac.ir</email>
	<code>10031947532846005486</code>
	<orcid>10031947532846005486</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation>Shahrood University</affiliation>
	<affiliation_fa>دانشگاه صنعتی شاهرود</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
