استخراج اطلاعات متنی از تصاویر ویدیویی نقش مهمی را در کاربردهایی نظیر تحلیل معنایی ویدیو، بازیابی اطلاعات متنی، آرشیو تصاویر ویدیویی و اطلاعات مربوطه ایفا میکند. در این مقاله روشی جهت استخراج متن فارسی- عربی از تصاویر ویدیویی ارائه میگردد. در ابتدا با استفاده از آشکارساز لبه مناسب، لبههای موجود در تصویر استخراج گردیده و با استفاده از مکان تلاقی لبهها، گوشههای تصنعی موجود در تصویر مشخص میشوند. تحلیل هیستوگرام جهت حذف برخی از گوشههای تصنعی نواحی غیرمتنی انجام میشود. سپس ضرایب تبدیل فوریه کسینوسی گسسته بلوکهای تصویر استخراج شده و با ترکیب تعدادی از ضرایب، تصویر شدت بافت حاصل میشود. با تلفیق مشخصههای حاصل از گوشههای تصنعی و تصویر شدت بافت، بردار مشخصهای جهت اعمال به یک طبقهبندی جهت جدا سازی نواحی متنی از غیرمتنی حاصل میشود. در نهایت با رسم پروفایلهای نرمالیزه شده شدت بافت، بازبینی نهایی انجام شده و تفکیک خطوط متنی از یکدیگر انجام میگیرد.
بازنشر اطلاعات | |
![]() |
این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است. |