دوره 9، شماره 1 - ( 6-1391 )                   جلد 9 شماره 1 صفحات 48-35 | برگشت به فهرست نسخه ها

XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

mohammadnejad H, vali M. New Approach in Robust Speech Recognition Based on Missing Feature using Bidirectional Neural Network. JSDP 2012; 9 (1) :35-48
URL: http://jsdp.rcisp.ac.ir/article-1-692-fa.html
محمدنژاد حجت، ولی منصور. روشی جدید در بازشناسی مقاوم گفتار مبتنی بر دادگان مفقود با استفاده از شبکه عصبی دوسویه. پردازش علائم و داده‌ها. 1391; 9 (1) :35-48

URL: http://jsdp.rcisp.ac.ir/article-1-692-fa.html


پژوهشگاه مخابرات و الکترونیک فجر
چکیده:   (3931 مشاهده)

عملکرد سیستم های بازشناسی گفتار زمانی که گفتار توسط نویز تخریب شده باشد، به شدت کاهش می یابد. یکی از روش های رایج برای مقاوم سازی سیستم های بازشناسی گفتار استفاده از روش دادگان مفقود است در این روش مؤلفه‌هایی از نمایش زمانی- فرکانسی گفتار (اسپکتروگرام) که نسبت سیگنال به نویز (SNR) آنها از یک آستانه کمتر است، بعنوان مؤلفه های نامعتبر یا مفقود برچسب دهی می شوند. این مؤلفه ها با استفاده از مؤلفه های معتبر و اطلاعات آماری که نسبت به دادگان تمیز، تخمین زده شده و جایگزین می شوند. در این مقاله الگوی ویژگی های مفقود با دیدگاهی نو به عنوان مسئله جبران سازی دادگان مطرح می شود. به اینصورت که با استفاده از شبکه عصبی دوسویه و انجام یک سری پردازش‌های غیرخطی و دوطرفه (جلوسو و برگشتی) از دانش نهفته در مدل، ناشی از یادگیری هم-زمان گفتار تمیز و نویزی بهره گرفته، بردارهای بازنمایی گفتار در جهت افزایش صحت بازشناسی آواها بهبود می یابند. در این روش نیازی به شناسایی مؤلفه‌های مفقود که یک بحث چالش برانگیز در حوزه بازشناسی مقاوم گفتار مبتنی بر دادگان مفقود است نمی باشد بلکه بازسازی در جهت هرچه شبیه تر شدن تمامی مؤلفه‌ها (خواه معتبر باشد خواه نامعتبر) به مؤلفه‌های گفتار تمیز صورت می گیرد و این یک برتری بسیار چشمگیری است که در این تحقیق حاصل شده است؛ نتایج مقایسه این دو روش نشان می دهد که با استفاده از روش دادگان مفقود، 2/4 درصد بهبود برای صحت بازشناسی گفتار نویزی با نسبت سیگنال به نویز dB0 حاصل شده درحالیکه با استفاده از روش مبتنی بر شبکه عصبی دوسویه، 5/8 درصد بهبود برای همان نسبت سیگنال به نویز به دست آمده است.

متن کامل [PDF 2905 kb]   (920 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: مقالات پردازش گفتار
دریافت: 1391/6/31 | پذیرش: 1396/11/30 | انتشار: 1396/11/30 | انتشار الکترونیک: 1396/11/30

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA

ارسال پیام به نویسنده مسئول


بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.

کلیه حقوق این تارنما متعلق به فصل‌نامة علمی - پژوهشی پردازش علائم و داده‌ها است.