دوره 13، شماره 1 - ( 3-1395 )                   جلد 13 شماره 1 صفحات 70-57 | برگشت به فهرست نسخه ها

XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Shekofteh Y, Gholipor H, Goodarzi M, kabudian J, Almasganj F, Reza S et al . Fast estimation of warping factor in the vocal tract length normalization using obtained scores of gender detection modeling. JSDP 2016; 13 (1) :57-70
URL: http://jsdp.rcisp.ac.ir/article-1-254-fa.html
شکفته یاسر، قلی پور حسن، گودرزی محمدمحسن، کبودیان جهانشاه، الماس‌گنج فرشاد، رضا شقایق و همکاران.. تخمین سریع ضرایب پیچش در هنجارسازی طول مجرای صوتی با استفاده از امتیاز به دست آمده از مدلسازی تشخیص جنسیت. پردازش علائم و داده‌ها. 1395; 13 (1) :57-70

URL: http://jsdp.rcisp.ac.ir/article-1-254-fa.html


پژوهشگاه توسعه فناوری های پیشرفته خواجه نصیرالدین طوسی
چکیده:   (6323 مشاهده)

یکی از مشکلات عمده­ی سامانه­های خودکار بازشناسی گفتار (ASR)، تنوعات موجود در بین گویند­ه­ها، کانال انتقال داده و محیط است که به علت وجود این تنوعات، کارایی این سامانه‌ها در شرایط کاربردی مختلف به شدت تغییر می‌کند. مقاوم سازی سیستم­های بازشناسی جهت مقابله با این تغییرات از جمله مسائل حال حاضر در حوزه بازشناسی گفتار است. از جمله عواملی که باعث کاهش کارایی سیستم­ها می­شود، تمایز مشخصات صوتی آواهای یکسانِ تولید شده از گوینده­های مختلف است. یکی از عوامل اصلی این مشکل ناشی از تفاوت موجود در طول مجرای صوتی (VTL) بین گوینده­های مختلف می‌باشد. روش هنجارسازی طول مجرای صوتی (VTLN) از روش­های رایج برای رفع این مشکل است که در آن برای هر گوینده یک ضریب پیچش فرکانسی تعیین می­گردد. در این مقاله روش متداول تعیین ضریب پیچش با رویکرد مبتنی بر جستجو در یک سیستم بازشناسی گفتار پیوسته فارسی مبتنی بر مدل مخفی مارکوف معرفی و مشکلات محاسباتی استفاده از این روش شرح داده شده است. در نهایت روشی مبتنی بر رگرسیون خطی از روی امتیازِ محاسبه شده از مدلسازی تشخیص جنسیت جهت تخمین ضرایب پیچش پیشنهاد شده است که منجر به کاهش قابل ملاحظه هزینه محاسباتیِ روش مبتنی بر جستجو می­شود. علاوه بر این، نتایج آزمایشات بر روی دادگان آزمون گفتار تلفنی محاوره­ای، بیانگر بهبود 54/0 درصدی دقت تشخیص کلمه روش پیشنهادی نسبت به روش متداول مبتنی بر جستجو می­باشد. 

متن کامل [PDF 2918 kb]   (1822 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: مقالات پردازش گفتار
دریافت: 1393/4/9 | پذیرش: 1394/12/7 | انتشار: 1395/4/2 | انتشار الکترونیک: 1395/4/2

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA

ارسال پیام به نویسنده مسئول


بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.

کلیه حقوق این تارنما متعلق به فصل‌نامة علمی - پژوهشی پردازش علائم و داده‌ها است.