دوره 14، شماره 1 - ( 3-1396 )                   جلد 14 شماره 1 صفحات 134-111 | برگشت به فهرست نسخه ها


XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

reza S, kabudian J. A survey on spectral methods in spoken language identification. JSDP 2017; 14 (1) :111-134
URL: http://jsdp.rcisp.ac.ir/article-1-390-fa.html
رضا شقایق، کبودیان جهانشاه. مقایسه روش های طیفی برای شناسایی زبان گفتاری . پردازش علائم و داده‌ها. 1396; 14 (1) :111-134

URL: http://jsdp.rcisp.ac.ir/article-1-390-fa.html


پژوهشکده پردازش داده، پژوهشگاه توسعه فناوری‌های پیشرفته خواجه‌نصیرالدین طوسی
چکیده:   (6482 مشاهده)

 شناسایی خودکار زبان گفتاری به تشخیص زبان از روی سیگنال گفتار گفته می­شود. شناسایی زبان به‌طورمعمول به یکی از  دو دسته روش آوایی و طیفی انجام می­شود. در این مقاله، انواع روش­های مختلف طیفی برای بازشناسی زبان گفتاری معرفی شده و نتایج به‌کارگیری آنها بر روی یک مجموعه دادگان گفتاری تلفنی محاوره­ای مقایسه شده است. روش طیفی پایۀ شناسایی زبان، مدل مخلوط گوسی-مدل جهانی (GMM-UBM) است. برای بهبود مدل گوسی هر زبان از روش تمایزی MMI و برای مدل­کردن دینامیک زبان از مدل پنهان مارکوف ارگودیک (EHMM) استفاده می­شود. روش­های GSV-SVM و روش نشانه­گذار مبتنی بر GMM (GMM Tokenizer) نیز دو روش طیفی دیگر است که مورد بررسی قرار گرفته است. در این مقاله همچنین روش­های جدیدِ مدل­سازی تنوعات کانال و گوینده (تحلیل توأم عامل­ها (JFA) و بردار شناسایی (i-Vector)) به‌کار رفته و برای بهبود نتایج آن از چند روش­ جبران­سازی تنوعات استفاده شده است. علاوه‌براین برای سهولت تصمیم­گیری و کاهش خطای سامانۀ شناسایی زبان، از پس­پردازش امتیاز استفاده شده است. این مقاله بخشی از هفت سال پژوهش‌ در زمینه شناسایی زبان گفتاری در پژوهشگاه توسعه فناوری­های پیشرفته خواجه نصیرالدین طوسی است و تنها خلاصه­ای از روش­ها و نتایج به‌دست‌آمده در این مقاله آورده شده است.

متن کامل [PDF 9032 kb]   (1618 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: مقالات پردازش گفتار
دریافت: 1394/4/14 | پذیرش: 1395/8/8 | انتشار: 1396/4/27 | انتشار الکترونیک: 1396/4/27

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA

ارسال پیام به نویسنده مسئول


بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.

کلیه حقوق این تارنما متعلق به فصل‌نامة علمی - پژوهشی پردازش علائم و داده‌ها است.