دوره 7، شماره 2 - ( 12-1389 )                   جلد 7 شماره 2 صفحات 84-69 | برگشت به فهرست نسخه ها

XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Design and Evaluation of a Persian TTS system using prosodically-sensitive concatenative units. JSDP 2011; 7 (2) :69-84
URL: http://jsdp.rcisp.ac.ir/article-1-715-fa.html
صادقی وحید. طراحی و ارزیابی یک مدل بازسازی گفتار به روش هم‌گذاری واحدهای حساس به بافت نوایی. پردازش علائم و داده‌ها. 1389; 7 (2) :69-84

URL: http://jsdp.rcisp.ac.ir/article-1-715-fa.html


چکیده:   (3063 مشاهده)

 در این مقاله، سه گونه گفتاری متفاوت از کلماتی یکسان از طریق هم گذاری هجاها به سه روش متفاوت بازسازی شدند. در روش اول، کلمات از طریق هم گذاری هجاهای حساس به بافت نوایی بدون پردازش فرکانس پایه و دیرش هجاها ساخته شدند. در روش دوم، ابتدا کلمات با هجاهای غیرنوایی هم گذاری شدند و سپس هجاهای درون کلمات هم گذاری شده با توجه به جایگاه نوایی کلمات در سطح جمله در حوزه فرکانس پایه و دیرش پردازش شدند. در روش سوم، کلمات بدون هر گونه پردازش نوایی از طریق هم گذاری هجاهای غیرنوایی ساخته شدند. کلمات بازسازی شده سپس در جایگاه های نوایی آغاز و پایان IP، AP و PW در درون سه جمله حامل قرار داده شده و پس از تولید در یک آزمون ادراکی به آزمودنی ها ارائه شدند. نتایج آزمون ادراکی نشان داد که کیفیت گفتار بازسازی شده نوع اول و دوم در تمامی جایگاه های نوایی به طور معنی داری از نوع سوم طبیعی تر است. همچنین بر اساس نتایج به دست آمده کیفیت گونه های گفتاری نوع اول و دوم در حد "طبیعی" است ولی میزان طبیعی بودن گونه گفتاری نوع اول در تمامی جایگاه ها از نوع دوم بیشتر است و این تفاوت در بعضی از جایگاه ها معنی دار است. این نتایج نشان می دهد واحدهای بازسازی حساس به بافت نوایی، کیفیت گفتار بازسازی شده را تا حد قابل قبولی بهبود می بخشد.

متن کامل [PDF 8159 kb]   (890 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: مقالات پردازش گفتار
دریافت: 1389/12/20 | پذیرش: 1396/11/30 | انتشار: 1396/11/30 | انتشار الکترونیک: 1396/11/30

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA

ارسال پیام به نویسنده مسئول


بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.

کلیه حقوق این تارنما متعلق به فصل‌نامة علمی - پژوهشی پردازش علائم و داده‌ها است.