TY - JOUR T1 - TT - پایه‌گذاری بستری نو و کارآمد در حوزه بازشناسی گفتار فارسی JF - jsdp JO - jsdp VL - 13 IS - 3 UR - http://jsdp.rcisp.ac.ir/article-1-348-fa.html Y1 - 2016 SP - 51 EP - 62 KW - Persian Continuous Speech Recognition KW - FarsDat Database KW - Kaldi Toolkit N2 - برخلاف پیشینۀ سی‌سالۀ پژوهش در حوزۀ بازشناسی گفتار فارسی در ایران و دست‌یافتن به پیشرفت‌های در خور توجه، نتایج عمده کارهای انجام‌شده به‌دلیل عدم وجود بستر یکسان، قابل مقایسه و ارزیابی دقیق نیستند. بستر بیش‌تر شامل سامانۀ بازشناسی و دادگان با تعریف مشخص مجموعه‌های آموزش، توسعه و ارزیابی است. سامانۀ متن‌باز کلدی با وجود نوظهور‌بودن آن ویژگی‌های منحصر‌به‌فردی دارد که در سال‌های اخیر مورد توجه اکثر آزمایشگاه‌های تراز نخست پردازش گفتار دنیا قرار گرفته است و با لحاظ همه جوانب، بهترین انتخاب موجود در راستای پایه‌گذاری این بستر برای تمامی زبان‌ها از جمله زبان فارسی است. در این مقاله پس از بررسی خصوصیات، توانمندی‌ها و اجزای مختلف نرم‌افراز کلدی؛ دادگان فارس‌دات را به‌دلیل ثبت رسمی و قابل دسترس‌بودن آن برای همگان از سراسر دنیا به‌عنوان بخش دیگر این بستر انتخاب کرده و به تأسی از انتخاب انجام‌شده بر روی دادگان TIMIT به تعریف مجموعه‌های آموزش، توسعه و ارزیابی می‌پردازیم. در‌نهایت بیش‌تر قریب به اتفاق تکنیک‌ها و روش‌های موجود در کلدی بر روی دادگان فارس‌دات، مطابق تعریف صورت گرفته، مورد آزمایش قرار گرفته‌اند. بهترین میزان خطای حاصل در بازشناسی واج برای مجموعه توسعه 3/20 درصد و برای مجموعه آزمون 8/19 بوده است. دسترسی به کدهای نوشته در جهت فراهم‌سازی این بستر، در نرم‌افزار کلدی موجود است که با توجه به متن‌باز‌بودن آن، دسترسی به آنها به‌منظور بازسازی نتایج آمده در این مقاله در‌صورت در‌اختیارداشتن دادگان فارس‌دات به‌راحتی قابل انجام است. M3 10.18869/acadpub.jsdp.13.3.51 ER -