دوره 20، شماره 4 - ( 12-1402 )                   جلد 20 شماره 4 صفحات 120-107 | برگشت به فهرست نسخه ها

XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

ForutanRad J, HourAli M, KeyvanRad M. Farsi Question and Answer Dataset (FarsiQuAD). JSDP 2024; 20 (4) : 7
URL: http://jsdp.rcisp.ac.ir/article-1-1337-fa.html
فروتن راد جواد، حورعلی مریم، کیوان راد محمدعلی. دادگان پرسش و پاسخ زبان فارسی. پردازش علائم و داده‌ها. 1402; 20 (4) :107-120

URL: http://jsdp.rcisp.ac.ir/article-1-1337-fa.html


دانشگاه صنعتی مالک اشتر
چکیده:   (64 مشاهده)
پاسخ سریع و دقیق به سؤالات مطرح شده به زبان طبیعی یکی اهداف مهم در توسعه سیستم‌های پرسش‌وپاسخ است که در آن رایانه یک متن و سؤال را درک می‌کند و پاسخ دقیق را برای کاربر ارائه می‌نماید. با اینکه پیشرفت‌های زیادی در این حوزه صورت‌گرفته است اما همچنان جزو مسائلی است که نیاز به ارتقا خصوصاً برای زبان‌های غیر از انگلیسی مثل زبان فارسی است. در این مقاله دادگان پرسش‌وپاسخ زبان فارسی (FarsiQuAD) تهیه شده که توسط انسان و از مقالات ویکی‌پدیای فارسی ایجاد گردیده و در دو نسخه منتشر شده است. نسخه 1 شامل  10000+ پرسش‌وپاسخ و نسخه 2 این شامل مجموعه بیش از 145000+ ردیف است. این دادگان قابلیت تجمیع با نسخه انگلیسی SQuAD و سایر دادگان زبان‌های دیگر که از این استاندارد استفاده کرده باشند را دارد و برای عموم منتشر شده است. این دادگان جهت ساخت مدل‌های هوش مصنوعی مبتی بر یادگیری عمیق و برای استفاده در سامانه‌های پرسش و پاسخ زبان فارسی است.  
نتایج این تحقیق نشان می‌دهد دادگان پرسش‌وپاسخ زبان فارسی ایجاد شده می‌تواند پاسخ به سؤالات مطرح شده به زبان طبیعی فارسی را با معیار تطابق دقیق 78 درصد و معیار F1 87 درصد برساند که هنوز نیازمند ارتقا است.  
 
شماره‌ی مقاله: 7
متن کامل [PDF 1290 kb]   (33 دریافت)    
نوع مطالعه: بنیادی | موضوع مقاله: مقالات پردازش متن
دریافت: 1401/6/10 | پذیرش: 1402/9/20 | انتشار: 1403/2/6 | انتشار الکترونیک: 1403/2/6

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA

ارسال پیام به نویسنده مسئول


بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.

کلیه حقوق این تارنما متعلق به فصل‌نامة علمی - پژوهشی پردازش علائم و داده‌ها است.