دوره 15، شماره 4 - ( 12-1397 )                   جلد 15 شماره 4 صفحات 71-84 | برگشت به فهرست نسخه ها

XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

paksima J. A novel model for phrase searching based-on Minimum Weighted Relocation Model. JSDP. 2019; 15 (4) :71-84
URL: http://jsdp.rcisp.ac.ir/article-1-670-fa.html
پاک سیما جواد. مدل جدیدی برای جستجوی عبارت بر اساس کمینه جابه‌جایی وزن‌دار. پردازش علائم و داده‌ها. 1397; 15 (4) :71-84

URL: http://jsdp.rcisp.ac.ir/article-1-670-fa.html


دانشگاه پیام‌نور یزد
چکیده:   (258 مشاهده)
بر اساس پژوهش­های انجام‌شده روی موتورهای جستجو،‌ بیش­تر پرس‌وجوهای کاربران بیش از یک واژه است. برای پرس‌وجوهای با بیش از یک واژه دو مدل می‌توان ارائه داد. در مدل نخست فرض می‌شود واژگان پرس‌وجو مستقل از یکدیگر هستند و در مدل دوم محل و ترتیب واژگان وابسته فرض می‌شود. آزمایش‌ها نشان می‌دهد که در بیش­تر پرس‌وجوها بین واژگان وابستگی وجود دارد. یکی از پارامترهایی که می‌تواند وابستگی بین واژگان پرس‌وجو را مشخص کند، فاصلۀ بین واژگان پرس‌وجو در سند است. در این مقاله تعریف جدیدی از فاصله بر اساس کمینه جابه­جایی وزن‌دار[1] واژگان سند به­منظور تطبیق بر پرس‌وجو ارائه می‌شود. هم‌چنین با توجه به این‌که بیش­تر الگوریتم‌های رتبه‌بندی از فرکانس رخداد یک واژه در سند[2] برای امتیاز‌دهی به اسناد استفاده می‌کنند و برای پرس‌وجو با بیش از یک واژه تعریف روشنی از این پارامتر وجود ندارد. در این مقاله پارامترهای ‌فرکانس رخداد یک عبارت[3]  و معکوس فرکانس سند[4] با توجه به مفهوم جدید فاصله تعریف‌شده و الگوریتم‌هایی برای محاسبه آن‌ها ارائه شده است. همچنین نتایج الگوریتم پیشنهادی با چند الگوریتم مقایسه شده است که افزایش خوبی را در میانگین دقّت نشان می‌دهد.

[1] MWRM
[2] Term Frequency
 
[3] Phrase Frequency
[4] Inverted Document Frequency
متن کامل [PDF 13146 kb]   (82 دریافت)    
نوع مطالعه: بنیادی | موضوع مقاله: مقالات پردازش متن
دریافت: ۱۳۹۶/۸/۲۵ | پذیرش: ۱۳۹۷/۱۰/۱۹ | انتشار: ۱۳۹۷/۱۲/۱۷ | انتشار الکترونیک: ۱۳۹۷/۱۲/۱۷

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA

ارسال پیام به نویسنده مسئول


کلیه حقوق این تارنما متعلق به فصل‌نامة علمی - پژوهشی پردازش علائم و داده‌ها است.