<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Signal and Data Processing</title>
<title_fa>پردازش علائم و داده‌ها</title_fa>
<short_title>JSDP</short_title>
<subject>Engineering &amp; Technology</subject>
<web_url>http://jsdp.rcisp.ac.ir</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>2538-4201</journal_id_issn>
<journal_id_issn_online>2538-421X</journal_id_issn_online>
<journal_id_pii></journal_id_pii>
<journal_id_doi>10.61882/jsdp</journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid>1</journal_id_sid>
<journal_id_nlai>8888</journal_id_nlai>
<journal_id_science></journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1397</year>
	<month>12</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2019</year>
	<month>3</month>
	<day>1</day>
</pubdate>
<volume>15</volume>
<number>4</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>مدل جدیدی برای جستجوی عبارت بر اساس کمینه جابه‌جایی وزن‌دار</title_fa>
	<title>A novel model for phrase searching based-on Minimum Weighted Relocation Model</title>
	<subject_fa>مقالات پردازش متن </subject_fa>
	<subject>Paper</subject>
	<content_type_fa>بنیادی</content_type_fa>
	<content_type>بنیادی</content_type>
	<abstract_fa>&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-style:normal;&quot;&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;بر اساس پژوهش&amp;shy;های انجام&#8204;شده روی موتورهای جستجو،&#8204; بیش&amp;shy;تر پرس&#8204;وجوهای کاربران بیش از یک واژه است. برای پرس&#8204;وجوهای با بیش از یک واژه دو مدل می&#8204;توان ارائه داد. در مدل نخست فرض می&#8204;شود واژگان پرس&#8204;وجو مستقل از یکدیگر هستند و در مدل دوم محل و ترتیب واژگان وابسته فرض می&#8204;شود. آزمایش&#8204;ها نشان می&#8204;دهد که در بیش&amp;shy;تر پرس&#8204;وجوها بین واژگان وابستگی وجود دارد. یکی از پارامترهایی که می&#8204;تواند وابستگی بین واژگان پرس&#8204;وجو را مشخص کند، فاصلۀ بین واژگان پرس&#8204;وجو در سند است. در این مقاله تعریف جدیدی از فاصله بر اساس کمینه جابه&amp;shy;جایی وزن&#8204;دار&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;a href=&quot;#_ftn1&quot; name=&quot;_ftnref1&quot; title=&quot;&quot;&gt;&lt;span style=&quot;font-style:normal;&quot;&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt;[1]&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/a&gt;&lt;span style=&quot;font-style:normal;&quot;&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt; واژگان سند به&amp;shy;منظور تطبیق بر پرس&#8204;وجو ارائه می&#8204;شود. هم&#8204;چنین با توجه به این&#8204;که بیش&amp;shy;تر الگوریتم&#8204;های رتبه&#8204;بندی از فرکانس رخداد یک واژه در سند&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;a href=&quot;#_ftn2&quot; name=&quot;_ftnref2&quot; title=&quot;&quot;&gt;&lt;span style=&quot;font-style:normal;&quot;&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt;[2]&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/a&gt;&lt;span style=&quot;font-style:normal;&quot;&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt; برای امتیاز&#8204;دهی به اسناد استفاده می&#8204;کنند و برای پرس&#8204;وجو با بیش از یک واژه تعریف روشنی از این پارامتر وجود ندارد. در این مقاله پارامترهای &#8204;فرکانس رخداد یک عبارت&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;a href=&quot;#_ftn3&quot; name=&quot;_ftnref3&quot; title=&quot;&quot;&gt;&lt;span style=&quot;font-style:normal;&quot;&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt;[3]&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/a&gt;&lt;span style=&quot;font-style:normal;&quot;&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt; &amp;nbsp;و معکوس فرکانس سند&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;a href=&quot;#_ftn4&quot; name=&quot;_ftnref4&quot; title=&quot;&quot;&gt;&lt;span style=&quot;font-style:normal;&quot;&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt;[4]&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/a&gt;&lt;span style=&quot;font-style:normal;&quot;&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt; با توجه به مفهوم جدید فاصله تعریف&#8204;شده و الگوریتم&#8204;هایی برای محاسبه آن&#8204;ها ارائه شده است. همچنین نتایج الگوریتم پیشنهادی با چند الگوریتم مقایسه شده است که افزایش خوبی را در میانگین دقّت نشان می&#8204;دهد.&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span dir=&quot;LTR&quot; style=&quot;font-style:normal;&quot;&gt;&lt;span style=&quot;font-family:times new roman bold,serif;&quot;&gt;&lt;span style=&quot;font-size:8.0pt;&quot;&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;

&lt;div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;/div&gt;
&lt;hr align=&quot;left&quot; size=&quot;1&quot; width=&quot;33%&quot; &gt;
&lt;div id=&quot;ftn1&quot; style=&quot;text-align: justify;&quot;&gt;&lt;a href=&quot;#_ftnref1&quot; name=&quot;_ftn1&quot; title=&quot;&quot;&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt;[1]&lt;/span&gt;&lt;/span&gt;&lt;/a&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt; MWRM&lt;span dir=&quot;RTL&quot;&gt;&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;

&lt;div id=&quot;ftn2&quot; style=&quot;text-align: justify;&quot;&gt;&lt;a href=&quot;#_ftnref2&quot; name=&quot;_ftn2&quot; title=&quot;&quot;&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt;[2]&lt;/span&gt;&lt;/span&gt;&lt;/a&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt; Term Frequency&lt;/span&gt;&lt;br&gt;
&amp;nbsp;&lt;/div&gt;

&lt;div id=&quot;ftn3&quot; style=&quot;text-align: justify;&quot;&gt;&lt;a href=&quot;#_ftnref3&quot; name=&quot;_ftn3&quot; title=&quot;&quot;&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt;[3]&lt;/span&gt;&lt;/span&gt;&lt;/a&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt; Phrase Frequency&lt;/span&gt;&lt;/div&gt;

&lt;div id=&quot;ftn4&quot; style=&quot;text-align: justify;&quot;&gt;&lt;a href=&quot;#_ftnref4&quot; name=&quot;_ftn4&quot; title=&quot;&quot;&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt;[4]&lt;/span&gt;&lt;/span&gt;&lt;/a&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt; Inverted Document Frequency&lt;/span&gt;&lt;/div&gt;
&lt;/div&gt;
</abstract_fa>
	<abstract>&lt;p style=&quot;text-align: justify;&quot;&gt;&lt;strong&gt;Finding high-quality web pages is one of the most important tasks of search engines. The relevance between the documents found and the query searched depends on the user observation and increases the complexity of ranking algorithms. The other issue is that users often explore just the first 10 to 20 results while millions of pages related to a query may exist. So search engines have to use suitable algorithms with high performance to find the most relevant pages.&lt;/strong&gt;&lt;strong&gt;&lt;span dir=&quot;RTL&quot;&gt;&lt;/span&gt;&lt;/strong&gt;&lt;br&gt;
&lt;strong&gt;The ranking section is an important part of search engines. Ranking is a process in which the web page quality is estimated by the search engine. There are two main methods for ranking web pages. In the first method, ranking is done based on the documents&amp;rsquo; content (traditional rankings). Models, such as Boolean model, probability model and vector space model are used to rank documents based on their contents. In the second method, based on the graph, web connections and the importance of web pages, ranking process is performed.&lt;/strong&gt;&lt;strong&gt;&lt;span dir=&quot;RTL&quot;&gt;&lt;/span&gt;&lt;/strong&gt;&lt;br&gt;
&lt;strong&gt;Based on researches on search engines, the majority of user queries is more than one term. For queries with more than one term, two&lt;/strong&gt;&lt;strong&gt; models can be used. The first model assumes that query terms are independent of each other while&lt;/strong&gt;&lt;strong&gt; the second model considers a location and order dependency between query terms. Experiments show that in the majority of queries there are dependencies between terms. One of the parameters that can specify dependencies between query terms is the distance between query terms in the document. In this paper, a new definition of distance based on Minimum Weighted Displacement Model (MWDM) of document terms to accommodate the query terms is presented. In the Minimum Weighted Displacement Model&lt;/strong&gt;&lt;strong&gt; (MWDM), we call the minimum number of words moving a text to match the query term by space.&lt;/strong&gt;&lt;strong&gt;&lt;span dir=&quot;RTL&quot;&gt;&lt;/span&gt;&lt;/strong&gt;&lt;br&gt;
&lt;strong&gt;In addition, because most of the ranking algorithms use the TF (Term Frequency) to score documents and for queries more than one term, there is no clear definition of these parameters; in this paper, according to the new distance concept, Phrase Frequency and Inverted Document Frequency are defined. Also, algorithms to calculate them are presented. The results of the proposed algorithm compared with multiple corresponding algorithms show&lt;s&gt;s&lt;/s&gt; a favorable increase in average precision.&lt;/strong&gt;&lt;br&gt;
&amp;nbsp;&lt;/p&gt;
</abstract>
	<keyword_fa>موتور جستجو, رتبه‌بندی, فاصله, وابستگی واژگان, فرکانس عبارت (PF)</keyword_fa>
	<keyword>Search engine, Ranking, Distance, Phrase Frequency</keyword>
	<start_page>71</start_page>
	<end_page>84</end_page>
	<web_url>http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-1330-1&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>javad</first_name>
	<middle_name></middle_name>
	<last_name>paksima</last_name>
	<suffix></suffix>
	<first_name_fa>جواد</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>پاک سیما</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>paksima@stu.yazd.ac.ir</email>
	<code>10031947532846007094</code>
	<orcid>10031947532846007094</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation>Payam Noor university</affiliation>
	<affiliation_fa>دانشگاه پیام‌نور یزد</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
