<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Signal and Data Processing</title>
<title_fa>پردازش علائم و داده‌ها</title_fa>
<short_title>JSDP</short_title>
<subject>Engineering &amp; Technology</subject>
<web_url>http://jsdp.rcisp.ac.ir</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>2538-4201</journal_id_issn>
<journal_id_issn_online>2538-421X</journal_id_issn_online>
<journal_id_pii></journal_id_pii>
<journal_id_doi>10.61882/jsdp</journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid>1</journal_id_sid>
<journal_id_nlai>8888</journal_id_nlai>
<journal_id_science></journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1403</year>
	<month>3</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2024</year>
	<month>6</month>
	<day>1</day>
</pubdate>
<volume>21</volume>
<number>1</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>استخراج و ترکیب ویژگیهای کارآمد از توالی پروتئین به منظور دسته‌بندی پروتئین بر اساس جنگل چرخش</title_fa>
	<title>Extracting and combination efficient feature from protein sequence for classify protein based on rotation forest</title>
	<subject_fa>مقالات گروه علائم حیاتی ( مرتبط با مهندسی پزشکی)</subject_fa>
	<subject>Paper</subject>
	<content_type_fa>پژوهشي</content_type_fa>
	<content_type>Research</content_type>
	<abstract_fa>&lt;span style=&quot;font-size:8pt&quot;&gt;&lt;span style=&quot;direction:rtl&quot;&gt;&lt;span style=&quot;unicode-bidi:embed&quot;&gt;&lt;span new=&quot;&quot; roman=&quot;&quot; style=&quot;font-family:&quot; times=&quot;&quot;&gt;&lt;span style=&quot;font-weight:bold&quot;&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-size:16.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;چکیده&lt;/span&gt;&lt;/span&gt;&lt;span dir=&quot;LTR&quot; style=&quot;font-size:12.0pt&quot;&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;
&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-size:8pt&quot;&gt;&lt;span style=&quot;direction:rtl&quot;&gt;&lt;span style=&quot;unicode-bidi:embed&quot;&gt;&lt;span new=&quot;&quot; roman=&quot;&quot; style=&quot;font-family:&quot; times=&quot;&quot;&gt;&lt;b&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-size:10.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;پیش&#8204;&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;b&gt;&lt;span dir=&quot;LTR&quot; lang=&quot;FA&quot; style=&quot;font-size:10.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;&amp;lrm;&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;b&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-size:10.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;بینی عملکرد پروتئین یکی از چالش&#8204;های اصلی در بیوانفورماتیک می&#8204;باشد که کاربردهای زیادی دارد. در سال&amp;shy;های اخیر در تحقیقات بسیاری از روش&#8204;های یادگیری ماشین در این زمینه استفاده شده&#8204;اند. در این روش&#8204;ها ابتدا باید از توالی پروتئین ویژگی&#8204;های مختلف استخراج شود و بر اساس ویژگی&#8204;های استخراج شده عمل دسته&#8204;بندی انجام شود. غالبا روش&#8204;های استخراج ویژگی بر اساس خصوصیات فیزیکی و شیمایی توالی پروئتین می&#8204;باشد. بنابراین استخراج ویژگی&#8204;هایی مناسب از توالی پروتئین باعث افزایش و بهبود عملکرد روش&#8204;های یادگیری ماشین می&#8204;شود. در این مقاله، یک مجموعه جدید از ویژگی&amp;shy;ها بر اساس روش&amp;shy;های &lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;b&gt;&lt;span dir=&quot;LTR&quot; style=&quot;font-size:10.0pt&quot;&gt;PSSM&lt;/span&gt;&lt;/b&gt;&lt;b&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-size:10.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;،&amp;nbsp; &lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;b&gt;&lt;span dir=&quot;LTR&quot; style=&quot;font-size:10.0pt&quot;&gt;PsePSSM&lt;/span&gt;&lt;/b&gt;&lt;b&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-size:10.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;، &lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;b&gt;&lt;span dir=&quot;LTR&quot; style=&quot;font-size:10.0pt&quot;&gt;K-gram &lt;/span&gt;&lt;/b&gt;&lt;b&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-size:10.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;، &lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;b&gt;&lt;span dir=&quot;LTR&quot; style=&quot;font-size:10.0pt&quot;&gt;AAC&lt;/span&gt;&lt;/b&gt;&lt;b&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-size:10.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt; و روش نوین &lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;b&gt;&lt;span dir=&quot;LTR&quot; style=&quot;font-size:10.0pt&quot;&gt;TFCRF&lt;/span&gt;&lt;/b&gt;&lt;b&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt; که تا کنون در این کاربرد استفاده نشده برای استخراج ویژگی&#8204;های مناسب پیشنهاد شده است. ویژگی&#8204;های استخراج شده با استفاده از این روش قدرت تمایز کنندگی خوبی بین داده&#8204;ها در دسته&#8204;ها، به مدل&#8204;های یادگیری ماشین می&#8204;دهد. در روش &lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;b&gt;&lt;span dir=&quot;LTR&quot; style=&quot;font-size:10.0pt&quot;&gt;TFCRF&lt;/span&gt;&lt;/b&gt;&lt;b&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt; وزن&#8204;دهی ویژگی&#8204;ها علاوه بر توجه به چگونگی توزیع آنها در توالی&#8204;های مختلف به چگونگی توزیع آنها در طبقات مختلف نیز توجه می&#8204;شود. در مرحله بعد با استفاده از ویژگی&#8204;های استخراج شده با استفاده از روش جنگل چرخ عمل دسته&#8204;بندی انجام می&#8204;شود. روش پیشنهادی با دسته&#8204;بند&#8204;های مختلف و روش&#8204;های متفاوت مقایسه شده است. نتایج حاصل نشان دهنده کارایی مناسب روش پیشنهادی نسبت به سایر روش&#8204;های نوین در این کاربرد &amp;nbsp;می&#8204;باشد.&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;</abstract_fa>
	<abstract>&lt;span style=&quot;font-size:8pt&quot;&gt;&lt;span new=&quot;&quot; roman=&quot;&quot; style=&quot;font-family:&quot; times=&quot;&quot;&gt;&lt;span style=&quot;font-weight:bold&quot;&gt;&lt;span style=&quot;font-size:12.0pt&quot;&gt;Abstract&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;br&gt;
&lt;span style=&quot;font-size:8pt&quot;&gt;&lt;span style=&quot;unicode-bidi:embed&quot;&gt;&lt;span new=&quot;&quot; roman=&quot;&quot; style=&quot;font-family:&quot; times=&quot;&quot;&gt;&lt;b&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt;Protein function prediction is one of the main challenges in bioinformatics, which has many applications. In recent years, many researches in this field have been used machine learning methods. In these methods, First, different features should be extracted from the protein sequence and classification should be done based on the extracted features. The feature extraction methods are based on the physical and chemical properties of the protein sequence. Therefore, extracting suitable features from protein sequence increases and improves the performance of machine learning methods. In this paper, usage of a new set of features based on Position-Specific Scoring Matrix (PSSM), Pseudo-Position Specific Scoring Matrix (PsePSSM), K-gram, Amino Acid Composition (AAC) and the new Term Frequency and Category Relevancy Factor (TFCRF) method, which has not been used in this application so far, is proposed to extract suitable features.&lt;/span&gt;&lt;/b&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;br&gt;
&lt;span style=&quot;font-size:8pt&quot;&gt;&lt;span style=&quot;unicode-bidi:embed&quot;&gt;&lt;span new=&quot;&quot; roman=&quot;&quot; style=&quot;font-family:&quot; times=&quot;&quot;&gt;&lt;b&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt;In the PSSM method for protein BLAST searches, a scoring matrix is used, in which amino acid substitution scores are given separately for each position in a multi-sequence protein alignment. The PsePSSM feature is described by considering different ranking correlation factors along a protein sequenc to preserve information about the amino acid sequence. The normalized occurrence frequency of a certain number of amino acids in the protein is calculated by the ACC method. An K-gram is a set of K successive items in a protein that&amp;nbsp; include amino acid. &lt;/span&gt;&lt;/b&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;br&gt;
&lt;span style=&quot;font-size:8pt&quot;&gt;&lt;span new=&quot;&quot; roman=&quot;&quot; style=&quot;font-family:&quot; times=&quot;&quot;&gt;&lt;b&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt;In the TFCRF weighting method, in addition to paying attention to how these are distributed in different sequences, how these are distributed in different classes is also paid attention to.The features extracted using this method give machine learning models a good discriminating power between data in classes. In the next step, classification is done using the extracted features using the rotation forest method. This classifier is a successful ensemble method for a wide range of data mining applications. In this method, the feature space is changed through Principal Component Analysis (PCA), which increases the power of this classifier. The proposed method has been compared to different classifiers. The results show that the efficiency of the proposed method is much better than other state-of&amp;ndash;the-art methods in this application.&lt;/span&gt;&lt;/b&gt;&lt;/span&gt;&lt;/span&gt;</abstract>
	<keyword_fa>توالی پروتئین, استخراج ویژگی, TFCRF, جنگل چرخش, فاکتور ارتباط</keyword_fa>
	<keyword>Protein sequence, feature extraction, TFCRF,  rotation forest, relevancy factor</keyword>
	<start_page>15</start_page>
	<end_page>26</end_page>
	<web_url>http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-2451-1&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>jamshid</first_name>
	<middle_name></middle_name>
	<last_name>pirgazi</last_name>
	<suffix></suffix>
	<first_name_fa>جمشید</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>پیرگزی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>j.pirgazi@mazust.ac.ir</email>
	<code>100319475328460012793</code>
	<orcid>100319475328460012793</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Faculty of Electrical and Computer Engineering, University of Science and Technology of Mazandaran, Behshahr, Iran</affiliation>
	<affiliation_fa>دانشکده مهندسی برق و کامپیوتر، دانشگاه علم و فناوری مازندران، بهشهر، ایران</affiliation_fa>
	 </author>


	<author>
	<first_name>Ali</first_name>
	<middle_name></middle_name>
	<last_name>Ghanbari sorkhi</last_name>
	<suffix></suffix>
	<first_name_fa>علی</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>قنبری سرخی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>ali.ghanbari@mazust.ac.ir</email>
	<code>100319475328460012794</code>
	<orcid>100319475328460012794</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation>Faculty of Electrical and Computer Engineering, University of Science and Technology of Mazandaran, Behshahr, Iran</affiliation>
	<affiliation_fa>دانشکده مهندسی برق و کامپیوتر، دانشگاه علم و فناوری مازندران، بهشهر، ایران</affiliation_fa>
	 </author>


	<author>
	<first_name>majid</first_name>
	<middle_name></middle_name>
	<last_name>Iranpour Mobarakeh</last_name>
	<suffix></suffix>
	<first_name_fa>مجید</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>ایرانپور مبارکه</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>iranpour@pnu.ac.ir</email>
	<code>100319475328460012795</code>
	<orcid>100319475328460012795</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Department of Computer Engineering and IT, Payam Noor University, Tehran, Iran</affiliation>
	<affiliation_fa>استادیار، دانشکده مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه پیام نور، تهران، ایران</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
