<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Signal and Data Processing</title>
<title_fa>پردازش علائم و داده‌ها</title_fa>
<short_title>JSDP</short_title>
<subject>Engineering &amp; Technology</subject>
<web_url>http://jsdp.rcisp.ac.ir</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>2538-4201</journal_id_issn>
<journal_id_issn_online>2538-421X</journal_id_issn_online>
<journal_id_pii></journal_id_pii>
<journal_id_doi>10.61882/jsdp</journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid>1</journal_id_sid>
<journal_id_nlai>8888</journal_id_nlai>
<journal_id_science></journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1389</year>
	<month>6</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2010</year>
	<month>9</month>
	<day>1</day>
</pubdate>
<volume>7</volume>
<number>1</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>شناسایی خودکار سبک موسیقی</title_fa>
	<title>Automatic Recognition of Music Genre</title>
	<subject_fa>مقالات پردازش گفتار </subject_fa>
	<subject>Paper</subject>
	<content_type_fa>پژوهشي</content_type_fa>
	<content_type>Research</content_type>
	<abstract_fa>&lt;a name=&quot;up&quot; style=&quot;color: rgb(0, 204, 0); font-family: tahoma; text-decoration: none; font-size: 12px; font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: 2; text-align: -webkit-center; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);&quot;&gt;&lt;/a&gt;

&lt;table border=&quot;0&quot; cellpadding=&quot;0&quot; cellspacing=&quot;0&quot; height=&quot;500&quot; width=&quot;900&quot;&gt;
	&lt;tbody&gt;
		&lt;tr&gt;
			&lt;td bgcolor=&quot;#ffffff&quot; dir=&quot;rtl&quot; style=&quot;color: rgb(0, 0, 0); font-family: tahoma, arial; font-size: 12px;&quot; valign=&quot;top&quot;&gt;
			&lt;table border=&quot;0&quot; cellpadding=&quot;0&quot; cellspacing=&quot;0&quot; width=&quot;100%&quot;&gt;
				&lt;tbody&gt;
					&lt;tr&gt;
						&lt;td style=&quot;color: rgb(0, 0, 0); font-family: tahoma, arial; font-size: 12px;&quot; valign=&quot;top&quot;&gt;
						&lt;table border=&quot;0&quot; cellpadding=&quot;0&quot; cellspacing=&quot;0&quot; dir=&quot;ltr&quot; height=&quot;500&quot; width=&quot;100%&quot;&gt;
							&lt;tbody&gt;
								&lt;tr&gt;
									&lt;td dir=&quot;rtl&quot; style=&quot;color: rgb(0, 0, 0); font-family: tahoma, arial; font-size: 12px;&quot; valign=&quot;top&quot;&gt;
									&lt;table border=&quot;0&quot; cellpadding=&quot;0&quot; cellspacing=&quot;5&quot; width=&quot;100%&quot;&gt;
										&lt;tbody&gt;
											&lt;tr&gt;
												&lt;td style=&quot;color: rgb(0, 0, 0); font-family: tahoma, arial; font-size: 12px;&quot;&gt;
												&lt;center&gt;
												&lt;center&gt;
												&lt;table border=&quot;0&quot; cellpadding=&quot;0&quot; cellspacing=&quot;0&quot; dir=&quot;ltr&quot; height=&quot;30&quot; width=&quot;100%&quot;&gt;
													&lt;tbody&gt;
														&lt;tr&gt;
															&lt;td bgcolor=&quot;#FFFFFF&quot; dir=&quot;rtl&quot; style=&quot;color: rgb(0, 0, 0); font-family: tahoma, arial; font-size: 12px;&quot;&gt;
															&lt;table border=&quot;0&quot; cellpadding=&quot;10&quot; cellspacing=&quot;0&quot; width=&quot;100%&quot;&gt;
																&lt;tbody&gt;
																	&lt;tr&gt;
																		&lt;td style=&quot;color: rgb(0, 0, 0); font-family: tahoma, arial; font-size: 12px;&quot;&gt;
																		&lt;p align=&quot;justify&quot; style=&quot;line-height: 18px;&quot;&gt;&lt;a name=&quot;up&quot; style=&quot;color: rgb(0, 204, 0); font-family: tahoma; text-decoration: none; font-size: 12px; font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: 2; text-align: -webkit-center; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255);&quot;&gt;در دهه اخیر به دلیل رشد سریع داده&#8204;های موسیقی که به صورت فایل&#8204;های صوتی در اینترنت و از طریق پایگاه داده&#8204;های بسیار بزرگ قابل دسترس هستند، توجه محققین به روش&#8204;های پردازش خودکار سیگنال های موسیقی بیشتر از گذشته شده است. شناسایی خودکار سبک موسیقی نیز به عنوان یکی از زمینه&#8204;های تحقیقی جذاب در این عرصه می&#8204;باشد. در این مقاله روش&#8204;های مختلفی برای استخراج ویژگی، انتخاب ویژگی و مدلسازی برای شناسایی خودکار 8 سبک موسیقی شامل سبک&#8204;های Celtic، Classic، Classic Piano، Jazz، Metal، Persian Classic، Relaxing و Dance که از آلبوم&#8204;هایی با نوازنده&#8204;های مختلف جمع&#8204;آوری شدند، پیاده&#8204;سازی و مورد ارزیابی قرار گرفت. از میان روش&#8204;های رایج استخراج ویژگی که در حوزه تشخیص گفتار، شناسایی آلت موسیقی و همچنین شناسایی سبک موسقی مورد استفاده قرار می&#8204;گیرند، انواع ویژگی&#8204;های کوتاه مدت، میان مدت و بلند مدت بررسی شده و از ویژگی&#8204;های بلند مدت به دلیل اینکه در تعیین سبک موسیقی کارآیی چندانی نداشتند، صرف نظر گردید. با استفاده از یک روش انتخاب ویژگی و مطالعه ترکیب&#8204;های مختلف ویژگی&#8204;ها، بردار ویژگی مناسب به دست آمد که نهایتا با استفاده از حدود 30 ویژگی برتر انتخاب شده از بین 122 ویژگی، به کارایی 90% در تشخیص سبک موسیقی دست یافتیم. مدلسازی سبک&#8204;های موسیقی با و بدون در نظر گرفتن توالی زمانی مورد ارزیابی قرار گرفت. از روش&#8204;های مدلسازی مانند شبکه&#8204;های عصبی، مدل مخلوط گاوسی، درخت تصمیم، ماشین بردار پشتیبان به تنهایی و نیز در یک ساختار سلسه&#8204;مراتبی که در آن شناسایی سبک موسیقی از کلاس&#8204;های با تعداد بیشتری سبک موسیقی شروع و به کلاس&#8204;های با تنها یک سبک موسیقی ختم می&#8204;گردد استفاده شد. کارایی بدست آمده با استفاده از این ساختار سلسه&#8204;مراتبی 88% و در حدود 2% از ساختار مسطح کمتر است، ضمن اینکه ساختار سلسله مراتبی برای تعیین سبک موسیقی در مواردی که با تعداد زیادی از سبک&#8204;های موسیقی مواجه هستیم بدلیل نیاز به استفاده از تعداد کمتری طبقه&#8204;بندی کننده در مرحله آزمایش، از سرعت بالاتری برخوردار است. علاوه بر این در یک ساختار سلسله&#8204;مراتبی دیگر، سعی شد که دسته&#8204;بندی کننده&#8204;ها به صورت ترکیب موازی مورد استفاده قرار گرفته و تصمیم&#8204;گیری بر اساس رای&#8204;گیری نسبت به نتیجه به دست آمده از دسته&#8204;بندی کننده&#8204;ها انجام شود.&lt;/a&gt;&lt;/p&gt;
																		&lt;/td&gt;
																	&lt;/tr&gt;
																&lt;/tbody&gt;
															&lt;/table&gt;
															&lt;/td&gt;
														&lt;/tr&gt;
													&lt;/tbody&gt;
												&lt;/table&gt;
												&lt;/center&gt;
												&lt;/center&gt;
												&lt;/td&gt;
											&lt;/tr&gt;
										&lt;/tbody&gt;
									&lt;/table&gt;
									&lt;/td&gt;
								&lt;/tr&gt;
							&lt;/tbody&gt;
						&lt;/table&gt;
						&lt;/td&gt;
					&lt;/tr&gt;
				&lt;/tbody&gt;
			&lt;/table&gt;
			&lt;/td&gt;
		&lt;/tr&gt;
	&lt;/tbody&gt;
&lt;/table&gt;
</abstract_fa>
	<abstract>&lt;a -webkit-text-stroke-width:=&quot;&quot; background-color:=&quot;&quot; font-size:=&quot;&quot; font-style:=&quot;&quot; font-variant-caps:=&quot;&quot; font-variant-ligatures:=&quot;&quot; font-weight:=&quot;&quot; letter-spacing:=&quot;&quot; name=&quot;up&quot; new=&quot;&quot; orphans:=&quot;&quot; style=&quot;color: rgb(0, 0, 0); font-family: &quot; text-align:=&quot;&quot; text-indent:=&quot;&quot; text-transform:=&quot;&quot; times=&quot;&quot; white-space:=&quot;&quot; widows:=&quot;&quot; word-spacing:=&quot;&quot;&gt;&lt;/a&gt;

&lt;table border=&quot;0&quot; cellpadding=&quot;0&quot; cellspacing=&quot;0&quot; height=&quot;500&quot; width=&quot;900&quot;&gt;
	&lt;tbody&gt;
		&lt;tr&gt;
			&lt;td bgcolor=&quot;#ffffff&quot; dir=&quot;rtl&quot; style=&quot;color: rgb(0, 0, 0); font-family: tahoma, arial; font-size: 12px;&quot; valign=&quot;top&quot;&gt;
			&lt;table border=&quot;0&quot; cellpadding=&quot;0&quot; cellspacing=&quot;0&quot; width=&quot;100%&quot;&gt;
				&lt;tbody&gt;
					&lt;tr&gt;
						&lt;td style=&quot;color: rgb(0, 0, 0); font-family: tahoma, arial; font-size: 12px;&quot; valign=&quot;top&quot;&gt;
						&lt;table border=&quot;0&quot; cellpadding=&quot;0&quot; cellspacing=&quot;0&quot; dir=&quot;ltr&quot; height=&quot;500&quot; width=&quot;100%&quot;&gt;
							&lt;tbody&gt;
								&lt;tr&gt;
									&lt;td dir=&quot;rtl&quot; style=&quot;color: rgb(0, 0, 0); font-family: tahoma, arial; font-size: 12px;&quot; valign=&quot;top&quot;&gt;
									&lt;table border=&quot;0&quot; cellpadding=&quot;0&quot; cellspacing=&quot;5&quot; width=&quot;100%&quot;&gt;
										&lt;tbody&gt;
											&lt;tr&gt;
												&lt;td style=&quot;color: rgb(0, 0, 0); font-family: tahoma, arial; font-size: 12px;&quot;&gt;
												&lt;center&gt;
												&lt;center&gt;
												&lt;table border=&quot;0&quot; cellpadding=&quot;0&quot; cellspacing=&quot;0&quot; dir=&quot;ltr&quot; height=&quot;30&quot; width=&quot;100%&quot;&gt;
													&lt;tbody&gt;
														&lt;tr&gt;
															&lt;td bgcolor=&quot;#FFFFFF&quot; dir=&quot;ltr&quot; style=&quot;color: rgb(0, 0, 0); font-family: tahoma, arial; font-size: 12px;&quot;&gt;
															&lt;table border=&quot;0&quot; cellpadding=&quot;10&quot; cellspacing=&quot;0&quot; width=&quot;100%&quot;&gt;
																&lt;tbody&gt;
																	&lt;tr&gt;
																		&lt;td style=&quot;color: rgb(0, 0, 0); font-family: tahoma, arial; font-size: 12px;&quot;&gt;
																		&lt;p align=&quot;justify&quot; style=&quot;line-height: 18px;&quot;&gt;&lt;a -webkit-text-stroke-width:=&quot;&quot; background-color:=&quot;&quot; font-size:=&quot;&quot; font-style:=&quot;&quot; font-variant-caps:=&quot;&quot; font-variant-ligatures:=&quot;&quot; font-weight:=&quot;&quot; letter-spacing:=&quot;&quot; name=&quot;up&quot; new=&quot;&quot; orphans:=&quot;&quot; style=&quot;color: rgb(0, 0, 0); font-family: &quot; text-align:=&quot;&quot; text-indent:=&quot;&quot; text-transform:=&quot;&quot; times=&quot;&quot; white-space:=&quot;&quot; widows:=&quot;&quot; word-spacing:=&quot;&quot;&gt;Nowadays, automatic analysis of music signals has gained a considerable importance due to the growing amount of music data found on the Web. Music genre classification is one of the interesting research areas in music information retrieval systems. In this paper several techniques were implemented and evaluated for music genre classification including feature extraction, feature selection and music genre modeling on a database of 8 different music genres containing Celtic, Classic, Classic Piano, Jazz, Metal, Persian Classic, Relaxing and Dance music. This database was gathered from several albums composed by different musicians. Short, middle and long term features were studied and finally only short and middle term features were used in our experiments. The long term features were discarded due to their low performance in music genre classification. Two modeling types of the music genres were evaluated. In the first type, only distribution of the feature vectors was used and in the second type, the ordering of the feature vectors was taken into account. Some modeling techniques such as ANN, GMM, Decision Tree and SVM were used individually and in a hierarchical approach. We proposed a taxonomy which classifies the music genres in a hierarchy where there are a small number of classes in the root and large number of classes in leaves. In fact, each class at the root of taxonomy contains one or more music genres and each genre is represented as a leaf at the bottom of the taxonomy. In addition, several classifiers were used simultaneously, in a way that each of them classifies the music genres individually. The decision is finally made using a voting algorithm. Besides, several short-term feature extraction techniques which have successfully been applied in speech recognition, music instrument classification and also music genre classification were studied and after analysis of the experimental results using statistical measures and different combinations of features, a near optimal feature vector was selected.&lt;/a&gt;&lt;/p&gt;

																		&lt;p&gt;&lt;/p&gt;
																		&amp;nbsp;

																		&lt;table border=&quot;0&quot; cellpadding=&quot;0&quot; cellspacing=&quot;0&quot; width=&quot;100%&quot;&gt;
																			&lt;tbody&gt;
																				&lt;tr&gt;
																				&lt;/tr&gt;
																			&lt;/tbody&gt;
																		&lt;/table&gt;
																		&lt;/td&gt;
																	&lt;/tr&gt;
																&lt;/tbody&gt;
															&lt;/table&gt;
															&lt;/td&gt;
														&lt;/tr&gt;
													&lt;/tbody&gt;
												&lt;/table&gt;
												&lt;/center&gt;
												&lt;/center&gt;
												&lt;/td&gt;
											&lt;/tr&gt;
										&lt;/tbody&gt;
									&lt;/table&gt;
									&lt;/td&gt;
								&lt;/tr&gt;
							&lt;/tbody&gt;
						&lt;/table&gt;
						&lt;/td&gt;
					&lt;/tr&gt;
				&lt;/tbody&gt;
			&lt;/table&gt;
			&lt;/td&gt;
		&lt;/tr&gt;
	&lt;/tbody&gt;
&lt;/table&gt;
</abstract>
	<keyword_fa>شناسایی سبک موسیقی, ویژگی طیفی, کنتراست طیفی مبتنی بر معیار اکتاو, شدت سیگنال مبتنی بر معیار اکتاو, ضرائب کسپترال مبتنی بر معیار مل, تجمیع ویژگی</keyword_fa>
	<keyword>Automatic recognition of music genre, spectral feature, octave base spectral contrast, octave based signal intensities, mel frequency cepstral coefficients, feature integration, hierarchical classification</keyword>
	<start_page>33</start_page>
	<end_page>52</end_page>
	<web_url>http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-31-2&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>Hamed</first_name>
	<middle_name></middle_name>
	<last_name>Habibi Aghdam</last_name>
	<suffix></suffix>
	<first_name_fa>حامد</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>حبیبی اقدم</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>habibiaghdam@aut.ac.ir</email>
	<code>10031947532846004312</code>
	<orcid>10031947532846004312</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation></affiliation>
	<affiliation_fa>دانشگاه صنعتی امیرکبیر</affiliation_fa>
	 </author>


	<author>
	<first_name></first_name>
	<middle_name></middle_name>
	<last_name></last_name>
	<suffix></suffix>
	<first_name_fa>محمد مهدی</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>همایون پور</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>homayoun@aut.ac.ir</email>
	<code>10031947532846004313</code>
	<orcid>10031947532846004313</orcid>
	<coreauthor>No</coreauthor>
	<affiliation></affiliation>
	<affiliation_fa>دانشگاه صنعتی امیرکبیر</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
