<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Signal and Data Processing</title>
<title_fa>پردازش علائم و داده‌ها</title_fa>
<short_title>JSDP</short_title>
<subject>Engineering &amp; Technology</subject>
<web_url>http://jsdp.rcisp.ac.ir</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>2538-4201</journal_id_issn>
<journal_id_issn_online>2538-421X</journal_id_issn_online>
<journal_id_pii></journal_id_pii>
<journal_id_doi>10.66224/jsdp</journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid>1</journal_id_sid>
<journal_id_nlai>8888</journal_id_nlai>
<journal_id_science></journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1398</year>
	<month>2</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2019</year>
	<month>5</month>
	<day>1</day>
</pubdate>
<volume>16</volume>
<number>1</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>تشخیص جنسیت نویسندگان از روی متون با استفاده از جنگل تصادفی بیز</title_fa>
	<title>Author gender identification from text using Bayesian Random Forest </title>
	<subject_fa>مقالات پردازش متن </subject_fa>
	<subject>Paper</subject>
	<content_type_fa>پژوهشي</content_type_fa>
	<content_type>Research</content_type>
	<abstract_fa>&lt;p style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;color:black;&quot;&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;امروزه استفاده زیاد کاربران از محیط&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&#8204;های مجازی و ارتباط آنها از طریق شبکه&#8204;های اجتماعی مانند فیسبوک و توییتر لزوم بررسی مطالب موجود را در فضای مجازی بیشتر از گذشته کرده است. از آنجا که بالاترین میزان تبادل اطلاعات در فضای مجازی از طریق متن صورت می&#8204;گیرد؛ لذا تشخیص هویت کاربران از نظر سن، جنس، عقاید مذهبی و سیاسی از روی متن&#8204;های اینترنت، پراهمیت خواهد بود. مسأله تشخیص جنسیت در حوزه&#8204;های امنیت و بازاریابی، می&#8204;تواند مؤثر واقع شود. در مقاله حاضر به تشخیص جنسیت نویسندگان مطالب بلاگ&#8204;ها پرداخته می&#8204;شود&lt;/span&gt; &lt;span style=&quot;font-family:b nazanin;&quot;&gt;و جهت تشخیص جنسیت نویسنده، ویژگی&#8204;های نحوی، مبتنی بر واژه، مبتنی بر حروف و واژگان گرامری مورد استفاده قرار می&#8204;گیرند. به&#8204;علاوه نتایج نشان می&#8204;دهد که استفاده از ویژگی&#8204;های &lt;/span&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-size:8.0pt;&quot;&gt;-n&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;گرمی&lt;/span&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt; حروف در بهبود عملکرد، بسیار مؤثر است. جهت انجام عمل دسته&#8204;بندی روش جدیدی با عنوان جنگل تصادفی بیز ارائه می&#8204;شود. نتایج آزمایش&#8204;ها نشان می&amp;shy;دهد که این روش در مقایسه با الگوریتم&#8204;هایی مانند الگوریتم بیز ساده، درخت بیز ساده و جنگل تصادفی، نتایج بهتری ارائه داده و دقت دسته&#8204;بندی را تا 5/89 % افزایش داده است. &lt;/span&gt;&lt;br&gt;
&amp;nbsp;&lt;/p&gt;
</abstract_fa>
	<abstract>&lt;p style=&quot;text-align: justify;&quot;&gt;Nowadays high usage of users from virtual environments and their connection via social networks like Facebook, Instagram, and Twitter shows the necessity of finding out shared subjects in this environment more than before. There are several applications that benefit from reliable methods for inferring age and gender of users in social media. Such applications exist across a wide area of fields, from personalized advertising to law enforcement of reputation management. Text posts represent a large portion of user generated content, and contain information which can be relevant to discovering undisclosed user attributes, or investigating the honesty of self-reported age and gender. Because the highest rate of information exchanges is in text format, author identification from the aspects like age, gender, political and religious opinions from these contents will seem more considerable. Gender identification&amp;nbsp; that could be useful in security and marketing&lt;s&gt;,&lt;/s&gt; also answers the following question: given a short text document, can we identify if the author is a male or a female?&amp;nbsp; This question is motivated by recent events where people faked their gender on the Internet. In this paper, author gender identification in blog&amp;rsquo;s data is investigated. In this regard, four groups of features include syntactic features, word-based features, character-based features, and function words are employed. In addition, character n-gram features is used for improving the accuracy of classification. For evaluation of the proposed method, 3212 texts were collected from Technorati.com and blogger.com. Experimental results demonstrate that these types of features are practical. furthermore, a new classification method called &amp;quot;Bayesian Random Forest&amp;quot; is introduced. Each tree in Bayesian Random Forest&amp;nbsp; is a Bayes tree. The results of experiment show that this method attains noticeable results in comparison with other classification algorithms such as Na&amp;iuml;ve Bayes, Na&amp;iuml;ve Bayes Tree, and Random Forest and it increases accuracy of gender identification to 89.5%&lt;span dir=&quot;RTL&quot;&gt;.&lt;/span&gt;&lt;br&gt;
&amp;nbsp;&lt;/p&gt;
</abstract>
	<keyword_fa>تشخیص جنسیت نویسنده, جنگل تصادفی, درخت بیز ساده, متن‌کاوی, دسته‌بندی</keyword_fa>
	<keyword>Author gender identification, Random Forest, NBTree, Text mining, Classification</keyword>
	<start_page>143</start_page>
	<end_page>157</end_page>
	<web_url>http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-827-7&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>Hedieh</first_name>
	<middle_name></middle_name>
	<last_name>Sajedi</last_name>
	<suffix></suffix>
	<first_name_fa>هدیه</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>ساجدی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>hhsajedi@ut.ac.ir</email>
	<code>10031947532846007515</code>
	<orcid>10031947532846007515</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation>University of Tehran</affiliation>
	<affiliation_fa>دانشگاه تهران</affiliation_fa>
	 </author>


	<author>
	<first_name>Mahnaz</first_name>
	<middle_name></middle_name>
	<last_name>Taslimi</last_name>
	<suffix></suffix>
	<first_name_fa>مهناز</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>تسلیمی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>mahnaz_taslimi@yahoo.com</email>
	<code>10031947532846007516</code>
	<orcid>10031947532846007516</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Azad Islamic University, Qazvin Branch</affiliation>
	<affiliation_fa>دانشگاه آزاد اسلامی، واحد قزوین</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
