TY - JOUR T1 - Author gender identification from text using Bayesian Random Forest TT - تشخیص جنسیت نویسندگان از روی متون با استفاده از جنگل تصادفی بیز JF - jsdp JO - jsdp VL - 16 IS - 1 UR - http://jsdp.rcisp.ac.ir/article-1-429-fa.html Y1 - 2019 SP - 143 EP - 157 KW - Author gender identification KW - Random Forest KW - NBTree KW - Text mining KW - Classification N2 - امروزه استفاده زیاد کاربران از محیط‌های مجازی و ارتباط آنها از طریق شبکه‌های اجتماعی مانند فیسبوک و توییتر لزوم بررسی مطالب موجود را در فضای مجازی بیشتر از گذشته کرده است. از آنجا که بالاترین میزان تبادل اطلاعات در فضای مجازی از طریق متن صورت می‌گیرد؛ لذا تشخیص هویت کاربران از نظر سن، جنس، عقاید مذهبی و سیاسی از روی متن‌های اینترنت، پراهمیت خواهد بود. مسأله تشخیص جنسیت در حوزه‌های امنیت و بازاریابی، می‌تواند مؤثر واقع شود. در مقاله حاضر به تشخیص جنسیت نویسندگان مطالب بلاگ‌ها پرداخته می‌شود و جهت تشخیص جنسیت نویسنده، ویژگی‌های نحوی، مبتنی بر واژه، مبتنی بر حروف و واژگان گرامری مورد استفاده قرار می‌گیرند. به‌علاوه نتایج نشان می‌دهد که استفاده از ویژگی‌های -nگرمی حروف در بهبود عملکرد، بسیار مؤثر است. جهت انجام عمل دسته‌بندی روش جدیدی با عنوان جنگل تصادفی بیز ارائه می‌شود. نتایج آزمایش‌ها نشان می­دهد که این روش در مقایسه با الگوریتم‌هایی مانند الگوریتم بیز ساده، درخت بیز ساده و جنگل تصادفی، نتایج بهتری ارائه داده و دقت دسته‌بندی را تا 5/89 % افزایش داده است. M3 10.29252/jsdp.16.1.143 ER -