دوره 13، شماره 4 - ( 12-1395 )                   جلد 13 شماره 4 صفحات 62-43 | برگشت به فهرست نسخه ها


XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Vafaei Jahan M. Feature Extraction of Computer Files Structure by Statistical Analysis . JSDP 2017; 13 (4) :43-62
URL: http://jsdp.rcisp.ac.ir/article-1-141-fa.html
وفایی جهان مجید. استخراج ویژگی‌های ساختاری فایل‌های کامپیوتری مبتنی بر تحلیل و ارزیابی آماری. پردازش علائم و داده‌ها. 1395; 13 (4) :43-62

URL: http://jsdp.rcisp.ac.ir/article-1-141-fa.html


دانشگاه آزاد اسلامی مشهد
چکیده:   (6154 مشاهده)

فایل‌ها مهم‌ترین منبع ارائه اطلاعات به صورت‌های مختلف از قبیل متن، صوت، تصویر، صفحات وب و غیره هستند؛ تحلیل و آنالیز فایل‌ها به منظور شناخت و بررسی ویژگی‌ها و خصوصیات منحصربه‌فرد آن‌ها، یکی از مسائل بسیار مهم در زمینه حریم خصوصی، امنیت اطلاعات، شناسایی نوع فایل‌ها، تحلیل ساختاری کدها و غیره می‌باشد. در این مقاله با تحلیل و آنالیز آماری بر روی محتوای باینری فایل‌ها مبتنی بر مدل n-gram، ویژگی‌ها و خصوصیات مختلف یک فایل مورد بررسی قرار گرفته است. علاوه بر این به منظور کاهش حجم محاسبات و حافظه مورد نیاز مدل n-gram، از خوشه‌بندی لغات استفاده شده و محتوای هر فایل در دو حالت کامل و بلوک‌بندی شده مورد تجزیه و تحلیل قرار گرفته است. در حالت کامل ویژگی‌هایی همچون آنتروپی، فراوانی، TF-IDF، خود همبستگی و در حالت بلوکی، ویژگی‌هایی همچون نرخ آنتروپی، بعد فرکتال، فاصله و غیره بررسی شده است. نتایج بررسی‌ها نشان داده ویژگی‌های استخراج شده در روش اول به خوبی می‌توانند خصوصیات منحصر به فرد فایل‌های jpg، mp3، swf و html را منعکس نمایند. ویژگی‌های استخراج شده در روش دوم نیز به خوبی می‌توانند خصوصیات فایل‌های doc، html و pdf را منعکس نمایند.

متن کامل [PDF 4938 kb]   (1558 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: مقالات پردازش داده‌های رقمی
دریافت: 1392/4/12 | پذیرش: 1395/7/14 | انتشار: 1396/3/16 | انتشار الکترونیک: 1396/3/16

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA

ارسال پیام به نویسنده مسئول


بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.

کلیه حقوق این تارنما متعلق به فصل‌نامة علمی - پژوهشی پردازش علائم و داده‌ها است.