基于SVM的Android恶意代码检测研究

来源 :沈阳理工大学 | 被引量 : 6次 | 上传用户:xmzh369
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网大时代的到来,各种智能手机的发展非常迅猛,Android作为当前市场占有率最高的智能手机操作系统,其相应的应用程序也是数量惊人。而由于其开源的特性,导致应用程序开发的门槛降低,同时开发者拥有更大的自由开发空间,另外,一些应用市场对应用程序的审核不到位,因而产生了大量在Android架构下的恶意应用程序。在未来几年间,应用程序数量预计将爆炸式增长,恶意代码的对抗手段也越来越高。而与爆炸式发展的移动应用技术及层出不穷快速翻新的恶意攻击手段相比,传统的恶意代码检测技术反应略显滞后,常常在危害发生之后才研究出应对措施,而无法主动监测新的恶意代码。面对这些威胁,本课题设计了一种基于后验概率SVM的恶意代码分类模型,这是一种基于统计学的自动发掘数据规律的方法,能通过分析海量样本的统计规律建立判别模型,从而让攻击者难以掌握免杀的规律,同时具有较强的泛化能力,对新的未知应用有较强的检测能力。本模型目前已在安天实验室正式上线使用,为安全分析人员提供参考,实现智能化的查杀手段。本课题以SVM为技术基础,以恶意代码检测为目的,实现对恶意代码家族粒度的判别模型。本文的主要内容包括数据预处理、行为规则库的构建以及分类模型的训练三个过程。首先介绍了Android操作系统的基本架构,并分析了应用程序的构成,其中包括META-INF目录、res目录、Android Manifest.xml文件,并详细介绍了classes.dex文件的基本结构和特征提取方法。其次,通过实验对比了信息增益、卡方统计量、文档频率三种特征选择算法,发现信息增益的效果最好。本模型选择信息增益值前5000名的特征项,通过TF-IDF计算这5000个特征项的权值,并构建特征字典,通过特征字典,可将任一APK的classes.dex文件映射为数值型特征向量。最后针对85个活跃家族样本,基于后验概率的SVM模型构建了85个二分类模型,并根据应用场景增加了阈值调控模块。另外,为提高模型的可靠性,分别利用样本的权限和行为信息的频繁项集构建了规则库。最后,投入真实场景使用,并根据第三方平台的反馈结果不断更新模型。本模型运行在Linux服务器上,全过程使用Python编写。实验结果验证了本模型的有效性,目前已正式部署在安天实验室,供安全分析人员使用。
其他文献
随着嵌入式技术、网络技术和多媒体技术的迅速发展,视频监控系统以其直观、准确、及时和信息内容丰富而广泛应用于公安、金融、交通、能源、通信等关键领域。人们对视频监控的
藻类浮游生物是海洋中重要的初级生产者,是海洋动物直接或间接的饵料。此外,藻类浮游生物还能富集污染物质,所以研究藻类浮游生物在海洋渔业以及海洋环境保护等方面具有重大
人脸自动识别系统是目前生物识别领域的热门研究课题,其关键技术之一是人脸检测。随着模式识别和计算机视觉的发展,如何有效利用色彩信息提高人脸检测成为研究重点。本文针对
随着陆上射频无线传感器网络研究的飞速发展和海洋实时监测应用需求的日益增加,作为陆上射频无线传感器网络向海洋发展的水下无线传感器网络成为当前海洋实时监测领域的研究
移动卫星通信系统(“动中通”系统)可以满足载体在任何时间、任何地点、任何情况下通信的需求,基于三轴自主跟踪平台的设计是“动中通”系统的核心技术,其可以隔离载体在运动过
随着现代社会生产力的不断发展,人们关于导航服务的需求越来越多元化,单独依赖卫星导航系统不足以应对现代社会日益增长的导航定位服务需求的局面。区域导航系统作为无线电导
变配电设计是建筑电气工程设计中的重要环节,其设计通常是使用AutoCAD等辅助绘图工具完成的。然而建筑物变配电工程的设计目前还停留在使用辅助绘图技术进行单纯绘图或解决某
随着军用技术和现代工业技术发展,航天、航海和车辆导航对导航精度的要求要来越高。本文主要分析了地磁辅助下的捷联惯性导航系统(SINS)和全球定位系统(GPS)的组合导航,该组
基于机器学习的图像检索技术,一直都是机器视觉领域里研究的热门技术。应用该技术的关键和难点在于:图像特征的有效选择与提取,如何综合利用特征数据实现图像检索等。传统图
二维不规则排样是一个典型的平面优化布局问题,母板和样片为平面不规则形状的多边形,其目标是在母板上寻求一个合理的样片布局方案,使母板的利用率最大。需要满足的约束条件为:样