基于多特征的Android恶意软件检测方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:xdh188
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前社会智能手机越来越成为生活中重要的一部分,当前智能手机给人们带来很多便利,在人们的生产生活中知道不可忽视的作用。在众多的智能手机中,基于Android平台的手机目前占据着主要的市场份额。Android应用下载的来源非常丰富,不管是官方还是其他手机厂商都提供了下载渠道,同时也有很多非法的下载渠道,使得APK的安全性得不到保障。大量的恶意软件的出现给Android手机用户的财产和隐私带来了威胁,并且大部分的用户没有安全意识,更给了恶意软件可乘之机。针对Android恶意软件泛滥的问题,本文提出一种可行的检测方法。首先,本文通过对Android系统和APK文件结构的研究,针对Android恶意软件检测的需要,提出一种基于permission名称,intent_filter中的action名称,intent_filter中的category名称和*.so文件名称的特征组合方式。本文收集2,000个良性样本和2,050个恶意样本。通过反编译样本文件提取特征,并以此为依据构建样本矩阵。其次,通过对国内外Android恶意软件检测的研究现状进行分析,提出一种特征筛选方法,该方法使用卡方检验法和ExtraTrees算法结合(CE特征筛选法)对样本矩阵进行特征筛选。先使用卡方检验法,计算每个特征的得分,对和类别相关的特征性比较弱的特征进行删除,保留相关性强的特征。再在新的样本矩阵上建立ExtraTrees实现对特征重要性的排序,保留重要性高的特征,以此得到最佳特征集合得到最终样本矩阵。然后,使用AdaBoost算法和GBDT算法对筛选后的样本矩阵进行分类。本文先研究并测试了五种Boosting算法(包括Adaboost、GBDT、Xgboost、LightGBM、CatBoost),尤其是最新的两种GBDT算法实现——LightGBM和CatBoost。并且根据这五种算法在准确度、恶意样本命中率、精度、召回率以及F1度量方面的表现,筛选出3个表现较好的算法(本文选出的算法是Adaboost、Xgboost和CatBoost),并且这三个算法调参后的结果使用Voting模型进行加权投票,进一步提高分类效果。最后,通过进一步实验,验证了CE特征筛选法可以有效缩短特征筛选时间,并且可以保证在和保存算法分类结果准确度的前提下大大减少特征维度,并以此缩短分类算法训练和预测的时间。同时本文也验证了在本文提出的融合方法在提高分类效果方法的有效性。最后的分类结果(本文提出的特征组合+CE特征筛选法+Boosting_Voting模型)的准确度达到97.33%,恶意样本的命中率达到98.73%。
其他文献
目的:探讨急性乙醇中毒对大鼠创伤性脑损伤( TBI)后血清及脑组织神经胶质纤维酸性蛋白(GFAP)、水通道蛋白4(AQP4)表达的影响,并分析其分子生物学机制。方法将45只大鼠按体质量随机分
《山海经》是一部有图有文的经典,本文以明、清十种《山海经》图 本中的山神图像为例,展示《山经》中各类山神的形貌、职能、神 格与祭祀,以探讨原始山神的神格、特征与初民的山
本文试着从中共党员以个人身份加入国民党这一历史事件为切入点,对其进行历史追溯与考察,试图从中探讨出一些可以启发我们当代开展统一战线工作的成功经验与先进做法。
目的:探讨CYP1A1与GSTM1基因多态与支气管肺癌癌变的关系。方法:采用回顾性“病例-对照”方法和PCR-RFLP技术,对98例肺癌患者和136名体检健康者(对照组)进行CYP1A1与GSTM1基因多态
智能手机是现代人类生活中不可分割的重要组成部分,为用户的生活带来极大的便利。智能手机为用户提供的各种功能是依托于手机上安装的各类应用程序实现的,因此应用程序市场随着智能手机的发展也获得了很大的繁荣。作为用户的重要私人物品,手机中或多或少都存有诸如照片、视频、短信、联系人数据等用户隐私相关信息,故手机中的用户隐私安全问题一直以来受到很大的关注。Android系统对应用程序权限划定了级别,将涉及用户隐
选取市场上废弃的甘蔗渣为原料,通过改性制得生物质吸附剂,以活性染料废水为处理对象,考察改性前后的吸附效果以及吸附剂投加量、pH、温度、时间等对吸附效果的影响。结果表明,改
分析了MFT跳闸继电器得电和失电动作的优缺点,提出了继电器失电改造方案,改造后进行了MFT保护试验,试验结果表明MFT功能正常,继电器正常动作。
随着计算机硬件计算能力的增强,深度学习与神经网络在目前的工业界已经得到了广泛的应用,相比于传统机器学习,它具备拟合能力强等优点,也有着不可解释,训练效率低等缺点,我们
目的:探讨CYP1A1基因多态与支气管肺癌癌变关系.方法:采用病例-对照设计和PCR-RFLP方法,检测肺癌组103例和对照组138例CYP1A1基因多态,以logistic回归模型计算比数比(odds ra
在体育教学中,准备活动是基本部分的前提,它的任务主要是提高学生大脑皮层的兴奋性,提高机体各器官系统的机能,使之尽快地进入工作状态,准备活动做得适宜,对于提高运动成绩、