基于协同训练的Android恶意软件检测方法的研究与实现

来源 :北京工业大学 | 被引量 : 2次 | 上传用户:netproxy_cisheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的高速发展,人们对智能设备的使用场景已经越来越多,其中以智能手机为主流的移动设备不仅为人们的生活添加了不少的娱乐性,也使人们在社交、出行、购物和阅读等方面更加便捷。Android系统由于其良好的操作界面和丰富的应用程序,自从发布以来便深受人们的青睐。但是,Android系统的安全问题也备受人们关注。自2010年,首个Android病毒Trojan-SMS被查到后,不同种类的Android恶意软件呈现出猛烈增长的状况。因此,针对Android恶意软件检测方法的研究是及其重要的。近年来,随着机器学习相关技术的不断发展,可以将机器学习的相关技术应用到Android恶意软件的检测方法中。但是,基于机器学习方法的Android恶意软件检测中存在一些潜在问题:第一,对于新出现的Android恶意软件,能搜集到的样本较少,使得分类器学习不充分导致分类准确率较低。第二,在传统的多视图协同训练方法中,通过两个充分冗余的视图训练出来两个分类器,在对一个未标记样本进行预测时,如果两个分类器的预测结果相反,同时置信度又相同的情况,该方案难以给出一个较为准确的结果。本文针对此两种情况,从以下三个方面提出了改进方案:第一,提出了使用Android应用软件的三种特征分别从不同的视图来描述该软件。通过对大量文献进行研究和实验,本文使用Android应用程序的权限申请特征、敏感API调用特征以及Dalvik OpCode特征分别构建三个视图从不同角度描述Android应用软件,并使用卡方检验方法过滤了一些与恶意软件弱相关性的权限。本文最终选取了120个常用的系统权限作为权限申请特征集合;33个敏感API调用序列构成API特征集合;包含了89条不同种类的Dalvik OpCode指令的OpCode特征集合。第二,提出了三个视图协同训练的检测方法。本文以Android应用软件的权限特征、API调用特征和OpCode特征分别建立三个子视图,针对不同子视图从支持向量机、朴素贝叶斯、K邻近、随机森林四个分类算法中分别甄选出最优的机器学习算法进行训练分类器。然后基于协同训练思想,利用单个分类器对未标记样本进行标记,把置信度最高的样本数据加入到另外两个分类器的训练集,以此达到三个分类器性能同步提升。第三,在对未知样本预测时,本文借鉴了集成学习策略,提出了通过三个分类器对未知样本的预测结果进行投票,以少数服从多数的思想得到最终结果。实验结果证明,本方案在单个视图分类最优的前提下,利用协同训练思想通过三个分类器进行协同训练后,各分类器的性能都有着明显的改善,表明本方案能够在已标记样本较少的情况下有效提升Android恶意软件的检测准确率。通过与传统的两视图协同分类对比实验结果显示,本方案可以在一定程度上弥补两视图协同分类方案因两个分类器预测结果相反,且置信度相等时难以给出准确结果的不足。
其他文献
伴随着中国经济的快速发展,人们物质生活的逐步提升,同时人们也越来越追求居住生活周边的生态景观环境。近年来由于中国政府大力推进高速铁路建设,1000公里以内的旅程,人们首
Zen Cart开源电子商务系统是在2003年从成熟的开源框架osCommerce的基础上开发出来的。由于其免费、界面友好和成熟性,及其对安装人员的专业知识要求不高,在世界上有广泛的应
在互联网飞速发展的今天,各种新型的网络应用层出不穷。人们对网络的服务质量(QoS)要求越来越高,要求网络传输时延更小,网络吞吐量更高等,而这些要求正与网络拥塞问题相矛盾
由于全球数据量的呈指数性增长,各大存储服务商担负着巨大的存储压力。分层存储已经成为同时实现高效访问和廉价存储的必要方案。但单一的分层存储系统面临着重复数据的问题,
目前我们已进入大数据时代,国内外各类计算机技术不断发展不断完善。计算机技术的兴起带动了大量传统行业、传统技术手段的变革。仅以公安部门的刑事侦查业务为例,目前通过侦
伴随着“乡村振兴”战略的提出,近年来村庄建设被提到前所未有的高度。通过对相关文献的梳理发现:针对乡村空间结构的研究多集中在东部、中部及西部较为发达地区,而对不发达地区特别是多民族聚集区研究较少。同仁县地处青藏高原和黄土高原的过渡地带,是一个以藏族为主的多民族聚集区,各民族村庄社会空间存在较大差异,同时乡村空间结构也出现诸多问题。因此,文章从社会空间视角出发,提出乡村空间结构优化策略成为研究的重点内
随着Internet技术的快速发展,众包服务作为一种灵活、有效的解决方式,开始受到人们越来越多的关注。最近几年,众包领域的各方面研究都取得了很大的进展,出现了许多采用众包手
目前关于非接触电能传输系统最大功率跟踪的研究存在着较少针对三阶补偿拓扑结构、跟踪过程容易陷入局部最优、最优点附近容易发生振荡及无法兼顾跟踪速度与精度等问题。针对以上问题,本文以基于轴式松耦合变压器的电磁感应式非接触电能传输系统为研究对象,构建三阶补偿拓扑结构并进行理论研究,提出一种易实现、变步长、高精度、防振荡的改进扰动观察法来对传输系统进行最大功率跟踪。首先,通过构建三阶补偿及松耦合变压器数学模
基于钴基巨磁阻抗(Giant Magneto Impedance,GMI)效应的磁传感器因其灵敏度高、响应速度快、功耗低、体积小、激励方式简单等优点,在地质资源勘探、地磁导航定位、无损探伤检
随着计算机技术的发展与电子办公的普及,大部分企业已经从以往的纸质办公转为了现在的电子化办公,纸质文档因保存不便、查找困难也逐渐退出使用,除了少数重要文件外,日常办公