基于集成学习的Android恶意软件检测研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:wuan461618
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Android智能手机已经成为人们生活中不可或缺的一部分,但同时恶意软件的出现也给移动用户的隐私安全和财产安全带来了潜在威胁。为维护移动互联网安全给用户提供一个安全可靠的使用环境,学术界和产业界对恶意软件检测进行了深入研究并取得一系列优秀的成果。但是该领域目前仍还有一些工作需要进一步深入研究并予以解决,例如单一检测模型泛化性差和单一特征不能全面表征恶意软件特性以及覆盖率低。因此本文针对以上两个问题,对集成学习思想以及恶意软件表征进行了深入研究,并提出以下两种Android恶意软件检测方法。(1)基于权限的轻量级恶意软件集成检测方法。本文针对单一检测模型泛化性差的问题,首先采用自定义权限和官方权限组合表征恶意软件,其次在集成学习“好而不同”(单个基分类器具有较好的准确性且基分类器之间应该具有多样性)思想指导下,提出一种新的集成学习方法EDMDroid用于Android恶意软件检测。EDMDroid方法的核心是确保基分类器准确性的前提下扩大其多样性,即针对每个基分类器,首先采用随机特征子空间和自采样技术生成不同的子集,并对子集进行非负矩阵分解得到系数矩阵,进而将该子集与系数矩阵相乘构建多样化数据集,最终将多个基分类器(决策树)进行有机整合,从而避免单个基分类器可能陷入局部极小点等情况导致的泛化性差问题。在本文收集的近年来的恶意软件和良性软件所构建的数据集上,EDMDroid检测性能优于采用单一检测模型的方案。(2)基于多类型特征深度融合的恶意软件集成检测方法。针对单一特征表征性弱的问题,本文在EDMDroid的基础上进一步扩充数据样本,以保持所构建数据集的时效性和代表性,进而提取五种不同类型的静态特征,包括权限,四大组件,API,Hardware和Intent。基于集成学习的思想,本文从应用程序开发角度出发进行特征扰动,即依据五种特征之间信息传递和依赖关系进行浅关联关系的组合,以达到数据多样性的目的。为进一步学习组合特征中具有丰富语义的高层抽象特征,进而对这些代表性特征进行集成和融合以提升恶意软件检测准确性的目的,本文提出了GadNetDroid,该方法与恶意软件检测领域中一些基于单特征和多特征同类方案进行对比,实验结果表明该方法可提高检测准确率达0.37%~9%。
其他文献
程序性死亡受体(Programmed cell death protein 1,PD-1)及其配体(Programmed cell death protein ligand 1,PD-L1)的相互作用可以抑制T细胞活化并阻碍其分泌细胞因子,从而促进肿瘤细胞免疫逃逸、免疫抑制等现象的发生。因此,阻断PD-1/PD-L1相互作用已经成为治疗癌症的一种有效手段。目前上市的PD-1或PD-L1抑制剂均为单
学位
基于视频的人体行为识别是计算机视觉领域中的一项热门研究课题,具有重要的研究价值和广阔的应用市场。但是由于现实视频环境存在的信息干扰,以及人体行为的复杂性和多样性,研究人员不断追寻有效的特征表示以及高效、鲁棒的识别算法。对此,本文主要从密集轨迹和深度学习方面进行研究,主要研究内容如下。(1)提出基于密集轨迹算法改进的视频人体行为识别算法,由于传统轨迹算法采集密集的人体行为轨迹,提取出大量的特征描述符
学位
问答系统是自然语言处理中研究的热点问题。得益于使用海量训练数据和大规模量模型,Transformer成为了实现问答系统的重要方法。但Transformer的训练效率是当前急需解决的重要问题,此外Transformer编码器输入长度的限制也极大的影响了模型的准确性。为了解决这些挑战,本文研究面向问答系统的新型Transformer。首先,设计一种新型Transformer来减少训练时间开销。给出权重
学位
各向异性色散介质的吸波特性使其广泛应用于许多实际工程问题领域,特别是雷达隐身技术中吸波材料在现代高科技武器研制中的应用,使各向异性色散介质成为近年来国内外研究的热点之一。时域有限差分(FDTD)方法是处理各向异性色散介质的主要数值方法,处理过程中存在的主要困难在于计算过程中的卷积关系以及计算过程中的稳定性和准确性问题。本文针对这些问题,重点研究了一种精细计算的新型FDTD方法,即时域精细积分(PI
学位
随着第五代(Fifth Generation,5G)移动通信技术的快速发展,对于信息的高传输速率和低延时性能要求也越来越高。同时1G-4G移动通信发展占用了较多的低频段频谱资源,造成低频段拥挤,5G移动通信发展逐渐具有高频化的特点。因此具有极宽频谱资源的毫米波频段引起越来越多研究学者的关注,具有广阔的应用前景。同时,由于5G移动通信的高频率、宽频带,所需的PCB结构越来越精密和复杂,多层PCB结构
学位
特征选择是机器学习中关键的数据预处理技术,其主要目标是降低数据维数和提高学习性能,所以特征选择问题本质上是一个多目标优化问题,并且基于空间分解的多目标粒子群优化(MOPSO)是解决该问题的有效方法之一。然而,现有的很多基于空间分解MOPSO的特征选择方法仍存在一些问题:一方面,不平衡的选择压力会导致非支配特征子集的数量较少且围绕于Pareto前沿中心;另一方面,缺少对特征选择Pareto前沿高度离
学位
近年来,随着云虚拟现实(Virtual Reality,VR)技术快速发展,使得用户不需要在本地部署昂贵的PC用于VR应用的运行,解决了长久以来制约VR行业发展的难题,目前已经成为新一代信息技术发展的热点与焦点。由于云VR系统不仅需要在云端实现对应用场景进行渲染并保证用户间实时交互,同时还需存储海量的应用相关的数据信息,如模型数据及音频数据等,因此,如何对云VR环境下计算及存储资源进行有效的管理调
学位
目的:鼻咽癌(Nasopharyngeal carcinoma,NPC)是一种发生在鼻咽上表皮里的非淋巴瘤性鳞状细胞癌,在中国南方和东南亚是一种常见的肿瘤,其发病率目前仍在增加。由于70%以上的鼻咽癌病例是在疾病的局部晚期被诊断出来的,因此鼻咽癌患者的死亡率很高。尽管放疗和化疗作为主要治疗手段被广泛使用,但大约30-40%的病例最终会发生远处转移,这成为成功治疗的主要障碍。因此,迫切需要研究鼻咽癌
学位
肝素酶Ⅲ是一类可作用于糖胺聚糖的多糖裂解酶,可特异性切割连接葡萄糖胺和葡萄糖醛酸之间的β(1,4)糖苷键,从而降解肝素、硫酸软骨素A(chondroitin sulfate A,CS-A)等糖胺聚糖,产物主要为不饱和二糖。肝素酶Ⅲ的主要功能为生产低分子量肝素、肝素的结构解析以及消除体外循环中多余的肝素等。本课题筛选了两种不同细菌来源的肝素酶Ⅲ,构建重组表达载体,并在大肠杆菌中进行可溶性表达,优化表
学位
报纸