基于深度主动学习的安卓恶意软件分类方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:houlanqing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随移动网络的迅速发展,手机已经成为人们上网的主要设备,其中安卓操作系统占比超过80%,安卓应用数量已经突破300万。各类安卓应用不断增加的同时,恶意软件规模也逐渐扩大,对用户个人隐私和财产造成极大威胁。研究安卓恶意软件分类能够帮助安全人员针对各类恶意软件提出更有针对性的防御手段,对于保障用户财产安全,构建移动端生态安全有着积极的作用。与传统基于特征分析的恶意软件分类方法不同,基于图像化的恶意软件分类是将恶意软件以二进制形式转换为像素点并构成图像,使用深度学习模型实现恶意软件的图像分类,在提高分类精度的同时免去了复杂的特征选择步骤。将图像与深度学习相结合进行安卓恶意软件分类,相关人员已经开展了一系列研究,但现有方案仍然存在两方面不足:一是恶意软件图像化方案没有充分表征恶意软件行为特征,影响分类精度;二是深度学习算法的高分类精度往往依赖于大量有标注样本,但恶意软件的标注需要专业人员进行长时间分析,标注成本很高。本文围绕提高安卓恶意软件分类精度和减少人工标注成本两个方面,提出了新的恶意软件图像化方案与分类方法。针对现有安卓恶意软件图像化方案未能充分表征恶意软件行为特征,提出了多文件灰度图合成的安卓恶意软件RGB图像生成方法。考虑到生成的RGB图像可能存在大量与恶意行为无关的噪声,以及恶意软件分布不均衡从而影响分类精度的问题,引入深度残差收缩网络作为分类器模型,通过软阈值函数抑制无关噪声,设计了类平衡损失函数缓解恶意软件分布不均衡带来的影响。通过对比实验表明本文提出的安卓恶意软件分类方法可以有效提高分类精度。基于深度学习的分类方法往往需要大量标注数据,而安卓恶意样本标注成本高,标签难以获取。针对这一问题,本文提出了基于深度主动学习的安卓恶意软件分类方法。通过计算未标注样本的不确定度和去除冗余样本来选择高价值样本,只需对选择的高价值样本进行标注,将标注样本加入原训练集后通过微调的形式对模型不断更新,提高模型分类准确率。实验结果表明,相较于基于深度学习的分类方法,该方法能有效降低标注成本,只需要标注部分样本就能取得良好的分类效果。基于上述安卓恶意软件图像化方案和深度主动学习分类方法,设计并实现了安卓恶意软件检测系统,实现了文件处理、软件检测、样本标注和统计分析等模块,通过功能测试验证了系统的可用性。
其他文献
近年来,影像技术飞速发展,低动态范围(Low Dynamic Range,LDR)数字图像已经难以满足科研及摄影的需求,随着获取高动态范围(High Dynamic Range,HDR)图像的设备越来越普及,HDR图像因其颜色层次多、明暗信息丰富等优点,被越来越多的用于场景建模、医疗、国防、影视等领域。但目前主流的显示设备大多动态范围较低,无法直接显示高于其动态范围的图像,因此需要将HDR图像的动
学位
纳米光子学领域对于粒子的设计问题有两种思想:一是利用物理理论,首先通过物理建模计算某一粒子的光学响应,判断光学响应是否满足需求;二是通过光学响应逆向反演和设计粒子结构参数。反演过程常见的解决方法可分为迭代优化算法和机器学习方法,前者是将反演问题看作一个优化问题,即目标函数的最优化,需要大量的迭代计算;后者则是近年来解决反演问题更高效的方法。本文使用离散偶极近似理论(DDA)计算分析圆锥粒子产生的光
学位
随着科学技术的不断发展,颗粒材料尤其是超细粉体材料在科研及现代工业领域中发挥着越来越重要的作用,其中颗粒的很多物理化学特性与颗粒的平均粒度及粒度分布参数存在紧密联系,因此,如何快速准确的获取颗粒材料的粒径分布对于颗粒材料的广泛应用具有重要的意义。其中光散射粒径测量法由于具有非接触、反演速度快、反演精度高、可重复性好等优点而成为粒径测量中最广泛使用的方法之一。在实际工程测量中,我们通常采用Mie理论
学位
图像实时拼接技术是机器视觉以及数字图像处理领域内研究的重点课题之一,将两幅或多幅存在图像畸变和亮度差异的实时图像无拼接缝拼接成视觉效果良好的实时图像是研究人员目前追求的目标。近些年来,随着许多不同架构平台的出现与快速更新发展,实时图像拼接技术越来越得到广泛关注,实时图像拼接系统也在不断涌现。虽然近年来基于多种不同处理器架构的实时图像拼接系统不断出现和快速更新发展,但仍不能满足探测和搜救工作中对较高
学位
随着世界各国军事技术的发展,弹道导弹成为了战场上最具威胁的战术及战略打击手段,若能尽快对其进行跟踪监测和精准定位,将为防御方提供足够的时间快速反应并实施拦截。而空基红外探测作为弹道导弹预警体系的重要组成部分,具有机动性好、观测范围广以及具备近敌观测等优点,因此基于机载红外预警系统对导弹探测定位具有十分重要的研究意义。本文从几何成像角度分析了机载红外预警系统导弹定位精度的影响因素,重点考虑了机械抖动
学位
森林火灾作为全球性的重大灾害,每年都会发生,不但给生态环境造成了巨大的破坏,而且也对人类的生命与财产安全构成了极大的威胁,因此如何尽快发现火情并及时采取措施成为亟待解决的问题。随着数字图像处理技术的飞速发展,基于图像的目标检测技术在森林火灾检测中得到了越来越广泛的应用,如何快速实现火灾告警具有非常巨大的实际意义。针对该应用需求,本文对基于可见光图像、红外图像及双波段融合的火灾检测进行了深入的研究。
学位
大视场、高分辨率成像系统作为计算成像领域中的一个重要研究热点,在区域监控、卫星侦察、生命科学等领域的需求迫切。但是目前大多数成像系统由于光学基础理论的限制和实际应用场景的复杂性,很难实现理想的成像效果。与此同时,基于广域图像拼接的成像系统虽然实现了宽视场、高分辨率的成像目标的要求,但由于其系统的成像特点不同需要通过图像拼接来获得全景图像。因此,如何在保证处理速度的前提之下,实现广域成像系统多幅图像
学位
宽带可调谐的飞秒激光对多光子显微成像、非线性光谱学及半导体计量等领域有着重大意义。传统的飞秒激光器受增益介质荧光发射谱的限制,输出波段和调谐能力有限,远不能满足这些领域的需求。而利用飞秒激光器作为泵浦源,结合光参量技术可以突破这一限制,使激光器的输出波段延伸到深紫外或中红外。特别是以Yb全固态飞秒激光器泵浦的光参量振荡器(OPO),因其结构紧凑、调谐范围广、振荡阈值低、光束质量好、成本低廉,已然成
学位
雾天条件下,成像设备采集到的图像、视频都会发生一定程度的降质,导致图像中的目标信息模糊难以辨识,对成像设备在目标检测识别与跟踪、遥感观测等领域的应用产生不良影响,因此对数字图像去雾技术的研究具有重要意义。目前去雾算法的研究取得了较大的进展,但是现有算法对光晕效应以及白亮区域的色彩失真处理仍存在不足,并且算法的计算复杂度较高,极大地限制去雾算法的工程应用。随着现场可编程逻辑门阵列(Field Pro
学位
在人类获取信息的所有途径中,视觉方式最为直观,经由视觉获取的信息量也最多。计算机的发展带来进一步的信息革命,图像作为一种信息载体已经渗透于人类社会生活的方方面面。夜晚等光照不足的环境是不可避免的现实因素,在这种环境下获取的图像总是亮度、对比度、细节可见度低,且常常伴随着颜色失真等问题,限制了图像进一步的使用与研究。本文对多种低照度图像增强方法进行了原理研究,分析了各算法的优势与不足之处。在真实的低
学位