基于图像特征的Android恶意代码识别研究

来源 :武汉邮电科学研究院 | 被引量 : 0次 | 上传用户:lxlove584
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年移动互联网技术的广泛传播使得移动端应用程序的安全性也逐渐受到人们的重视,而Android系统作为时下流行的智能手机操作系统,它的安全性自然也受到大众广泛的关注。怎样能够高效快捷的实现恶意代码的检测识别成为保护用户信息安全的关键问题。本文主要针对Android恶意代码的图像特征的有效提取以及利用机器学习算法实现分类系统模型的设计做了深入研究,主要工作内容如下:1.本文提出将Android应用程序的APK安装包中二进制代码文件转化为对应的图像文件来提取出有效的图像特征信息。在二进制代码文件中,每个字节所对应的编码范围是从00到FF,刚好可以对应到灰度像素中的256个像素颜色等级。因此可以将应用程序划分为每个数据块,然后将数据块转化为对应的矩阵并按照上述规则映射为灰度图像。2.由于灰度图像的信息量有限,为了使得到的图像特征能够携带更多的有效信息,把二进制的代码文件转化为灰度向量后,接着将其映射到颜色通道中形成具有更加丰富的信息量的彩色图像。然后通过计算Android应用程序安装包中.dex代码文件的信息熵值,并将计算结果作为图像的透明度。实现对应的二进制代码到带有透明度的RGB图像信息的转换过程,最后通过卷积神经网络来完成对Android恶意代码的识别检测。3.为了实现对Android恶意程序所属的家族进行分类判断的目的,本文使用分析工具Flow Droid来对Android恶意程序进行分析处理,然后获取到应用程序中不同函数之间的调用关系,再将这些函数调用关系通过相应的算法进行降维操作得到能够反映出And roid应用程序中不同函数之间函数关系的二维图像信息,使恶意代码内部的结构特征更加清晰。类似的恶意代码家族通常具有类似的函数调用关系,依据此原理设计K近邻分类系统实现对二维函数关系调用图像进行分类识别,实现恶意代码归属类别判断。4.依据上述所提出的恶意代码识别和分类的方法,本文设计并进行了一系列的实验来进行验证。实验选择了共2600多个Android应用程序,其中包括来自40个不同恶意程序家族的1250个Android恶意应用程序和1400个非恶意应用程序。最后的实验结果表明,该系统能够有效地检测恶意程序,并能够识别其所属的恶意程序家族中的种类,精确度达到95.20%,实现了预期的实验目标。
其他文献
随着云计算的蓬勃发展和5G时代的到来,虚拟网络中虚拟机之间的数据通信越来越频繁,对数据流转发效率的需求也越来越高。本论文从当前虚拟网络转发技术出发,介绍了虚拟网络转发过程中常用组件的基本原理,提出了一种基于vDPA(vhost数据路径加速)技术的数据流转发优化方案。通过对优化前后的虚拟网络中数据流转发性能进行测试实验,可以看到虚拟机之间通信带宽值在原来的基础上提升了20%左右,基本达到了网卡直通技
随着SDN技术的不断普及以及发展应用,基于YANG模型进行业务配置的场景逐渐普及。为了适应技术发展需求并提高业务配置的灵活性,对YANG模型进行统一管理同时提供南向接口服务已经成为一种必然。命令行是一种通信设备与网管系统或用户终端之间信息交互的管理协议,一般使用命令行接口进行网络配置,并通过输入管理命令脚本实现配置的管理。很多传统的协议栈管理模型是基于命令行的,所以为了复用现有的命令行接口,统一管
随着互联网和人工智能的普及与发展,互联网已经成为万物互联的媒介,它为世界的发展提供了强劲的动力。对于互联网,人们在分享它带来无限便利与体验感的同时,也因恶意网络入侵攻击面临着威胁与损失。提高现有网络入侵检测系统效果和挖掘未知网络入侵行为能力,提高网络信息安全技术是当下亟待解决的难题。其中针对算法效率与检测准确性的研究是该领域突破的重点。本文将当今热门的深度学习和粒计算理论应用于网络入侵检测系统,通
图像是视觉信息的主要载体之一,而由于各种因素,获得的图片分辨率往往有限,因此常利用超分辨率方法对图像细节进行推测并重建。但现有方法多是端到端的训练,复杂网络模型对设备要求较高。此外图像不同部位的重建纹理往往与该部位的类别存在很大关系。因此,本文从数据集准备和先验信息提取两个方面进行深入研究,以提高超分辨率重建算法的性能。本文主要工作和成果如下:(1)提出了超像素分割能够将一张图像拆分为多流形数据结
通信网络飞速发展的现状对数据中心的网络质量、运维能力提出了更高的要求。传统骨干网使用的VPLS技术将网络全连接,这样的方式存在消耗网络资源、容易引起ARP洪泛的缺陷,后续的演进中提出了将MAC学习迁移到控制层、使用BGP通告对端的EVPN解决方案,能够有效提升网络性能。NP芯片使用微码编程,具有快速的响应能力和高效的计算能力能够很好地适应转发层要求,所以采用NP芯片与CPU共同参与MAC学习的方案
物联网设备数目庞大且具备一定的网络攻击能力,大多数物联网设备也会涉及用户隐私并关联用户的敏感设备。随着物联网行业的迅捷发展和物联网设备的大规模投入使用,在智慧城市与物联网深度融合的规模化发展的趋势下,物联网设备带来的安全问题引起广泛关注。为了满足智慧消防系统由于应急管理对设备一致性的高要求,本文基于主动式和被动式设备指纹构建方式,将智慧消防系统中的物联网设备分为感知器和执行器进行相关实验研究,验证
机器阅读理解是当前自然语言处理领域最为前沿和热门的研究方向之一,它的研究目的是利用计算机建立模型,使计算机能像人类一样阅读文章、分析语义和回答问题,有着重要的研究价值和实用价值。随着硬件算力的不断提升、大数据的爆炸式增长,以及深度学习技术的不断发展,机器阅读理解研究有了长足的进步,在一些特定的任务中,计算机模型的回答已经可以媲美人类的水平了。机器阅读理解模型需要充分理解问题和文章的语义信息,通常采
模拟画像是由画像师通过目击证人的描述,结合刑事相貌学和画师个人经验,对嫌疑人进行肖像绘画,在刑侦工作中具有重要作用。由于其专业性,使用门槛较高,且现有模拟画像系统依赖图像合成,存在拼接人脸图像生硬、缺失启发性推荐、人脸编辑不够灵活、肖像人脸细节缺失的问题和不便于进行大规模检索的问题。本文针对模拟画像系统存在的问题和关键技术展开研究,具体研究内容如下:(1)目前人脸肖像化和重建主要依靠成对的数据建立
本文采用前沿神经网络算法研究成果,结合追踪算法,在此基础上结合肤色检测、清晰度检测、人脸姿态估计构建一个面向图像序列的人脸检测、追踪、优选为一体的方式,相信可以用于人脸识别的应用里并且发挥很好的改善作用。针对人脸区域在图像中提取问题,采用MTCNN网络算法作为人脸检测算法,能够有效快速地检测出图像中的人脸部分。人脸在图像序列之中,位置可能会随着时间的改变而不断变化,针对人脸区域无法动态锁定的问题,
当今城市中摄像头的数量大幅度增加,这为现场监控和事故的追踪提供了极大的便利。但由于摄像头的监控信息中,有效信息较少,如果需要按照行人属性对行人进行检索或分类,手动整理的工作量将是巨大的。因此,为了节省工作成本,研究一种端到端的、自动地对行人属性进行识别的模型是很有必要的。虽然当前已经提出了许多行人属性识别方法,但存在较多难点需要解决。典型的待解决三个问题有:(1)行人属性空间依赖关系和属性间的语义