恶意软件识别方法研究与应用

来源 :电子科技大学 | 被引量 : 3次 | 上传用户：guigui198302

【摘要】

：

近年来,我国互联网行业发展迅速。原来只存在于现实世界的许多事物被不断地搬上互联网,比如电子商务、网络社交、互联网金融等。人们的生活已经越来越离不开互联网,其已经成

【作者】

：

陈维

【机构】

：

电子科技大学

【出处】

：

电子科技大学

【发表日期】

：

2017年01期

【关键词】

：

恶意软件识别 XGBoost 模型融合 LSTM 深度残差网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,我国互联网行业发展迅速。原来只存在于现实世界的许多事物被不断地搬上互联网,比如电子商务、网络社交、互联网金融等。人们的生活已经越来越离不开互联网,其已经成为人们生活的一部分。但在互联网不断融入人们生活的同时,不法分子也大量渗入进来。他们利用恶意软件窃取用户帐户密码、窥探隐私、发送垃圾邮件等,从而获取利益或者破坏正常的互联网环境,这严重侵害了普通用户的利益。对恶意软件进行准确识别对于保护普通用户的利益至关重要。但是国内主流的杀毒软件仍然采用特征码识别、启发式搜索等恶意软件识别技术。基于机器学习的恶意识别方法还没有得到广泛的研究与使用。故本文主要研究基于机器学习的恶意软件识别技术。本文主要以windows可执行文件为例研究恶意软件的识别,主要工作如下:1.使用静态分析技术与动态分析技术进行软件样本的特征的提取,利用提取到的信息构建了包括PE文件头特征、可读字符串特征、关键行为特征、API调用次数特征、API调用时间序列、网络特征等6类特征,以全面刻画软件样本。2.提出基于XGBoost的多特征群模型融合算法进行恶意软件的识别,算法训练了多个分类模型,相当于训练了多个精通不同领域的恶意软件识别专家,每个分类模型使用一个或多个特征群的特征进行模型的训练。然后综合他们的识别结果得出最终的识别结果。实验表明其有较高的恶意软件识别效果,在本文收集的数据集上正确率为97.6%,召回率为97.1%,准确率为96.7%,高于传统的分类算法。应用该融合算法进行恶意软件识别为本文的主要贡献和创新点之一。3.构建基于LSTM的深度神经网络提取软件样本API调用时间序列的高层抽象特征。这同时本文借鉴深度残差网络的思想使用包括API时间序列高层抽象特征在内的6类恶意软件特征训练带shortcut连接的深度神经网络进行恶意软件的识别,实验发现其正确率为98.1%,召回率为97.9%,准确率为97.1%,能够对恶意软件进行更为准确的识别。该识别方法为本文另一个主要贡献和创新点。

其他文献

面向动态页面的网络爬虫系统的设计与实现

互联网从诞生到现在，已经聚集了海量的信息资源，然而这些信息在网络中的存放杂乱无章，使人们在获取信息的时候遇到困难，搜索引擎是的产生就是为了帮助人们更好地从互联网中检索信

学位

计算机网络信息检索网络爬虫程序设计

一种新型的Web应用程序框架的设计与实现

随着互联网技术的飞速发展,各种Web应用系统的需求日新月异,复杂度也越来越高,因此对Web应用系统的开发提出了新的要求。在当前Web开发技术中,最著名的莫过于MVC架构了,MVC架

学位

Web开发框架开发MVCPHP

基于移动锚节点的WSN节点定位研究

随着无线通信技术的快速发展，无线传感器网络(WSN)得到了国内外学者越来越多的关注。而节点定位技术作为其主要支撑技术，已经成为WSN的研究热点之一。由于利用静态锚节点的定位

学位

无线传感器网络定位移动锚节点改进贪婪算法动态能量管理

基于卷积神经网络的自然场景下的车牌检测

图像获取和存储技术、以及互联网技术的发展,使社会生活中的各个领域都积累了大量的历史车牌图像和实时车牌图像,这些数据大部分是自然场景下自动获取的,呈现获取场景不受限

学位

车牌检测卷积神经网络自然场景

基于Android智能手机的温室环境监控技术的研究

随着农业科学技术的发展与种植结构的调整,设施化农业得到了前所未有的发展,温室作为设施化农业的典型代表,改变了传统农业的生产模式,打破了植物生长的地域和时空限制,提高

学位

设施农业温室环境监控系统优化设计智能手机

基于SIFT和Gabor变换的两类掌纹识别算法研究

随着电子技术的快速成长,身份认证技术至关重要。掌纹识别技术,作为一种新兴的生物特征识别技术。相对其它的,具有难以伪装,比较稳定、不具侵犯性以及难以隐藏和非接触等特性

学位

生物特征识别掌纹识别Gabor变换SIFT

基于DOM的Web信息自动抽取技术的研究

随着互联网技术的发展，Web成为各种应用与研究的重要数据源之一，为信息检索、数据挖掘等领域提供高质量的数据。Web中一类重要的数据保存在可搜索网络数据库中，只有通过提交查询

学位

web信息抽取列表页面决策树熵

RFID测距的研究与应用

近几年来随着RFID技术的成熟和发展,RFID作为物联网关键支撑技术,在物联网上的应用越来越广泛,随着数据信息处理能力的提高,智能物件之间的距离和位置信息越来越受到重视。RF

学位

RFID室内测距数据分析

FiWi网络动态带宽分配与负载均衡算法研究

随着网络电话、网络电视、视频直播等为代表的高带宽消耗的多媒体应用在日常生活中爆炸性的增长,无线接入网络的速率也需要大幅的提升。以光纤网络和无线接入网络技术融合而

学位

FiWi网络动态带宽分配公平性软件定义网络负载均衡

基于A*算法的游戏地图寻径的研究

随着硬件水平的不断提升,目前电子游戏的音效和视觉效果都得到了较明显的提高和改善。但游戏人工智能的研究和应用却相对不完善,从而造成游戏中非玩家角色(NPC)的行动显得单

学位

人工智能双层寻径A*算法电子游戏游戏地图寻径启发式搜索

恶意软件识别方法研究与应用

与本文相关的学术论文