一种基于深度学习的恶意代码克隆检测技术

来源 :北京航空航天大学学报 | 被引量 : 0次 | 上传用户:zingerler
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
恶意代码克隆检测已经成为恶意代码同源分析及高级持续性威胁(APT)攻击溯源的有效方式.从公共威胁情报中收集了不同APT组织的样本,并提出了一种基于深度学习的恶意代码克隆检测框架,目的是检测新发现的恶意代码中的函数与已知APT组织资源库中的恶意代码的相似性,以此高效地对恶意软件进行分析,进而快速判别APT攻击来源.通过反汇编技术对恶意代码进行静态分析,并利用其关键系统函数调用图及反汇编代码作为该恶意代码的特征.根据神经网络模型对APT组织资源库中的恶意代码进行分类.通过广泛评估和与MCrab模型的对比可知,改进模型优于MCrab模型,可以有效地进行恶意代码克隆检测与分类,且获得了较高的检测率.
其他文献
在信息时代,网络技术进入人们的视野,并在各个行业发展中发挥突出的作用.疾病预防控制中心档案管理工作涉及多方面的内容,比如卫生管理、卫生监测、疾病规划和防控等,在这一过程中合理应用先进的信息化手段可提升档案管理工作质量.为此,疾病预防控制中心要认识到运用信息技术的重要意义,制订完善的运用措施.
基层公安机关是维护国家政权稳定,构建和谐社会的重要力量.新形势下,基层公安机关应将数字化档案建设作为当前档案管理的重点,主动地适应时代发展趋势,进一步明确基层公安数字化档案建设面临的主要挑战,并以此作为导向,进一步推动基层公安机关数字化档案建设.在具体实施过程中,一方面,要对数字化档案建设足够重视,完善相应的制度机制,配齐专业管理人员;另一方面,也要为数字化档案建设提供足够的资金支持和政策保障,进一步提升基层公安机关数字化档案建设水平,更好地服务公安工作.
关键词抽取对文本处理影响较大,其识别的准确度及流畅程度是任务的关键.为有效缓解短文本关键词提取过程中词划分不准确、关键词与文本主题不匹配、多语言混合等难题,提出了一种基于图到序列学习模型的自适应短文本关键词生成模型ADGCN.模型采用图神经网络与注意力机制相结合的方式作为对文本信息特征提取的编码框架,针对词的位置特征和语境特征编码,解决了短文本结构不规律和词之间存在关联复杂信息的问题.同时采用了一种线性解码方案,生成了可解释的关键词.在解决问题的过程中,从某社交平台收集并公布了一个标签数据集,其包括社交平
通过将信息化管理手段合理应用到高校大学生日常管理中,不但能提升高校学生的管理水平,而且还能有效降低高校大学生日常管理的成本.本文通过具体论述信息化管理手段用于高校大学生日常管理中的便捷性,并根据实际情况提出信息化管理手段在高校大学生日常管理中的应用途径,全面提升高校大学生的日常管理水平.
随着网络社交媒体的快速发展,对舆情信息的传播模式进行分析成为研究热点.针对网络舆情传播模式分类任务中,小样本数据多路径生成分类正确率低的问题,提出了舆情传播领域知识图谱结构定义,建立了基于微博数据的舆情传播知识图谱与舆情传播分析任务数据集,使用GraphDIVA模型进行舆情传播模式分类,并在自建数据集中进行了舆情传播模式分类25样本测试实验.结果表明:模型在经过20轮训练后,分类正确率从76%提升到89.4%,说明GraphDIVA模型在减少训练次数、提升分类正确率方面具有更优的效果.
针对Android恶意软件检测特征选择中,对类间具有相同频率分布的特征过度关注而导致特征冗余问题,提出了一种Android恶意软件检测低冗余特征选择方法.利用Mann-Whitney检验方法选择出存在频率分布偏差的特征;通过外观比率间隔算法量化偏差程度和特征出现频率剔除低偏差和整体软件中低频使用的特征;结合粒子群优化算法和分类器检测效果得到最优特征子集.使用公开数据集DREBIN和AMD进行实验,实验结果显示,在AMD数据集上选择出了294维特征,进行特征选择后6种分类器的检测准确率提高了1% ~5%,在
模糊测试作为当前最有效的漏洞挖掘方法,不仅比其他漏洞挖掘技术更能应对复杂的程序,而且可扩展性很强.在数据量相对较大的测试中,模糊测试输入样本集存在质量低、冗余性高和可用性弱等问题.因此,对模糊测试输入样本集进行研究,提出了启发式遗传算法,借助0-1矩阵,通过启发式遗传算法对样本的执行路径进行选取和压缩,从而获得优化后兼顾样本质量的样本集最小样本集合,进而加快模糊测试的效率.实验结果表明:在没有损失的情况下,样本集精简后模糊测试的时间比精简前降低了22%,压缩率相比传统方案提升约40%.
不同场景下数据类型和脱敏需求的差异,使得传统的数据脱敏方法难以满足大数据背景下的用户隐私保护需求.如何实现异构大数据中敏感信息的精准定向、高效脱敏,从而更好地确保数据安全、可信和可用,是本领域的研究难点.提出了一种在异构大数据环境下,基于文本、图片、音频和数据库等异构数据的脱敏模型,并对4个关键模块进行了描述.通过脱敏数据预处理,实现不同应用场景下敏感数据的自动标注和分级设置.采用数据预脱敏处理方法,并从数据可用性、数据关联性、隐私保护度、时间和空间复杂度等5个维度进行脱敏效果评价,实现定制化脱敏策略.经
恶意代码对网络安全、信息安全造成了严重威胁.如何快速检测恶意代码,阻止和降低恶意代码产生的危害一直是亟需解决的问题.通过获取恶意应用的动态信息、构造异质信息网络(HIN),提出了描述恶意代码动态特征的方法,实现了恶意代码检测与分类.构建了FILE、API、DLL三类对象的4种元图,刻画了恶意代码HIN的网络模式.经过改进的随机游走策略,尽可能多地获取元图中对象节点的上下文信息,将其作为连续词包(CBOW)模型的输入,从而得到词向量的网络嵌入.通过投票方法改进主角度分析模型,得到多元图特征融合的分类结果.在
对需要存储在服务器端的用户文档进行加密是对用户隐私保护的根本方法.采用不同的保序加密算法对加密文档排序结果有着不同的影响,寻找排序结果最优的保序加密算法是亟待解决的问题.提出了基于鉴别信息的保序加密算法选择的标准,比较了2种保序加密算法下对加密文档排序的性能.在通过保序加密算法得到的密文分布接近明文分布的情况下,排序得到的结果更接近明文检索的情况.所提出的选择标准具有理论上的意义,同时也可以指导在相同安全条件下保序加密算法的选择,以达到最优的检索结果.