基于动静结合的程序行为识别技术的研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:net917208
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年恶意软件的变化手段在不断更新,这使得大量的用户数据受到严重的威胁。如何快速准确地对未知的程序行为进行识别是目前软件安全领域的重大挑战。传统程序动态识别技术往往基于程序系统调用层面的信息,并没有下探到更深一层的汇编指令层。程序静态识别技术通常是根据程序中的字符串对加解密算法进行识别,对更加广泛的程序行为并没有做更多方面的拓展。本文提出一种基于动静结合的程序行为识别技术。在程序静态特征方面,使用IDAPython工具提取程序中的操作码与立即数,并且对程序静态中的其他关键常量信息进行整理和分析。在程序动态特征方面,提出一种基于二进制插桩的系统调用抽取技术,针对不同类型特征的系统调用,采取不同的策略进行对系统调用信息的提取。除此之外,本文重点提出了一种基于动态汇编指令序列的语义分析技术,对汇编指令进行建模,设计汇编指令序列相似度算法,多维度地记录程序的离散特征与序列特征,结合动态信息和静态信息的优势,最后使用机器学习技术对这些信息进行训练,对未知程序进行识别。实验的特点涉及到了多领域的知识,包括二进制程序插桩、系统调用分析、汇编指令分析、序列比对、机器学习等,在汇编指令层面,提出了汇编指令的建模与序列相似度计算方法。在系统调用层面上,对数据的有效拦截与信息提取上也做了大量的尝试与创新。
其他文献
论文以均相橡胶沥青为胶结料,从材料性能、评价指标、混合料设计以及施工工艺等方面开展研究,使均相橡胶沥青超薄磨耗层具备良好的抗滑性能、高温性能以及抗水损害能力,以服
设M ∈Mn(Z)是一个整数扩张矩阵,D(?)Zn是一个基数为|D|的有限数字集.由仿射迭代函数系{φd(x)=M-1(x+d)}d ∈D确定的自仿测度μM,D是满足自仿恒等式μ=1/|D|Σd∈Dμoφd-1
随着国家现代化进程的发展,为满足现代城市轨道交通的大功率需求和缓解日益严重的城市交通压力,地铁车辆车体结构的轻量化问题已经成为研究人员所关注的热点。随着结构优化技术的越发成熟,国内外学者对轨道列车车体结构截面尺寸优化的研究也日趋完善,但是对于列车挤压型材截面的拓扑优化研究还处于发展阶段。对于复杂挤压型材的截面结构,仍然依靠研究人员的经验设计,如此很难设计出较好的轻型结构。因此,在保证地铁车辆车体结
目前,太阳能电池主要材料的禁带宽度普遍高于1eV,使得低于该能量值的太阳光不能被电池材料所吸收,太阳能电池对太阳光谱的响应范围很低,这也是制约太阳能电池转换效率的关键
随着电力系统的完善,电网输电设备的安全性和稳定性越来越受到学者和大众的关注。电力变压器作为整个电网中的中枢结构,电力变压器的缺陷会给人们的生活带来极大的不便,并且有可能造成重大的经济损失。并且随着泛在电力物联网技术的发展,电力变压器缺陷预测成为智能电网建设的重要问题。通过电力变压器的设备属性、运行环境等特征进行电力变压器的缺陷预测能取得很好的效果,但是电力变压器缺陷预测数据的不平衡性却是一个一直以
20世纪的意大利遭遇欧洲浪漫思潮的影响,以罗西尼、贝里尼、威尔第等为代表的闻名艺术家完成了对演唱的一个世纪的传承,创编了很多深度映射意大利国民的民族自豪感与热忱的歌曲。尽管歌剧传统在意大利由来已久,然而歌剧艺术家们并未忽视对艺术歌曲的创编,数目庞大的优质艺术歌曲也开始不断涌现。关于威尔第的艺术歌曲我国的民众接触得较少,即使在我国闻名的音乐大学,也仅有几曲经典曲目被颂唱。在威尔第的创作中艺术歌曲的创
情感分类方法发展至今,主要有两种流派:基于词典的方法以及基于统计学、机器学习的方法。基于词典的方法由于十分依赖情感字典的建立并且其构建成本较大以及不能够应对复杂多
雾霾天气作为一种极端的大气污染状态,不仅影响人们的日常生活,而且对人体具有极大地伤害。人们对于雾霾的认识与了解主要来自于大众传媒,媒体作为雾霾信息的主要传播者,必须
伴随着计算机网络的进步,我们来到了互联网时代,互联网快捷便利,而且效率较高、成本低,具有很多优势,改变了传统的金融交易以及支付形式。互联网时代给传统的经营带来了强大冲击,互联网金融也呈现出国际化和混业经营的状态。作为互联网金融领域里极具代表性的P2P网络借贷行业,近年来持续扩张。在其高速发展过程中也暴露了一些问题,平台倒闭、经营者跑路、消费者血本无归甚至家破人亡这些社会现象频频发生。我们国家的P2
随着数字技术和计算机技术的快速发展,产品设计模式也发生了变化。传统的产品设计主要考虑如何构建三维模型,而现在主要考虑如何从已有的数据库中寻找所需的三维模型并加以利