面向混合符号执行优化的混合模糊测试技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:farmeress
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
混合模糊测试是一种新近提出的软件漏洞挖掘技术,由黑盒模糊测试和白盒符号执行两种方法结合,很快成为软件安全领域的研究热点。混合符号执行作为其中的重要技术之一,具有求解精确、指向性强、资源消耗巨大等特点。由于真实软件系统庞大复杂,基于二进制的混合符号执行依然存在可伸缩性(scalability)问题,导致混合模糊测试效率低下,不能实用。传统的混合模糊测试提升技术多聚焦于利用多种动静态分析手段辅助模糊测试,但忽略了混合符号执行自身的性能问题。本文基于混合模糊测试的方法架构和组成原理,针对混合符号执行的性能提升,以加强混合模糊测试漏洞挖掘效率为目标,展开下列研究。(1)评价体系建立与优化策略分析。混合符号执行作为混合模糊测试中的重要组成方法,其性能和开销对系统的整体影响通常比模糊测试的部分更大,具有特殊的性质,需要进行单独的性能与开销评价,当前研究缺乏对该评价体系的完整阐述。而混合模糊测试虽然由混合符号执行和模糊测试共同组成,但最终的评价体系一般还是遵循模糊测试的评价标准,存在局限性。本文提出了混合符号执行和混合模糊测试的评价体系,并依据评价体系对二者的优化策略分别进行分析。基于混合符号执行的评价体系,本文利用混合执行引擎Triton设计了一个综合测试平台,实现了6种混合符号执行优化方法的模拟,并进行了10个程序20个输入的分析实验,从“时间效率”、“内存开销”和“覆盖率提升”三个评价指标的角度进行测试,分析了不同优化方案提升的百分比数据,最终生成优化方案的性能序列,并提出了三种针对不同情况的优化选择方案,作为实际应用的参考,为混合符号执行优化的研究工作提出了指导目标。基于混合模糊测试的评价体系,本文提出了混合模糊测试架构中的三点重要问题,为提升混合模糊测试漏洞挖掘效率的研究工作提出了指导目标。(2)基于污点分析的混合符号执行约束缩减方法。从混合模糊测试的白盒符号执行一端出发,混合符号执行的可伸缩性问题是漏洞挖掘效率的主要瓶颈。约束膨胀问题是混合符号执行效率不高的主要原因之一,其成因来自于两个方面:第一,约束收集过程中由于环境建模导致环境相关额外约束引入;第二,约束求解过程中由于冗余约束存在导致求解效率低下。本文针对混合符号执行中的约束膨胀问题,提出了一种基于污点分析的约束缩减方法,该方法由两个模块组成:基于函数端符号化追踪的环境建模约束优化技术和基于输入部分符号化的冗余约束优化方法。本文实现了优化后的混合符号执行工具PSCE,实验评测证明,PSCE对比未经优化的混合符号执行工具Triton在时间开销上优化了37.54%,在内存开销上优化了20.62%,在代码覆盖率方面提升了3.96%。(3)基于混合符号执行优化的混合模糊测试漏洞挖掘系统架构设计。已有的混合模糊测试架构中常有以精确性换执行效率,导致漏洞挖掘性能不高的问题。本文针对混合模糊测试漏洞挖掘架构设计问题,说明混合模糊测试的精确性问题来源于两点:第一,混合符号执行本身的过于优化导致精确性问题;第二,混合模糊测试整体架构导致精确性问题。本文提出了一种基于混合符号执行优化的混合模糊测试漏洞挖掘架构设计,从两个方面对漏洞挖掘效率进行提升:兼顾精确性和效率的混合符号执行自身优化、混合模糊测试漏洞挖掘架构中的分支调度方案。本文实现了两个漏洞挖掘原型工具,一是基于QSYM进行优化的PSYM,在漏洞测试集LAVA-M上发现已知漏洞的个数增加了148个;二是基于PSCE的漏洞挖掘架构PSFuzzer,对比已有工作,在覆盖率方面,比AFL、Triton和QSYM分别高出5.16%、7.32%和6.14%;在触发已知漏洞的平均时间上,比AFL、Triton和QSYM分别快了3.62倍、3.37倍和4.1倍;在平均发现崩溃数量上,比AFL、Triton和QSYM分别多了18个、28.91个和18.92个。PSFuzzer还在5个最新版本的程序中发现17个零日漏洞。(4)基于混合模糊测试平衡点理论的分支调度方法。基于覆盖率的模糊测试缺乏指向性,会导致覆盖率平坦问题。在混合模糊测试中,这个问题可以通过混合符号执行的分支选择方法进行缓解。本文提出了一种混合模糊测试的平衡点理论与调节模型,将混合模糊测试研究模型化为一个寻找最佳平衡点的问题,其中动态平衡点问题即分支调度问题。在混合模糊测试过程中,会产生大量待混合符号执行分析的新输入,每个输入中又有大量分支指令,为了在有限时间和资源的限制下达到最大覆盖率,需要对输入和分支进行仔细的选择。本文提出了一种基于分支调度的选择性混合模糊测试的方案,包括两个内容:第一,基于三个评价指标的重要分支选择算法,对每个分支计算一个权重;第二,基于分支权重的优先级分数算法,用于选择分数最高的输入,进行混合符号执行的分析。本文在QSYM的基础上实现了方案中的两个算法,实现原型工具SHFuzz,并在20个真实程序上进行测试,平均覆盖率可提升8.4%,发现独特漏洞数量增加100个,发现已知漏洞效率提升7.85倍,并且发现了QSYM无法发现的新漏洞。
其他文献
镁颗粒因其能量密度高、点火特性和燃烧效率好的优势,作为燃料或添加剂应用于爆震燃烧动力系统具有广阔的应用前景。本文借鉴国内外现有关于粉末燃料爆震燃烧模型及试验技术,针对镁粉-空气混合物爆震波的传播特性开展研究,建立了适用于描述镁粉-空气混合物爆震波传播过程的理论模型,开展了镁粉-空气混合物爆震可行性试验,分析了影响爆震波速度、稳定性、传播模式的主要因素,为下一步镁粉燃料应用于爆震动力系统提供理论和技
学位
仿生超疏水材料具有防水、防冰、自清洁等独特性能,在日常生活、工业设备及武器装备等领域具有广阔的应用前景。耐久性是制约其应用的关键难题。此外,赋予超疏水材料多功能特性是拓展其应用范畴的重要途径。本论文以提升超疏水材料的耐久性为主要目标,针对不同的应用背景,设计并制备了三种典型形态的超疏水材料——超疏水纳米涂层、超疏水碳纤维复合材料以及超疏水多孔材料。对这三种超疏水材料的组成和结构进行分析,对疏水性能
学位
雷达成像在诸多领域有着重要的应用价值。本文针对MIMO阵列雷达在近场条件下的成像应用,围绕系统参数与阵列设计、快速三维成像算法和栅旁瓣抑制算法三个方面展开研究。旨在为实际系统从参数设计、图像获取和图像质量提升等方面提供完善的解决方案。在系统参数与阵列设计方面,本文针对匹配滤波成像算法,首先建立了波数谱与系统参数和成像点展布函数之间的联系,推导了成像点展布函数的理论表达式。然后,基于波数谱分析了阵元
学位
随着5G和物联网时代的来临,大量高速率需求的无线通信设备正与雷达设备竞争频谱资源,对雷达服务造成严重的干扰并阻碍未来更高速率无线通信技术的发展。而雷达通信频谱共享技术则能从根本上解决这一问题。当前对该领域的研究分为两条主线——雷达通信共存技术与双功能一体化技术。以两条主线为脉络,论文对雷达通信频谱共享技术进行了研究。主要工作和创新点总结如下:一、针对频谱共享的不同实现方案,搭建了场景模型并分析了资
学位
目标微动是对目标或目标部件的微小运动状态的精细描述,微动特性细微而多变,需要敏锐地捕捉和识别。雷达目标微动特征研究是近十多年来国内外遥感学术界和工程界的一个研究热点,运用微多普勒信息进行目标分类、鉴别和识别被认为是极具潜力的技术手段。本文系统研究了雷达目标微动特征提取与参数估计技术,阐述其回波调制及特征分析,深入研究了基于时频分析和基于时频原子的两大类微动参数估计方法,并针对多分量微多普勒信号分解
学位
本文以霍尔推力器在深空探测等长周期空间任务中的应用为背景,针对霍尔推力器中等离子体与放电通道和内磁极的相互作用等问题,采用理论分析、光学诊断为主,辅以数值仿真的方法,开展霍尔推力器中交叉电场和磁场环境下等离子体与放电通道和内磁极相互作用的机理研究。设计了一台放电功率600 W的传统磁场位形霍尔推力器USHT-600,建立了一套完整的霍尔推力器实验测试系统,并实现了推力器稳定运行。磁场有限元三维数值
学位
图像分类是计算机视觉领域最基础的研究之一,在医疗图像分析、智能视频监控、无人车辆驾驶、个人信息管理等诸多领域具有广泛应用。过去八年中,深度学习研究取得显著进展,图像分类技术突飞猛进,可控条件下的图像分类问题已经基本趋于成熟,然而在很多实际应用中,由于受不确定的外界因素和成本因素的影响,很难获得大量包含丰富变化并且标记完整的训练数据,图像分类依然是一个很有挑战性的问题。本文针对非受控条件下机器学习面
学位
地球系统中的各个分量之间具有紧密的相互作用,其中大气和海洋是两个最重要也最活跃的分量系统。随着海气耦合模式在天气气候研究中的广泛应用,人们对海气耦合资料同化的需求随之兴起。基于耦合模式框架,耦合资料同化可将多个分量中的观测信息吸收到耦合系统中,并允许观测信息在不同分量间进行传递和交换,因而理论上能够为耦合模式提供更加平衡和协调的耦合状态估计。耦合资料同化一般可分为弱耦合同化和强耦合同化,其中弱耦合
学位
波达方向(Direction of Arrival,DOA)估计是阵列信号处理领域的核心问题之一,在雷达、导航、数字通信、目标检测等领域都有着广泛而重要的应用。均匀线性阵列拥有规则化的阵列结构,与其匹配的DOA估计算法得到了广泛的研究,并形成了相对成熟的技术。但阵列孔径与阵列自由度受限于实际阵元的数量。基于均匀线性阵列的DOA估计算法需要通过增加实际阵元数量来提升阵列自由度,并提高精度和分辨率。近
学位
随着信息技术,尤其是传感器网络与物联网等技术的飞速发展,各类复杂系统的数据呈海量性增长,从这些数据中挖掘与系统相关的规律与模式,对于理解、分析、运用与改造复杂系统具有至关重要的作用。作为数据挖掘的基础性工作,相似性度量方法直接关系后续数据挖掘任务的实现,一直是数据挖掘研究的热点与难点。属性网络作为有效的复杂系统建模工具,其相似性度量方法主要考虑节点在整个网络中的拓扑结构特征,往往忽略了节点自身的非
学位