【摘 要】
:
随着开源社区的发展和壮大,互联网上出现越来越多的开源代码和第三方组件。这些开源代码和第三方组件可以为应用程序的开发提供基础支撑。开发人员常常会在互联网、开源代码仓库中检索已有的开源代码,并将已有的功能代码引入到自己的项目中,来提高开发效率。但是开发人员却通常并不掌握他们在开发过程中使用过的组件清单,因此对组件中的安全隐患和已知漏洞也并不知晓。近年来针对软件供应链的攻击报告也越来越多,诸如Heart
论文部分内容阅读
随着开源社区的发展和壮大,互联网上出现越来越多的开源代码和第三方组件。这些开源代码和第三方组件可以为应用程序的开发提供基础支撑。开发人员常常会在互联网、开源代码仓库中检索已有的开源代码,并将已有的功能代码引入到自己的项目中,来提高开发效率。但是开发人员却通常并不掌握他们在开发过程中使用过的组件清单,因此对组件中的安全隐患和已知漏洞也并不知晓。近年来针对软件供应链的攻击报告也越来越多,诸如Heartbleed、Ghost等危害极大且影响广泛的漏洞,都是由软件供应链中未修复的已知漏洞引起的。因此,针对软件供应链进行深入分析对软件的安全性能至关重要。针对软件供应链存在的安全隐患,为解决二进制文件的供应链安全问题,本文进行了基因视角下的软件供应链分析技术研究。本文分别从基本块、函数两个层次依次进行了二进制的相似性比较,提出软件基因语义嵌入、基因图移动距离两个方法,在此基础上对二进制文件的多级依赖关系进行分析,得到其软件供应链中的组件列表,进而检测供应链中存在的已知漏洞。本文主要研究成果如下:1、提出了软件基因语义嵌入方法,实现软件基因的语义编码,解决了基本块粒度的跨指令集二进制语义相似性比较问题。根据汇编指令的控制流关系切分得到最小功能单元,并进行抽象得到软件基因;在机器翻译模型的启发下,设计了基因语义嵌入模型,训练编码器对跨指令集的软件基因进行语义提取,将不同指令集下的基因编码到同一个向量空间下的语义向量。实验证明该方法得到的语义向量尽可能多得保留了汇编序列的语义信息,在汇编序列的语义相似性匹配任务中,该方法比当前主要的方法有着更高的准确率,@10指标达到94.9%。2、提出了图移动距离算法,将其应用于函数基因图的比较,实现了二进制函数的相似性匹配,解决了二进制文件在函数粒度的相似性比较问题。采用图注意力神经网络学习图中节点的空间结构,将节点编码到包含了空间结构和邻居节点信息的节点嵌入。在节点嵌入的基础上,将“搬土距离”(EMD)推广到图匹配问题上,提出了图移动距离,作为图相似性的指标,解决两个图之间的匹配问题,使相似的图之间移动距离更小,不相似的图之间距离更大。实验证明该方法可以有效评估两个基因图之间的相似性,在2、3两个优化选项的函数相似性匹配任务中,@10指标达到87.8%。3、提出供应链中已知漏洞的检测方法,实现对二进制文件的供应链分析,解决了软件供应链中已知漏洞检测的问题。根据函数基因图的相似性,扫描二进制文件中包含的第三方组件和开源代码,分析其多级供应链关系;收集第三方组件中的漏洞信息,比较漏洞函数在漏洞修复前后的基因差异,根据基因差异分析第三方组件中的函数是否是存在漏洞的版本。最终在开源项目Safe Board Messenger上进行了案例分析,证明该方法可以有效分析得到软件的完整供应链关系,并可以检测出软件中存在的已知漏洞。
其他文献
在互联网高速发展的时期,各行各业都依赖软件实现数据化运转,这其中离不开运维人员的工作。但是随着高新技术的发展,逐渐庞大的软硬件系统、大数据以及无法估量的变化等,都反映出人力决策无法应对当前运维面对的重大挑战。我们希望逐渐减少人力决策在运维中的比例,因此智能运维应运而生。智能运维在网络服务中应用广泛,而在航天器等机械重工上的应用还不普遍。并且航天器发回的遥测数据具有数据量大、数据类型复杂的特点,因此
此次輯錄的女性賦主要從《歷代婦女著作考》和《歷代辭賦總匯》兩部工具書中蒐集,共計67位作家,196篇賦。其間有因查找困難只看到殘篇的,也有由於年代久遠已散佚,僅存目錄的,
金属卡宾作为一种活性中间体,在有机合成化学中占有重要地位。通常由重氮化合物在过渡金属催化下离去氮气原位产生。由于它们绝大多数非常不稳定,性质非常活泼,在合成中的应
产酶溶杆菌(Lysobacter enzymogenes)属于黄单胞科(Xanthomonadaceae)、溶杆菌属(Lysobacter)。OH11是本实验室从辣椒根际土壤中分离出的一种生防细菌,该细菌基因组DNA的G+C%
本文主要开展了观赏贝母在苏州地区引种栽培及繁殖技术的研究。运用层次分析法对10种观赏贝母的综合价值进行评价,筛选出适合苏州地区栽培的观赏贝母品种并对筛选出的品种进
能源是人类社会发展进步的重要基础,能源消费则是反映一个国家经济发展和人民生活水平的重要标志。对我国而言,持续多年的中高速经济增长、快速的工业化和城市化不断助推着中国能源消费总量攀升。2017年,我国能源消费量已占全球能源消费量的23.2%,能源需求压力巨大。与此同时,长期粗放型发展、人口众多、资源约束趋紧的现实国情使能源领域供给与需求之间的结构性矛盾不断加剧。当前,我国《能源生产和消费革命战略(2
红外检测方法和设备无接触,方便、快捷,不影响系统的正常运行,因此,已成为输变电设备状态检测的一种有效手段。但目前的输变电设备红外图像诊断主要靠人工对红外图片进行分析和判断,方法落后,效率低下。为了提高电网设备故障诊断的水平和效率,减轻工作人员的负担,研究了采用机器学习对变电设备类型进行自动识别的方法,研究了利用深度学习对设备结构区域进行自动划分的方法,并研究了在此基础上实现设备温度自动提取和设备状
本文的目的是研究具有退化阻尼项和源项,并且具有动力学边界的非线性波动方程的初边值问题(?)其中Ω是RN(N≥ 2)中具有C1边界的有界开区域,Γ=(?)Ω,并且假设(Γ0,Γ1)是Γ的
环二鸟苷酸(c-di-GMP)是一种重要的第二信使,在调控生物膜的形成、毒力因子的产生以及适应环境等生物过程发挥着重要的作用。c-di-GMP作为免疫佐剂不仅在全身免疫中有强大的免疫增强效果,而且其作为粘膜佐剂也有着很好的免疫增强效果。因此,c-di-GMP是一种极具开发潜力的疫苗佐剂,在临床上具有重要的应用前景。二鸟苷酸环化酶(DGC)是体外酶法合成环二鸟苷酸的催化剂,本课题通过筛选、异源表达以
随着消费者对生活品质要求的提高,干衣机作为新兴品类,市场规模不断扩大,特别是在新冠疫情爆发的时期,由于消费者对衣物穿着强烈的健康卫生护理需求,干衣机的销量开始爆发式