基于图嵌入和多特征增强的软件缺陷定位方法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:ck198
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
软件开发过程中,测试人员或者用户在发现软件异常后,会形成描述相关缺陷的软件缺陷报告提交到缺陷管理系统中,开发人员需要分析缺陷报告从代码文件库中找到缺陷所在位置并修复。为了以更少的成本完成生产环境中的软件缺陷定位,研究人员提出了多种自动化地解决软件缺陷定位的方法。基于信息检索的软件缺陷定位方法将缺陷定位视作检索任务,为每一份缺陷报告生成一份按照程序模块与缺陷相关性降序排序的列表。然而目前方法在性能上存在可提升空间,为此,本文以缺陷报告和代码文件为主要研究对象,从改进代码表征和相关性表征的角度,研究基于图嵌入和多特征增强的软件缺陷定位方法,提高软件缺陷定位的性能。本文主要的研究内容和成果如下:第一,针对基于深度学习方法的缺陷定位方法在缺陷报告和源代码潜在语义表征上不足的问题,提出基于双向注意力的神经网络缺陷定位方法和基于图嵌入的代码结构特征提取方法。使用双向注意力机制增强代码和缺陷报告的相互潜在语义表示,解决代码的语句间特征聚合不佳、代码与缺陷报告隔离学习和表示的问题;使用图注意力网络对代码的改进抽象语法树进行代码层次结构特征提取,解决代码结构表征不恰当的问题。第二,采用基于传统检索方法的缺陷定位方法对缺陷和代码文件关联特征进行表征。在保证有效性的前提下,结合多数据源的多角度信息,通过特征分析提取多角度的缺陷倾向性特征对缺陷和代码文件的关系进行表征,进一步提出基于深度神经网络的多特征缺陷定位方法,融合多角度特征以捕获缺陷和代码的潜在相似度分数。第三,针对目前方法对缺陷报告的过度依赖而缺陷报告质量不可控的问题,本文进一步提出基于图嵌入和多特征增强的软件缺陷定位方法,融合本文从多特征、双向注意力、图嵌入三个角度提出的三种方法,在优化对缺陷报告和代码文件语义特征提取的同时,从多角度增强缺陷报告和代码文件的关联性表达。在Tomcat和Aspect J缺陷定位数据集上进行实验,对本文方法与其它同类方法进行比较,验证本文方法具有更佳的软件缺陷定位性能。
其他文献
本文研究基于骨架和视频的驾驶员行为识别,旨在自动识别车内的驾驶员行为。交通安全是一个重大的社会问题,其中驾驶员危险行为是导致事故发生的重要原因。准确识别驾驶员危险行为并及时预警,是减少交通事故数量的关键。如何自动、准确和高效地识别驾驶员行为是当前人工智能研究的热点。然而,驾驶员行为识别仍面临一些困难亟待解决,一方面,驾驶员动作幅度小,身体部位移动细微,难以提取有效的时序信息。另一方面,驾驶员行为相
学位
多原子分子与强飞秒激光相互作用的研究是强场超快原子分子物理的难点问题。由于多原子分子的多电子及多中心特性,从理论上精确描述其在强激光作用下发生的电离及解离等动力学过程面对很大挑战。另一方面,实现对气相多原子分子体系激发态的精确结构成像一直是强场超快领域的重要研究目标。针对这些难点问题,本论文从两方面展开了实验研究。首先,我们应用激光场致电子重散射诱导的库仑爆炸成像方法,研究了NO2分子的精确结构。
学位
负离子的几何结构和电子态迥异于中性原子分子,其额外电子是通过短程势与中性原子分子结合在一起,使得其在与激光的相互作用下出现了许多新奇的物理现象。结合高分辨的光电子成像技术,研究负离子与激光场的相互作用,能够准确测量负离子的解吸附能和激发态能级结构,对超快强激光场中的负离子光解吸附研究,有助于深入理解短程势下的强场物理过程,推动强场物理理论的发展。本论文自主设计并搭建了一套负离子光电子成像系统,测试
学位
传统的软件开发方式以开发团队人员的工作为主,为了令待开发的系统尽可能满足用户需求,开发人员的工作需要对用户需求进行分析以获得对系统的深刻理解。但在以传统的软件开发方式进行开发的一个项目的开发周期中,用户通常只参与前期的需求调研和需求分析,并且在这一阶段用户未必能清晰地表达出自己的需求,而后续的开发工作中开发人员的工作基于对前期需求分析的结果的理解,如果前期需求分析工作做得不透彻,在系统开发过程中就
学位
超短激光脉冲控制分子的转动是原子分子物理研究领域的热点问题。使用不同的泵浦脉冲能够产生各种有趣的转动现象,如单向旋转[1,2]、平面准直[3]、三维准直[4]和转动回声[5,6]等。转动动力学研究不仅为超冷分子和量子信息等研究领域提供了理论参考,同时在原子、分子光物理以及物理化学的基础研究中具有重要意义。我们通过两束延迟连续变化的泵浦脉冲激发分子体系产生转动准直回声,测量了一系列泵浦双脉冲延迟τ条
学位
操作系统是管理计算机软件和硬件资源的一个系统软件。随着业务场景的挖掘,越来越多的流程复杂的应用涌现出来。然而,复杂的应用往往涉及到多个跨领域、架构不一甚至事务隔离的服务。软硬件资源的调用方式不一,数据孤岛化,要整合多个应用,设计师往往要屈服于采取重构各系统的低效办法,当整合后的系统又遇到新的领域系统需要集成,将会对开发带来不小的压力。不同软件和硬件的灵活交互方式很难基于传统操作系统实现,不同服务提
学位
聚钨酸盐重液因其密度高,粘度低,无毒,无污染,密度可调节,易回收等特点而被广泛应用于各个领域的重介质密度分级中。尤其在选矿工作中,重液不仅可在工业选矿中分离低品位矿石和有害物质,对高品位矿石进行预先富集,提高选矿效率,而且可在实验中进行矿物、矿石分离,从而了解矿物、矿石的组成。虽然聚钨酸盐重液已有实际应用的实例,但是有关聚钨酸盐及其重液的制备未见报道。本文利用水溶液合成法,主要以钨酸和钨酸钠为原料
学位
移动互联网的普及让网民可随时随地上网,发布和阅读各类信息。但互联网在给生活带来便利的同时,也成为了抄袭行为滋生的温床。互联网的数字版权作品有信息量大、易传播、低复制成本等特点,不仅抄袭成本低,而且人工判别的方式工作量极大。因此,用计算机辅助检测抄袭现象十分有必要。本文着重研究短篇新闻的相似度计算方法,旨在开发具有较高速度和较高准确率的相似新闻检测系统,提供实时的相似内容检索服务,辅助内容发布平台对
学位
学术论文是科研成果的重要体现方式之一,是科学研究工作的结晶,具有很高的参考价值。随着科技的进步,新兴技术不断地应用在标准文献的研究上,论文分析正朝着更细粒度的方向发展。但越来越丰富的功能让开发者的压力也越来越大,学术论文分析往往需要不小的门槛,没有专业背景的开发人员与研究者的沟通障碍也会让双方的工作效率都会下降,同时,研究者日渐复杂和个性化的分析需求无法及时满足,也会影响到科研的效率。本文针对特定
学位
图数据描述个体与个体之间的关联关系,在我们的日常生活应用中广泛地出现。图数据潜藏着大量有意义的信息,近年来,图数据的分析和挖掘是人工智能领域的一个热点,而图节点分类是图数据挖掘中最重要的研究方向之一。图节点分类通过对现实中具体任务进行建模,挖掘图的节点特征信息和节点间的连接信息,实现对节点的标签分类。图神经网络在学习非欧里几得数据时具有明显的优势,是实现图节点分类任务有效的神经网络模型。然而,随着
学位