基于源码语义的软件缺陷预测方法研究与实现

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:sep
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在软件产品呈现多样化的今天,软件规模与复杂度也随之提高,给软件测试与质量保证带来了新的挑战。软件缺陷预测通过历史代码模块构建缺陷预测模型,预测项目中潜在的缺陷模块,帮助开发者合理地分配有限的测试资源以及优化测试流程,为软件质量提供保障。传统的软件缺陷预测方法通过设计与源代码统计特性相关的软件度量作为缺陷预测模型的输入特征。然而这些手工软件度量存在不能充分地捕获源代码语法结构和语义信息的问题。此外,在跨项目软件缺陷预测任务中,不同的项目数据分布存在差异,缺陷预测模型从一个项目中学习到的知识难以直接应用到其他项目中。为了解决上述问题,本文对基于源码语义的软件缺陷预测方法进行了深入研究和优化,利用深度学习从源码的另一种表示形式抽象语法树中提取源码的语义特征用于缺陷预测,具体研究工作包括:(1)针对抽象语法树中节点的词嵌入问题,结合连续词袋模型,赋予中心节点的父节点和子节点以不同的权重,提出了一种抽象语法树权重编码方法;(2)针对源码语义提取问题,将抽象语法树节点编码后,不仅使用抽象语法树的先序序列,还使用中序序列一起输入到双层的长短期神经网络模型中提取源码的语义特征,提出了一种项目内缺陷预测模型;(3)针对跨项目软件缺陷预测任务中的数据分布差异问题,引入迁移学习中的领域自适应方法改进缺陷预测模型,在再生核希尔伯特空间中减少源项目与目标项目之间的数据分布差异,使得模型从源项目中学习到的知识能够迁移到目标项目。最后结合Web应用技术,设计并实现了一套软件缺陷预测系统。在PROMISE数据集中的一系列实验表明,相对于传统的缺陷预测方法或者基于深度学习提取源码语义的缺陷预测方法,本文提出的方法能够提高缺陷预测的性能表现,为软件缺陷预测的研究提供了一种新的思路。
其他文献
二冲程发动机的功率较高、动力性能较好以及结构简单可靠等优点,使其在众多领域都有着广泛应用。但二冲程发动机在工作过程中,由于其结构特点以及工作环境等影响,使得气缸特别容易磨损。珩磨工艺作为气缸生产的最后一道工序,也是对气缸寿命影响最大的一道工序,为了提高二冲程发动机的使用寿命以及改善排放,对于二冲程发动机气缸珩磨工艺的研究就显得非常必要。本文以某二冲程发动机生产企业引入气缸珩磨工序为研究对象,在对二
随着互联网以及云计算等信息技术的不断发展,信息化应用已经渗透到我们日常生活的各方面。“十四五”规划指出,加强个人信息保护和扩大数据开放共享对加快信息化建设意义重大。然而当前信息化应用中,用户个人信息泄露的安全问题时有发生。主要是由于用户在实现身份确权时个人信息被不同服务与应用重发收集以及用户为了简化繁杂的账号管理问题而使用单一的账号和密码,这些都增大了用户个人信息和账号泄露的风险。数据共享方面则存
物联网技术的蓬勃发展给人们的生活带来了极大的便利和帮助。GSMA指出到2025年全球的物联网设备数量将达到250亿级别。物联网设备采集的大量数据蕴藏着重要的信息资源,可通过技术挖掘分析产生对人类生产生活有意义的信息。物联网数据一般存储于第三方云服务,并由云服务商提供存储和共享服务。由于传统第三方云服务商的中心化特点,再加上用户对云服务商的不信任,物联网数据的共享存在以下安全问题:第一,物联网数据容
电致变色“智能窗”具有对太阳光的照射以及热辐射选择性吸收或透过的特点,可以大幅度降低建筑中的能耗、缓解资源紧缺问题。目前制备的全固态电致变色器件仍然无法满足实际应用需求。本论文针对如何提高薄膜与器件的光学调制幅度、循环寿命,缩短着色、褪色响应时间等问题,采用磁控溅射方法制备WO3、NiOx电致变色薄膜,通过调控沉积工艺参数、Cu掺杂等方式改善薄膜的电致变色性能。搭建了全固态电致变色器件ITO/WO
良好的数字病理图像质量是数字病理学准确应用的前提。为提出应用性更强的数字病理图像质量问题的检测方法,本文把数字病理图像的质量检测问题分为切片级和图片级。切片级质量问题包括对焦错误、载玻片压片偏移、虚拟位置与实际位置偏移,这些问题会导致全视野数字病理切片不可用。图片级质量问题指全视野数字病理切片中存在的不可用的图像区域。针对三种切片级质量问题,本文提出了检测的方法。首先,对焦错误问题的检测依赖于图像
随着物联网新型应用场景的不断发展和通信需求的日益提高,接入网络的移动终端设备和通信数据量呈指数式增长,无线通信网络的性能也面临着更高的要求。一方面,现有的移动终端设备和无线节点多为电池供电,有限的续航能力成为制约通信网络寿命和可靠性的关键因素;另一方面,持续增长的通信业务量带来了巨大的能量消耗。此外,随着基站和接入点增多,基础承载网络的容量面临着更高的需求,无线通信的基础网络架构部署也亟需优化。因
根据Tyler提出的氧插入机理,复合氧化物中的氧空位可被视为天然的赝电容储能点位,本身具有氧空穴结构的烧绿石型复合氧化物是一类具有很大潜力的电化学储能材料,可以通过在其A位或B位掺杂低价元素来调控氧空穴的浓度,从而增加电荷储存位点。为了改善当前柔性超级电容器存在的工作电压有限、能量密度低等问题,本论文采用静电纺丝技术结合低温煅烧制备了具有较高电化学储能性能的烧绿石型无机复合氧化物(La2Ti2O7
纤维素是地球上含量最丰富的天然高分子碳水化合物,采用化学法、机械法或化学与机械相结合等方法可制备出尺度较小的微纳米纤维素(Micro-nano Cellulose Filaments),尤其是纳米纤维素具有较大的比表面积、高强度、高长径比和低热膨胀系数等特点,在食品、化妆、烟草、涂料和造纸等领域具有广泛的应用。本文以漂白针叶木浆为原料,通过羧甲基化预处理结合超声波处理的方法制备出具有高长径比的微纳
作为聚类分析的一大分支,子空间聚类由于其在高维数据条件下表现出的优异性能引起了国内外的广泛关注。而深度学习和子空间聚类理论的结合,则让这种通过将高维数据映射至低维子空间,获取自表达矩阵以进行谱聚类的算法在速度和准确性上提升到一个新高度。然而,当前的深度子空间聚类算法在准确性上仍有进步空间,其局限于理论本身所带来对数据量的限制,导致信息量缺失,影响了算法的泛化性和鲁棒性;此外,其无法良好学习原始高维