基于深度学习的跨项目软件缺陷预测

来源 :天津大学 | 被引量 : 0次 | 上传用户:glorfinde
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
软件缺陷预测技术可以预测出软件系统中存在缺陷的可能性较高的软件模块,从而帮助开发和测试人员优化测试资源分配以在有限的时间和资源条件下尽可能多地发现和修复软件缺陷。然而,在实际的场景中,某些软件项目本身的缺陷数据不足,难以构建有效的缺陷预测模型;而直接使用其他软件项目的缺陷数据训练得到的模型,也通常无法获得令人满意的预测性能。因此,利用其他软件项目的缺陷数据为目标软件项目构建有效的缺陷预测模型,即跨项目缺陷预测(Cross-Project Defect Prediction,CPDP),吸引了国内外研究人员的广泛关注。本文提出了一种基于ASTToken2Vec、双向长短期记忆(Long Short-Term Memory,LSTM)模型和注意力机制的CPDP方法。首先,通过简化的抽象语法树(Simplified Abstract Syntax Tree,S-AST)对软件模块进行建模,并基于S-AST提取Token序列。对于S-AST中的每个节点,只保留了与项目无关的结点类型,而忽略其他可能是某些项目特有的信息(如变量名和方法名等)。这种不依赖于项目特有信息的建模方法适用于CPDP。其次,为了构造Token序列的语义表示,提出了一种无监督的向量表示学习算法ASTToken2Vec,从S-AST的树状结构中自动学习Token的语义表示,进而构造Token序列的语义表示。再次,提出通过双向LSTM从Token序列中提取上下文语义特征,并通过注意力机制对Token序列中的不同部分赋予不同程度的关注,如对缺陷强相关的部分赋予更多关注,最终基于自动学得的特征构建CPDP模型。最后,为了验证方法的有效性,以真实的大型开源项目作为实验对象,在大量的源-目标项目对上进行了广泛的实验,并应用统计分析方法对实验结果进行分析。实验结果表明:ASTToken2Vec算法可以有效地学习Token序列的语义表示并可以显著提升缺陷预测的性能,基于ASTToken2Vec、双向LSTM和注意力机制的CPDP方法的预测性能显著优于其他5个最先进的CPDP方法。综上所述,本文提出的基于ASTToken2Vec、双向LSTM和注意力机制的CPDP方法,显著地提高了CPDP的性能,并验证了基于深度学习的CPDP的有效性及发展潜力。
其他文献
输变电设备不锈钢薄壁箱体是由六块薄壁不锈钢板焊接成型,并且要终生密封。其中,焊接是影响产品质量的关键工序,既要保证箱体的强度和精度,更要保证箱体的气密性。现阶段国内一般采用氩弧焊或气体保护焊。少数企业和一些国外公司在大规模生产时会采用更为先进的激光焊接,效率高,变形小,能够降低因人为造成的缺陷。但是这种焊接方式对箱体的结构、被焊件下料的精度以及夹具提出了更高要求。因此,设计一套专用的不锈钢钢薄壁箱
近年来,由于化石燃料的过度使用而造成的能源危机和环境污染问题严重威胁着人类的生存,因而寻找绿色环保的清洁能源和高效便捷的储能装置成为亟需解决的问题。超级电容器因其高功率密度,快速充放电特性,优异的循环稳定性和环境友好性而被认为是一类重要的储能装置。电极材料作为超级电容器的重要组成部分,其选取的好坏是决定超级电容器性能优劣的关键因素。在各类电极材料中,生物质基多孔碳电极是最为常用的双电层电容器电极材
磷污染导致的水体富营养化已经成为环境治理难题,减少废水中磷的排放是缓解富营养化的关键。陶粒吸附法由于工艺简单、运行稳定、成本低、除磷效果好,已经成为除磷领域的研究热点。另外,目前环境危害性废弃污泥产出量惊人且处理费用昂贵,也同样加重了生态环境负担。本研究基于“变废为宝、以废治废”的环境保护理念,使用污泥热解固态残渣污泥生物碳等材料,制备了符合人工陶粒滤料标准、安全性高、磷吸附效果优良的污泥生物碳基
转向架作为地铁车辆的重要组成部分,在运行过程中起到了提供车辆牵引力、支撑车辆以及导向的功能,其性能的好坏很大程度上直接决定了地铁车辆能否安全、平稳的运行。转向架构
正中胸骨切开术是开放性心脏手术的标准入路方式,目前的手术存在切口界面力损伤大、骨组织难愈合等问题。本文结合临床需求,对胸骨锯切力展开了仿真与实验研究,主要内容和结论如下:针对胸骨各向异性粘弹性生物复合组织结构特征,建立基于骨单元增强的骨组织复合本构力学物理模型。利用ABAQUS的VUMAT子程序进行二次开发,对骨组织复合材料进行宏观整体建模,子程序中包含了骨正交各向异性材料的本构模型、应力应变关系
植保无人机作为现代具有代表性的农业高新科技之一,在农业病虫害防治中有,效率高,效果好,劳动力投入少等优势,在我国农业植保作业上已经得到广泛应用,对我国农业现代化建设有着不可忽视的重要作用。本文从农业社会化服务角度出发,研究植保无人机服务发展的现状与问题。首先对无人机植保服务的服务优势和国内外发展现状进行了论述,发现植保无人机具有成本低、效率高、安全性强的优势,但是国内的社会化服务体系尚不成熟。接着
目的:本文基于中医“辨质论治”的理论,研究中医体质为湿热质的肛周脓肿患者,术后服用自拟清热利湿方给创面恢复、并发症及其整体治疗效果带来的影响。方法:选取了60例满足标准的体质为湿热质的肛周脓肿病患,并随机分为对照组与治疗组,每组各30例。其中,对照组患者手术后采用常规抗感染与伤口换药治疗;治疗组30例,在对照组治疗方法的基础上,于术后第1至14天口服自拟清热利湿方。治疗3周后,对两组患者术后恢复情
黄曲霉毒素是一类由黄曲霉和寄生曲霉等真菌产生的刺激代谢产物,广泛存在于各种农作物中,具有强毒性、强致癌性、致畸性和肝毒素作用。黄曲霉毒素的理化性质非常稳定,朴永德食品加工过程很难被破坏,给人类和动物带来严重威胁,并且造成了巨大的经济损失。生物法降解黄曲霉毒素毒素由于其反应条件温和、无污染、不会造成二次污染及产品营养价值流失等优点收到人们的广泛关注。黑水虻能够耐受高浓度的黄曲霉毒素,并且将污染的饲料
轨道是城市轨道交通的重要组成部分,是支撑列车安全运营的基础设备。然而,由于列车与轨道长时间的接触和摩擦造成轨道表面和路基的变化,使得轨道线形发生几何变形,从而给列车
随着几十年来我国经济的高速发展,人们越来越重视食品安全问题。在食品卫生监督检验中,检测样品中的菌落总数可以反映出样品的污染程度或安全性。目前在检疫检测领域中迫切需要一种将细菌培养和菌落计数功能结合的实验室设备,通过智能系统使机器人来代替人进行细菌的培养和计数等工作,将实验室人员从重复低效的劳动中解放出来,提高工作效率。本文以实验室自主研发的全自动菌落培养计数工作站中的培养皿抓取机械臂为研究对象,研