基于遗传规划的实时缺陷预测技术

来源 :武汉大学 | 被引量 : 0次 | 上传用户:DSSQWYSDD
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
软件无处不在。为了满足人的需要,并提升自身质量,软件在整个生命周期会进行多次修改。这些修改可能会引入缺陷,对软件的正常运行产生影响。因此软件质量的保证成为了重中之重。诸多学者对如何保证软件质量进行了深入研究,其中很重要的一个方面是如何消除缺陷。针对缺陷已经发展出了缺陷定位、缺陷预测和缺陷自动修复等研究方向。在缺陷预测领域,实时缺陷预测技术是近年来出现的重要方向。这种技术专注于细粒度预测,追求用最小的投入发现尽量多的缺陷。实时缺陷预测受到了一些公司的关注,如Cisco公司已将该技术应用到了其产品中。
  本文提出了一种带有局部搜索的遗传规划的实时缺陷预测技术。该技术的预测粒度为一次软件修改。相比于目前已经提出的其它方法,该技术在实验表现上有一定改进,提高了实时缺陷预测的准确性,一定程度提升了实时缺陷预测技术的实用性。本技术提取了软件修改的14个特征,将这14个特征与加减乘除四则运算结合,生成用于对修改进行评分的染色体(其本质为一个合法的数学表达式),并设置适应度函数。以该函数为指导对染色体进行交叉变异生成新的染色体,再根据适应度函数使用局部搜索算法从这些染色体的领域中找出表现最好的染色体,迭代一定次数直到染色体表现稳定后得到一个最优染色体。在得到最优染色体后,结合修改的修改行数和在最优染色体下的得分表现确定修改的风险值,根据风险值对修改进行排序,找到风险值最大的修改推荐给开发者检查,辅助开发者效率地进行缺陷修复工作。在实验中,本文使用了如下指标进行评估:准确率、召回率、耗费总精力20%(以修改总行数为度量)所能找到的缺陷占总缺陷比等,并与现有的其它方法进行比较。实验结果表明,与已有的EALR算法、无监督学习算法LT和监督学习算法OneWay相比,本文提出的技术在寻找缺陷的能力上获得了更好的结果。本文提出的基于遗传规划的实时缺陷预测技术可以辅助程序员发现代码修改中的潜在缺陷,具有一定应用潜力。
其他文献
本文主要研究基于采样数据的事件驱动系统及其应用。首先基于推广的连续离散分析方法给出了在不同通讯条件下保证事件驱动系统指数稳定的充分条件,而后分别将其应用到一类本质非线性系统的输出反馈控制,一类多输出非线性系统的观测器设计以及多智能体系统分布式优化等问题中。主要工作可以总结如下:  第一章介绍了课题的研究背景。分别说明了事件驱动控制,输出函数未知的非线性系统镇定问题,非线性观测器设计及分布式优化与控
四旋翼飞行器是一种结构简单、体积较小、易于操控、能够垂直起降的无人航空器,它凭借着这些优点被广泛应用于民用和军事领域。四旋翼无人机能够稳定飞行需要依靠它的飞行控制系统,因此对飞控系统的研究具有重要意义。对于这个欠驱动、多变量、强耦合的非线性系统,可能还会受到各种环境因素的影响,提高四旋翼控制系统的稳定性、鲁棒性和抗扰性是很有必要的。本文基于自抗扰控制技术,设计了四旋翼姿态和位置的自抗扰控制器,实现
该文主要研究遗传算法的理论及应用.首先分析遗传操作的可达性和达概率以及交叉和变异概率的上限,然后针对遗传算法的早熟收敛提出新的种群多样性衡量标准、作用因子函数及个体浓度等概念,提出一种新的近亲交叉回避策略,基于上述工作提出几种改进的遗传算法:一种新的优胜劣汰遗传算法、自适应变步长定向变异遗传算法、基于抽象遗传算法模型的自适应遗传算法、自适应小生境递阶遗传算法及改进的压缩映射遗传算法,证明了自适应变
学位
中医在我国医疗体系处于重要地位,几千年来为民族繁荣和人民健康做出了巨大贡献,特别在最近的新冠疫情(COVID-19)中,中医诊疗技术发挥了重要作用。在“人工智能+”的大背景下,智能中医技术的研究能为中医打开智能化发展的新格局。中医知识体系庞大且错综复杂,医师严重依赖大量临床经验。将中医知识库融合多源体征信息,嵌入中医领域知识,再进行全过程高效、客观的健康管理是智能中医研发的必然趋势。  本文的研究
学位
本文探讨了生命科学领域的一个热点问题—-疾病标志物识别,并且采用计算机科学领域网络分析方法解决该问题,这种交叉研究使其在理论和应用层面上都具有巨大的研究价值和科学意义。生物体是存储并加工信息的复杂系统,而该系统的核心是其组成成分准确地行使各自的功能并且相互协调合作,疾病的产生和发展往往是分子之间调控机制异常导致的,因此,设计有效的数学分析方法发现疾病相关的分子调控机理(疾病标志物),对疾病深入了解
视图合成作为计算机视觉领域的一项热门的研究,在虚拟现实、场景三维展示、2D视频转3D视频等领域应用广泛,为传统的图像和视频媒体提供了更为生动的信息展示方式。作为其中的关键性技术,深度估计为视图合成提供了场景的几何信息和从已知视图中采样的依据,其质量直接决定了视图合成的效果。  传统的基于多视图立体几何的深度估计方法依赖于特征点匹配算法,在真实世界中复杂的自然场景下拍摄的图片经常会出现光照不一致或者
学位
随着互联网和移动通信技术的不断发展,我们所面临的信息过载问题也日益严重,而文本自动摘要技术作为有效解决该问题的方法之一,一直以来都是自然语言处理领域的研究热点。目前,语音识别和自然语言处理联系紧密,而经过语音识别系统输出的文本也会面临各种各样的自然语言处理任务。因此,本文研究一种语音识别场景下的生成式短文本自动摘要方法,以探究文本自动摘要技术在复杂场景下的可行性。  本论文的研究内容分为了两部分:
随着互联网的快速发展,Web服务器的安全问题也愈发重要。网络攻击行为的层出不穷使得构建Web服务器入侵检测系统迫在眉睫。用于Web服务器入侵检测中的免疫算法目前主要有树突状细胞算法和反向选择算法两种。前者虽然能检测到未知类型的入侵行为,但信号提取的不准确性导致了误报率较高;后者是一种单类学习算法,对训练过的入侵类型检测结果较好,但无法检测出未知类型的入侵行为。  上述两种免疫算法存在的问题与其模拟
学位
心血管疾病(cardiovascular disease,CVD)一直是人类健康的首要威胁。目前临床上,医生通常使用心电图(electrocardiogram,ECG)进行诊断。与此同时判断心电图是否异常是一项非常专业的工作,因此需要具有丰富理论知识和丰富临床经验的医生,但是目前心血管疾病医生数量不足且工作强度大。因此,开发快速,准确的算法十分重要。尽管目前已经提出了很多自动判别心电图的算法,但是
学位
如今,机器学习已成为必不可少的数据分析技术,该技术可从大规模数据集中获取有用的信息。传统机器学习在单个机器上训练和处理数据。随着大数据时代的到来,单个机器无法满足机器学习任务庞大的存储和计算需求。于是,分布式机器学习应运而生。机器学习庞大的训练数据集和复杂的训练模型被划分为多个部分分布式地部署在多台机器上,并发地训练数据。大多数领先的IT公司都部署和维护着基于GPU服务器的分布式机器学习集群。分布
学位