基于无偏差最优特征和优化集成学习的预测变异测试方法

来源 :南昌航空大学 | 被引量 : 0次 | 上传用户:cyuaxl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
变异测试是一种评估和改进测试套件质量的重要技术,对保证软件质量起着关键作用。但变异测试中一直存在因大量变异体导致测试执行成本过高、变异测试效率较低的问题。预测变异测试是一种在不需要测试套件执行变异体的情况下,直接利用机器学习方法来预测新变异体是否被杀死的方法。此方法可以显著降低执行变异体成本,提高变异测试效率。因此本文从预测变异测试出发,提出了一种基于无偏差最优特征和优化集成学习的预测变异测试方法。本文主要贡献如下。首先,此方法从变异体来源、产生和执行三个层次进行分析,探究变异体衍生相关特征对预测变异测试性能的影响。在传统的变异体特征基础上,设计了6个密切与变异体产生相关的特征。针对数据集中高维特征问题,本文提出了基于多层次特征的无偏差最优特征子集构建的方法。该方法首先利用特征重要性分析和斯皮尔曼系数分析特征与标签间的重要性排名和特征之间的秩相关系数来消除噪声特征和冗余特征,再利用随机森林筛选出无偏差最优特征子集。该方法既可以减少特征维度,也可提高数据质量。其次,在预测变异测试中,单一分类器构建的模型存在泛化性较差、预测性能在不同的评价指标中差异较大的问题。本文提出一种基于优化集成学习的方法。该方法首先选择预测性能整体较好的随机森林和卷积神经网络两种基分类器来构建优化集成学习的预测变异测试模型。接着先对基分类器进行参数设置与优化,再利用权重优化方法寻找基分类器最优权重系数。最后根据最优权重系数对每个基分类器进行加权投票集成,得到最终预测变异测试模型预测结果。该方法既可提高模型预测性能,也可增加分类器的多样性。最后,在10个开源的Java项目上进行实验,采用了5项评价指标:准确率、精确率、召回率、F1分数和AUC,对本文提出的方法进行了实验验证和有效性分析。首先在新增6个特征的有效性实验中,与当前主流的基线方法相比较,在准确率和AUC上都有较大的提升。然后在无偏差最优特征子集的有效性实验中,对比实验中的五个评价指标上基本都提高了预测变异测试性能。并且在构建的无偏差最优特征子集中,本文新增的6个特征中有5个在其中。最后在优化集成学习的有效性实验中,与最先进的方法相比时,其准确率、精确率、召回率、F1分数和AUC上均有提升,分别是0.12,0.14,0.15,0.16和0.20。综上所述,本文提出的预测变异测试方法能有效地提高预测变异测试性能。
其他文献
区块链技术的持续发展,使得区块链的落地商业化应用逐渐增多。与此同时,联盟链的优势也变得突出。然而,联盟链常用的共识算法存在的问题也越来越明显,这一定程度上反映联盟链中的共识算法难以通用于电子政务、智慧医疗和供应链等实际的应用场景。目前这些缺陷亟待解决,最大程度地推进联盟链环境中的具体应用的落地。基于此,对联盟链中常用的PBFT(Practical Byazentine Fault Toleranc
学位
生物特征识别是一种新式的身份认证方式,具有唯一性、安全性、稳定性等特点,被广泛应用于各大领域。生物特征识别系统的广泛应用引起了人们对其安全问题的关注,各种不同的攻击方法被设计出来,主要目的是冒充合法用户,从而通过识别系统的验证。这些攻击严重威胁到庞大用户群体的财产和信息安全,也揭示了生物特征系统的安全隐患。掌纹是重要的生物特征模态,其识别稳定性高、成本低、用户友好性高、隐私性强,是一种非侵犯式的识
学位
图像在人类社会的发展中至关重要,是重要的记录器。图像修复技术旨在利用图像内已知区域的信息来补全图像内的缺失区域。图像修复是一项基础且复杂的计算机视觉任务,能广泛应用于摄影、文物修复、老照片修复、工业等领域,是近年来人们关注的热点课题。图像修复常用的方法有基于像素扩散、样例传播和深度学习等。深度学习的出现,加快了图像修复技术的发展。目前基于深度学习方法的图像修复技术,虽能修复大区域的图像缺失,但是在
学位
机会网络是一种特殊的移动自组织网络,借助节点移动带来的相遇机会实现网络通信,在环境监测、野生动物追踪、应急通信等领域有广泛应用。机会网络拓扑预测通过分析历史连接信息挖掘网络的演化规律,结合当前网络结构信息,预测下一时刻拓扑变化,为机会网络的路由协议设计提供理论支持。机会网络拓扑预测是网络行为预测的关键问题之一,其面临节点频繁移动、拓扑结构时变等挑战。本文通过分析机会网络中当前网络结构与历史连接信息
学位
随着互联网及智能设备的高速发展和普及,以数字图像为主的多媒体信息的发送和接收成为人们日常生活中最重要的交流方式之一。但近年来隐私泄露、侵犯版权等违法犯罪行为日益增多,对人们的日常生活带来巨大影响,信息安全问题备受关注。传统加密技术虽然是一种有效的信息保密手段,但其不可理解性容易吸引恶意攻击者使用高性能计算工具对密文进行解译或破坏。作为对加密技术的一种补充和完善,信息隐藏技术应运而生。以数字图像为载
学位
在新冠肺炎疫情期间,接触式的指纹识别和非遮挡式的人脸识别在身份认证过程中应用受到了一定的限制,这让人们意识到非接触式认证方式--虹膜识别的重要性。但现有的虹膜识别算法对于非合作状态下获取的低质量虹膜图像的分割和识别性能不佳,而这类图像是大量存在的。同时,对这类虹膜图像的真实虹膜区域进行人工定位的做法存在不可靠性,不利于虹膜识别算法的进一步发展。本文主要设计了基于深度学习的虹膜定位分割分及识别算法,
学位
水资源作为生命之源,生态系统中的核心资源,可以发展区域经济、保障人民生活。然而人们却常常忽略水生态系统功能价值,由于人类活动和自然因素,造成河道漂浮物堆积、侵占河道的情况,破坏了河道景观以及自然水生态。如何提高河道巡查监管能力成为目前河流管护的迫切需求。围绕此需求,本文依托中国水利水电科学研究院北京市科技重大专项课题,大运河智慧巡河系统研发及示范应用,研究针对河道目标场景优化的目标检测算法,同时设
学位
角膜疾病可能会导致角膜组织弹性模量等参数发生改变,从而引起角膜组织生物力学特性的改变,影响角膜弹性成像结果。因此,本文基于有限元分析的方法模拟弹性成像,定量分析超声弹性成像在角膜疾病中的作用,对基于剪切波的光学相干弹性成像在角膜弹性测量中所受到的影响因素进行分析。主要的研究内容如下:(1)构建经典人眼三维有限元模型,有限元法被用于模拟角膜组织的超声弹性成像,然后通过改变角膜病变组织与正常组织杨氏模
学位
随着在线教育的兴起,教师面临着帮助学习者准确理解知识的挑战。编程课程由于较强的综合性和程序调试的特殊性而不同于其他学科,学习者在学习编程的过程中容易产生误解和疑惑,尤其在程序调试方面存在较大困难,从而抑制了其学习和进步的动力。因此,研究如何有效地辅助学习者理解调试信息和提升编程能力具有极其重要的意义。本文针对编程学习的不同阶段,设计了相应的编程资源推荐方法,包括代码演化片段推荐和编程习题推荐。具体
学位
自动测试数据生成是降低软件测试成本和时间的传统技术之一,目前元启发式技术已成功应用于测试数据生成。粒子群算法(PSO)具有多种优点,在性能上具有较强的竞争力。但是PSO算法存在与其他种类算法相似的问题,在高维度和多峰值的寻优问题中容易收敛到局部最优,且算法搜索到后期收敛速度缓慢。针对上述问题,本文提出了两种改进PSO优化算法。同时,为适应测试数据自动生成应用场景的寻优问题,基于上述两种改进PSO算
学位