基于机器学习的软件缺陷数量预测方法研究

来源 :战略支援部队信息工程大学 | 被引量 : 0次 | 上传用户:jwliangbo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着软件逐步成为推动社会发展的重要力量,确保软件质量已经成为软件开发和应用中最重要的工作。开展软件质量管理工作可以有效提升软件的可靠性和耐用性,软件缺陷预测技术是软件质量管理常用的技术手段,它可以较早的识别出存在缺陷的软件模块,指导软件测试工作者合理分配资源,及时处理软件缺陷,保证软件质量。软件缺陷预测技术主要是从软件历史数据中提取缺陷特征信息,基于统计学或机器学习算法构建软件缺陷预测模型预测软件模块的缺陷情况。基于机器学习的软件缺陷数量预测方法已经成为当前缺陷预测领域研究的热点之一,但在缺陷数量预测过程中仍存在数据集特征冗余、数据类不平衡以及不同项目之间数据分布差异等影响缺陷预测准确度的问题。因此,本文在现有基于机器学习算法的软件缺陷数量预测方法研究的基础上,从缺陷数量预测过程中的特征选择方法、类不平衡处理方法以及跨项目的软件缺陷数量预测方法三个方面展开研究,提出了相对应的解决方法。1.针对目前软件缺陷数量预测过程中存在的冗余或无关特征问题,本文采用改进密度峰值聚类算法与Pearson相关系数提出了一种基于特征聚类和相关性的IDPCP(Improved Density Peak Clustering and Pearson)特征选择方法。首先引入基尼系数改进密度峰值聚类算法,采用改进的密度峰值聚类算法对缺陷特征进行聚类分析,消除人为因素对聚类过程的影响,将关联度高的特征聚类在同一簇中;之后通过计算聚类后各簇中各特征与缺陷数类别之间的Pearson相关系数进行排序,筛选出最优特征子集。实验结果表明,该方法可以有效消除特征数据中的部分冗余或无关特征,提高软件缺陷数据集的质量,进而提高软件缺陷数量预测的准确度。2.针对目前软件缺陷数量预测过程中存在的类不平衡问题,本文提出了一种基于混合采样和集成学习的HS-Stacking软件缺陷数量预测方法。首先引入边界信息和权重关系思想改进SMOTE算法,使改进的SMOTE过采样方法能够适用于缺陷数量预测过程中的数据过采样,然后采用改进的SMOTE过采样和随机向下采样相结合的混合采样方法平衡缺陷数据集;之后采用Stacking集成方法集成线性回归、支持向量回归、贝叶斯岭回归以及决策树回归算法构建Stacking集成学习模型,完成软件缺陷数量预测。实验结果表明,该方法不仅解决了缺陷数量预测过程中的类不平衡问题,还避免了预测过程的过拟合,有效提高了软件缺陷数量预测的准确度。3.针对新项目缺少足够的历史数据及不同项目间存在的数据分布差异问题,本文提出了一种基于深度学习的跨项目软件缺陷数量预测方法。主要将迁移学习与深度学习框架相结合,同时考虑不同项目之间存在的数据特征分布差异,在迁移深度学习框架中引入最大均值差异距离,提出了一种基于迁移堆叠降噪自编码器(Transfer Stacked Denoising AutoEncoders,TSDAEs)的跨项目软件缺陷数量预测方法。该方法将软件传统度量元作为网络输入,通过同时最小化源项目和目标项目特征数据的重构误差和不同项目之间的数据分布差异,提取源项目和目标项目之间基于传统软件度量的可迁移深层次特征,并基于可迁移的深层次特征完成跨项目的软件缺陷数量预测。实验结果表明,该方法可以有效提取不同项目之间的可迁移深层次特征,消除不同项目之间数据分布差异对预测过程的影响,进而提高了跨项目缺陷数量预测的准确度。
其他文献
本实践报告围绕报告人为全球化智库名家对话做模拟同声传译的经历展开。2021年12月8日,全球化智库邀请耶鲁大学高级研究员斯蒂芬·罗奇与全球化智库主任王辉耀进行对话,题为“变化中的中美关系:国际影响与未来发展”。报告人以切尔诺夫的概率预期模型为理论指导,完成了对话的模拟同声传译任务,并从中选取典型案例,阐释了概率预期模型如何帮助译员在同声传译中做出合理预测,减轻记忆负担,缓解信息处理压力。切尔诺夫的
学位
越南学者悛映的《旧习俗——越南乡村》是越南经典学术著作,有较高的学术价值,对研究越南乡村的岁时节俗有着重要参考意义,翻译该作有助于加深中越两国的学术交流,本次实践选择该作的第三章第三节《乡村春节》进行翻译,以纽马克的文本分类模式与语义翻译和交际翻译策略为指导,分析翻译实践过程,总结该类文本的翻译方法。首先以纽马克的文本分类模式对翻译文本类型进行划分,然后根据文本类型选择翻译策略。该翻译文本类型是以
学位
天地一体化网络是以地面网络为依托、融合空天网络的大规模网络体系,因其地面网络能力强、空天网络覆盖广的优势而在军事等各领域发挥重要作用,具有重要的战略意义。空天网络作为天地一体化网络的关键组成部分,因其具有卫星节点暴露、动态性强、链路间歇连通、星上计算与存储资源受限等特点,必须采取相应的安全保障机制以维护空天网络的正常运行。然而,应用于传统地面网络的安全策略无法完全适用于动态变化场景下的空天网络,这
学位
随着近年来中国“走出去”战略的推进,外宣翻译日益成为翻译实践和研究的重点。其中,新闻外译以其对外宣传的真实性、准确性和时效性成为外宣翻译的重要阵地。然而,梳理新闻翻译的现有研究发现,研究存在语种分布失衡、研究对象同质化严重和重要概念混淆等问题。为解决以上问题,本论文在翻译目的论的指导下,在理清重要翻译概念的基础上,基于自建的人民网新闻汉日翻译语料库,对新闻日译的翻译技巧、翻译手法和翻译策略展开量化
学位
目的 系统、全面的评价保留神经的根治性膀胱切除术(Nerve-sparing radical cystectomy,NS-RC)治疗膀胱癌的有效性及安全性。方法 利用计算机等工具检索PubMed、中国期刊全文数据库(China National Knowledge Infrastructure,CNKI)、Web of science、万方数据库、Embase、Medline 等中英文数据库中与N
学位
期刊
随着生活水平的提高,征兵难成为世界各国面临的共同难题,中国也不例外。近年来,我国征兵工作也开始出现一些新情况。不管是城市还是农村,征兵中“意外”地出现报名人数走低的现象,特别是在一些经济较为发达的地区尤为明显。美国是世界头号军事强国,研究其军事招募工作对解决我国征兵工作面临的新情况、新问题、新挑战具有重要的借鉴和参考意义。本文为军事信息型文本的翻译实践报告,翻译文本为美国陆军退役中将托马斯·斯波尔
学位
锆钛酸钡(BZT)体系陶瓷因其高相对介电常数、低损耗和成本较低等优点被广泛应用于多层陶瓷电容器(MLCCs)产业,近年来MLCCs用陶瓷介质逐渐由微米级向着纳米级别发展,这就需要陶瓷材料同时兼具小晶粒与优越的介电性能两大特点。本文旨在于获得具有高相对介电常数、低介电损耗以及低电容-温度变化率的锆钛酸钡(BZT)基陶瓷电容器材料。本实验采用固相法制备了x wt%Gd2O3掺杂Ba(Zr0.1Ti0.
学位
本报告基于笔者在中国人民解放军国防大学国际防务学院实习期间就纪录片《印度海军学院》所做的模拟英汉同传实践撰写。笔者以韩礼德的语域理论为指导,以芒迪的语域变量七种典型实现形式为分类依据,对此次口译实践中的具体案例进行深入分析,证明语域理论对口译实践具有较好的指导意义。韩礼德认为,语域包括语场、语旨和语式三个变量,分别对应三种“元功能”,即概念功能、人际功能和篇章功能。这些“元功能”由篇章生产者做的词
学位
卢武铉政府上台后依托韩国高速发展的经济基础,在军事领域进行了大刀阔斧的改革,最终出台了《国防改革基本计划(2006-2020)》。此后历届政府均以此为军事改革蓝本,根据实际情况不断做出调整。2015年年末,被喻为中国“60年来最大的一次军事改革”正式启动。分析研究韩国军事改革进程可为我国当下军改提供宝贵的经验教训。此外,韩军是韩美军事同盟的关键一环,加强对韩国军事改革问题的研究,有助于我们更加准确
学位