【摘 要】
:
随着信息社会的发展和科技的进步,人们对软件系统的依赖逐渐加深,软件质量的可靠性保障越来越重要。软件缺陷预测作为检测缺陷模块的重要手段之一,可以通过对历史仓库的挖掘,描写与之相关的度量信息形成数据集,利用机器学习等方法对数据集进行学习,构建有效的预测模型。以测试出包含高缺陷的模块,对其进行检测,优化测试资源的分配。然而现实中有缺陷的数据样本较少,会导致机器学习训练后,更易将测试数据划分成多数类,在软
论文部分内容阅读
随着信息社会的发展和科技的进步,人们对软件系统的依赖逐渐加深,软件质量的可靠性保障越来越重要。软件缺陷预测作为检测缺陷模块的重要手段之一,可以通过对历史仓库的挖掘,描写与之相关的度量信息形成数据集,利用机器学习等方法对数据集进行学习,构建有效的预测模型。以测试出包含高缺陷的模块,对其进行检测,优化测试资源的分配。然而现实中有缺陷的数据样本较少,会导致机器学习训练后,更易将测试数据划分成多数类,在软件缺陷预测中严重影响模型的分类性能。因此采用一定的方法缓解类不平衡问题是很有必要的。本文主要工作有:(1)在数据预处理层面,为了利用缺陷数据自身周围分布的类别特性,以进行准确的过采样形成合理而平衡的数据集,本文提出了一种新的多层次自适应判断合成随机过采样方法AJCC-Ram(Adaptive Judgment Cure Clustering Random Sampling),该方法基于改进的ADASYN自适应过采样和CURE-SMOTE过采样,分别在类边缘和类中心多层次生成新样本形成平衡数据集,再通过CLNI进行平衡数据集的噪声过滤清理。实验在软件缺陷预测常用数据集AEEEM和NASA中与多种采样方法在朴素贝叶斯分类器中进行了对比,实验评价指标F1结果表明:AJCC-Ram方法可以获得更稳定,更高效的预测结果。(2)在算法分类方面,为进一步改善分类器在类不均衡数据中的分类效果,对XGBoost(e Xtreme Gradient Boosting)集成学习器进行了理论研究,并进行数据集AEEEM和NASA下的适度调参,将调参后的XGBoost集成学习器与各式机器学习分类器进行了对比实验研究,证明了XGBoost学习器的有效性。(3)在模型构建阶段,本文在上述的研究基础上,建立了一个基于过采样和集成学习的不平衡数据软件缺陷预测模型XG-AJCC(AJCC-Ram+XGBoost)。实验比较了AEEEM和NASA数据集在多个采样集成的不平衡数据处理中的应用。以评价指标F1值,表明了:XG-AJCC预测模型可以有效地降低数据不平衡对软件缺陷的预测影响,以获得更稳定,更高效的预测结果。
其他文献
多金属氧酸盐(POMs)是由金属离子、或者非金属离子通过氧离子形成的簇合物,能够进行多重电子转移反应,在电化学和催化中具有重要应用。在POMs家族中,Keggin型POMs的研究备受瞩目,在功能有机配体存在的情况下与过渡金属离子相互作用,形成多维扩展结构的Keggin型无机-有机杂化物,已成为电催化、储能和传感器应用领域合适的候选材料。然而,大多数已知的杂化物都集中在以主族原子为中心的多氧阴离子上
化石燃料燃烧造成的能源消耗和环境污染,使开发替代性能源存储技术成为解决问题的重要途径之一。超级电容器是一种对环境友好、充放电快速的新型储能装置,由于其较高的功率密度、持久的循环稳定性等优点而备受青睐。电极材料是超级电容器的重要组成部分。要获得性能优异的超级电容器需要从电极材料的设计和可控制备开展研究。多金属氧酸盐(POMs)具有优越的质子/电子转移和储存能力,是超级电容器理想的电极材料。Keggi
人们对矿物燃料的枯竭及日益增长的能源需求,极大地促使人们研制高效率和低成本的电化学能源储存系统。研究并利用一个具备低功耗、高稳定性以及较长循环寿命等优势的储能体系成为目前十分紧迫的关键任务。由于低成本和高理论能量密度,室温钠硫电池已引起广泛关注。但是,单硫和多硫代物中介载体的存在致使电子导电性显著降低,以及反应中间体溶解严重和充放电循环过程中的体积变大等问题,极大地制约着其进展。为了解决这些问题,
集成学习作为机器学习领域的一个重要研究方向,可以通过集成多个基学习器的方式获得比单个学习器更强的能力。由于集成学习优异的性能,使其不仅在回归、聚类、分类等任务方面中取得了显赫的成绩,而且被广泛应用于目标识别、目标跟踪、入侵检测、辅助诊断等实际领域。在集成学习中,选择合适的基学习器和使用有效的结合策略对最终集成学习模型的结果有着重要的影响。目前集成学习中的结合策略单一,难以有效挖掘基学习器之间的信息
石油管道的安全运输对于环境保护以及管道管理公司都具有十分重要的意义。在长期的石油管道运输过程中,由于管道自身材质老化、腐蚀和第三方破坏等因素在一定程度上降低了管道运输的安全性,导致安全事故频发。因此,有必要对石油管道进行泄漏检测,同时对泄漏量的大小进行估算,以便后续采取相应的修复措施,所以对石油管道泄漏进行检测具有理论与实际应用价值。在石油管道运输中,泄漏往往是由少量泄漏逐渐演变成大量泄漏,而在初
直接甲酸燃料电池(DFAFC)被认为是有前途的能量转换装置之一,而钯(Pd)基纳米催化剂虽然在甲酸氧化反应(FAOR)中表现出优于铂(Pt)基纳米催化剂的催化活性以及抗毒化能力,但是考虑到Pd的高昂成本以及并不出众的稳定性,开发活性高、稳定性优良的低成本Pd基催化剂急不可待。针对以上问题,本论文对纳米催化剂的成分以及形貌等方面进行调节,具体内容及结果如下:本论文首先采用一种不添加有机溶剂的简便方法
随着新时代的快速发展,人们对电子储能设备的需求量和关注度逐渐增加。在众多电池体系中,其中以镍金属化合物材料为正极的水系锌离子电池脱颖而出。其表现出电压高、在水电解质中稳定、平衡电位低、功率密度大、环境危害小、安全性好、储量大、制备成本低廉、可重复利用率高等优点。然而镍基材料也存在需要解决的问题,例如导电性、容量和循环寿稳定性都不理想等。因此为推动开发具有高性能的电池储能系统的研究进程,重点是研究出
南方科技大学教育集团第二实验学校通过八年多的跨学科课程改革,撬动了学校空间场景、互联技术、师生发展、组织管理等系统变革,塑造了满足儿童内在需求,凸显儿童主体地位的学习生态。在这样的学习生态中,儿童得到充分尊重,儿童的潜能得到充分激活,儿童的创造力得到充分释放。
钠离子电池因资源丰富、价格低廉、安全性高等优点,在大规模电化学储能领域展现出极大的发展潜力,是我国实现能源与环境可持续发展的重要途径。相比于其它电化学储能技术,钠离子电池在经济和技术层面都呈现出优异的可行性。基于此,面向储能领域高质量发展的国家重大战略需求,聚焦钠离子电池电极材料、电解液、隔膜等关键部件,以及它们之间的相互联系、相互作用机制,总结归纳出钠离子电池关键科学问题,并提出相应研究方向和解
新媒体时代背景下,我国网络暴力的发生频率快速增长,非理性网络失范行为导致当事人合法权益受到侵害,社会和谐稳定受到威胁。网络暴力的规范治理是一项系统工程,必须以法律规范做保障,弥补立法缺陷;以技术控制为手段,强化平台监管;以道德自律为根本,提升网民媒介素养,共同构建海晏河清的健康网络环境。