论文部分内容阅读
软件缺陷预测的目的是通过历史缺陷数据预测新软件模块的缺陷倾向性,从而提高软件系统的质量。软件的缺陷模块存在结构复杂和类别分布不平衡的问题,并且历史数据是有限的。针对这些问题,提出了一种多核集成学习的跨项目软件缺陷预测方法。跨项目软件缺陷预测是解决项目初期缺陷预测缺乏数据集的有效途径。多核学习方法能够将不同特性的核函数进行组合,使数据在新的特征空间中得到更好的表达,提高预测精度。集成学习方法能够解决类别分布不平衡问题。考虑到在软件缺陷预测中将有缺陷模块预测为无缺陷模块的风险远远大于将无缺陷模块预测为有缺陷模