用于软件缺陷预测的集成模型

来源 :计算机科学 | 被引量 : 0次 | 上传用户:ciscohd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
软件缺陷预测的目的是有效地识别出有缺陷的模块。对于类别平衡数据,传统的分类器具有较好的预测效果,但当数据类别比例分布不均衡时,传统的分类器往往偏向于多数类,易使得少数类模块被误分。但是,真实的软件缺陷预测中的数据往往是类别不平衡的。为了处理软件缺陷中的这种类别不平衡问题,文中提出了基于改进的类权自适应、软投票与阈值移动的集成模型,该模型在不改变原始数据集的情况下,从训练阶段和决策阶段同时考虑处理类别不平衡的问题。首先,在类权值学习阶段,通过类权自适应学习得到不同类的最优权值;然后,在训练阶段,使用前一步得
其他文献
通过卡尺结构、示值误差测量结果不足情况分析可知游标卡尺测量误差主要来源于:量具的握法、游标卡尺的零位误差、测量力的大小、读数方法、使用方法等因素,正确地使用游标卡
互联网在快速发展的过程中面临新的挑战,其中网络能耗问题尤为突出。学术界提出了大量用于解决网络能耗问题的方案,然而这些方案都考虑了网络中的实时流量数据,计算复杂度较
数据的完整性和可靠性是保证其能被高效访问的关键,尤其是在云存储环境中,数据副本策略是影响系统性能和保障数据可用性的核心。从数据副本布局的角度,提出了基于多属性最优化的数据副本布局策略(Data Replica Layout Strategy based on Multiple Attribute Optimization,MAO-DRLS)。该策略根据数据的访问热度和存储节点的关键属性特点,为每个
中小金融机构和中小企业在发展中都面临诸多问题,为有效提升中小金融机构核心竞争力,缓解中小企业融资难、融资贵的问题,搭建中小金融机构票据平台不失为一条有效途径。本文
车载自组织网络具有节点移动速度快、链路拓扑结构变化剧烈等特点,传统的城市道路环境车载自组织网络路由算法在路口经常会遇到局部最大化问题。根据城市道路环境的特点,利用