一种半监督集成学习软件缺陷预测方法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:BarDy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对软件缺陷预测中标记样本难以获取以及分类不平衡的问题,提出一种基于半监督集成学习方法的软件缺陷预测模型(Tri_Adaboost).一方面利用欠采样方法以及半监督学习对标记样本进行扩充,随机选取一部分无标记样本进行预标注,缓解标记样本不足的问题;另一方面,利用SMOTE方法对扩充后的标记样本进行采样,然后使用AdaBoost集成方法对标记样本集进行预测.本文在NASA MDP数据集及基于开源项目下生成的空指针引用缺陷数据集上,验证模型的有效性,较于四种基本的机器学习分类方法,Tri Adaboost算法在F-measure和AUC上均能取得较高的值.
其他文献
本文以河北为例系统地分析了气象灾害管理的必要性,气象灾害管理的要素、原则和模式,根据气象灾害风险管理的特性,结合河北“7.21”特大暴雨的实例,查找河北省气象灾害管理的
文化的定义之多,难以数计;文化与文明之别,细入毫芒:似乎因人而异,各自为说.但在名词解释的基础阶段,总该有常识性的、字面上的共同说法.为此,我翻检易得之书(1979),其对“文
以两优287为材料,研究了水分管理与氮肥运筹对鄱阳湖流域水稻磷素吸收利用的影响。结果表明,在等量磷投入的条件下,磷素积累总量随施氮量的增加而增加;间歇式灌溉抑制了水稻
针对现有的无参考语音质量评价与主观评价结果相关性较低、无法满足市场需求的问题,本文提出了一种基于栈式自动编码机(SAE)的无参考语音质量评价新方法.该方法由BP神经网络
美国将一次死亡5人(含)以上的居住建筑火灾和一次死亡3人(含)以上的非居住建筑、非建筑火灾定义为造成重大人员伤亡的火灾.2001年,美国共发生537起此类火灾,造成2 975人死亡-
针对一类具有时变时延和丢包的网络化控制系统,同时考虑模型参数不确定性和外界扰动的影响,基于一种状态多时延模型,以时滞依赖的方法,推证出了确保闭环系统在执行器或传感器发生失效故障时具有鲁棒H∞完整性的判据,并以求解线性或非线性矩阵不等式的方式,给出了鲁棒H∞容错控制器的设计方法。由于模型中考虑了时延下界,且证明过程未进行模型转换和交叉项放大处理,其结果具有较少保守性。最后以一仿真示例验证了所述方法的
随着人类社会的进步与发展,当前企业对员工素质的要求也正逐渐提高,这就给学校的人才培养提出了更高的要求。对企业来说,良好的职业技能与职业素养是企业员工必备的两项基本
在 进 入 中 国 第 22 年,Archer Daniels Midland公司(下简称艾地盟公司)着手进入中国水产饲料业务.据悉销售工作在今年年内稳步进行总部位于美国芝加哥市的艾地盟公司(ADM)
期刊
权威:权力与威势,含涉尊严与力量。当下中国的安全监督缺乏权威,这是一个不争的事实。高悬权威的安全监督“尚方宝剑”,是遏制生产安全事故的有力武器。呼唤权威——捍卫生
1 税控收款机标准基本情况rn根据信息产业部《关于成立税控收款机标准工作组的通知》(信科函[2002]1 9号)和国家税务总局《国家税务总局关于报送税控收款机税控功能业务需求