HFS:一种面向软件缺陷预测的混合特征选择方法

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:jiuki
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在软件缺陷预测研究中,若考虑了大量度量元会造成数据集中含有大量特征,其中冗余特征和无关特征会降低缺陷预测模型的性能。提出一种两阶段混合特征选择方法 HFS,具体来说,首先基于特征子集评估器移除已有特征集中的无关特征和冗余特征,随后基于特征排序评估器进一步移除其中的无关特征。在实证研究中,以基于实际开发项目的数据集作为评测对象,以NONE、CFS和CAR三种方法作为与HFS方法比较的经典方法。最终基于三种不同类型的分类器(包括决策树法、支持向量机和最近邻法)上,发现HFS方法不仅能够选出更小规模的特征子集,
其他文献
针对传感器量测信息异常与传感器之间数据传输错误,融合系统中的数据会出现异常值(outlier)的目标跟踪问题,提出了一种集中式非线性抗差卡尔曼滤波算法。该方法应用鲁棒统计理论
为解决集装箱港口岸桥和集卡资源紧张的现状,针对岸桥和集卡协调调度问题,综合考虑集装箱顺序及岸桥干涉、集卡作业面调度等约束,建立了一个以最大完工时间最小化为目标的混合整
基于程序频谱的动态缺陷定位(spectrumbaseddynamicfaultlocalization,SFL)可分为基于可执行语句覆盖的方法和基于谓词覆盖的方法。通过分析以上两类方法可以发现:a)基于可执行语
针对产业链协同Saa S平台业务功能动态定制的特点,在研究云平台业务功能个性化定制架构的基础上,分析了产业链协同Saa S平台业务功能自适应演化的需求,基于复杂适应系统理论
针对两类树状输运网络——自然演化的克隆植物网络和人工建造的城市地铁网络,构建L空间和P空间下相应的网络模型,通过网络拓扑结构特征和随机树两个角度进行比对分析。研究发现,虽然这两类网络构建目的不同,但它们在L空间和P空间下都展现出相似的拓扑结构;同时将这两个网络的结构与随机分支树进行比较,发现它们以相同的方式和程度偏离随机分支树的预估值。
大数据空间分析是Cyber-GIS的重要方面。如何利用现有的网络基础设施(如大规模计算集群)对大数据进行并行分布式空间分析仍然是一大难题。提出一种基于MapReduce的空间权重创建
面向方面的规范描述在软件体系结构建模和分析中起着重要的作用,但目前已有的方法不能对体系结构方面及其编织逻辑的详细描述提供足够的支持,也缺乏行之有效的方法对方面的编织
针对软件可靠性模型中对故障检测率行为描述的不足,考虑软件固有的故障检测率是一个随时间增加的减函数,以及测试人员的学习能力是一个随时间增加呈S型的增函数,两者共同决定