基于多层特征选择的软件缺陷预测模型研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:yfg1243
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在软件工程中,软件缺陷是对软件质量影响最大的因素。人工审查代码的速度和效率已经日趋不能满足软件系统生产发展的需要,因此,高效的软件缺陷预测变得愈发重要。本文针对软件缺陷预测中的特征选择问题进行了深入研究,以支持向量机为分类器,搭建了软件缺陷预测模型,并使用多个评价指标检验软件缺陷模型的性能。主要研究内容如下:首先,提出了一种基于多种关联性指标的综合排序过滤式特征选择算法。为了合理的评价特征与标签的关系,该算法从统计学、概率学和样本关系三个不同角度考虑,基于平等性原则综合评价特征,使用动态自动阈值调整策略自动选择特征子集,根据特征与标签的关联度来对缺陷数据进行降维。其次,本文提出了一种基于聚类的包裹式特征选择算法。为降低特征之间的冗余性,该算法通过皮尔逊相关系数度量特征彼此的关系,使用层次凝聚聚类算法进行特征聚类。按照包裹式特征的思想,采用前向选取策略,逐步选取簇中的最优特征,直至模型性能不再提升,至此完成特征选择。此算法根据特征之间的关系进行聚类分析,降低了特征子集中的冗余性。再次,本文建立了一个基于多层特征选择的软件缺陷预测模型。采用多层特征选择方法,遵循“最大相关最小冗余”策略,使用支持向量机为基础分类器,以此来搭建软件缺陷预测模型,实现对软件缺陷的预测。最后,使用NASA的公共软件缺陷数据集SDP进行了实验,验证了本文所提出的特征选择算法的有效性,并将本文的软件缺陷预测模型与其他学者的模型进行了对比,并对实验结果进行分析。
其他文献
脑-机接口(BCI)研究的一个挑战是在保证准确识别的前提下减少对用户的训练时间。基于运动想象(MI)范式的BCI需要训练一段时间来调整系统适应每个用户的大脑,通过获取用户的脑电图(EEG)创建分类器,此分类器的性能取决于用于训练的数据量,更多的数据可以改善分类器性能,但也会增加训练时间,这对于某些患者而言尤其成问题。为此,本文提出在离线状态下,设计一个能够缩短用户训练时间的BCI系统,以期在小训练
目的:探讨绶草中分离得到的两个菲类化合物orchinol和spiranthesphenanthrene A对人肝细胞癌HepG-2、人胃癌AGS和小鼠黑色素瘤B16-F10细胞的抑制作用及其可能的作用机制。方法:1、通过MTT实验检测不同浓度的orchinol作用于HepG-2细胞48 h对细胞相对活力的影响;通过细胞克隆形成实验检测不同浓度orchinol对HepG-2细胞克隆形成的影响;通过流
大脑中普遍存在同步现象,是大脑中不同模块之间信息传递、相互作用的综合表现,分析大脑中不同区域的同步特性,可以研究各脑区之间的联系。本文基于互信息方法,通过信号的趋势信息计算序列的概率,构成加权趋势互信息算法;使用余弦相似度算法计算相空间重构后向量的相关性,构成余弦相似度同步强度算法。并对轻度认知障碍脑电信号的同步特性进行研究,探究轻度认知障碍与脑电同步的内在联系。首先,针对排序同步算法的缺点,利用
交叉频率耦合(cross-frequency coupling,CFC)作为一种能够反映神经肌肉系统中大脑与肌肉间跨频带振荡的信息交互及传递的现象,有助于理解运动控制过程及其运动障碍的病理机制,为脑卒中康复状态辅助评价提供了全新视角。大脑不同节律的耦合状态被证明与大脑的认知、记忆等活动密切相关,交叉频率耦合分析从脑电信号不同节律之间相互作用的角度刻画其特征,具有明显的优点。本论文从运动控制系统的非
脑机接口(Brain-Computer Interface,BCI)的发展旨在提供一个从人到计算机的沟通渠道,从而将大脑活动转换成一系列控制命令。近年来,BCI与计算机游戏交互的应用日益流行,相对于其他类型的BCI游戏系统而言,基于稳态视觉诱发电位(Steady-State Visual Evoked Potential,SSVEP)的BCI游戏系统具有更高的识别准确率和更短的训练时间,在推进BC
运动想象(Motor Imagery,MI)是脑机接口(Brain Computer Interface,BCI)系统中最常用的控制范式之一。运动想象脑电信号(Electroencephalogram,EEG)的分类与意图识别,则是基于运动想象的脑机接口系统的一个重点研究角度。本文将以左右手运动想象脑电信号为研究对象,以提高脑电信号的识别率为研究目标,结合运动想象脑电信号的特性,对脑电信号的伪迹去
以光纤、波带和波长为主的三层多粒度光交叉连接(Multi-Granularity Optical Cross-Connect,MG-OXC)结构已得到广泛应用,但该结构中波长利用率低、波带受波长连续性限制。而基于光码分复用技术(Optical Code Division Multiplex,OCDM)的三层结构,可以提高波长利用率,但端口使用数明显增多。针对以上问题,本文采用包含光纤、波带、波长和
快速序列视觉呈现(Rapid Serial Visual Presentation,RSVP)是一种典型的脑机接口(Brian Computer Interface,BCI)实验范式,在以10 Hz频率快速呈现大量图像刺激的同时,采集被试观看过程中的脑电信号(Electroencephalogram,EEG)并进行实时处理,提取出目标图像相关的脑电特征并用于分类,从而实现对特定目标图像的识别。本文
压缩感知是一种重要的信号处理技术,已经被广泛应用于医疗成像、射电天文等领域。其理论不受传统采样定理的束缚,统一了采样与压缩,用极少的采样量便可完整恢复出原信号,节省了大量的空间,避免了不必要的资源浪费。测量矩阵构造研究是压缩感知领域的关键技术之一。随机测量矩阵不仅需要存储大量数据,占用过多存储空间,而且因为是随机生成数据,对硬件配置有较高要求。为了适应实际需要,确定性测量矩阵研究受到广泛关注。该文
开放式领域的对话系统由于单轮语料库的容易获得以及深度学习技术的发展而取得了巨大的成功,但多轮对话因为其中经常出现的指代和信息省略现象,使得机器难以理解对话中的真实意图。近年来,不完整语句重写的任务引起了广泛关注,通过重写语句作为预处理过程,可以帮助进行后续的多轮对话建模。本论文研究的任务就是构建语句重写模型,通过学习与不完整语句相关的上下文信息,以恢复所有关键引用和省略的信息,帮助机器理解整个对话