基于特征提取的软件缺陷预测方法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:zhuyong006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
软件缺陷预测被用来检测待测软件是否有错误,它利用该软件历史版本的数据进行学习,来得出一种预测模型,对当前软件进行测试,来检测该软件的错误倾向。到目前为止,已经有很多方法被提出,如机器学习、统计方法等,这些方法都被用在软件预测上,且取得了很好的效果,本文在介绍软件缺陷预测的基础上,对特征提取技术进行探究,并做出了以下工作:(1)在软件工程中,大部分的模块数据是无标签的,所以想要得到大量的有标签的数据样本是不现实的,为了适应现实情况,很多方法已经引入了半监督学习,而拉普拉斯特征映射(LE)方法是一种无监督的维数简约方法,它没有充分利用样本数据中的标签数据,本文在LE方法上将样本标签考虑在内,提出了基于半监督学习的拉普拉斯特征映射方法(SSLE)。该方法将有类别标记和无类别标记的样本共同处理,在LE中使用半监督学习,改进LE方法。通过该方法可以有效改善特征提取的鉴别性。(2)LE方法能够很好的保留样本间的局部信息,但一般其所得投影向量是非正交的,这样LE方法得到的投影变换就会在样本间存在冗余信息,本文提出了基于半监督学习的整体正交拉普拉斯特征映射方法(SSHOLE)。该方法的基本思路是,先使用上面提出的基于半监督学习的拉普拉斯特征映射方法构建出目标函数,再在目标函数中加入正交约束,这样可以获得自然正交的投影向量。这种方法可以有效消除样本间的冗余信息,改善分类预测效果。(3)另外,现实生活中,软件数据通常具有非线性关系,为了能够很好的提取非线性数据的流形结构,本文使用核方法将样本投影到高维核空间中,将非线性样本变得线性可分,在该高维核空间中使用上面提到的基于半监督学习的整体正交拉普拉斯特征映射方法,提出了核半监督整体正交拉普拉斯特征映射方法(KSSHOLE)。该方法可以有效地改善预测模型的预测效果。本文将所提方法和对比方法应用在NASA、AEEEM和ReLink三个库上。经实验验证,可得本文提出的三个方法的有效性,并且和其他对比的特征提取方法相比,在分类性能上有一定的提升。
其他文献
1月13日零时55分,湖南省长沙市岳麓区西娜湾宾馆发生火灾,造成101人死亡、4人受伤。1卟小时后,
这是前不久发生在某小区的一件真事:消防人员在例行检查时发现,一个几百户的住宅小区,楼内大多数消火栓箱里竟然空空如也,根本不见水带、水枪、灭火器这些应该常备的消防器材。
儿童作为儿童鞋的消费群体,其足部功能发育尚不成熟但又活泼好动,对外界的认知能力有限但又充满好奇,他们的健康和安全易受到伤害。因而,儿童的健康成长与童鞋的质量密切相关。
2007年10月30日,由《首席财务官》杂志社主办的“首届中国企业金融创新论坛暨2007年度中国CFO最信赖的银行评选颁奖典礼”活动在北京世纪金源大酒店成功举行。令我们欣慰的是
在超级牛市和从紧货币政策的双重环境下,丽珠集团CFO安宁的价值创造之道,既要快速总现短期投资收益,同时又大幅压缩销售费用率。
电力电子、微电子技术以及现代控制理论的迅速发展和交流调速技术的日益成熟,在很大程度上促进了船舶电力推进技术的发展,使其应用领域不断扩展,船舶电力推进是未来船舶的发
随着我国经济的快速发展,税收筹划已被越来越多的企业管理者和财会人员接受和运用。民营企业尤其是中小型民营企业,由于在管理上还存在较多不规范现象,税收筹划尽管需求很强
“你是消防队的呀,我还公安局的呢!”“我是消防支队防火监督处的,我们到时开警车来,还会出示警官证!”“开警车来,警车还不是有假的……”日前,重庆涪陵支队一名防火参谋给辖区乡下
笼型倍半硅氧烷(简称POSS)作为一类具有三维结构、有机-无机杂化的纳米分子,在杂化多孔材料研究上有着广泛的应用。但是,随着研究的深入,已有POSS化合物已不能满足许多应用方
中国经济金融体制正处于一个前所未有的大转型时期。作为资本供求互动关系的主要构成者,企业与银行的业务合作关系正经历着史无前例的大变局。