基于AdaBoost-SVM的软件缺陷优先级预测模型的研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:zhuzhuzhilian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
软件缺陷报告是开发人员和使用者在软件开发和维护中提交到软件缺陷库中的软件系统的错误。要管理铺天盖地而来的软件缺陷报告无疑是一项挑战性的任务。传统的方法是人工辨别,这种方法耗时费力,会延误重要软件缺陷的修复。基于数据挖掘中的分类技术,论文提出了一种机器学习的方法来开发软件缺陷优先级分类器,以实现对新提交的软件缺陷自动分配适当的优先级。由于软件缺陷报告的文本属性包含了软件缺陷的许多重要信息,在bug修复过程中起了至关重要的作用。要选择合适的文本特征词,就需用到文本分类技术对其形式化,论文根据传统的文本特征词选择算法提出了一种改进的基于语义分析的文本证据权的特征词选择算法。在此基础之上论文利用支持向量机的方法进行软件缺陷预测,支持向量机可以把线性不可分的原始数据映射到线性可分的高维空间,在新的映射数据中找到分类平面,满足软件缺陷报告优先级的分布情况的需要。最后,论文又提出一种基于AdaBoost-SVM算法的软件缺陷优先级预测方法,由支持向量机做自适应增强算法(AdaBoost)的弱学习机,此方法利用了AdaBoost的优势,在训练过程中侧重错分的样本,最终获得强分类器。分类器的实验评估是使用精确度、召回率和F值来衡量。实验表明,基于AdaBoost-SVM算法的软件缺陷优先级预测方法的各项指标均有所改善,尤其是召回率,但是运算复杂度高于基于SVM算法的预测方法。
其他文献
数码照片和视频数据的急剧增长需要既能支持速度快又能支持内容形象化浏览的表达技术。随着图像文件数量的爆炸式增长,管理大量图像的内容的能力已成为一项关键技术。  一
目前国内外各个城市都在积极构建智慧城市应急指挥平台,但盲目无序的重复建设无法保证平台功能的完备性、通用性和可扩展性,本文将通过对于大量平台应用实例的分析,从领域工程的
随着网络和存储技术的不断发展,越来越多的数据呈现出数据量大、维数高等新的特点。这些海量的高维数据包含更加丰富信息的同时,也带来了如维数灾难、计算量大等问题,对数据
当前全球化竞争不断加剧,企业要寻求新的发展,必须专注于自己的核心业务,将自己擅长的方面发挥到极致;同时,企业对于自己不擅长的业务可能需要借助于其他企业的制造服务和能力
钻孔柱状图、勘探线剖面图等是地质工作者经常使用的基础性、先导性图件。它们是由各种花纹图案、曲线、文字等基本符号构成的,不仅能够清晰的表达地层岩性、地层特征,而且能够
网络时代涌现了大量与个体相关数据,即微数据,微数据对趋势分析,疾病预测以及经营决策具有重要的意义,因此很多组织开始收集和发布一些微数据,如医院会发布患者的医疗数据用
语义网的不断发展使得RDF数据存储系统成为一个重要的研究课题。传统RDF数据存储系统在互联网数据爆炸式增长的趋势下遭遇难题,存储能力和查询响应性能都已不能满足用户日益增
自21世纪以来,全球各国的城镇化率不断提高。人口大量涌入城市,致使城市的人口密度密度大幅度增长。在人群密集型的大型公共场所中发生拥挤、踩踏现象造成人员伤亡的事故越来越频繁。这类公共安全问题引起了人们的恐慌,造成了大量的财产损失,也严重干扰了城市的发展步伐。计算机仿真技术为人群行为仿真提供了快速安全的方式,克服了采用真人演练模拟人群疏散的弊端。通过对人群行为模拟,在人群聚集的公共场合中发生公共安全问
在当今的大数据时代,图像信息非常重要,为此我们需要分析图像,在图像分析中,纹理特征是图像中极为关键的信息,所以纹理分析是图像分析中非常重要的研究分支。由于对于机器视
本体是对特定领域之中某套概念及其相互之间关系的形式化表达。作为一种知识表达的方法,本体已经在很多领域得到了广泛应用,如Tim Berners-Lee提出的语义网构想和生物医学信