基于面向对象软件度量和机器学习的软件缺陷预测及质量改进

来源 :东南大学 | 被引量 : 0次 | 上传用户:lovehlq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
软件缺陷存在于软件开发的各个环节中,是影响软件质量的主要因素。随着现代软件产业规模的不断壮大和质量需求的逐步提升,软件缺陷预测(Software Defects Prediction,SDP)已成为降低开发成本、保障软件质量的重要技术手段。软件缺陷预测通常基于复杂度等度量指标,利用信息检索和机器学习等方法实现对潜在威胁发生概率的预估,其目的在于最小化测试与维护的时间和空间消耗,对于提升开发效率和提高可靠性有很大帮助。在传统的软件测试和维护过程中,开发人员为解决缺陷消耗了大量的资源,高效的缺陷预测技术可以用于指导资源的分配,提升整理的能效。迄今为止,学术界和工业界提出了很多缺陷预测模型。但这些模型缺少有效的适用范围分析,开发人员在具体的需求场景中难以选择合适的预测模型。为了更好的适应不同预测技术的特征,本文工作利用机器学习分类器来预测缺陷。本文工作基于支持向量机(Support Vector Machine,SVM)和极限学习机(Extreme Learning Machine,ELM),通过分析面向对象程序的多种度量指标,对软件缺陷进行分析预测。在具体工作中,预测模型通常使用基于测试数据和训练数据的三种不同的预测技术来创建,即交叉验证预测、交叉版本预测和交叉项目预测。我们的研究使用了跨版本的数据来预测软件缺陷,旧版本软件为训练集提供数据支持,有效保障了同项目后续版本缺陷的预测精度。为验证本文工作的有效性,我们从开源项目Eclipse的版本库中抽取了三个待测版本。建立缺陷预测模型的需要从历史数据中抽取实例,历史数据来源于VCS版本控制系统、缺陷跟踪系统和电子邮件记录等。一个实例包含多个从软件仓库中提取的度量指标和属性,相关代码被标记为是否存在软件缺陷,如存在则进一步标记缺陷数量。实例的标记信息用于机器学校算法的度量操作,为保障预测精度,我们引入了数据预处理的操作步骤。经过数据预处理,我们基于面向对象软件度量指标和算法来构建缺陷预测模型,旨在利用不同指标的特征预测不同类型的缺陷。实验中的数据被分割成多个文件进行打包。为了提高模型训练的精度,我们改进了支持向量机(SVM)和极限学习机(ELM)的使用方法,使其能够适应多种场景下的缺陷预测。为了验证模型的预测性能,实验中采用精确度、准确度、召回率、AUC(ROC曲线下的面积)等指标来评估预测结果。实验数据显示,支持向量机具有最佳准确度,AUC值明显降低。因此可以得出结论,支持向量机最适合交叉版本缺陷预测。将来,我们将使用更多的机器学习技术来预测缺陷的数量、缺陷的类型以及缺陷的修复建议,同时将我们的研究扩展到交叉验证预测和跨项目预测领域中。
其他文献
美塔协议签署后,阿富汗和平进程深受美国、阿富汗政府与塔利班三个行为体各自内部博弈的影响。美国内部博弈在以白宫行政系统为代表的"撤军派"和以国安职能部门为代表的"驻军派"间展开,主要分为三阶段:美塔协议签署至特朗普总统卸任,拜登总统上台至美国重启撤军,重启撤军至加尼政府倒台。最终"撤军派"主张在美国内部博弈中胜出成为美国政策。阿富汗政府内部博弈在以加尼为代表的"抵抗派"和以阿卜杜拉为代表的"和谈派"
蓝牙低功耗Mesh网络(BLE Mesh)是蓝牙技术联盟(SIG)推出的新型组网方式,相比于传统蓝牙技术,除了具备更多的节点通信和更远的传播距离之外,也面临着更多潜在的威胁与攻击,特别是当整个网络中使用相同的网络密钥时,对节点捕获攻击的抵抗能力较弱,存在着因单个节点被攻陷而会威胁到整个网络安全的问题。密钥管理是安全机制的基础,所以针对蓝牙低功耗Mesh网络的密钥管理机制的研究具有非常重要的意义。本
随着集成电路制造工艺进入到纳米尺度,工艺偏差对电路性能的影响越来越复杂。同时集成电路朝着更高的集成度和更大的电路规模方向发展,受工艺偏差影响的参数更多,具有明显的高维特性,一个适用于高维电路的良率分析算法亟待提出。本文针对蒙特卡洛方法所需仿真次数庞大、仿真时间长,以及现有大部分快速良率分析算法难以解决300维以上电路良率分析问题,基于低秩张量近似(Low Rank Tensor Approxima
随着科技发展,物联网设备的数量飞速激增,这在很大程度上方便了人们的生活,但也同样带来了新的安全问题。密码算法是所有物联网设备安全的基石,为了降低密码算法对物联网设备的资源消耗,近年来新的轻量级密码算法不断涌现。轻量级密码算法相较于传统密码算法消耗的资源更低,但是同样面临着差分功耗攻击的威胁。传统的防护方案更注重安全性的提升和降低频率损失,往往会需要较大的额外面积,不再适用于对资源消耗要求较高的物联
部分负荷下,提高冷冻水温可显著提升冷水机组的运行效率,实现空调系统节能,但随冷冻水温的提高,末端设备的换热除湿性能将降低,影响空调区域环境的舒适性。目前空调系统运行过程中因对舒适性影响难以预测,变冷冻水温调节主要根据经验设定,导致其节能潜力难以充分发挥。因此,研究部分负荷下以满足舒适性为目标的变冷冻水温空调系统优化运行对于充分挖掘变冷冻水温技术的节能潜力具有较大意义和价值。本课题以某办公建筑为研究
由于电源电压过低会导致模拟误差放大器无法有效控制功率管,所以模拟LDO在近阈值电压下性能下降。数字LDO可以在更低电源电压下工作,而且不同工艺间容易移植,在低电压条件下具有优势。数字LDO的调节速度和时钟频率成正比,但快速调节和低静态电流是一组矛盾,这制约了数字LDO的应用。针对数字LDO上述不足,本文设计了一种快速调节低静态电流的数字LDO。本文提出了一种阶梯控制方案,功率管阵列划分方式结合了二
随着人们对基于位置服务需求的不断增加,室内定位技术的应用前景和商业价值也日益增加。智能手机搭载的传感器越来越丰富,基于智能手机传感器的室内定位技术发展迅速,并获得了广泛的应用。其中,高精度、抗多径干扰的基于手机图像传感器的可见光定位(Visible Light Positioning,VLP)技术,以及低功耗、无需外界信号的基于惯性传感器的行人航迹推算(Pedestrian Dead Reckon
物联网智能节点芯片一般在休眠状态下具有较低的功耗,可使用能量采集电路将外界能量转化后为芯片供电,减少电池的能量消耗。相比于其它能量源,太阳能的功率密度较高,是理想的能量采集源。为了满足智能节点全天候、全方位的能量供应,需要实现低照度(~300lux)环境下的光能采集。本文设计的低照度光能采集电路主要从低电压自启动、开关电容拓扑、输入电压检测、工作频率调节以及双电压自供电五个电路模块来实现。针对低光
随着互联网技术的快速发展以及智能手机的普及,全球卫星导航系统(Global Navigation Satellite System,GNSS)提供的位置服务给人们的生活带来了极大的便利。然而在室内环境中,由于建筑物的阻碍以及室内的复杂环境,GNSS提供的位置服务无法满足用户的需求。因此,人们迫切需要一种在室内环境中能够提供高精度的位置服务的技术。基于WiFi的室内定位技术以其成本低、精度高、鲁棒性
针对新一轮电力体制改革影响下发电企业生产经营的转变,提质增效工作已是发电企业提升自身竞争力和生存的必然选择,电厂成本中占比最大的为燃料成本。本论文提出一种发电企业配煤掺烧与燃料采购的协同优化策略,指导企业深入结合煤炭市场与安全生产,统筹优化生产和经营关系,在降低发电成本的基础上实现企业利润的最大化。论文首先介绍了配煤掺烧对火电厂安全经济运行的影响,分析了配煤掺烧带来的安全风险,结合电厂实际总结提炼