基于代码特征的软件缺陷预测方法研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:gmgan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
软件缺陷预测可以预判软件模块是否缺陷,针对性分配测试资源,提高产品质量,一般基于代码特征实现。本文针对其中的类不平衡问题和特征选择效率问题进行分析处理,最终提出一种高效、稳定的软件缺陷预测方法,并进行系统设计与实现:首先,提出一种基于核密度估计的不平衡处理方法,用于解决不平衡处理中新样本无法充分覆盖缺陷风险特征空间,造成模型对缺陷样本识别能力不足问题。为各特征建立单独的概率分布模型,并以“继承”和“变异”相结合的方式,合成新的缺陷样本直至数据集平衡。“继承”表示新样本特征值源于已有样本,“变异”表示用概率模型采样值替换部分特征值。因所有概率模型均基于全体缺陷样本,相比传统插值类方法,新样本覆盖范围更广,且更符合原分布,有助于识别各种不同的缺陷样本。实验表明,该方法能有效提高缺陷样本的识别率。其次,提出一种针对相关性特征选择的效率优化模型。由于上述不平衡处理中各特征的概率模型是相互独立的,故应消除数据集中冗余特征。现有的特征选择方法存在较多重复计算,算法效率低。通过对优先度计算公式进行基于熵粒度的分析重构,找出其中重复计算,设计“累加映射表”与“计算映射表”,将其转化为更高效的映射表访问操作。实验表明,可在保持算法性能一致的前提下,显著提升算法效率。最后,结合以上方法,提出一种基于代码特征的软件缺陷预测方法并进行系统设计与实现。首先利用基于熵因子分析的优化模型对已有特征选择算法进行效率优化,快速筛选出具有代表性的特征子集,然后利用基于核密度估计的不平衡处理方法进行数据处理,最后分类器训练得到预测模型,输入新模块特征预测。
其他文献
现实世界的工程优化中存在着大量含有多个冲突目标的组合优化问题,被称为多目标组合优化问题。强化学习,作为常见的时序决策方法,可应用于求解组合优化问题。本论文围绕强化学习与多目标组合优化开展交叉研究,主要研究内容包括以下两方面:首先,Pareto局部搜索是求解多目标组合优化问题的主流方法之一。在Pareto局部搜索中,如何选择一组好的初始解集并对其邻域进行搜索,将决定其最终性能。我们将多智能体强化学习
学位
系留气球是一种重要的浮空器,软件是系留气球设计和优化的重要工具。根据VTK功能和可视化机制,基于VTK几何构建和三维模型可视化技术对系留气球设计和优化软件进行开发探索。在Qt平台上使用C++语言开发系留气球三维可视化平台,该平台包括显示控制和截面切割等功能,可初步实现系留气球的设计。测试结果表明,基于VTK的几何构建及可视化技术能够满足系留气球三维模型可视化要求,可用于系留气球设计软件的后续开发。
期刊
现实世界中的优化问题往往含有多个目标以及双层嵌套结构,这些问题被称为双层多目标优化问题(BLMOPs)。对BLMOPs直接嵌套求解将消耗不可忍受的计算资源。因此,如何设计方法对BLMOPs进行高效地求解至关重要。本文的研究内容主要包含以下两部分:第一,变量分解是解决双层优化问题的有效手段。针对现有双层变量分解中对上层变量间相关性以及分组间的弱相关性欠考虑的不足,提出了一种基于静态变量分解的双层多目
学位
传统的移动云计算(Mobile Cloud Computing,MCC)逐渐转向移动边缘计算(Mobile Edge Computing,MEC),以满足低延迟场景的需求,并且合理的部署边缘服务器是构建MEC系统中基础的问题之一。传统的边缘服务器的部署工作包括边缘服务器的选址和计算能力的分配两部分内容。在5G网络环境中,将MEC服务器部署在5G基站中是一种典型的方式,接下来如何合理的分配边缘服务器
学位
在移动App快速发展的同时,也暴露出多种质量问题,例如安全缺陷、功能缺陷。为了保障移动App的质量,缺陷分析和测试等活动已成为开发和质量保证人员关注的焦点。随着自然语言处理和机器学习技术的发展,从用户评论中挖掘有价值的缺陷信息已成为软件工程领域的热门研究。评论中包含大量有价值的用户反馈,可为开发和测试人员可以发现和分析用户反馈的缺陷问题提供参考,并进一步支持测试等质量保证活动。然而评论数据海量,非
学位
互联网时代信息爆炸性增长,选择一个符合用户要求的子集来代表整个数据集是数据库系统中一项重要功能。作为多准则决策的重要工具之一,遗憾最小化查询可以很好地满足该功能需求。为了降低查询的遗憾率,交互策略可以不断地逼近用户真实想法,从而降低遗憾率。然而现有的交互查询算法存在交互轮数过多的缺陷。本论文针对已有算法存在的缺陷,设计出高效的交互遗憾最小化查询算法。论文主要工作和创新点如下:(1)提出了基于排序的
学位
增值评价是以学生成长为核心,以学校发展为目标的一种评价方式,可以更公平地评价学校效能。增值评价有多种数学模型,其中,与基于平均名次、基于标准分的两种模型相比,基于学生成长百分位和多层线性回归两种模型的优势在于能够避免优秀学生增值空间受限的问题。在多层线性回归模型中纳入学生性别、家庭社会经济地位指数等学校不可控的生源因素,可有效排除生源因素对学生的影响,更符合关注学校“净效能”的评价理念。
期刊
该文按照标准YY/T 0342—2020的要求,分别采用挠度法和位移法对3种不同规格型号的金属接骨板进行四点弯曲测试,计算出金属接骨板的弯曲强度和刚度。通过探讨2种测试方法的差异和数据分析,最终发现应用挠度法和位移法测定接骨板弯曲刚度的结果基本一致。但是,测定接骨板弯曲强度时,2种方法测得的结果差异较大,不能直接进行对比。这为金属接骨板的力学性能检验和研发过程中方法的选择提供了客观的数据及指导。
期刊
近年来,差分隐私在研究领域已经逐渐成为数据隐私保护的实际标准。本地差分隐私在继承差分隐私特性的基础之上,细化了对个人隐私数据的保护。现阶段,基于本地差分隐私的数据统计与分析已有大量的相关工作,并且一些基于本地差分隐私的技术已经在工业界得以应用。但是,随着用户个人隐私保护意识越来越强,需要进行隐私保护的场景越来越多,保护的数据越来越复杂,现有的基于本地差分隐私的数据统计与分析机制还有许多改进空间。基
学位
随着5G和物联网的快速发展,窄带物联网(NB-Io T)作为专门为低速率物联网应用而设计的新兴蜂窝通信技术,具备低功耗、深覆盖、大连接、低成本的优势。NB-Io T网络可以基于当前的蜂窝网络进行软件升级实现部署,因此受到了国内运营商的青睐,得到了快速的发展。用户设备的小区选择决定其通信质量,因此是蜂窝网络中的重要问题。但是,由于NB-Io T与以往的蜂窝网络技术的应用场景不同、更加关注能耗、终端设
学位