基于卷积自动编码器的软件缺陷预测方法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:rserrrrr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
一个理想的软件缺陷预测模型能发现软件中隐藏的各种缺陷,能够极大地帮助开发团队降低开发周期,减少维护开销,提高软件可靠性等等。在软件缺陷预测中,软件特征和分类算法的选择对于预测性能有重要影响。因此,研究者们就如何设计能反映软件质量的特征,以及提出相应算法来构建预测模型展开了研究。当前所使用的传统软件特征主要关注软件模块的代码规模,复杂度等属性,忽视了源代码中丰富的语法和语义信息。在传统特征上构建的预测模型存在一定局限性。有研究人员尝试借助人工神经网络强大的学习能力从软件源代码中提取新的语义特征。然而,不同类型的特征都是对软件缺陷性质的反映,仅使用传统特征或者语义特征来构建单个预测模型性能不够理想。此外,在跨项目缺陷预测中,不同项目之间特征分布存在差异,直接将源项目上训练得到的预测模型迁移至目标项目可能存在“欠适配”等问题。本文工作主要包含以下四个部分:(1)考虑到卷积自动编码器在特征提取方面的优点,本文将其与程序抽象语法树结合,提出了一种基于卷积自动编码器的代码语义特征提取方法。该方法能够从软件源代码中获取到丰富的语法和语义信息,有助于提升缺陷预测的准确性。(2)通过在不同特征空间中训练得到个体分类器,并使用集成学习来集成多个分类器,提出了一种基于集成学习的同项目缺陷预测方法,能够减小预测模型的泛化误差。(3)针对源项目和目标项目之间语义特征存在分布差异的问题,提出了一种基于可迁移卷积自动编码器的跨项目缺陷预测方法。通过领域适配,该方法最小化不同项目之间的最大均值差异,使其特征分布更加匹配,并提升了跨项目缺陷预测的性能。(4)通过总结软件缺陷预测流程,设计并实现了一个软件缺陷预测系统。该系统能提供有关缺陷预测的服务,以帮助用户更好地保障软件的可靠性。
其他文献
张量鲁棒分解问题在信号处理、模式识别、机器学习以及计算机视觉等研究领域具有重要的应用.本文主要研究三阶张量的平均秩加零范数的最小二乘损失正则化问题,以从噪声观测数据中恢复低秩张量和稀疏张量.首先,本文借助3模积从代数角度研究了三阶张量Tubal秩的计算,给出了原始张量与沿第三维度进行离散傅里叶变换后张量在CP秩、Tucker秩的关系.这有助于理解张量秩的定义,并对后续研究奠定了理论基础.其次,尽管
近年来,可再生能源和氢能发展势头迅猛,利用可再生能源制氢已经成为碳减排的重要途径之一。由于风能/太阳能自身存在的随机性和波动性,使得可再生能源发电制氢系统的稳定性和经济性受到影响,这也是限制其大规模发展的主要原因。因此有必要思考如何利用好风/光资源,实现大规模稳定制氢。风能光能发电制氢是一个复杂的过程,本文先分析了风力发电、光伏发电、蓄电储能、电解制氢、储氢等各部分的工作原理,建立了数学模型,并运
随着无线通信系统的发展,±45°双极化天线因其具有抗极化失配以及抗干扰能力强等优点被广泛应用与基站系统,宽带天线能覆盖多个通信频段,减少天线数量,从而大大节约通信系统成本,因此,宽带双极化的研究具有重要意义。如今已经进入5G时代,我国已经对5G频谱进行了划分,要想同时满足中国移动联通、中国移动以及中国电信三家公司的5G频段,天线带宽至少要覆盖2.5GHz-4.9GHz,相对带宽达到65%。同时,5
我国的电力装机容量保持稳定的增长态势,但电力需求增长明显放缓,同时电力体制改革给发电公司带来严峻的挑战,电力市场竞争越来越激烈。如何减少项目投资、优化进度管理、提高安全管理水平是各发电公司亟待考虑和解决的问题。随着时代的发展,传统的电厂建设方式已不能满足电力企业对工程进度、成本和安全管理的需要。PDMS软件是电力行业三维建模的主流软件,其特点是全比例模型,以数据为中心,在管道设计方面有强大的优势,
面曝光3D光固化打印技术采用切片逐层固化成型方式,具有打印精度高和打印速度快等优点,广泛应用于高精度复杂结构试样的制备。面曝光3D打印过程的模拟仿真与精度研究一直是人们所关注的重点。在面曝光3D打印成形的仿真模型中,存在逐层曝光、多物理场耦合、约束载荷实时更新迭代等众多影响因素,同时打印材料的差异也会引起打印过程新现象的出现。目前在面曝光打印成形仿真模拟时,研究人员对几何模型的处理、载荷条件、反应
演化计算是一种适用于求解复杂、高维、大规模问题的全局搜索算法。通过将数据向量模拟为生物中的基因型,模拟自然界中物种的进化过程,对数据向量进行交叉、变异等操作,并从新生成的个体以及原有个体中选取更加适应环境的个体作为新的种群,从而不断迭代对数据进行优化,最终寻找全局最优解。在聚类问题中,作为一种经典的全局优化算法,演化计算提供了强大的求解办法。根据应用的场景,聚类算法又可以分为在向量空间和图空间上的
近年来,信息越发透明化、公开化,大数据时代的隐私安全问题受到广泛关注,数据隐私成为机器学习建模的壁垒,如何在保护数据隐私的同时完成机器学习建模亟待解决,联邦学习应运而生。联邦学习是一种拥有广泛应用场景的分布式机器学习框架,参与训练的客户端在不交换数据的情况下的完成联合建模。联邦优化算法是联邦学习的核心,典型代表是谷歌公司提出的FedAvg联邦优化算法,客户端本地训练完成后将模型参数传输到服务端进行
人工智能的不断发展,智能机器人近些年得到了飞速发展,广泛的应用于各个领域。且随着传感器及驱动器技术的日趋成熟,使得设计一款尺寸接近人手、抓取行为仿人手的灵巧手成为现实。同时随着机械手的广泛应用,刚性灵巧手暴露出相应的缺点,如:适应能力差,无法抓取易碎物体等,柔性灵巧手成为了新的研究热点。因此本文研究开发了一款尺寸接近人手且抓取行为仿人手的柔性灵巧手,使机械手的应用场景更加广泛。本文首先对人手的抓取
出血控制仍然是一个重大的挑战,尤其是对于枪伤和锐利物造成的深层不可压缩创面出血。据统计出血死亡在伤害死亡中占比30-40%,其中33-56%发生在患者被送往医院之前,因此院前使用止血材料早期控制出血能够有效降低死亡率。然而传统的止血方法如纱布、止血带和按压止血对这些极端出血是无效的。另外,多孔沸石、高岭土、明胶海绵和水凝胶止血剂等不适用于这种伤口,且这些材料功能单一,不能在止血后进一步抑制创面感染
木质纤维素底物中的纤维素可通过纤维素酶酶解转化为可发酵糖,进而通过发酵生产纤维素乙醇。酶解成本偏高制约了纤维素乙醇的发展,实现纤维素酶的多酶协同增效是降低酶解成本的重要方法。针对β-葡萄糖苷酶等电点偏高和纤维二糖底物溶于水的特点,本文提出对β-葡萄糖苷酶进行亲木质素改性,即在其表面接枝阳离子基团,通过增强其与木质素间的静电作用力使其优先吸附在木质素上,构建β-葡萄糖苷酶/木质素非均相酶解纤维二糖体