基于抽象语法树编码的软件缺陷预测方法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:yingluoyuchen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,计算机软件的数量呈现爆炸式地增长并且复杂度与体积也在与日俱增。在这样的背景下,软件出现缺陷的概率越来越大,因软件的可靠性及质量问题造成的后果也会随之加大。软件缺陷预测作为保证软件质量一种手段,是通过代码本身蕴含的信息来判断是否有可能存在缺陷,因此采用软件缺陷预测技术不仅能够减少软件开发中潜在的缺陷,还能够帮助测试人员将测试重点放在更有可能存在缺陷的代码上。近年来,学术界涌现出一批研究将如何将人工智能技术与软件缺陷预测领域结合的文章。而此类文章的主流的过程可以概述为将程序代码转换成抽象语法树后输入到神经网络进行缺陷的判断。然而,目前主流的与人工智能技术相结合的软件缺陷预测框架在将抽象语法树输入到神经网络的一步中,给予抽象语法树上不同的节点唯一的实数编码,然后遍历抽象语法树转成向量的表示形式再输入到神经网络以至于影响模型训练的效果。因此,本文提出了一种方法,结合了抽象语法树的特点,把抽象语法树的节点转化成一种向量的表示形式,用以解决不可度量抽象语法树节点之间的语义距离问题。本文的主要工作包括以下三部分:(1)面向抽象语法树的编码方式。在软件缺陷预测邻域引入并改进了连续词袋模型用于对抽象语法树进行编码。该编码方式针对抽象语法树的树状结构做无监督训练,将抽象语法树上的节点表示成向量的形式,节点对应的向量之间的欧氏距离就是节点间的语义距离。(2)面向抽象语法树的编码方式在项目内及跨项目的情况下对于缺陷预测的效果。引入了卷积神经网络作为软件缺陷预测的监督训练模型,同时也引入了迁移学习解决跨项目缺陷预测中遇到的源项目和目标项目之间特征差异较大的问题。(3)面向该抽象语法树编码方式的软件缺陷预测系统设计与实现。该系统接受实际的项目代码作为训练集,然后可给出新版本的项目或目标项目的文件或模块缺陷报告,帮助开发者了解项目的代码缺陷分布。
其他文献
随着数据流量的爆炸式增长,卫星网络作为最具潜力的通信网络之一,其自身存在的功能单一、灵活性不足以及传播时延长等问题急需解决。同时,为了更加有效地利用越发稀缺的卫星
在企业管理的过程中,为了实现企业的发展战略,企业管理者会根据企业现状及短期发展目标建立组织架构。同时,为了实现对生产、营销、物资等对象的管理,有一定经济基础的企业会
自闭症是一种覆盖区域广泛的精神发育障碍性疾病,大部分患者是在婴儿期或童年早期开始显露病情,且具有发病原因不明、不可治愈及症状特殊等特性,因此,自闭症群体的康复过程主
经济新常态下,我国经济增长速度放缓。同时,人口老龄化问题凸显,劳动力资源竞相出现缺口,“人口红利”上风开始消退。最为明显的是,用工难、招工难和员工流失等问题已成为制造型企业持续发展的难题。此外,我国制造业起步较晚,技术储备相对薄弱,生产成本较高。技能培训工作受重视程度不够,工人技能水平低。加之新兴产业的冲击与就业观念的转变,员工流动性加大等问题,严重制约着企业发展。同时,由于制造企业人力资源管理机
近年来我国信用债券违约事件频发,违约风险的识别与管理成为债券市场的迫切需要以及学术研究的焦点,而目前国内实务界对于违约风险的度量仍停留在基于财务指标的定性分析阶段
近年来,随着城市化的快速发展,生态环境问题日益突出。因此如何在提高城市化水平的同时保护生态环境,成为当今日益关注的问题。随着丝绸之路经济带倡议的提出,重点建设中国西北地区成为国家大势所趋,然而西北地区的快速发展,带来了一系列生态环境问题。因此,研究如何使城市化与生态环境达到协调发展,对其今后西北地区健康良好和可持续发展具有重要意义。论文以中国西北地区的18个城市为研究对象,依据区域城市化实际和生态
有机电化学合成是一种近年来新兴的绿色合成方法,由于其无需外加氧化还原剂、高原子利用率及反应条件温和等特性,越来越受到有机化学家们的广泛关注。电化学脱氢氧化反应由于其极高效的原子利用率更是为有机化学家所青睐,大量有关的研究已在有机电化学领域涌现。电化学合成方法为碳碳键、碳杂键及硫杂键的构建提供了一条全新的、高效的路径。本论文主要介绍了近年来电化学合成方法在各类化学键构建方面的应用,并且在此基础上利用
随着电力市场化改革的不断推进,我国电力运行模式由计划电力大步向市场化电力转变。部分省级电网新能源、外电占比较高,发用电体量较大,火电市场垄断性质较明显,为保证电力市场化改革的有序、公正进行,电力现货市场必须有一套适应火电集中垄断和新能源高占比特性的规则来加以约束。研究电网自身的发供用电特性,选取适合火电集中垄断、新能源高占比受端电网的电力市场模式;在现有的电力交易规则基础上,通过计算市场参与个体的
锚杆支护如今作为一种常用的加固手段广泛应用在各种岩土工程中。受施工因素的影响,工程中由灌浆质量不合格引发的安全问题不在少数,所以要对锚杆锚固灌浆质量检测问题进行研究。本文采用随机森林算法搭载信号分析手段用于锚杆灌浆质量的检测,由于灌浆质量样本数据属于不平衡数据,分别从特征选择和算法本身对随机森林进行改进,并在实验和仿真数据上加以验证,试验证明经改进的随机森林算法在锚杆灌浆质量分类上表现更好。本文的
公共图书馆作为公共文化设施,是政府提供公共文化服务的重要载体,承担着传播主流文化、营造社会氛围、提高全民素质等功能。政府如何履行好职责,加强公共图书馆建设,提升其服务水平,对我国公共文化事业发展具有重要意义。由于在公共图书馆建设和发展过程中,长期以来沿袭已久的行政理念和制度制约,财政投入政策的不健全,公共图书馆建设呈现出资源分布不均、建设水准高低不一、服务质量层次不齐等问题。2018年1月1日《中