基于程序向量树的代码克隆检测

来源 :计算机科学与探索 | 被引量 : 0次 | 上传用户:www860227
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
代码克隆能够加速软件开发但是也会导致缺陷重复发生和软件质量问题。部分类型的代码克隆在字面上相似度低,导致识别困难。针对这一问题,提出一种基于程序向量树的代码克隆检测方法。首先,基于统计语言模型抽取词法单元的特征表示,分析不同字面单词之间的语义相似性;接着,通过语法分析提取程序的抽象语法树(AST),为叶子节点赋予对应字面单词的特征表示,将抽象语法树转化为程序向量树;最后,提出一种加权编码规则,在考虑区分不同树节点重要程度的基础上,将程序向量树编码为定长向量,而具有相似向量表示的代码片段被判定为代码克隆。实
其他文献
依据我国现行的刑事诉讼法,附条件不起诉是指对于犯罪嫌疑人涉嫌刑法某些章节犯罪,可能判处较轻的刑罚,已经构成犯罪,达到起诉标准,因为犯罪嫌疑人是未成年人且对所犯罪行有
随着我国国民经济的持续高速发展,市场竞争愈演愈烈,企业对员工的要求大大提高,员工在面对越来越大的工作压力、环境变化和社会变迁时出现了很多身心问题,因此有关员工的工作压力
社区发现是个性化推荐、群体特征归集、社会网络分析等领域研究的基础与核心,而现有社区发现算法在处理日益复杂的社会网络时,存在准确性不高、收敛速度慢、模块度分辨率受限
在诸如通信网络、协作网络和社交网络的分析等应用中,边缘上通常包含时间戳。然而以前大多数的研究主要集中在识别没有时间信息的网络中的社区。大规模时序图数据管理与挖掘
[目的]探讨乳腺癌脑转移患者的临床病理特征及影响其预后的相关因素。[方法]分析110例乳腺癌脑转移病例的年龄、TNM分期、病理类型、组织学分级、ER/PR/HER-2表达情况、绝经
通过对103例初期疮疡患者外敷芙蓉膏治疗的临床疗效观察,并与采用金黄散治疗的64例进行对照,3d为1疗程,连续观察2疗程,结果表明:芙蓉骨治疗组有效率、治愈率分别为97.l%和74.8%,治愈病
针对格上可链接环签名方案中存在密钥较大、效率较低的问题,基于环上容错学习(RLWE)难题,依据"同态承诺→∑-协议→Fiat-Shamir转化"的技术路线,重新构造一个格上可链接环签
内网恶意内部活动的证据通常隐藏在大型数据流中,例如数月或数年累积的系统日志,然而数据流往往是无界的、不断变化的和未标记的。因此,为实现高度准确的异常检测,提出集成流
目的:本研究旨在探讨功能性消化不良(functional dyspepsia,FD)伴焦虑(anxiety)状态患者的相关因素与中医证候学之间的规律。方法:运用流行病学的方法,收集功能性消化不良伴焦虑状态
随着经济社会的发展,特别是新一轮林区制度改革后,林地流转日趋活跃,森林资源资产价值评估的需求日益增长,由于我国森林资源资产价值评估市场没有建立健全的秩序,在评估方法选择、