基于代码克隆检测的代码来源分析方法

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:sms126
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着软件生态系统和开源社区的发展,代码常在多个软件系统中复制、传播和演化,给软件系统带来了软件质量的不确定性和风险,因此,高效地查找软件系统代码可能的来源是当前研究的热点之一。提出一种基于代码克隆检测的代码来源分析方法,将目标软件代码以方法为单位切割为代码片段,转换为词袋后,在大规模代码资源库中进行并行化代码克隆检测,从而实现方法粒度的代码来源分析。基于该方法,设计并实现了一个代码来源分析工具。该工具能自动分析被测软件项目代码与代码资源库中多个项目以及版本之间的可能来源。实验结果表明,该系统能够有效地找出
其他文献
民族地区汉语书面广告语言,随着社会的发展,人们需求的变化,受民族心理、民族文化的影响,创造出新颖别致的广告语言。具体表现在语音、词汇、语法和修辞的运用及其独特的表达
目的分析河南省新型冠状病毒肺炎(NCP)的流行病学特点,为河南省NCP的防控决策提供证据支持。方法收集河南省及省内各地市卫生健康委员会官方疫情信息、省内官方媒体及新媒体
在当前中国“以县为主”的教育体制下,财政分权对农村义务教育的预算内和预算外教育投入有着重大影响。随着县级政府收不抵支现象日益严重,转移支付和预算外财力在保证农村义
纳米碳混悬液是淋巴示踪剂的一种,具有染色率高、染色时间长、示踪清晰和假阴性率低以及对甲状旁腺的“负显影”作用等优点,可以帮助术中进行更全面的淋巴结清扫和保护甲状旁
基于边坡位移监测数据满足纵向数据部分线性模型的假定,采用广义最小二乘法求得回归系数和回归函数,应用B样条法对坡表水平位移和观测时间进行回归分析,得到纵向数据部分线性
进化博弈是生物进化论和博弈论结合的产物。首先,给出了进化博弈的最基本的均衡概念(进化稳定策略:ESS),并讨论了它在不同条件下的拓展。其次,分析了进化博弈的动态概念,并主要讨论
微网运行特别是在孤岛情况下,由于太阳能光伏发电、风力发电的随机性较大,使得其电能的调度成为一个重要且困难的问题。针对不同分布式电源的特性以及成本,对传统意义下的微
软件系统中克隆代码的检测与管理是软件工程中的基本问题之一,在软件的质量、维护、架构、进化、专利和剽窃等众多领域有着广泛的应用需求。综述了克隆检测的过程、技术及其
随着社会的不断发展,新媒体技术日益更新,新的媒介产品层出不穷,媒介传播对人们日常生活的影响越来越大。大学生作为当下社会发展过程中最为活跃的一个群体,其就业问题每年都
1895至1937年间,一些传统文人或为亡命,或为应聘教学,或为视察,或为旅行,穿梭于两岸之间,留下了不少以“之台湾”和“之大陆”命名的诗歌作品.此类诗歌大体可分为两类,其一是