程序相似度检测系统的研究与实现

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:hanxianzhi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
程序代码相似度检测在防止代码抄袭和软件版本鉴定等领域具有广泛的应用前景。一直以来,受到了相关产业和学术界的高度关注。然而目前的程序相似度检测系统只是单一的考虑程序的属性特征或者结构特征,难以得到满意的相似度计算结果,无法满足代码抄袭自动识别的实际需求。  针对目前程序相似度检测系统的不足,本文采用属性特征和结构特征相结合的相似度计算方法,研究和开发程序相似度检测系统,主要研究工作和成果如下:  (1)提出了一种属性特征和结构特征相结合的程序代码相似度计算方法。该方法考虑程序的多方面特征,从程序代码的混合属性特征和结构特征两方面来度量程序的相似度,通过设置不同的权重经加权得到相似度值,通过理论分析和实验验证,该方法能自动检测出更多抄袭手段,提高了代码相似度计算的准确性。  (2)对传统的属性计数方法进行了改进,增加了数据类型、控制结构数量等属性信息,通过混合属性来计算程序的属性相似度,得到更准确的属性相似度值。通过对结构度量方法中的字符串匹配算法进行分析,选择了准确率高的 RKR-GST算法,同时对RKR-GST算法进行改进,降低了算法的时间复杂度,提高了程序结构相似度检测的效率。  (3)基于程序相似度算法研究成果,设计并实现了一套程序相似度检测软件系统,给出了系统分析和设计的主要模型及其主要模块的实现方案和核心代码。该软件实现了代码相似度的自动计算和主要代码抄袭行为的自动识别。  将本文研发的程序相似度检测系统应用到了山东科技大学Online Judge系统中。应用结果表明,本文研究的多特征结合的程序相似度检测系统能有效检测出学生的多种抄袭手段,较其他系统,有较高的准确度和效率,同时对于进一步研究程序代码的相似度技术和系统具有一定的理论价值。
其他文献
随着互联网的普及,消费观念的改变,在网上开展电子商务的环境已基本成熟,同时各级政府正在积极实施和推动政府上网工程。这些预示着越来越多的应用将构筑在Internet之上,以Web方
计算机网络与多媒体技术的飞速发展,对传统远程通信领域产生了深远的影响,越来越多的多媒体信息出现在Internet上,视频点播(Video on Demand,简称VOD)也随之产生.该文首先介
该论文仔细深入分析了网络体系结构模式Thin-C/S和B/S的特点.提出了用Thin-C/S和B/S混合模式来构建网络财务系统;在网络财务系统的开发模式选择上分析研究了传统的开发模式的
随着实时通信业务的发展,对实时数据的传输质量和可靠性提出越来越高的要求。利用多径传输实时数据可以提高数据传输质量和稳定性,但是现有的多径传输控制协议都是基于文件类
使异构环境下计算机互联,实现资源共享是当今计算机应用领域追求的主要目标之一.分布式对象模型的研究目的在于针对分布式系统特点,运用面向对象方法,实现异构环境下异种机器
随着社会的进步,IT行业的发展越来越快。伴随的问题也越来越多。在数据种类多、数据混乱致使难以管理的情形下,出现了产品数据管理。同时,由于在管理过程中,出现了安全问题,
该文预报系统,适用于全国各级气象预报业务工作.该系统有效地利用了数值损报产品.在先进的计算机设备条件支持下,有效地提高了天气预报的准确率,生成客观化指导预报产品,然后
信息检索是一门有关信息表示、信息存储、信息组织、信息访问的学科.目前主要采用两个方面的技术,即自动查询扩展技术在线优化与基于用户日志分析的查询结果重新排序的离线优
几何约束求解技术是基于约束满足的参数化设计方法的核心技术之一,本文在对几何约束求解技术的图论方法和数值方法的分析研究基础上,针对经典方法的不足,从图论方法和数值方
认知无线网状网作为一种结合了认知无线电技术和无线网状网组网方式的新型网络,既继承了无线网状网容错能力强、易于架构及高带宽的优势,又具有解决频谱资源匮乏和授权频谱利