基于Git中版本演化过程的代码抄袭检测技术研究与实现

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:gxp_crysta1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展,电子数据极易获取的特性使得源代码抄袭的现象越来越严重。在各大高校的计算机类课程的教学中,源代码抄袭的现象将会导致教学课程无法正常进行、学生专业素质能力成长缓慢、教学质量评估困难等诸多负面影响。所以,如何检测学生代码作业之间的相似度并判定是否抄袭是代码抄袭检测领域中面临的一个关键的问题。自上世纪70年代开始,源代码抄袭检测算法便开始被关注,随后以属性计数、结构度量为框架的诸多检测算法便被提出。然而在今天由于教学模式的转变与计算机的普及,以版本管理为基础技术的在线课程管理系统开始广泛出现,而传统的源代码检测技术并不适用于该类课程管理系统之中。所以,一种高效准确的符合版本管理技术定位的源代码检测技术便成为了代码抄袭检测领域中的全新的目标。在另一方面,缺少正统而完善的基于版本管理的课程代码管理系统使得对在线课程管理系统中抄袭检测的研究进度缓慢,所以一款完全适用于版本管理技术的课程代码管理系统也是迫切需要的。依据上述需求,本文基于Git仓库信息的整合原理与大量课程中学生提交代码的行为习惯,提出了一种基于变基处理的代码抄袭检测算法,适用于各类以版本管理为基础的在线课程管理系统。并且以该算法为核心、以实际中的管理需求为主题,设计并实现了一款以Onedev代码托管平台为基础的基于版本控制的代码管理系统,它将代码管理、Git仓库、代码抄袭检测结合为一体,包含完整的在线课程代码版本管理系统的功能。最后,本文以实现系统作为实验平台,验证了基于变基处理的代码抄袭检测算法在时间复杂度与精准率上的优越性。
其他文献
目的 建立miR-339-5p的稳定转染细胞系并探讨其在小鼠体内的成瘤性.方法 用Lipofectamine 2000介导的转染法将含miR-339-5p片段的质粒转染人乳腺癌细胞株MDA-MB-231,以空载体
通过氮磷钾肥不同组合处理对玉米一穴双株高密度和单株常规种植施肥效应进行比较,试验结果表明,玉米一穴双株高密度种植各肥料处理比单株常规种植的相同处理增产,氮磷钾足量
目的观察早期食管癌采用放射诊断的临床效果。方法 80例怀疑早期食管癌患者为研究对象,分别行超声内镜诊断及放射诊断,以电子纤维镜活检作为金标准,比较超声内镜诊断和放射诊
农村经济的稳定发展,必须要有市场经济的支持。要将农业经济与市场经济有机结合,从而推动市场农业经济稳定发展。文章主要从当前我国市场经济发展的现状出发,对促进农村经济
采用Hull-White模型和指数O-U过程来刻画利率和股票价格的变化规律,考虑到标的资产价格和利率的随机性与均值回复性,利用鞅理论和Girsanov定理,研究了股票价格在随机利率下遵
①目的比较骨髓源间充质干细胞和脂肪源间充质干细胞的生物学特性。②方法分离人的骨髓源间充质干细胞和脂肪源间充质干细胞进行体外培养,通过绘制生长曲线,比较细胞的增殖能力
为了了解土工合成材料的抗紫外线老化的能力.对土工合成材料进行了户外现场模拟老化试验,得到了材料抗拉强度随老化时间变化的规律.并利用灰色系统理论对成果进行了分析与预测,确
随着时代的发展和进步,竞技体操的传统十分评分制度于2006年正式画上了休止符。在规则的改变下,中国女子竞技体操的发展目标已经将如何保持良好的竞技水平列入在内。该文通过文
电影作为一种文化产品,往往具有典型的社会文化特征.本文拟运用字幕翻译美学重构的翻译理论解读英语字幕翻译配音版的语言特点,探究由于不同语言间的文化差异,影响和妨碍译入