【摘 要】
:
程序代码相似性的识别是利用一定的检测识别手段,判断两个源程序代码之间的相似性,并度量两个程序代码之间的相似程度。本文针对计算机教学考核中对程序设计客观性和真实性的要
论文部分内容阅读
程序代码相似性的识别是利用一定的检测识别手段,判断两个源程序代码之间的相似性,并度量两个程序代码之间的相似程度。本文针对计算机教学考核中对程序设计客观性和真实性的要求,重点研究C程序代码相似性的识别方法,同时设计度量相似度检测软件,实现可应用于教学考核中评估依据和参考的C代码相似度的自动化检测要求,提高考核工作效率。根据两个程序代码之间存在的相似性问题,着重研究了相似代码的特点和类型、源程序的属性类型特点、源程序预处理、属性数据库构建以及相似度评价标准,采用属性计数与目标代码对比相结合的思想实施相似代码的检测,实现对输入程序代码相似度和评价结果的自动获取。同时应用最长公共子序列(Longest Common Subsequence,LCS)算法来对比两个源程序文件在结构上的相似性。系统软件设计基于.NET的开发平台,采用面向对象的功能模块化设计思想,在构建属性数据库的基础上,设计开发了预处理模块、属性检测模块、相似目标代码检测模块和相似度评价模块等五大功能模块。界面简洁友好、显示界面相似度评价数据完整清晰,便于浏览查询。软件识别系统的设计已经通过运行调试,测试表明能够实现对常见抄袭C语言程序的检测识别,对于有一定难度的抄袭程序能够增强识别的能力,具有较高的检测精确度,相似代码检测评价方法的设计应用具有较强的实用价值。尤其是在加权属性的识别方法中,采用代码属性向量的加权思想增强属性元素中具有隐蔽性相似代码的影响因素,使相似代码评估更具有客观性,改善和提高了识别质量和准确性。实际测量证明,该方法能够识别空白字符、参变量及语句顺序等综合三个方面的代码相似性,相对于原有的属性识别方法将综合相似度提高了4%,中度和高度相似性相对理想计算值的测量精度可达到94%以上。
其他文献
人脸检测是模式识别与计算机视觉研究领域比较基础和重要的研究课题,在基于内容的图像与视频检索、视频监控、自动人脸识别以及智能人机交互等领域有着重要的应用价值。人脸检
交流伺服驱动器(又称“伺服系统”)是数控系统中的核心部件。驱动器技术已由最初的模拟量、脉冲序列,发展到最近的全数字。数字式驱动器以其能提供更高的控制精度、达到更快的响应速度,还能够实现更复杂的控制算法,提供参数调整能力和系统的诊断等优势成为今后发展的趋势。本文设计了一款基于工业以太网EPA(Ethernet for Plant Automation)标准的全数字交流伺服驱动器,并从以下几个方面进行
减少交通事故,保证行车安全是交通工程人员一直探讨研究的重要问题。导致交通事故的原因是多方面的,其中,天气因素是造成交通事故的重要原因之一,尤其是在雾、雨、雪、沙尘等
本文重点研究了变间隙式传感器的结构设计和制备工艺、信号测试系统及处理电路的设计以及厚膜电容传感器在位移检测过程中的非线性问题。 结合PZT驱动的微纳操作平台总体
随着国民经济的发展,物流业越来越受到人们的重视。在大力发展物流业的同时,人们面临着一个共同的难题是配送中心如何进行合理的选址。在物流网络中配送中心连接着供货点和需求
在现代医学影像学中,超声成像、CT和磁共振都是重要的医学成像方式。由于CT和MRI的数据是直接在三维笛卡尔坐标系当中获得的,因此能相对容易的进行体渲染。并且由于CT和MRI的
本论文以早期森林火灾的监测为背景,应用数字图像处理技术和人工神经网络识别技术对早期森林火灾监测识别进行了研究,为将来森林火灾智能化监测提供了理论基础和技术支持。本
说话人识别作为生物认证技术的一种,是根据语音波形中反映说话人生理和行为特征的语音参数,自动鉴别说话人身份的一项技术。说话人识别技术以其独特的方便性、经济性和准确性
随着全球经济的快速发展,人们对地球的能源不断开采和使用,尤其是汽车行业,作为近现代的新兴产业,它的快速发展消耗了大量的能源同时也带来了大量的污染,因此,混合动力汽车作