基于XML的C程序相似度研究

来源 :内蒙古师范大学 | 被引量 : 0次 | 上传用户:tsengyg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅速发展,获取信息资源变得更加方便和快捷,同时抄袭也变更得加容易。就计算机专业而言,因其工程实践性的特征几乎完全可采用计算机进行教学与考核,从而导致作业中程序代码抄袭、克隆等现象越来越普遍。日益严重的抄袭现象既破坏正常的教学秩序,也影响教学质量和学生素质的提高。程序代码的相似度研究既能高效地发现有抄袭嫌疑的程序代码,也有助于确保检测的准确性与客观性。本文在分析目前国内外程序代码相似度研究的基础上,提出一种基于XML的C程序相似度研究方法。首先,从C语言全集中挑选出部分能代表程序结构的关键结构,总结出关键结构常见的抄袭方式,统一源程序的编程风格并按要求格式化源程序。其次,确定各个关键结构转化为XML文本时对应的结点标记和所要提取的属性项,根据不同的关键结构和对应的抄袭方式设计C程序转化为XML文本的算法,即用XML文本表示C程序。第三,根据不同的关键结构和对应的抄袭方式设计XML文本行的相似值计算算法,计算XML文本行的相似值。最后,根据XML文本行的相似值设计程序对的相似度计算算法,计算程序对的相似度,根据得到的相似度判断抄袭。在上述理论研究的基础上,作者设计并实现了一个基于XML的C程序抄袭检测实验系统,并选用不同的验证方法验证实验系统的有效性和可靠性。实验证明,基于XML的C程序相似度研究方法既能有效的检测多种抄袭手段并存的程序代码,又能有效检测针对函数、函数调用、结构体、指针、数组、控制结构和表达式的等价替换出现的常见抄袭。
其他文献
随着模式识别技术的发展,传统统计学理论的模式识别技术对小样本数据处理能力的不足越来越突出,支持向量机作为主要针对小样本数据的模式识别技术得到了广泛的关注。基本的支
粗糙集理论在经过了近三十年的发展得到了广泛的认可,已经成为智能信息学科中研究极其活跃的部分之一。作为一种数学工具,粗糙集理论能够十分有效的处理那些不完整的,模糊的,
随着信息技术和嵌入式技术的飞速发展,嵌入式手持设备在越来越多的领域发挥着重要的作用。在某些专用领域,以小型化、便携化的嵌入式设备取代通用型计算机系统已成为了当今一
近年来,随着计算机与通讯技术的快速发展,各企业更加注重使用高度集成的计算机软件来进行日常的生产及办公,从而提高工作的效率和降低成本。而工作流技术顺应了以过程为中心
高级加密标准(AES)是由Joan Daemen和Vincent Rjimen开发并经美国国家标准与技术研究所于2001年通过。这是设计来取代数据加密标准(DES),在银行领域成功后,在各种领域,如车辆安
随着多Agent系统被越来越多的应用到政府、商业和服务业等领域,对多Agent系统的可靠性研究也逐渐成为热点。由于Agent自身的特性,使得面向Agent的软件测试与传统软件测试有着较
视频搜索关键技术主要是指视频中的目标检测和识别。目标检测是目标识别的基础,直接影响着识别结果的准确性和鲁棒性。目前目标检测方法多种多样,根据目标属性的不同,采用不
CCD传感器和扫描控制器是扫描仪的核心,只有透彻地掌握与之相关的内核技术,才能开发出更高性能的扫描仪产品。本文通过参与一种新型号的大幅面CCD扫描仪的开发过程,设计并实
网络覆盖是无线传感器网络的基本问题之一,通常期望通过部署或者调度传感器节点,在保证一定服务质量的前提下,达到网络覆盖范围的最大化。如果使所有节点同时处于工作状态,无线传
近年来微波作为一种节能环保的新的能源形式,在国内外得到了迅猛发展。在工业控制中,如何对微波加热进行控制直接影响微波加热设备的应用前景,对于大功率微波加热系统,其操作程序