基于写作风格特征的论文剽窃检查优化方法研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:ltsomeday
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术日新月异的发展与网络数据库资源的日益丰富,为科研工作带来极大的帮助。学术论文、调研报告、分析数据等等学术论文写作所需要的参考资料得以便捷获取,与此同时论文抄袭也相应地更为容易与常见。寻找并建立有效预防及遏制剽窃行为的手段已经刻不容缓。自2005年以来,作者所在课题组通过产学研合作模式,在论文剽窃检查方面进行了大量的研究和开发,完成了基于词频的论文剽窃检查以及基于相对单元密度的论文剽窃检查的设计与实现。前者对于完全抄袭的情况可以起到很好的判别作用,后者则在此基础上完成了对部分抄袭情况的判断,使得检查结果的召回率得到显著提高。然而,这两种剽窃检查方法在改变原文的剽窃行为判断方面还存在较大的局限。为此,我们在其基础上引入了综合性考量对象——写作风格特征,对现有的剽窃检查方法进行优化。主要工作有如下4个方面:1.本文研究对比了国内外主流的与写作风格特征分析相关的技术以及语义词典技术,从中寻找适合应用于单篇论文的,满足剽窃检查应用需求的技术思路。2.介绍了本课题组的前期工作:设计并实现了基于词频统计的论文剽窃检查算法,以及基于相对单元密度的论文剽窃检查应用。在介绍前期工作取得的具体进展同时,还说明了目前这两个方法存在的问题、局限以及可改进之处。3.在前期工作基础上,借鉴国内外相关技术,提出了基于写作风格特征的论文剽窃检查优化方法,建立初步的写作风格特征语义词典,描述了相应的论文剽窃检查系统的结构与整体流程。4.本文通过具体的应用实例分析,阐述了优化方法的应用场景与效果,验证了新方法的有效性。本文所研究的基于写作风格特征的论文剽窃检查方法是对前期工作的补充优化,对改变原文的论文剽窃情况进行分析检查,为剽窃检查课题引入了新的思路,帮助该课题进一步深入研究奠定基础,从而逐步建立起更准确更完善的剽窃检查方法与系统,对学术剽窃的不正风气起到有效的打击预防作用。
其他文献
电容层析成像(ElctricalCapacitanceTomography,简称ECT)技术是一种新型的非侵入式电学层析成像技术。目前ECT系统通常使用个人计算机实现传感器数据采集、图像重建、系统的
在当前的企业信息化开发过程中,利用基于B/S模式的J2EE多层体系结构进行Web应用开发是主要的解决方案。但是传统的J2EE开发,由于受其核心组件EJB模型缺陷的制约,应用并不广泛
随着计算机硬件性能的不断提高,嵌入式系统中软件系统的规模和复杂性不断增加,软件可靠性问题已成为嵌入式控制系统发展的一个瓶颈。传统的嵌入式软件可靠性保障技术主要关注
随着网络技术,多媒体技术以及计算机技术的发展以及人们对流媒体信息需求的增加,流媒体系统已经在因特网上开始了现大规模地应用。可是流媒体传输的实时性、高宽带性等特点使
随着GIS地图功能的完善,以及日益增大的地图数据量,GIS对计算机的软硬件要求也越来越高。目前,GIS在嵌入式设备上的应用也日益增多,但由于软硬件存在的局限性,内存容量有限,
随着计算机和互联网技术的发展,云计算作为一种新兴的商业分布式计算模型产生了。云计算是分布式处理、并行处理和网格计算的发展,通过将计算任务分布在处于不同地理位置的大量
SaaS (Software as a Service,软件即服务),是随着互联网技术的飞速发展与应用软件的日趋成熟而形成的一种新型软件服务供销模式。它通过互联网提供应用软件服务,消除了客户
联想记忆网络是一类特殊的人工神经网络,能够从不完整、含噪信息中获得全部信息。模糊联想记忆是模糊系统和神经网络的结合,兼具两种优点,已广泛应用在人工智能,模式识别等领
随着信息化时代的到来,Internet飞速发展,各种新的网络应用层出不穷,导致了各种网络问题的出现,给网络监测带来巨大的挑战。网络检测是保证网络正常运行的重要手段,合适的网
信息技术的快速发展使得越来越多的企业使用电子应用系统替代传统的电话、传真等方式。大量具有应用意义的事件在各应用系统之间进行传递。因此实时地搜集事件信息,并快速推