基于情感语义特征的论文剽窃检查优化方法研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:mqzhen1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
学术论文的剽窃现象屡见不鲜,如何通过有效的手段预防并遏制学术剽窃行为,已经成为各科研机构单位所关注的问题。作者所在课题组自2005起,在学术论文的剽窃检查与识别方面进行了大量研究和分析,并先后完成了基于词频统计的论文剽窃检查、基于相对单元密度的论文剽窃检查和基于写作风格特征的论文剽窃检查等版本的系统研发。前两者在大篇幅抄袭和部分文字抄袭的情况下,较好的完成了对剽窃现象的识别和剽窃文字的定位分析,并通过大量的实验证明检查识别结果具有较高的召回率。后者在前两个版本的基础上,引入了针对写作风格特征的检查和识别算法,进一步优化了原有的检查方法,并在检查精度和系统执行效率方面,取得了较好的进展。但是,上述检查方法未考虑学术论文的情感特征,针对情感倾向性不同但文字相似度较高的情况下检查方法具有一定局限性。因此,我们在基于写作风格特征的检查方法基础上,引入针对情感特征语义的考量,优化现有的剽窃检查方法。本文的主要工作有如下五个方面:1.研究比较国内外针对情感特征语义的识别和提取算法,分析本文作者所在课题组的前期工作,说明现有检查方法存在的局限性,论证在学术论文剽窃检查中引入情感语义特征的可行性。2.在前期工作的基础上,结合国内外相关技术,提出基于语义情感特征的论文剽窃检查优化方法,建立情感语义特征词典和多种情感特征评价资源,设计并描述优化后的论文剽窃检查系统流程和检查算法。3.说明了基于云计算平台进行剽窃检查原型系统的技术方案,描述了具体的实现方法。4.通过论文宝剽窃检查系统的实证分析,阐述了基于情感语义特征的检查方法的优化效果,通过实验数据,验证算法的有效性。本文所研究的基于情感语义特征的论文剽窃检查方法,是对本课题组前期工作的优化改进,对学术论文中所包含的情感特征进行识别分析,为剽窃检查课题引入新的考量,进一步完善剽窃检查算法,为打击学术腐败与学术剽窃行为起到有效的预防和打击作用。
其他文献
随着互联网技术的进步和发展,Web包含了越来越多的丰富信息,从而使Web成为了一个巨大的、分布广泛的、全球化的在线信息源。尤其是近些年来,各式各样的大型数据库逐渐建立起
随着人脸识别技术的日趋成熟,其商业化应用也愈加广泛。不过,随着该技术的不断应用,也出现了十分严重的安全问题。现在,几乎所有的人脸识别系统均无法甄别人脸的真假,也就是
随着互联网的高速发展,Internet在我们日常的生活中扮演越来越重要的角色,成为我们生活和工作中必不可少的一部分。网络的高速发展带来了网络信息的爆炸式增长,而网络用户对
移动Ad Hoc网络的研究已成为网络领域中的重要研究方向,相关路由协议的设计和性能研究工作逐渐成为热点,一个能够对Ad Hoc网络路由协议进行全面性分析的性能评估方法显得越来
由于现代计算机硬件技术、互联网技术以及多媒体信息技术的高速发展,人们所拥有的数据量已经达到了前所未有的规模,而数据挖掘技术的出现使得对大量的库存数据进行有针对性地处
Internet的用户行为分析主要是基于Web数据挖掘,Web数据挖掘是使用数据挖掘或机器学习的方法从Web文档中抽取出用户感兴趣的潜在有用模式和信息。Web数据挖掘分为Web内容挖掘
无线传感器网络(Wireless Sensor Networks, WSNs)起源于军事领域,随着因特网技术、嵌入式计算技术、传感器技术、微机电技术、现代网络及分布式信息处理技术、无线通信技术
XML (eXtensible Markup Language,可扩展标记语言)自1998年出现以来,已经成为互联网数据交换格式的标准。大量与之相关的应用,如消息通知系统、个人个性化信息等都需要对信
对于处理多目标优化问题,本文着重对不同的多目标优化算法进行研究,例如传统多目标优化算法、 MOGA(Mulit-Objective Genetic Algorithm)、NSGA(Non-Dominated Sorting Genetic
近年来,互联网和软件应用技术的普及和迅猛发展,使得软件的发展逐步趋向网络化、平台化和服务化。SaaS (Software as a Service)具有按需租用、无需用户维护、便于扩展等特征