基于文本相似性比对的校内查重系统的设计与实现

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:huangyuli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机网络的发展,各领域信息化的趋势也在不断加强,在进行文字写作时我们可以更加轻易地检索到用于参考的信息。但同时,防止文书写作时的抄袭现象也是十分必要的。目前,高等学校对于学术不端的重视程度日益提高,对论文、作业的查重需求也与日俱增,然而目前已有的查重系统大都只能提供基于文献数据库的查重,对于学校的内部数据查重尚没有非常成熟的解决方案。校内查重系统的开发可以补齐学校内部数据查重的短板,让更多人意识到学术道德建设的重要性,对于强化提高学校内各类文书写作的原创性、保护知识产权、打击学术不端具有较强的现实意义。校内查重系统可以对学生作业等不会被文献数据库所收录的数据进行纵向和横向查重,也可以对应届生论文等因收录存在延时无法被文献数据库即时收录的数据进行内部查重。同时本系统支持纯私有化部署,部队院校等有数据保密需求的机构也可以放心使用。该系统主要服务于学校、学院、教师和学生四类用户。学校用户对系统进行整体配置和管理;学院用户可以管理本学院的论文数据库以及本学院所拥有的教师和学生信息,对学生的论文发起横向、纵向查重任务并导出查重报告;教师用户可以管理自己的学生作业数据库,并可以批量对学生的作业发起横向、纵向查重任务;学生用户可以在系统中上传自己的论文进行纵向查重,并下载自己的查重报告。同时,如果本系统独立部署至多个学校,在学校互相授权的情况下,支持在多个系统间进行论文库共享。本人独立主持了该项目并进行了项目的需求分析、后端部分的架构设计、研发与测试。后端部分遵循微服务架构的设计原则划分为查重核心系统和查重业务系统两个子系统。项目研发过程中使用My SQL、H2作为数据存储工具,在最小编辑距离和Aho-Corasick算法的基础上设计了基于文本相似性的查重算法,并改进了原有算法在文本查重这一应用场景下的性能。目前本文中所述的查重算法及查重系统已经应用至多家学校及企业,为数十万终端用户提供了查重服务。
其他文献
近些年来,中国城市轨道交通领域的发展日新月异,地铁、轻轨、磁浮等轨道交通系统的总运营里程逐年提高。同时运营里程的增加伴随着巨大的能源消耗,因此列车自动驾驶的节能运行与城市轨道交通的可持续发展密切相关。本文以城市轨道交通为研究对象,建立了基于强化学习相关算法的列车节能运行控制方法。选取实际的地铁线路信息,通过仿真验证了上述方法的有效性。本文主要有以下几个方面的工作:首先,根据国内外对列车节能运行的研
近年来,作为企业盈利杠杆的促销活动随着电商的迅速发展变得更加多元化,最具代表的“双11”狂欢购物节成了电商必争之地。J企业平台是由自营商和入驻商共同构成的,由于平台自营商和平台入驻商的产品价格和提供的物流服务水平具有差异性,导致消费者对两个零售商的偏好度也大相径庭,从营销数据看,消费者明显偏好平台自营商。平台入驻商为了获利,一方面会通过各种变相的降价手段吸引消费者抢占市场份额,这无疑破坏了市场规则
学位
学位
学位
教育资源不平衡是我国普遍存在的问题,经济水平即教育水平是目前的现状,经济发达地区教育水平高,师资力量强,而经济落后地区的教育水平普遍落后。这个困扰我们多年的问题,却随着移动互联网技术的发展出现了转机。在线教育可以实现教育资源的共享,互联网+教育的模式在一定程度上可以让教育资源匮乏地区的学生享受到优质教育资源。在线教育因其价格低廉、师资优质和无视地域的特点受到各大互联网公司的追捧,俨然已经成为互联网
飞机穿过由过冷水滴组成的云层时航空发动机进气位置可能发生积冰现象,这些区域的积冰会限制流进航空发动机的气体流量,从而导致发动机性能下降或积冰脱落引起发动机故障。进口支板是航空发动机进气部件之一,容易产生积冰现象。本文针对典型航空发动机进口支板结构,应用CFD流-固耦合传热仿真技术,对热气防冰条件下支板的温度场特性开展数值模拟研究,为航空发动机进口支板热气防冰内部结构的设计改进提供支撑。首先,针对典
光纤传感技术正一日千里地向前发展,其中,基于布里渊散射的分布式光纤传感系统在管道监测、国防和结构健康检测领域日益受到重视,并被应用于国民经济和国防工业。随着分布式光纤传感的距离增长,空间分辨率增加,传感信息也指数化增长,传统的数据处理方法无法满足传感系统的实时性要求。如何高效、准确地获取分布式光纤传感信息是其中的关键,近年来基于机器学习、神经网络的方案成为研究热点,本文研究正是在此基础上展开,主要
飞行器的安全运行是确保航天事业的发展和进步的基础。然而飞行器飞行过程中,由于与空气中的冰晶粒子碰撞,发动机燃料燃烧等原因,其表面会积累静电荷,当表面静电荷积累到一定程度,且产生的场强达到周围介质的击穿阈值场强时,发生静电放电。静电放电可以直接在飞行器表面上产生高的感应电势,也会以辐射的形式通过孔缝耦合到飞行器内,影响飞行器的安全运行。因此研究飞行器的充放电机理对评估静电对飞行器的威胁并做出相应的电
学位