论文部分内容阅读
网络的发展为人们共享信息提供了前所未有的条件,然而这也为科技论文抄袭行为提供了便利,于是判定科技论文的原创性变得尤为重要。针对这一问题,本文提出并实现了基于信息检索技术的中文科技论文的原创性检查系统。本文采用n元文法结构作为索引单元,以概率模型为检索模型,利用开源的Lemur Toolkit作为基础建立系统。实验结果表明,该方法行之有效。