论文部分内容阅读
针对学术论文的剽窃检测,提出一种应用复杂特征集表示文档特征的方法,并扩展了复杂特征集的合一运算.对文档不同层次结构的特征,利用否决函数和概率函数的方法进行剽窃检测.基于文档不同部分在剽窃检测过程中的重要性不同的事实,采用shingling方法,结合段落权重定义了3种概率函数,形成了一套较完善的文档剽窃检测系统.实验结果表明,用该方法可取得良好的效果.