基于分词矩阵模型的模糊匹配查重算法研究

来源 :计算机科学 | 被引量 : 0次 | 上传用户:abcwangyong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对中文文本查重的需求,利用分词的结果,将待查重的目标文本和查重样本文本转换为分词矩阵模型,然后扫描和分析矩阵,得到查重结果。由此提出了一种查重算法,并通过实例验证了该算法具有一定的实用效果。
其他文献
<正>2019年以来,美国海岸警卫队两艘大型传奇级巡逻舰在亚太水域陆续亮相,先是伯索夫号(Bertholf)在中国东海频繁进入中国专属经济区"巡逻",随后又派遣斯特拉顿号(Stratton)
本文针对安庆石油化工总厂大气污染源的情况,因地制宜,科学选择绿化植物,合理布置该厂各个区域的绿化种植设计。十多年经验证明,该厂在绿化工作中已取得了很好的效益,创造了
运用一元时间序列的分析方法对中国债券市场的三个主要指数(中国债券总指数、银行间债券总指数和上海交易所国债指数)进行的检验结果显示,中国债券市场基本上接受随机行走假
如何提高高职高专学生的自主学习能力是高职高专英语教学的一个重要研究领域;翻转课堂改变了高职高专英语教学的传统模式,突出"以学生为中心"的教学思路;本文通过分析翻转课
林则徐的《回疆竹枝词》是他流放期间深入天山以南勘地时所作的反映清代维吾尔人民生活的风俗图画,体现了林则徐文学方面的极高造诣及其创作特色。诗歌里面对回疆的描写也表
领袖崇拜是人类历史上亘古常新的话题,本文通过对胡锦涛温家宝的偶像崇拜群体"什锦八宝饭"的研究,发现网络时代的领袖崇拜模式呈现平民化、个性化等特征,这种去神化的崇拜模
探讨了汽车催化剂的微波消解过程中酸的用量及种类,以及可能存在的残渣物是否影响测定的问题.经过对消解程序的优化以及酸比例的调节,建立了一种可大大降低HF用量,就能得到清
在课堂教学中,理想的课堂一直是我们追求的目标,所以作为教师,怎样去引导学生学习,诱导学生思维,指导点拨其学习方法,激发其学习的主动性,保证其思维的灵活性,这是一门学问,
合肥话中的"子"缀词在皖中江淮方言中具有一定的典型性。合肥话的后缀"子"是一个语素聚合体,其小类根据语义虚化程度的不同可构成一个序列。表达性派生"子"缀的能产性最强,类
公共需求是影响地方公共品供给的根本因素,主要表现在公众通过公共需求偏好表达对地方公共支出结构的影响上。基于2003~2016年中国30个省份的面板数据,采用似不相关回归分析