基于指纹和语义特征的文档复制检测方法

来源 :燕山大学学报 | 被引量 : 0次 | 上传用户:xlweb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文档复制检测是保护知识产权、提高信息检索效率的有效手段。提出一种基于指纹和语义特征的文档复制检测方法。介绍了指纹提取算法以及相关的重叠度度量,并且以知网的概念描述为基础对文本进行语义分析,利用词类信息和语义规则进行歧义消解,并采用基于框架的层级表示方法描述句子的语义特征。在3种测试集上把该方法与现存的方法在检测准确率上进行比较,实验结果表明该方法能够有效地检测出各种方式的复制文本。
其他文献
2002--2005年进行紫花苜蓿生产力动态研究,发现紫花苜蓿种植不宜沿用传统轮作周期。结果表明,农田灌溉条件下草产量高峰出现在播种后的第2年,株丛密度和1级分枝数大幅下降是草产
选取东祁连山具有代表性的4类高寒草地样地珠芽蓼草地、禾草草地、沼泽草地和蒿草草地的优势牧草作为试验材料。采用组织培养分离方法,在9种优势植物根部分离得到28株真菌,经
目的调查余姚地区儿童变态反应性疾病外过敏原分布情况,为疾病防治提供科学依据。方法对608例变态反应性疾病患儿行皮肤点刺,进行外过敏原筛查;按年龄分为≤7岁组和7~12岁组两
目的 探讨320排动态容积CT在脑血管病中的应用价值.方法 对行320排动态容积CT头颅动态CTA和/或全脑CT灌注(CTP)的53例图像进行回顾性分析.结果 53例患者发现病变40例,其中动脉
目的探讨全身麻醉诱导期非正压通气预防患者急性胃扩张的效果。方法将60例ASAI~II级、术前评估无气道插管困难择期行全身麻醉患者随机分成A组及B组,各30例。A组气管插管前采用
本文从理论分析、模拟计算、实验测试等方式,对LPG民用气中加臭剂选择进行了研究。研究表明,我国目前在民用LPG中使用的四氢噻吩加臭剂无法随LPG中的C3、C4组分挥发出来,大部
老年糖尿病(DM)患者受各种因素影响,如何更好发挥健康教育的指导作用成为关注目标,本文注重从老年DM患者生理、心理、智力角度分析教育难点,针对性加强键康教育指导,收到良好效果。
水库防洪实时调度决策方法是研究水库调度问题的主要内容.针对传统方法研究不系统、不全面、不能综合利用面临时刻所有信息、不具有学习功能等缺点,提出了水库防洪实时调度决
目的 观察麻醉前输注羟乙基淀粉200/0.5氯化钠注射液在腰麻联合硬膜外麻醉中预防低血压的效果.方法 将60例择期行子宫肌瘤手术患者分为2组,各30例.麻醉前30min分别输注500mL
基于Lyapunov稳定性理论和线性矩阵不等式技术,针对一类时变时滞BAM神经网络系统给出了时滞依赖的指数稳定性准则。所得到的条件可用Matlab中的LMI控制工具箱方便的求解。仿真