基于部件关联图的文本相似度检测算法

来源 :第十二届全国信息隐藏暨多媒体信息安全学术大会 | 被引量 : 0次 | 上传用户:SoDoLa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种新的基于部件关联图的文本相似度检测算法.根据汉字数学表达式理论将文本汉字拆分成部件,统计每个部件出现的频次并构建部件直方图;接着,构造出每个部件在文本中与之相关联的部件相互关联组成汉字的关系构建部件关联图;最后对部件关联图进行图匹配,得到关联图的相似度,最终得出文本的相似度值.实验结果表明CRM-TSD算法具有较好的准确率、召回率和F值;在与余弦定理和Jaccard系数方法的对比实验中表明,CRM-TSD算法在综合评价指标F-度量值上也优于这两种方法.
其他文献
针对传统湿纸码计算复杂度较高的问题,提出了一种基于约简汉明校验阵的湿纸码快速构造方法.首先分析了汉明校验阵列消减对信息隐藏性能的影响,提出了载体改变不超过2比特的约
欧李(Prumus humilis Bunge)为蔷薇科樱属的小灌木,高2尺左右,晋东南各县多有分布,以山坡、沟边、路旁生长最多。当年生枝条红褐色,幼树有短细毛,老枝条灰褐色,分枝力强,根
安志敏(1916—1967),曾用名安天江,四川省阆中县人。参加了红军二万五千里长征,是中国共产党早期培养的飞行员,人民空军服装设计的组织者,1955年被授予少将军衔。先后任空军
西瓜原产非洲,是最喜温的作物,种籽发芽的起始温度高达16℃。在新疆瓜产区,春季播种季节中,冷空气入侵频繁,干旱多风,以致土壤水热状况很不稳定,影响瓜出苗,大多数年份露地
首先基于tetrolet-covering在4×4图像块级分析JPEG压缩的量化误差效应.接着,引入tetrolet-covering变化图提出了基于压缩历史不一致性检测图像合成篡改检测方法.当一幅图像
会议
在已往工作的基础上,于1981年主要对苹果无性系半矮化砧—MM106继续进行硬枝扦插生根试验。结果如下: 1.利用一年生休眠期硬枝扦插,以选用枝条的中下部分生根率高达62.7%。剪
当健康被前所未有的重视时,养生开始成为热门话题。于是,各路高人各显其能,养生内容的电视节目、书籍、讲座层出不穷,什么真专家、假专家都出来著书立说,还有些人一头扎进故
结合湖州市外环北路长田漾大桥桥面CRCP复合铺装的监理控制实践,总结了连续拱桥的工程概况、CRCP特点,以及监理在质量方面的控制要点,为在连续拱桥上设置CRCP桥面复合铺装路
图像隐密分析的目的是,通过分析网络日常图像的微观统计特征,检测图像数据中可能潜藏的秘密信息.采用隐密特征提取结合分类器的隐密分析技术能较好的对隐密图像进行判决.但大
高邮市八桥镇退休干部袁德纯2001年创办了高邮市光明化工厂,到2004年已初具规模。他从厂长位置上退下来之后,即把关爱弱势群体、扶贫帮困作为新的职责,用企业的利润和自己的