一种基于熵的文本相似性计算方法 - 论文文献免费下载 - 搜论网

一种基于熵的文本相似性计算方法

来源 :计算机应用研究 | 被引量 : 26次 | 上传用户：qq104397622

【摘要】

：

文本比较是求解两个文本间相似度的过程,文本间的相似度越高代表两个文本越趋于类似。传统的相似度算法主要从字符的角度度量文本的相似性,忽略了文本内多个共同文本串对于文本相似度的影响。针对此问题提出一种基于熵的相似度求解方法,在对文本间字符信息的提取基础上,建立共同子文本串度量维度,然后采用熵的方法进行相似度度量。实验表明,该方法具有更平滑的相似度曲线,从而验证了算法的有效性和准确性。

【作者】

：

李圣文凌微龚君芳周长征

【机构】

：

中国地质大学信息工程学院,国网十堰供电公司

【出处】

：

计算机应用研究

【发表日期】

：

2016年01期

【关键词】

：

文本相似性字符串匹配编辑距离算法最长公共子序列 text similarity string match Levenshtein distance alg

【基金项目】

：

国家自然科学基金资助项目（61272470）,中国地质大学（武汉）中央高校基本科研业务费专项资金资助项目（2012119039,2012119145）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

文本比较是求解两个文本间相似度的过程,文本间的相似度越高代表两个文本越趋于类似。传统的相似度算法主要从字符的角度度量文本的相似性,忽略了文本内多个共同文本串对于文本相似度的影响。针对此问题提出一种基于熵的相似度求解方法,在对文本间字符信息的提取基础上,建立共同子文本串度量维度,然后采用熵的方法进行相似度度量。实验表明,该方法具有更平滑的相似度曲线,从而验证了算法的有效性和准确性。

其他文献

不同社区下呼吸道感染中环丙沙星耐药变迁的研究

目的 :比较研究不同社区下呼吸道感染病原菌对环丙沙星耐药性的差异。方法 :1997～ 1999年一所城市医院与乡村卫生院下呼吸道感染患者分泌物分离细菌并作环丙沙星药物敏感试验

期刊

下呼吸道感染环丙沙星耐药性药物疗法

胆固醇与冠心病：筛检和治疗（续完）

期刊

冠心病胆固醇筛检治疗

西沙必利治疗糖尿病性胃轻瘫疗效观察：附96例报告

目的 :通过对糖尿病胃轻瘫病人的治疗 ,观察西沙必利治疗效果。方法 :通过用西沙必利对 96例糖尿病性胃轻瘫病人的治疗 ,对治疗前、治疗后 2周、 4周疗效的观察 ,以及血糖变

期刊

糖尿病性胃轻瘫西沙必利药物疗法

铁路危险货物办理站布局优化双层规划模型与算法

根据国家标准中规定的常见危险化学品在存储区的临界量,提出布局优化阶段的铁路危险货物办理站环境风险评估模型.在此基础上,根据铁路决策部门与危险货物运输客户之间的主从

期刊

危险货物运输危险货物办理站布局优化环境风险运输费用双层规划模型启发式算法Computer programming Deci

隧道超前地质预报中不良地质体的瞬变电磁响应特征

采用电磁场有限元方法,模拟计算隧道中瞬变电磁法预报不良地质体的视电阻率,研究视电阻率等值线图中断层、溶洞等不良地质体的瞬变电磁响应特征。研究结果表明：在不良地质体周

期刊

瞬变电磁法不良地质体视电阻率等值线隧道地质预报Transient electromagnetic method Unfavorable geolo

基于蠕滑机理的车轮磨耗模型分析

以C80型货车为例建立车辆动力学模型，利用FASTSIM算法计算出接触斑内蠕滑力的大小和分布，依据Pearce，Zobory，Jendel和Braghin4种磨耗模型计算轴重、速度、曲线半径和车轮硬度对车

期刊

车轮磨耗蠕滑磨耗模型轴重速度曲线半径车轮硬度货车Wheel wear Creep Wear model Axle load Veloci

怎样与使用呼吸机病人进行有效交流

使用呼吸机病人突出的护理问题是语言交流障碍。在临床护理48例病人中得出一套有效交流模式，护士在病人使用呼吸机前训练病人应用肢体语言表达需求；使用呼吸机后指导病人应用肢

期刊

使用呼吸机病人呼吸机语言交流临床护理交流模式

基于联合介数中心度的铁路货运嵌入社会大物流系统网络结构优化

社会大物流系统是一个无标度网络，存在明显的集群现象。铁路货运系统作为另一个群体嵌入社会大物流系统，需要在优化网络结构的同时，考虑群体之间的连接和群体内部的连接。基于Ba

期刊

铁路货运联合运输无标度网络物流系统结构优化联合介数中心度Railway freightCombined transport Scale-free

吸入低浓度氧在恶性肿瘤放射治疗中的应用

目的：灵活运用麻醉机达到吸入１０％低浓度氧放射治疗的效果。方法：采用国产麻醉机使其笑气通路与氧气连接，氧气通路与纯氮气连接，开启并调节流量开关在ＤａｔｅｘＣａｐｎｏｍａｏ呼吸监护仪监测下使病人吸气体

期刊

恶性肿瘤放射治疗吸氧低深度氧HPT

环磷酰胺,秋水仙碱治疗急性脑梗塞的临床观察

急性脑梗塞是一种常见病，其高致残率严重威胁人类健康，迄今为止，缩小梗死范围、改善神经系统功能的治疗措施仍未取得明显进展。近年来，脑缺血后白细胞浸润所致的炎性反应造成的脑

期刊

脑梗塞药物疗法环磷酰胺秋水仙碱

与本文相关的学术论文