基于加权语义网的文本相似度计算的研究

来源 :情报杂志 | 被引量 : 0次 | 上传用户:ciscohd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于词频统计思想的传统文本相似度算法,往往只考虑特征项在文本中的权重,而忽视了特征项之间的语义关系。综合考虑了特征项在文本中的重要程度以及特征项之间的语义关系,提出构建文本特征项的加权语义网模型来计算文本之间的相似度,并在模型构建的过程中,对特征项的选取、权值计算做了适当的改进。最后用实验验证了基于加权语义网的文本相似度算法相较于传统的算法,相似度计算的精确度有了进一步的提高。
其他文献
余华的《活着》被认为是他所发表的最有影响力的作品之一。福贵,作为小说的主要人物,带领我们品味生死的意义。各种惨剧发生在他的一生中,福贵从容应对,历经坎坷,最终参透人生。本
作为一种交流工具和娱乐方式,手机短信越来越受到人们的青睐。手机短信的流行归功于科技的发展,先进的科学技术给手机短信提供了一个快速发展的平台。手机短信语言不仅传达了
采用事故树分析了三峡库区水污染重大公共安全事件的诱因结构,发现存在52条诱发事件的路径以及7条防治路径;水体污染重大公其安全事件会导致社会行为变异,生活必需品缺乏已成为
随着中国近几年来经济型酒店的快速增长,经济型酒店的竞争越来越激烈,那么经济型酒店该如何获取核心竞争力,如何进行服务创新。本文将通过对服务创新研究和中国当前经济型酒店发
目的:血管活性物质在调节门脉血管阻力和门脉血流量方面及门脉高压症的形成中发挥着重要作用.本研究测定了肝硬化患者部分血管活性物质ET及CGRP和门脉系统血流动力学,旨在探
随着社会经济的不断发展,我国各行各业中的企业都在进行相应的改革以便提升自身工作的效率,但是对于我国企业的财务工作而言,其财务报告工作所采用的依旧是传统的方式,这样就
准分子激光角膜切削术(PRK)治疗近视及近视散光患者61例(119眼)。术前等值球镜屈光度-1.00D~10.50D.结果:术后半年Ⅰ组(-1.00D~6.00D)和Ⅱ组(-6.25D~10.50D)裸眼视力≥0.5者分别为100%和94.29%;≥1.0者分
为研究藻酸双酯钠(PSS)对高粘血症的治疗价值,本文观察了PSS(n=52)及复方丹参(n=48)对高粘血症患者血流变学的影响,结果表明,PSS组血流变学各项指标的改善均优于复方丹参组(P〈0.01),说明PSS有明显的降低血粘度作用
禁止重复原则是法学理论中的一项重要原则,在刑法理论中也不例外。但该原则在刑法理论的研究中尚未找到合适的位置,本文将从规范刑法学的角度来研究禁止重复评价原则与我国刑法
殷海光作为中国反对专制的学者,至今被人们所敬仰,同时也被台湾政客捧上神坛。其短暂的五十年的人生旅途中中国政局和思想界不断发生着变化,这些变化同时造化着一个逐渐走向