基于加权语义网的文本相似度计算方法研究

来源 :赤峰学院学报(自然科学版) | 被引量 : 0次 | 上传用户:Air8712
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了更加准确地计算文本特征权重,提高文本相似度计算的精确度,文章提出了一种基于《知网(HowNet)》语义知识库的加权语义复杂网络文本相似度计算方法.该方法首先以特征词为节点,以特征词窗口共现为边,以特征词的TF-IDF值为特征词节点的初始权重,以融合共现频率和概念间语义距离计算特征词节点之间边的权重,构建加权语义文本复杂网络.然后利用综合特征指数作为加权语义网中文本的特征权重.最后基于公开数据集和KNN算法进行文本聚类实验,实验结果表明,在基于F-度量值标准上本文提出的方法要优于传统基于向量空间模型的T
其他文献
裙装是覆盖人体下半身的主要服装之一,也是款式变化最多样的结构之一。裙装结构以纵向的裙长和横向的臀围为基础参考数值,构成矩形的裙装原型结构,它是裙装结构千变万化的基
研究者对产业转移的概念和内涵进行广义和狭义的区分,从不同角度对产业转移模式和类型进行了归纳。科学研究产业跨区域转移的规模、方向和效果是当前学术界一直没有解决的问
对我国猪传染病的发展现状及流行原因进行了分析,指出了畜牧管理在猪传染病控制中的作用,提出了畜牧管理实践作用于猪传染病的方法及策略.
在魏晋南北朝以前 ,田园是朦胧而缥渺的 ,东汉张衡《归田赋》中的田园方才有了一个较为清晰的印象 ,然而张衡毕竟没有归田。晋宋之际的陶渊明葛巾短褐 ,以农人的装束 ,以文人
<正>"兵妈妈,你在哪里?"来自5岁男孩张弘扬的一声童心呼唤,是对震后新生的生命礼赞,是对军队医护人员的最高褒奖,更让全国全军读者在"5·12"这个不应忘却的日子里,拥抱了一份
2008年,她以"5·12"汶川特大地震报道中的敏锐、果敢、专业、忘我,折服了电视观众,为抗震救灾工作创造了良好的舆论环境,被网民评为"震区最美的战地记者",李长春同志称赞她为
自1999年我国高校开始扩招以来,每年大学毕业生数量迅速递增,至2009年毕业生数量已经达到610万。但是,近年来大学生失业状况日趋严重,甚至出现了毕业即失业的现象。究其原因
某白钨矿选矿废水中固体、水玻璃含量较高,形成的稳定胶体分散体系难于利用。采用酸碱联用工艺,充分利用废水中的水玻璃进行混凝沉淀,可消除其中的悬浮物和重金属,澄清后的水
目的探讨影响早产儿脑损伤发生的危险因素,构建并检验风险模型的预测效能。方法 收集2014年1月-2016年1月我院新生儿科收治的476例早产儿的临床资料,根据颅脑超声结果,将新生
经过三十多年的发展,非接触三维形貌检测技术在工业检测、质量控制、海洋勘探、医学测量、虚拟现实等很多领域中得到了广泛的应用。在这种巨大的应用需求的推动下,光学三维检