基于词项语义组合的文本相似度计算方法研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户：angwjif

【摘要】

：

文本之间在相似度比较时主要考虑关键词的匹配特性，缺乏对关键词间组合关系的深入分析。针对关键词间组合特性，按序组合的关键词数目越大，对文本之间相似度贡献越大，并提出基于关

【作者】

：

周丽杰于伟海郭成

【机构】

：

烟台职业学院电教中心,烟台市普通话培训测试中心,大连理工大学软件学院

【出处】

：

计算机工程与应用

【发表日期】

：

2016年19期

【关键词】

：

组合非线性语义关联语义关联函数文本相似度

【基金项目】

：

国家自然科学基金(No.61401060,No.61272173);山东省高等学校科技计划基金(No.J12LN73)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

文本之间在相似度比较时主要考虑关键词的匹配特性，缺乏对关键词间组合关系的深入分析。针对关键词间组合特性，按序组合的关键词数目越大，对文本之间相似度贡献越大，并提出基于关键词组合数目的非线性语义关联性函数，在LCS基础上提取文本中所有关键词组合块。将这种结合关键词组合关系的相似度比较方法运用于短文本的相似度比较中，数据采用微软语义释义语料库，实验结果表明，短文本相似度计算的准确率和F1值都有了提高，其中F1值的提高较为明显。

其他文献

刈割时期对昭苏马场人工割草地产量和品质的影响

分别于2013年7月上中旬和8月上中旬对新疆维吾尔自治区伊犁哈萨克自治州昭苏马场人工割草地进行刈割,并进行了产草量测定和牧草品质的比较分析。结果表明,刈割时期对建植第3

期刊

割草地刈割时期牧草产量牧草品质

药品生产质量管理规范课程模块设计

药品生产质量管理规范（GMP）是药学专业课程之一，是当今国际社会通行簟．药品生产和质量管理必须遵循的基本准则。GMP的核心是药品生产和质量管理，内容多而杂，同时又具有较强的实践性

期刊

药品生产质量管理规范课程模块课程目标

过程性评价与大学英语教学

大学英语课堂教学评价是课程教学的一个重要环节，它既是教师获取教学反馈信息、改进教学管理、保证教学质量的重要依据，又是学生调整学习策略、改进学习方法、提高学习效率的有

期刊

大学英语教学大学英语课堂教学对分课堂

经内镜逆行胰胆管造影术后迟发性胆道出血的原因和应对措施

目的探讨经内镜逆行胰胆管造影（ERCP）术后迟发性胆道出血的原因和应对措施。方法回顾性分析1007例行ERCP的术后并发症，7例为迟发性胆道出血，对出血时间、疾病谱、出血量和治疗过

期刊

胆道出血胰胆管造影术内窥镜逆行括约肌切开术内窥镜

水溶性药物巯甲丙脯酸/Si-MCM-41载药新体系的制备与缓释作用研究

采用浸渍法将水溶性的抗高血压药物巯甲丙脯酸组装到Si-MCM-41的孔道中, 药物组装量达33.99%[m(药物)/m(载体)];用XRD, IR和固体紫外法对药物组装体进行了表征; 通过测定组装

期刊

介孔分子筛Si-MCM-41巯甲丙脯酸组装缓释作用

泰国汽车工业正在起飞

1988年1月10日,泰日合资的三菱—西蒂普汽车公司装配的420辆小轿车开始运往加拿大。根据该公司同克莱斯勒(加拿大)汽车公司签订的协议,今后六年内将向加拿大出口10万辆小轿

期刊

汽车工业新的发展阶段加拿大汽车公司

区域低碳技术创新能力评价模型研究

构建科学的区域低碳技术创新能力评价模型对于准确评价中国低碳技术创新能力现状和分析影响低碳技术创新的因素具有重要意义。基于区域低碳技术创新系统特征，通过理论遴选以及

期刊

区域低碳技术创新能力评价模型实证筛选

浅谈犹太民族创造力卓越的社会文化因素

犹太民族是一个古老而神奇的民族,虽然没有自己稳定的疆土,为数不多的同族人流散在世界各地,但他们却为这个世界的发展做出了与其民族所拥有的领土和人口形成反差的巨大贡献

期刊

犹太民族创造力宗教文化教育观念历史遭遇

甘肃省河西地区紫花苜蓿适时刈割技术研究

本试验在玉门黄花农场通过对紫花苜蓿的适时刈割期进行研究,综合考虑刈割时期对紫花苜蓿品质和产量的影响,确定河西地区紫花苜蓿的最佳刈割时期为孕蕾期至初花期。

期刊

紫花苜蓿刈割时期孕蕾期初花期甘肃省河西地区

笼式调节阀积垢解决方案

晋能大土河电厂高加正常输水调节阀,是某英国阀门公司制造,该阀门流通介质为水,受某些原因影响,阀笼上的孔经常被一些不明来历的Fe3O4杂质所堵,导致阀门开度不能达到设计值,

期刊

阀笼积垢堵塞窗口式阀笼

基于词项语义组合的文本相似度计算方法研究

与本文相关的学术论文