【摘 要】
:
词语语义相似度计算是自然语言处理领域研究的基础。针对基于路径方法中普遍存在的密度不均匀性问题,提出融合路径距离与信息内容方法,通过一个平滑参数将路径和信息内容融合
【机 构】
:
广西壮族自治区食品药品安全信息与监控中心,广西医科大学信息与管理学院
【基金项目】
:
国家重点研发计划项目(2017YFC1602000)
论文部分内容阅读
词语语义相似度计算是自然语言处理领域研究的基础。针对基于路径方法中普遍存在的密度不均匀性问题,提出融合路径距离与信息内容方法,通过一个平滑参数将路径和信息内容融合调整概念间的语义距离,使路径方法计算的相似度值更加合理。该方法具有较少的参数,能够避免其他方法因引入参数过多带来的过拟合问题,具有较好的通用性。实验结果表明:本文方法计算的相似度值与国际标准测试集人工判定值的皮尔逊相关系数达到了0.852 3,具有较好的性能。同时对实验结果分析发现,结果受算法参数的影响甚小,表明本文提出的算法具有较强的鲁棒性。
其他文献
通过对12个倒角竖向开裂型方钢管短柱进行高温后轴压力学性能试验,研究不同温度和不同竖向裂缝长度对试件极限承载力和破坏模式的影响,描述了荷载—位移曲线、荷载—应变曲线
近日,全球领先致力于为制造、分销、零售和服务企业提供企业软件解决方案的供应商Epicor软件公司在上海对外正式宣布推出Epicor ERP10。新版本ERP的推出标志着企业软件的重大
爱穿裙子的女孩子都爱过夏天,于是很羡慕那些常年生活在长夏国度的人们,特别是那里要是还有湛蓝的海水、硕大的椰子、诱人的芒果、曼妙的歌舞、灿烂的笑容和负氧离子含量极高
城市经济的发展程度对一个区域来说至关重要。随着区域经济的不断发展,城市间的竞争变得愈加激烈。因此,如何提升城市竞争力已成为一个城市未来发展的关键所在。本文基于科学性
拥有高的储能密度值和良好的温度稳定性的介电薄膜电容器在现代微电子系统中非常具有吸引力。为研究不同底电极对(Ba(0.904)Ca(0.096))(Zr(0.136)Ti(0.864))O3(BCZT)薄膜储能
罗登强是大足县化龙乡一个普通的村民,原本依靠几亩水稻过着"日出而作,日落而息"的生活。这一片平常的稻田,一年只种植一季中稻,收割后关水越冬,来年又种水稻,每亩平均收入40