基于《知网》的词语相似度算法研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:wuchen2007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于《知网》的词语(句子)相似度计算通常是把义原(词语)之间的最优匹配做为运算的基本单位的,最终的整体相似度数值可由每一部分的相似度值通过适当的加权计算合成而来,这样的做法往往会造成一些匹配对的信息重复和结构不合理。针对这个问题,该文通过统计出两个直接义原集合间的共有信息(共性)和差异信息(个性)来计算集合的相似度,并把此方法引入到词语(句子)的相似度计算中去。最终的实验比对结果表明该文所采用的方法更为稳定和有效。
其他文献
本文结合全站仪的原理及工作特点浅谈全站仪在矿山井下曲线施工放样中的应用。根据不同情况运用不同方法标定出中线位置;施工放样是矿井施工中的重要环节,合理的设计,加之优
一、调料的制备用盐1-1.5公斤和辣椒粉0.25公斤.充分混合后用开水冲成浆糊状.冷却待用。再用与辣椒等量的蒜捣成泥.用刀将适量葱剁成碎末.同时把适量梨擦成细丝待用。将上述蒜泥、
<正>数学作为一种研究问题的工具,对自然科学的学习起着非常重要的作用。将化学问题转化为数学问题,或利用数学方法分析和解决化学问题,更是《高考大纲》的基本要求。利用数
为了开发出一种生态安全的植物源农药,以天然植物蛇床子、花椒、瑞香狼毒为原料,根据农药混配原理将其提取物进行加工组配,并与多杀菌素复配,用于防治小菜蛾,进行生物活性测
目的:探讨中老年高血压患者鼻出血的病因、临床特点及治疗措施。方法:回顾性分析316例中老年高血压性鼻出血患者的临床资料。结果:所有病例均治愈,无一例死亡,无一例发生心脑
宋氏一号药用葛一般着生l~3条块根。且粗壮肥大,长圆形,形似人参,表皮淡黄色,光滑无须根,肉质浆白色,纤维细脆含量低.易折断.易破碎、加工,淀粉含量高。块根顶部生长点膨大饱满.似拳头,青
<正>农村基层党组织是党的整个组织体系的基石,是连接党与人民群众之间的纽带。农村基层党组织能否规范有序地运行,直接关系着党和国家对农村的方针政策能否落实到位,党在基
本文以现代汉字构形学理论、心理语言学相关理论为理论依据,主要探讨三个问题:1)汉字识别过程中表意部件在语义激活中的作用;2)汉字识别过程中整字与部件的语义激活孰先孰后;3)
携手中国自主品牌汽车博览会,标志着"爱我中国车"年度车型评选迈上新的台阶。人们期待着,7月展会上年度车型在党和国家领导人面前的集体亮相,将成为这一历经5年的评选值得炫耀