基于百度百科多特征信息的词汇相似度计算

来源 :计算机与数字工程 | 被引量 : 0次 | 上传用户:wanganInsh888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为自然语言理解的一项基础工作,词汇语义相似度度量一直是研究的重点。语义相似度度量本身是一个中间任务,它是大多数自然语言处理任务中一个必不可少的中间层次,在自然语言处理中有着广泛的应用,如词义消歧、信息检索以及机器翻译等。论文提出了一种新的基于百度百科词条信息的词汇相似度计算方法。该方法经由百科名片、词条正文,开放分类和相关词条四个部分的内容,分别计算出它们之间的相似性值,以此来获得一对词汇间的整体相似性。经试验证明,在Words-240数据集上,论文方法在词汇相似度计算上,准确率更高。
其他文献
风力发电和光伏发电具有随机性和高能量波动的特点,会给由风机、光伏电池、蓄电池和柴油发电机构成的独立运行微电网系统带来系统总成本高、负荷失电率高等问题。为解决以上
本文介绍了一种用于压水堆动力装置的间接操作式高温高压电磁阀的开发过程。这是国 内对这种电磁阀的首次开发。整个开发过程可分为“研究设计”和“改进完善”两个阶段。在
看图讲述是幼儿园语言领域讲述活动中重要的一个活动类型,对培养幼儿观察能力、表达能力、逻辑思维能力有重要的作用。文章立足于当前中职学前教育专业学生的看图讲述教学现
本研究基于对泰安市的出国务工人员实用英语培训的现状分析和出国务工人员的特点与不同需求,针对目前成人英语培训面临的困难和问题,通过实践探索成人英语培训教学的有效方法
船用空心轴在保证传动不发生变化情况下,可以减轻传动轴重量及传动惯性,但在装配时空心轴会出现液压联轴器内套受力变化不均,在设计液压联轴器时无法准确设计内、外套的壁厚
目的:探讨优质护理干预在小儿重症肺炎中的临床护理效果。方法:在笔者所在医院2013年1月-2014年12月收治的重症肺炎患儿中,选择具有可比性的60例作为研究对象,并将其按照随机
今年上海车展上各品牌都在力推自家展台的新车,而上汽通用汽车凯迪拉克品牌除了为国内消费者带来了年初已在北美亮相的重磅车型XT6之外,同时发布了“指尖上的服务MyCadillac
报纸
目的:探讨胰岛素泵在糖尿病治疗中的临床效果及使用方法。方法:对2013年1月~2013年9月期间我院收治的52例糖尿病患者的临床资料进行回顾性分析。按照0.5U/kg的比例取适量的短
目的分析继发性甲状旁腺功能亢进(SHPT)术后出血的临床特征及处理预防措施。方法该院2014-08~2017-08接受手术治疗SHPT患者100例,对其中6例发生术后出血患者的临床资料进行回
随着导航系统的发展,以及导航系统的装配量越来越大,用户和市场对导航系统的定位精度和实时性要求越来越高,结合GPS卫星定位系统的特点及实际需要,论文提出了基于STM32单片机的卫星定位设计方案,设计与研究GPS定位数据提取方法。