基于维基百科的汉越词语相似度计算

来源 :南京理工大学学报 | 被引量 : 0次 | 上传用户:fongyifei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了解决跨语言汉越词语相似度计算问题,以维基百科多语言概念页面作为桥梁,利用概念之间存在的翻译对应关系、词语出现在不同概念页面及与其他概念之间存在共现关系,提出了基于维基百科的汉越词语相似度计算方法,该方法首先提取维基百科中汉语越南语具有对应关系的概念集合,构建双语概念特征空间,然后根据词语在相应概念描述文本中出现的词频特征,以及词语与概念在其他概念文本中的共现特征构建词语的概念向量值,最后通过夹角余弦对两个向量进行词语相似度计算。实验结果表明提出的方法在汉越双语词语相似度计算上表现了好的效果,概念共现关系能够提高词语相似度的准确率。
其他文献
完善的薪酬体系对于满足员工对工作的积极性和工资的期望能够起到非常重要的作用,建立与现代企业制度相配套的、并且符合企业自身发展的薪酬激励制度与分配方案,成为市场经济
从人力资源管理的概念、管理学理论发展经历的三个阶段、独成体系的人力资源管理学的形成、西方当代战略人力资源管理等方面探讨了中西方人力资源管理理论体系的起源、发展、
目的:观察糖肾消白汤结合常规西药治疗早期糖尿病肾病的临床疗效。方法:本研究将符合入选标准的60例早期糖尿病肾病患者,用简单随机化原则分为治疗组和对照组各30例,治疗组和
讨论了一类随机Kuramoto-Sivashinsky方程解数值解的收敛性,随机Kuramoto-Sivashinsky方程一般没有解析解,数值近似的方法成为开发其性质的有用工具,利用Ito公式,Burkholder-
高职院校扩大办学规模的一个重要动因,是通过在校生数量的增加提高资源使用效率,降低办学成本,从而实现收益的增加。但通常在实践中,随着高职院校规模的扩大,收入与支出的差
目的:观察中西医结合方法治疗恶性肿瘤化疗后所致白细胞减少症的临床疗效。方法:将50例患者随机分为2组各25例,西药组采用鲨肝醇、利血生及维生素B4治疗;结合组在西药组治疗
<正>一年级的科学课以观察活动为主,重点是培养学生的科学学习兴趣、观察习惯和观察能力,让他们在观察活动中体验学科学的乐趣。一、训练学生课堂常规对一年级学生来讲,进行
<正>"扎克,我听说你那个疯子堂弟,那个像外星人一样的怪家伙,几个星期以后就要搬回镇上了!"肯一边说一边朝我走过来。操场上有几个平衡木,我正无聊地坐在其中一个上面。"嘿,
目的:观察电针结合穴位贴敷治疗顽固性面瘫的临床疗效。方法:采用脉冲针灸治疗仪电针治疗结合艾条灸及穴位贴敷治疗,共治疗3疗程。结果:治愈38例,治愈率63.3%;好转21例,好转
城乡社区治理的重要性日益凸显,实践中亦有大量社区治理创新的探索,然而对于我国社区治理创新的整体性图景,学界探讨的不多。基于对民政部组织评选出的2013至2015年三届共55