论文部分内容阅读
词语相关度的计算是自然语言处理关键技术之一,在信息检索、机器翻译、词义消歧、句法分析等领域有广泛应用。国内现有大部分词语相关度计算方法是基于知网(HowNet)的。本文将中文维基百科作为语义资源,利用其分类层次、概念文档之间的链接来计算汉语词语之间的相关度。在借鉴向量空间模型和谷歌相似度(Google Similarity Distance)计算方法基础上,通过构建分类图和相关语义向量来实现汉语词语相关度的计算。在测试集Word Similarity-353上进行了实验,实验结果的斯皮尔曼等级相关系数显示