论文部分内容阅读
在语义研究中,词语相似度是一个基本的概念,但是在研究文档内容的相关性时它具有较大的局限性。例如,“医院”和“医生”两个词语,医院是一个场所,而医生是一个人,分属于语义树两个不同的分支,因此它们的相似度必然很低。但是它们在语义上实际上又是两个密切相关的词语。为此,本文提出一种基于语义资源库HOWNET的词语相关度计算方法,本方法摒弃了常见的计算词语相似度时义原权值固定的方法,而是对不同的词语进行动态调整其义原的权值,采用该方法计算两个词语的语义相似性可以解决上面提到的局限性。并且将该方法应用到广泛使用的搜索引擎检索技术中,有利于提高检索的查准率和查全率。