论文部分内容阅读
词语相似度、相关度计算一直是机器翻译、语义消歧、信息检索等领域的基础,本文介绍了目前国内外关于词语相似度、相关度计算的研究现状,阐述了几种具有代表性的词语相似度、相关度计算方法,分析了它们的理论基础和算法特点。 论文指出目前基于知网进行词语相似度计算的不足之处,并对其计算公式进行了改进,使其对具有反义或对义词语的相似度计算更加精确,对于知网未能解决的未登录词的相似度计算问题提出了解决方法。 本文在对知网概念层次关系进行解析的基础上设计了一种概念-义原树结构,该概念-义原树能够清晰地反映概念义原间的关系,利用该结构使得研究者能很直观地理解知网是如何进行语义描述和计算。知网没有提供词语相关度计算接口,本文在对知网资源进行了探讨和研究的基础上,提出基于知网的词语相关度计算公式,实验结果表明本文提出的计算词语相关度的方法能取得比较令人满意的结果。 论文中在基于知网的词语相似度计算的基础上,研究了基于知网的句子相似度计算,并将句子相似度计算应用于安全FAQ问答系统中,系统通过基于语义的计算能够提供给用户查询扩展功能,即在用户问题与FAQ库中的问题关键词不匹配的情况下,系统能够提示给用户可能感兴趣的相关问题。