论文部分内容阅读
随着网络技术的迅速发展,传统的基于关键词匹配的信息检索技术已不能满足用户准确、全面定位信息的要求。因此,许多研究者开始关注基于语义的信息检索,将语义上相同、相近、相包含的术语进行匹配,以此来提高检索性能。
利用同义词扩展查询可以扩大相关信息的检索,即提高查全率。但是盲目的扩展查询就会以牺牲查准率为代价,因为这些同义词之间的相似程度存在着区别,究竟使用哪些同义词来扩展查询直接影响着检索结果的质量。术语相似度可以从一定程度上辨别这些同义词间的近似程度,从而可以更准确的确定用于扩展查询的同义词,即可以在不降低查准率的条件下提高查全率。
论文利用术语相似度量化术语间的相似关系,并将这种量化的术语关系应用于基于贝叶斯网络的信息检索,构造基于这种量化术语关系的扩展的贝叶斯网络检索模型。文中给出了扩展模型的拓扑结构,各层节点详尽的概率估计以及完整的文档检索与推理过程。最后对扩展模型进行评估,结果表明该模型不仅可以有效地提高检索性能,而且相关文档的排序也更加合理,在一定程度上实现了基于语义的信息检索,这正是目前信息检索发展的必然趋势。