基于术语相似度的贝叶斯网络检索模型扩展研究

来源 :河北大学 | 被引量 : 0次 | 上传用户:skljgsdklj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的迅速发展,传统的基于关键词匹配的信息检索技术已不能满足用户准确、全面定位信息的要求。因此,许多研究者开始关注基于语义的信息检索,将语义上相同、相近、相包含的术语进行匹配,以此来提高检索性能。   利用同义词扩展查询可以扩大相关信息的检索,即提高查全率。但是盲目的扩展查询就会以牺牲查准率为代价,因为这些同义词之间的相似程度存在着区别,究竟使用哪些同义词来扩展查询直接影响着检索结果的质量。术语相似度可以从一定程度上辨别这些同义词间的近似程度,从而可以更准确的确定用于扩展查询的同义词,即可以在不降低查准率的条件下提高查全率。   论文利用术语相似度量化术语间的相似关系,并将这种量化的术语关系应用于基于贝叶斯网络的信息检索,构造基于这种量化术语关系的扩展的贝叶斯网络检索模型。文中给出了扩展模型的拓扑结构,各层节点详尽的概率估计以及完整的文档检索与推理过程。最后对扩展模型进行评估,结果表明该模型不仅可以有效地提高检索性能,而且相关文档的排序也更加合理,在一定程度上实现了基于语义的信息检索,这正是目前信息检索发展的必然趋势。  
其他文献
随着因特网的飞速进步和发展,分布式系统和Web应用系统在当今的计算机科学中起着越来越重要的作用。在Internet平台之上的动态Web开发是一个系统性任务,需要从网络、体系结构和
数据挖掘又称数据库中知识发现,是从大量数据中用非平凡的方法发现有用的知识。分类是数据挖掘中的一项非常重要的任务,在商业、金融、电讯、DNA分析、科学研究等诸多领域具有
学位
微机电系统、片上系统和无线通信技术的进步孕育了无线传感器网络.网络中的节点具有体积小,价格低并且具有传感和计算能力等特点,由于这些特性,它们可应用于各种不同的区域,
内容管理系统作为一种专门的非结构化信息管理技术,伴随着非结构化和半结构化信息规模和应用需求的急剧增长,正逐渐成为信息管理技术发展的一个重要方向。本论文以成都理工大学
随着技术和需求的发展,计算方式在不断地变化,从60年代开始的集中式计算,今天广泛采用的分布式计算,到90年代中期新兴的移动式计算。新的计算方式与固定的网络相比,无线通信具有带
MVC是一种良好的设计模式,它将应用程序分成三个核心部件:模型、视图、控制器,每个部件处理各自的任务:模型表示数据对象,视图负责数据显示,控制器接受来自视图的用户输入,并根据用
远程监控系统借助Internet实现监视与控制任务,将监控范围扩展到更广的空间,进一步推动了控制技术向网络化、分散化和开放化的方向发展。随着基于Internet的远程监控系统的逐步
嵌入式数据库系统是近些年才兴起的一项新的数据库系统。它以目前成熟的数据库技术为基础,针对嵌入式设备的具体特点,实现对移动设备和嵌入式设备上数据的存储、组织和管理。本
随着计算机技术的发展,对外围设备的接口技术也提出了更高的要求。由于USB接口的许多显著优点,使得它在计算机外围接口中占据了越来越明显的优势。为了使得USB接口的相关设计变