基于同义词扩展的贝叶斯网络结构化文档检索模型

来源 :河北大学 | 被引量 : 0次 | 上传用户:jiushiaijiujiu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
结构化文档检索系统利用文档的结构信息,对文档的部分内容建立索引并检索呈现,所得查询结果能精细化地表达查询需求。利用同义词扩展查询是实现基于语义检索的一种有效方式。术语相似度能量化描述同义词间的相似程度。在信息检索系统中,利用量化的同义词关系扩展查询可以在不降低查准率的条件下提高查全率。本文利用基于《知网》的术语相似度计算方法量化同义词间的相似关系,并将这种关系引入到基于贝叶斯网络的结构化文档信息检索模型中,用于实现基于语义概念的检索,构造基于这种量化术语关系的扩展贝叶斯网络检索模型。详细描述了如何有效的挖掘术语同义词关系并采用有效的量化算法对其进行量化;给出了基于此量化同义词关系扩展的贝叶斯网络结构化文档检索模型的拓扑结构,网络中各层结点的概率计算方法和模型推理与文档检索的详细过程。最后对扩展模型进行了评测,结果表明扩展模型能有效地提高检索性能,各个粒度不同的结构元素的排序也更能表达查询需求。
其他文献
目前,Web服务已经开始由基础构建阶段向大规模企业应用阶段发展。但是,Web服务本身没有语义和流程的概念,单个的Web服务功能有限,难以满足复杂的应用需求,这就需要Web服务进行组合
并行计算模型为并行算法和并行计算机系统结构的分析与设计提供了具有指导意义的理论界面和模型框架,它是并行计算研究的重要领域。基于LogGP模型的非独占异构模型NHBL模型是
在Ad Hoc网络中,路由协议是当前国际上研究与应用的热点之一。本文对按需路由协议中的AODV协议进行了深入研究。研究发现,AODV协议中缺少有效机制对链路稳定性进行判定,从而
科学计算可视化是发达国家二十世纪八十年代后期提出并发展起来的一门新兴技术。它将科学计算过程中及计算结果的数据转换为几何图形及图像信息在屏幕上显示出来并进行交互处
基于内容的图像检索(Content-Based Image Retrieval)研究的目的是实现自动地、智能地检索图像,研究的对象是使查询者可以方便、快速、准确地从图像数据库中查找特定图像的方
当前我国在音视频产业领域已经具备较强的产业基础,但由于没有掌握核心技术标准,相关企业长期受制于国外持有标准化专利与技术的企业和组织。为了在音视频产业领域拥有更多的
本文探讨一种白盒测试中测试用例自动生成的搜索算法,旨在为软件测试提供完整的测试用例。 路径覆盖是白盒测试中覆盖率最高的一种覆盖方法,结构化测试数据一般都是通过路径
自然语言描述的协议规范存在二义性问题,协议软件开发人员对同一协议规范理解的差异是导致其协议实现“百花齐放”的根本原因。协议实现与协议规范之间的丝毫偏差都可能给通信
急救护理学是一门理论性与实践性都很强的学科,其教学目的是:增强学员的急救意识,传授急救护理学的基本理论,训练急救技术操作的基本技能,培养学员在紧急情况下迅速评估、正
随着Internet的普及信息处理等高科技技术的不断发展,越来越多的企业也在广泛利用Internet技术进行数据共享等信息处理的应用,使得信息内容也正以惊人的速度增加,同时内部业务系