基于贝叶斯网络的信息检索研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户：emmajqf

【摘要】

：

贝叶斯网络是以统计学为基础,是数据挖掘技术的一种方法。本质上贝叶斯网络是一个有向无循环的图表模型,直观地表述了多个变量之间的依赖关系。它通过一个有向无循环图来描述

【作者】

：

白田恬

【机构】

：

重庆大学

【出处】

：

重庆大学

【发表日期】

：

2007年期

【关键词】

：

贝叶斯网络信息检索模型关联规则挖掘向量空间模型查全率查准率

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

贝叶斯网络是以统计学为基础,是数据挖掘技术的一种方法。本质上贝叶斯网络是一个有向无循环的图表模型,直观地表述了多个变量之间的依赖关系。它通过一个有向无循环图来描述各个节点之间的因果关系,通过一个条件概率分布表来描述各个节点之间的关系密切程度。并且,贝叶斯网络可以有效地把先验知识和现有数据结合起来,使得网络的推理结果更加的合理。特别是在当前数据较少或者较难获得的情况下,贝叶斯网络的这一优点更加明显。现在随着因特网技术的迅速发展,因特网上的信息成几何级数增长,传统的信息检索服务已不能满足用户的检索需求,因此智能信息检索成为重要的研究课题。影响一个检索系统的性能有很多因素,最关键的还是信息检索的模型。信息检索的模型的效率决定了整个信息检索效果。本文从介绍了信息检索的三类数学模型——集合模型、代数模型和概率模型着手,对这三类信息检索模型的检索效果进行了分析。并分析了利用贝叶斯网络来进行信息检索的几个优势:贝叶斯网络方法有坚实的理论基础;贝叶斯网络有成熟的概率推理算法和开发软件;贝叶斯网络更适合于信息检索模型;贝叶斯网络具有很强的学习能力。同时结合信息检索本身的特点,本文在推理网络模型的基础上设计了一个贝叶斯网络模型。并对信息检索中的贝叶斯网络模型做了若干改进,通过对贝叶斯模型中的概率进行限定,由此简化了计算的工作量。同时由于用户在输入查询关键词的时候,往往由于自身的种种原因,而不够准确、细致,这时会严重的影响到信息检索的结果。为了解决这个问题,本文在再次基于贝叶斯网络、利用关联规则挖掘的方法对检索词进行了扩展,这样可以有效地解决用户输入的查询关键词不准确的问题。本文最后通过实验在查全率和查准率上对我们提出的信息检索模型和其他三种传统的信息检索模型做了比较,结果证明我们提出的信息检索模型是十分有效的。

其他文献

虚拟机实时迁移技术研究

虚拟机实时迁移技术允许虚拟机在不同物理主机之间进行重定位，在云计算、数据中心、数据库一体机等新型系统平台中，这一技术为资源管理提供了强有力的支持。利用虚拟机实时迁移

学位

虚拟机实时迁移数据库系统状态同步模型数据过滤器自适应调优

EPC系统中的中间件研究

将RFID (Radio Frequency Identification)标签应用在物联网中,与传统条码相比,它有快速扫描,重复使用,无障碍阅读,记忆的数据容量大,安全等优点。尤其是其具有超强的数据采

学位

无线射频识别产品电子码SAVANT中间件对象名解析服务物理标识语言

数据挖掘在中医若干问题研究中的应用

中医是我国的国粹，是中华民族的和全人类知识宝库的重要组成部分。经过数千年的不断发展，积累了大量的典籍，数据。当前，我国对中医学的现代化，信息化，数字化建设非常重视。相继建成

学位

数据挖掘聚类分析分类方法关联规则中风病中医证候量表治法

求解单机调度问题的启发式算法研究

单机调度问题一直是调度领域的研究热点，是生产调度问题的基础及核心问题之一。大多数单机调度问题已经被证明是NP难度的，因此，单机调度问题的研究不论是在当今国际学术界还是在

学位

机器作业单机调度程序设计启发式算法

个性化服务网站研究

随着互联网上信息的持续快速增加,传统的信息提供方式已不能满足人们的需要,能够根据个人兴趣为用户提供个性化信息服务的网站得到人们的广泛关注。本文研究了设计开发个性化

学位

个性化本体内容过滤Web日志协作过滤网站

信息安全风险评估的量化模型研究及实践

随着计算机网络技术的发展，特别是Internet的广泛应用，现代社会对信息及信息系统的依赖程度日益加深。然而信息技术在带给生活工作便利的同时，也带来了巨大的安全隐患。为了保障

学位

信息安全风险评估量化模型层次分析法模糊综合评判法灰色预测模型计算机网络

基于模糊聚类的入侵检测方法研究

入侵检测系统是继加密机制、访问控制机制及硬件防火墙等传统网络安全保护措施后又一种新的安全技术，作为一种积极主动的动态防护技术已成为近年来的研究热点。目前的入侵检测

学位

入侵检测模糊聚类可能隶属度不确定性隶属度遗传算法禁忌搜索

社区医疗物联网安全身份验证与访问控制

学位

基于邻近度的P2P路由算法的设计与实现

P2P(peer-to-peer)网络是近年来网络研究的一个热点。目前绝大多数的P2P网络系统都是以覆盖网络方式构建的。在覆盖网络中相邻的节点在底层网络中可能并不相邻甚至相隔很远,

学位

P2P网络覆盖网络P2P路由邻近度邻居选择

汉语篇章连贯性自动分析方法研究

随着自然语言处理技术的不断发展，文本处理技术进一步引起人们的关注，如信息检索、文本分类、文本自动生成等等。这些技术会使我们的工作变得更为简单、快捷。但是在实际应用中

学位

连贯性概念主位述位句子序列主题

基于贝叶斯网络的信息检索研究

与本文相关的学术论文