基于全文数据库的全文检索模型研究

来源 :中国石油大学(华东) | 被引量 : 0次 | 上传用户:zkw_2209
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
全文检索技术已经在企业信息门户等领域有了广泛的应用。然而,目前大部分全文检索系统是面向静态数据库或半动态数据库的,即信息一旦录入就不能更新,或者只能在预先设置的时间段内统一更新。这显然不能满足一些实时性要求很高的应用,如报社新闻的查询等。因此,全文检索的动态性是全文检索技术发展的一个必然趋势。全文检索的动态性取决于全文索引创建和更新的动态性。通过对传统模型和新兴模型进行分析,发现互关联后继树模型具有出色的时间效率和空间效率,但动态更新效率还不是特别理想。为了提高其动态性能,从存储结构的优化、动态更新索引结构的设计、分布式并行检索策略的使用三方面进行研究。在优化存储结构方面,将索引文件分块处理,详细讨论了块、块中记录及文档的算法设计,实验表明:该方案提高了索引更新的灵活性。在设计动态更新索引结构方面,索引由主索引、附加索引和删除文件列表组成,实验证明:独特的结构很好地解决了索引的更新问题。在分布式并行检索策略的使用方面,给出具体的分布式存储建库和并行处理方法,在一定程度上避免了互关联后继树模型动态性能不理想的弱点。最后,提出一个整合了以上各种方案的基于互关联后继树模型的全文检索系统框架,该框架具有良好的综合性能。
其他文献
本文在分析了当前分布式PKI环境下证书验证存在的问题后,提出了一种证书验证代理服务器的方案,由该服务器来执行复杂的证书路径构建和证书路径验证的工作,从而将客户端从复杂
在网络得到快速发展和应用的现代社会,信息安全问题成为人们密切关注的问题之一。数字签名作为一种保障信息安全的技术,在确保信息的完整性、不可伪造性、不可否认性方面发挥了
手语识别作为多模式人机接口领域的一项重要组成部分,已经吸引了越来越多的专家和学者们的注意。手语识别的研究目标是让机器“看懂”聋哑人的语言。这里“看懂”有两种含意,一
生物信息学(Bioinformatics)是利用计算机技术对在分子生物学等学科研究中的数据进行收集、整理和分析的一门学科。计算机中数据挖掘(Data mining)技术是一个从大量的数据中
在现代物流的背景下,物流中心起着至关重要的作用。尤其从供应链的高度看,其在仓储方面的优势可以在更好地降低物流成本的同时,缓冲供求的矛盾。而物流中心要想让自己的仓储工作
本文作为面向解释的偏差分析的前半部分工作,主要是通过对我们所做的一些偏差分析系统进行比较、分析,将面向解释的偏差分析问题模型化,并提出相应的问题解决方法。在模型化问题
在基于证书的公钥密码系统中需要大量的时间和存储空间来签发、存储用户的证书和公钥,而且验证也比较烦琐。为了简化公钥密码系统的密钥管理程序、降低开销,1984年Adi.Shamir提
传统计算机图形学,涉及到复杂建模、消隐、投影、裁剪和光照明计算,对高度复杂的场景,现有的计算机硬件无法实现几何场景的实时绘制。随着对绘制真实感和实时性要求的不断提高,目
防火墙作为信息安全保障的重要措施已经应用在众多组织机构的网络中。从防火墙技术诞生近20年来,防火墙产品的功能得到了不断的加强。但由于新的黑客攻击手段层出不穷,基于静
随着现代化社会的日新月异,计算机网络、数据库技术等信息技术的高速发展,使得企业在高速发展的同时,所面临的竞争也同益激烈。政府和企业如何能在复杂多变的市场环境中适应市场