DM4全文检索机制的改进

来源 :第二十三届中国数据库学术会议(NDBC2006) | 被引量 : 0次 | 上传用户:yucol
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文通过理论和实验的分析,在采用了新的压缩方法和索引表结构等手段,DM4的全文检索系统所存在的两大问题,即空间膨胀率过高和索引填充时间较长的问题,已经得到了很好的解决.现在的分词算法仍是字粒度的细粒度的分词方法,应该使用更优秀的分词方法来改进.而且,现有系统的检索方面的能力尚不够强,不支持检索结果的排位输出,这也是需要提高的地方。
其他文献
本文论述了建设中国动物数据库及其信息系统的意义,阐明了系统的总体结构框架、数据库技术、功能模块的设计与实现、网站开发及实现数据共享的方法和思路,介绍了中国动物数据
近年来,移动对象数据库得到了广泛的重视与研究,其技术在许多领域中展现了广阔的应用前景.然而,数据库中的移动对象的数目是非常巨大的,从性能方面考虑,在查询的时候应当避免
会议
本文简要介绍了数据的遗传信息模型,重点介绍了遗传信息的查询语言.鉴于管理数据的进化过程是数据管理领域一个新的研究分支,现阶段我们并未发现有相关的一些研究成果,可见的
流数据处理系统是目前研究的热点,流数据受环境影响非常明显.在不同环境下的性能和稳定性是流数据处理系统的关键和核心.本文在深入分析和研究CPU和内存在流数据处理中的特点
数据缓冲区运行状况是数据库系统性能的关键所在.自适应管理技术,尤其是数据缓冲区的自适应管理研究,已经成为数据管理领域的一项重要内容.本文在PostgreSQL数据缓冲区中实现
会议
导航系统的运作方式简介在互连网上怎样高效地管理、组织信息,以及为普通公众提供简洁方便的信息检索,称为互连网信息导航.目前普遍是通过建立互连网信息导航站点,来引导用户
会议
Model-Driven Architecture(MDA)是由OMG组织于2001年2月提出的用模型技术进行软件系统开发的方法和标准体系,它代表了现代软件开发理论与方法发展的主流趋势.可以预见它会成
会议
海量数据来源于科学统计和计算的结果(例如:地震监测、天气预报等),并被存储在科学统计数据库(Scientific and Statistical Databases,SSDB)中.SSDB有如下特点:①关系的模式
会议
在企业信息系统中隐藏着大量结构化、半结构化及非结构化存储的文本信息还没得到有效利用.结构化存储的文本信息隐藏于关系数据库内部,而传统关系数据库管理平台文本信息检索
会议
本文针对普通用户自然语言提出查询请求,结合XML文档检索的新特征,分析了XML文档中自然语言查询的模糊内容和结构检索结果排序的影响因素.充分利用答案结点的逻辑意义完整性,
会议