倒排文件相关论文
由于Internet技术的迅猛发展和广泛应用,信息的多元化、复杂化、为信息检索、分类和相关技术领域的研究和发展提出了新的挑战.因此......
随着互联网上信息的不断增长和日益更新,检索系统,特别是中文文本检索系统,正在受到人们越来越多的关注。索引是检索系统必不可少......
全文检索是现代信息检索技术的一个非常重要的分支,它是处理非结构化数据的强大工具,也是搜索引擎的核心技术之一。本文对中文全文......
随着GPS、移动网络的飞速发展和智能设备的普及,使得基于位置的服务(Loccation-based Service,LBS)得到广泛的应用,比如美团、百度......
在研究传统信息检索技术实现的同时,结合现有的网页分类技术,提出了一种基于自动分类的智能信息检索系统原型系统.在此基础上,对基......
文本信息的急剧增加和越来越多的用户通过在线方式获取文本信息,使得查询效率成为信息检索系统一个突出瓶颈.提出两种新型全文索引......
文章论述面向中文的五种全文索引模型的关键技术,描述各种模型的查询算法,并从时间复杂度和空间复杂度分析了模型的性能指标,以及......
要提高文件检索系统的性能,需要对倒排文件压缩技术进行研究与对比,以使文件检索系统在最大压缩比和最快的解压速度间寻找均衡,以到达......
索引项(Index Unit)的提取是中文全文检索领域的关键技术之一。将通用搜索引擎的索引项提取策略应用于某一专业领域的检索系统中,会出......
针对倒排索引空间开销大、查询时间效率低以及难以同时支持连接布尔查询和排序查询的问题,提出了一种同时提高空间效率与查询时间......
检索效率对大规模信息检索系统至关重要.本文基于Web搜索应用背景,针对用户查询的统计特性,提出了一种分块组织倒排文件的方法.通......
对于按照单汉字建立倒排索引的全文检索系统,最需要解决的问题是如何提高其存储效率和运算速度.本文针对此问题提出了以下优化方法......
介绍在对TRIP全文数据库系统和中文切词有关技术研究分析的基础上,开发J2EE架构下基于TRIP的全文检索系统。该全文检索系统在WEB环......
全文索引技术(gull-text index technique)作为提高全文检索时空效率的有效方式之一,近年来得到了广泛而深入的研究.根据全文索引实现......
在线文本信息的急剧增加,给信息检索系统无论是查询时间还是存储空间都带来了新的挑战.本文通过对传统的倒排文件索引模型、PAT数......
该文基于开放源码的Berkeley DB嵌入式数据库,采用不支持事务的Berkeley DB Concurrent Data Store配置,实现了科学文献的全文检索和......
研究了基于关键词倒排表的中文网页快速检索方法。在建立大量网页语料库的前提下,利用关键词词典和优化后的前向最大切词算法脱机......
搜索引擎(Search Engine)技术是在网络数据成指数级增加的情况下出现的新技术。然而现在的搜索引擎在检索时都采用的是倒排文件,从后......
介绍了关联规则方法的研究概况,提出了利用基于倒排文件的比特向量操作实现布尔规则隐藏算法,以及对实验结果的评估分析,并对未来......
索引结构是搜索引擎的核心,直接影响着搜索引擎的检索性能.本文提出了一种新的索引结构,该结构充分利用字符串前缀个数及排列顺序......
随着企业内部网络应用的深入,Intranet内部的信息资源越来越庞大,怎样为这些数据信息构建索引是我们面If缶的主要任务,而全文检索的产......
在线位置服务技术日益普及,用户能够很容易获得他们的地理位置信息.随之产生了各类有关空间关键字的查询,这些查询可以提供定位服......
传统Top-k空间关键字查询忽略了兴趣对象周围的基础设施属性对于用户偏好的影响,针对该问题,研究了基于影响区域约束关系的Top-k空......
"语料检索"跟一般的信息检索不同,它是为语言学工作者服务的,主要关注语料文本的形式特征以及相关的语篇属性。不仅需要字符串检索......
在对全文检索有关技术进行分析和研究的基础之上,提出并实现了一个实用的全文检索系统 UFRS,它能够处理中英文文档并可以扩展到其......
后缀树的重要性可以为多年来学术界对它总是有新的发现而印证.它的结构简单,但可以在线性的时间里解决许多复杂的问题,被大量的使......
针对目前Web信息挖掘中存在大量页面重复的问题,从Web信息的组织角度对其中的一些关键问题进行深入分析,提出了基于关键词的部分相似......
在移动Web搜索中人们希望搜索到的目标对象既满足地理位置相近性,又满足描述文档相关性。由此产生的地理位置和文档相融合的top-k......
为了便于福建省预防医学科学研究技术资料的管理,我们以CDS/ISIS为平台建立福建省预防医学系统科研项目档案管理系统。它包括福建省预防医......
倒排文件作为现代大规模搜索引擎工作的一个核心技术,其原理简单,具备灵活高效的特点,具体体现在其根据需要可做到适当的变通。本文通......
页是磁盘与内存进行数据交换的基本单位,它在操作系统、数据库管理系统以及倒排文件的数据组织中占据十分重要的地位.为减少倒排索......
目前,搜索引擎的核心模块(索引器)均采用倒排文件结构,对短语查询的准确率较低。该文引入后缀数组技术进行全文索引,为克服全文索......
信息检索(Information Retrieval),通常指文本信息检索,包括信息的存储、组织、表现、查询、存取等各个方面,其核心为文本信息的索......
全文检索是现代信息检索技术的一个非常重要的分支,它是处理非结构化数据的强大工具,也是搜索引擎的核心技术之一。本文对中文全文......