倒排文件相关论文
随着3G手机网络时代的到来,移动互联网和互联网必将融合到一起,移动终端的Web搜索也已成为一个新的研究、开发领域。针对在互联网......
基于实例的机器翻译(EBMT)是一种高效的机器翻译方法,需要有一个海量的实例模式库,如何从中快速地选择出一定数量的与待翻译句子比......
搜索引擎一般采用倒排文件作为索引机制,在倒排文件中保存词目对应的文档编号的列表.而如果采用一般的数据类型如长整型来表示文档......
对于海量数据的处理,尤其是在索引和检索的效率方面给检索系统提出了很大的挑战.本文从系统结构、提高建立索引的效率、关键词表的......
由于Internet技术的迅猛发展和广泛应用,信息的多元化、复杂化、为信息检索、分类和相关技术领域的研究和发展提出了新的挑战.因此......
随着互联网上信息的不断增长和日益更新,检索系统,特别是中文文本检索系统,正在受到人们越来越多的关注。索引是检索系统必不可少......
全文检索是现代信息检索技术的一个非常重要的分支,它是处理非结构化数据的强大工具,也是搜索引擎的核心技术之一。本文对中文全文......
随着GPS、移动网络的飞速发展和智能设备的普及,使得基于位置的服务(Loccation-based Service,LBS)得到广泛的应用,比如美团、百度......
该文提出一种文档聚类新方法。其基本思想是利用数据挖掘,发现文档库中针对文档或词的关联规则,然后利用超图划分算法对关联规则超图......
Maze系统是基于P2P的内容交换系统,采用集中式架构管理用户和资源。本文的研究范围为Maze检索系统以及Maze系统中资源的性质。 ......
电网调度控制系统采用描述电网模型的公共信息模型(CIM)文件进行多级调度系统间的模型交换.在电网调度控制系统内部,开始采用CIM文......
直方图是一种非常重要的图像特征,常用于基于内容的图像检索系统中,例如,用颜色直方图可以检索到相似颜色的图像.但是,目前使用的颜色直......
在研究传统信息检索技术实现的同时,结合现有的网页分类技术,提出了一种基于自动分类的智能信息检索系统原型系统.在此基础上,对基......
文本信息的急剧增加和越来越多的用户通过在线方式获取文本信息,使得查询效率成为信息检索系统一个突出瓶颈.提出两种新型全文索引......
【正】 文献检索系统LIRES(Library Information Retrieval System)是我们研制的一个微机软件系统.它合并文献检索与图书采编为一......
要提高文件检索系统的性能,需要对倒排文件压缩技术进行研究与对比,以使文件检索系统在最大压缩比和最快的解压速度间寻找均衡,以到达......
介绍用C语言编程,构造B-树生成倒非文件,实现数据查找。...
索引项(Index Unit)的提取是中文全文检索领域的关键技术之一。将通用搜索引擎的索引项提取策略应用于某一专业领域的检索系统中,会出......
为了改善联机情报检索系统的检索性能,笔者在图书馆分类目录的启示下,提出了一种新的逻辑文件结构——归类文件。归类文件的基本思......
针对倒排索引空间开销大、查询时间效率低以及难以同时支持连接布尔查询和排序查询的问题,提出了一种同时提高空间效率与查询时间......
对于数据文件中的记录进行查找的方法一般可采用顺序查找等方法来进行,但这些查找方法的速度都较慢。本文研究采用B_树来建立倒排表,并......
【正】 电子计算机检索是情报检索的一次深刻革命,是传统的手工检索无法比拟的。然而,应当清醒地看到:机检和手续之间,并不存在万......
本文提出一种新的快速图像检索方法,它用格矢量量化器对特征矢量进行量化和描述,用倒排文件和Hash表存储和索引量化后的特征矢量,利用代数......
检索效率对大规模信息检索系统至关重要.本文基于Web搜索应用背景,针对用户查询的统计特性,提出了一种分块组织倒排文件的方法.通......
对于按照单汉字建立倒排索引的全文检索系统,最需要解决的问题是如何提高其存储效率和运算速度.本文针对此问题提出了以下优化方法......
介绍在对TRIP全文数据库系统和中文切词有关技术研究分析的基础上,开发J2EE架构下基于TRIP的全文检索系统。该全文检索系统在WEB环......
全文索引技术(gull-text index technique)作为提高全文检索时空效率的有效方式之一,近年来得到了广泛而深入的研究.根据全文索引实现......
在线文本信息的急剧增加,给信息检索系统无论是查询时间还是存储空间都带来了新的挑战.本文通过对传统的倒排文件索引模型、PAT数......
该文较为详细地阐明了用C语言编程构造B-树生成倒排文件实现数据查找。对于文件记录中的数据项查找,往往采用对整个文件顺序查找的办法......
该文基于开放源码的Berkeley DB嵌入式数据库,采用不支持事务的Berkeley DB Concurrent Data Store配置,实现了科学文献的全文检索和......
研究了基于关键词倒排表的中文网页快速检索方法。在建立大量网页语料库的前提下,利用关键词词典和优化后的前向最大切词算法脱机......
【正】 一、H.S.HEAPS 的《情报检索:计算与理论概述》[1](以下简称《情报检索》)是美国科学出版公司出版的图书情报科学丛书中一......
【正】 一、概述DBASE Ⅲ关系数据库管理系统,具有功能强,使用灵活,操作方便。简单易学等特点,并且充分发挥了新一代微型计算机系......
搜索引擎(Search Engine)技术是在网络数据成指数级增加的情况下出现的新技术。然而现在的搜索引擎在检索时都采用的是倒排文件,从后......
提出了原始数据文件与倒排文件同时进行维护的具体方法和步骤,从而使得倒排检索可以不受约束地进行。......
介绍了关联规则方法的研究概况,提出了利用基于倒排文件的比特向量操作实现布尔规则隐藏算法,以及对实验结果的评估分析,并对未来......
探讨了一类海量数据的倒排文件组织的理论和技术,以一部1100余万字的巨著的数据组织为例,阐述了主索引文件的生成、变长记录的处理、记录......
索引结构是搜索引擎的核心,直接影响着搜索引擎的检索性能.本文提出了一种新的索引结构,该结构充分利用字符串前缀个数及排列顺序......
随着企业内部网络应用的深入,Intranet内部的信息资源越来越庞大,怎样为这些数据信息构建索引是我们面If缶的主要任务,而全文检索的产......
【正】 CDS/ISIS是联合国教科文组织于1985年研究成功的一个软件,适宜藏书在1万到5万册的中小型图书馆作图书情报存贮和检索用。CD......
直方图是一种非常重要的图像特征,常用于基于内容的图像检索系统中,例如,用颜色直方图可以检索到相似颜色的图像。但是,目前使用的颜色......
一、利用NINISIS建立 机读目录系统 1.对系统进行分析与研究 图书馆实现自动化的关键是书刊资料编目的计算机处理,也就是建立机读......