索引压缩相关论文
该文首先探讨了全文检索技术发展和概况,简单介绍了日益成熟的全文检索技术以及对于 中文全文检索还需要解决的问题.然后介绍了科......
面对日益增长的海量网页数据和更大规模的用户查询请求,如何保证较高的处理效率是当代搜索引擎面临的严峻挑战,同时也是信息检索系统......
闪存由于高效的随机读、低功耗和无噪音等优点,被认为有望取代磁盘成为数据库的永久性存储介质。闪存一些不同于磁盘的I/O特性,使......
随着社会信息化的不断推进,如何对海量的信息进行有效地组织和管理并进行快速地查找,是全文检索技术面临的一大挑战。全文检索技术给......
大数据时代的来临,使得数据量、数据复杂度和数据的处理方式发生了很大的变化,也给如何高效地、安全地从海量数据中检索到用户所关......
随着万维网的飞速发展,每天都有海量的新网页在万维网上诞生,但是也伴随着大批原有网页的不可避免的消亡。美国的Internet Archive和......
对于提高网络搜索引擎系统的性能而言,有效的存取倒排索引表和快速的响应搜索操作起着关键的作用,故提出了一种能够有效提高索引压......
基于分区的Elias-Fano算法被应用于倒排索引压缩,显示出良好的空间压缩性能。本文证明了Golomb-Rice算法的压缩性能优于Elias-Fano......
针对目前比较流行的基于词的倒排文档索引模型 ,结合全文检索数据的特点 ,提出了变长编码的索引压缩算法。利用该压缩编码 ,研究了......
在基于乐纹的音乐检索系统中,提取的乐纹的多少决定了检索结果的匹配度,这就造成了数据库大小与检索匹配度不能兼顾的矛盾。提出使......
提出了一种对倒排索引进行压缩的方法,在保证较高压缩率的前提下,对压缩后的数据提供了随机访问的能力.这种方法将压缩后的数据分......
提出了一种图像矢量量化的无损索引编码算法.该算法通过利用索引域中的相关性,对矢量量化器输出的索引图进行有效的编码,并且不引......
针对全文检索模型的研究,在双排序互关联后继树(DIRST)模型的基础上,进行了索引压缩,并在此基础上提出了一种新的原文生成算法。实......
随着计算机的广泛应用以及互联网的飞速发展,互联网流量呈现爆炸式增长的态势。为了应对日益严重的网络滥用以及网络安全事件,出于......
在数据储存量急遽增大的今天,桌面搜索工具带给我们的好处是——任何人都可以在极短的时间里,从自己所拥有的海量数据中,找到所需要的......
随着互联网技术的不断发展,网络信息爆炸式地增长,繁杂的文本数据带给人们便利的同时,也给文本检索带来巨大的挑战。倒排索引技术......
手写文档检索很难同时保证较高的检索精度和速度.基于上述原因,文中提出快速手写中文文档关键词检索方法,大幅提高检索速度并保持......
在64位体系结构的CPU中,字长从32位扩展到64位,处理器每次可以处理的数据也增加到64位。这对搜索引擎使用的核心数据结构——倒排索......
为了降低实时地形绘制任务中遥感纹理图像的装载时间,提出一种基于矢量量化的自适应遥感纹理压缩解压算法.基于人类视觉特性优化设计......
高效地访问倒排索引是搜索引擎快速响应用户查询的关键,而压缩倒排列表是提高搜索引擎性能的最重要的手段之一。针对自适应分段压缩......
倒排索引是信息检索系统的重要组成部分之一,被用于维护数十亿文档并对大量查询操作进行响应。随着当前互联网数据量的不断增加,倒......
倒排索引是大多数大型文本搜索系统的核心数据结构,索引压缩可以有效地减少倒排索引的空间占用,提升检索效率。针对倒排索引压缩算......
在社会快速的发展过程,所产生的数据信息量越来越大,由于信息基数的数量较大,使得人们在数据检索应用中难度较大,需要花费大量的时......
本文主要围绕搜索引擎中核心技术之一的倒排索引技术进行展开,主要包括索引的组织结构,构建过程,压缩编码技术,动态更新技术,大规......
相似字符串匹配是计算机科学中的一个基础问题,它在很多领域都有广泛的应用,如信息检索、计算生物学和模式识别等。研究快速、准确......
本文征对中小学信息化基础教育的需求特点,对教学资源的个性化搜索引擎进行了一个特色规划。随着用户群和教学资源库的不断壮大,如......
OpenMP是一种支持Fortran,C/C++的共享存储并行编程标准。它基于fork-join的并行执行模型,将程序划分为并行区和串行区。近几年来,......
随着单机内存容量的持续上升,内存数据库技术逐渐取代传统磁盘数据库为数据管理提供更快速的支持.本文分析了设计内存索引结构所需......
索引是所有搜索引擎的核心概念,为了进行快速查找,就需要把数据处理成一种高效的、可交叉引用的组织格式。倒排索引是一种高效的索......
随着计算机和数据库技术的迅猛发展,人类已进入信息时代,需要存储的数据大大增长,已远远超出单台服务器的承受范围。为了满足数据的检......