倒排索引相关论文
为了满足大数据背景下不断增长的数据应用需求,存储系统正在由传统的集中式架构向分布式架构演进。星际文件系统(IPFS)是一个新兴的......
学位
基于路网距离的多源Skyline查询在地图服务中广泛使用。但现有的Skyline查询方法对于复杂的路网距离计算效率低下,并且随着查询点数......
随着人工智能应用的普及,与生活相关的各种服务都在向着智能化发展,铁路客服作为旅客业务咨询的重要窗口,高效的服务能够带给旅客更优......
随着计算机技术在各个领域的广泛应用,信息量也在呈指数增长,庞大的数据量对查询请求处理也带来了新的挑战。另一方面,用户对查询......
本文回顾了通用的信息检索技术,尤其是向量空间模型及其改进、倒排索引技术。分析了现有方法的长处和不足。基于对语料的统计分析,......
大数据时代背景下,如何快速准确地从海量音频库中检索感兴趣的内容已经成为当前亟待解决的问题。传统的基于文本的音频检索并不能......
伴随着互联网的飞速发展,互联网的内容从文字逐渐向着图片视频等多媒体形式方向发展,特别是近年来移动互联网的普及使图片应用的限制......
随着XML逐渐成为数据表示和数据交换的标准,XML在越来越多的领域得到了广泛的应用,XML文档的数量也在逐渐增多,如何从大量的XML文......
随着移动通信产业的快速发展,移动网络覆盖范围不断扩大,移动用户数量的不断增加。当前,提高移动网络质量和改善移动网络用户体验......
模式匹配问题在计算机科学中出现的最早且人们对它的研究也最广泛,随着需要处理的文本规模越来越大,在文本中进行的搜索越来越复杂,模......
本文论述了XML及其相关技术的发展历程、技术要点及行业应用。由于信息表示的独立性,XML可用于数据交换;由于其层次结构特性,XML更多......
搜索引擎是传统的信息检索(InformationRetrival)技术与Web结合的产物,是一个集多种技术于一体的综合性系统。倒排索引是其中的一项......
随着互联网(Internet)的出现和普及,人们的信息来源得到极大的丰富,获取信息的方式也随之改变。互联网成为人们获取信息的主要来源之......
随着互联网技术的飞速发展,网络信息呈爆炸式增长,导致信息过载问题越来越严重,大量无关的冗余信息增加了用户获取准确信息的难度。而......
随着数字电视的普及,数字电视节目越来越多,因此如何有效地在大量电视节目中快速找到用户喜欢看的节目成为一个紧迫的研究任务,一......
由于我国经济的快速发展,大城市中交通拥堵成为了普遍的现象。找到一条方便快捷的路径,顺利地到达目的地,成了人们出行的迫切需要......
P2P技术和搜索引擎相关技术是当前科研院所、公司争相研究的热点。P2P的分布式网络结构具有可扩展性、健壮性、负载均衡等特点,与传......
面向主题的搜索引擎是一种分类精确细致、更新及时的搜索引擎,是搜索引擎的细分和延伸。随着Web信息的爆炸增长以及信息多元化的发......
随着网络的发展和Web资源的丰富,利用Web全文信息检索系统来获取所需信息已经成为人们日常生活的重要组成部分,用户也越来越关注如何......
数据集的检索通常使用倒排索引模型进行检索,可以在海量的文本数据获取信息。基于数据集构建倒排索引文件通常十分庞大,压缩倒排索......
当今随着信息技术的日新月异,快速发展,人们对信息的渴望也是与日俱增。面对杂乱的海量数据,如何能从中快速得到用户想要的信息,是当前......
字符串相似性搜索在众多的领域具有广泛的应用,例如:数据清洗、数据集成、拼写检查、抄袭检测、生物序列分析等。到目前为止,有很......
学位
随着Internet的飞速发展,Web上的信息量越来越大,通用搜索引擎将面临信息采集、存储等方面更大的挑战。此外,工作频率不断加快的现代......
随着互联网的飞速发展,用户的私有数据越来越难管理。人们对信息的存储和管理的需求已经不是使用传统的本地存储策略就能够满足的,......
随着互联网网页数量的日益增多,如何提高搜索引擎的效率是近些年学术界及工业界都在极力解决的问题。搜索引擎的基本检索数据结构是......
随着多媒体技术和网络技术的不断发展,多媒体信息的数量迅猛增长,为了充分利用已有的多媒体资源,研究多媒体检索技术变得越来越重......
目前的搜索引擎大多是综合性的,收录各方面、各学科和各行业的信息,在反映专题或专业化信息方面很难做到全、快、准。因此课题完成......
浩如烟海的互联网信息推动了搜索引擎的普及和应用,同时也促进了搜索引擎技术的蓬勃发展。当今搜索引擎的各项技术日趋成熟,学术界......
倒排索引是提高全文检索效率的重要技术,但是倒排索引的空间效率、动态性能、创建效率和检索效率一直是倒排索引面临的关键问题。......
由于网络带宽的提高,人们通过网络共享大量数据文件,而架设Ftp服务器来提供共享服务无疑是最节约成本投入方式。因此研究一种高性能......
万维网改变了人们彼此交流的方式,然而绝大部分现有的网络内容只适合于人工处理,虽然一些软件工具在一定程度上改善了人类的交流方......
搜索引擎是人们检索互联网信息的一个重要工具。它由爬行器、索引器、查询器等3个部分组成。网页索引器是建立搜索引擎的一个关键......
随着计算机与互联网的日益普及与应用,在10年左右的时间里互联网上至少产生了50亿的网页,浩如烟海的互联网信息极大地促进了搜索引擎......
伴随着互联网的快速发展,大型搜索引擎面临着越来越严峻的性能挑战。一方面,它们每秒钟都要响应成百上千的查询请求,而这些请求需要从......
伴随着信息化进程的加快,越来越多的企业构建了自己的Web站点,通过站点向用户提供产品和服务信息。但伴随的问题是,随着Web信息资......
随着信息化发展速度的不断加快,XML技术发挥的作用越来越重要。目前,XML在多领域的数据表示、建模分析等方面都有广泛的应用。然而......
互联网信息资源的快速膨胀推动了搜索引擎技术的蓬勃发展,作为一种网上信息检索工具,搜索引擎能够帮助用户从杂乱的信息中抽出一条......
伴随着互联网的普及和网络信息的爆炸式增长,人们查阅资料己不是依靠有限范围内的网站来寻找,而是依靠搜索引擎对信息海洋中的海量......
随着互联网应用的不断发展,传统的基于文本的音频搜索引擎在用户体验上已经无法满足人们日益增长的使用需求。近年来,基于内容的音......
随着Web服务技术的快速发展和应用,Web服务的数量与日俱增,提供的功能也越来越多样化。然而,单个Web服务提供的功能有限,很多时候......
Internet已经成为目前世界上最大的信息资源库,但是网上信息资源纷繁芜杂,如何满足人们对快速、准确而全面获取信息的要求,已经成......
XML是一种可扩展的标记语言,由于其丰富的表达能力和自描述性、灵活性等特点,被广泛应用于Web环境下数据的表示和共享。随着大量数......
由于信息科技的飞速发展,数据爆炸式增长,形成了人类史上前所未有的海量文本信息。面对海量的文本信息,倒排索引作为一种有效的全......