倒排索引相关论文
为了满足大数据背景下不断增长的数据应用需求,存储系统正在由传统的集中式架构向分布式架构演进。星际文件系统(IPFS)是一个新兴的......
学位
基于路网距离的多源Skyline查询在地图服务中广泛使用。但现有的Skyline查询方法对于复杂的路网距离计算效率低下,并且随着查询点数......
随着人工智能应用的普及,与生活相关的各种服务都在向着智能化发展,铁路客服作为旅客业务咨询的重要窗口,高效的服务能够带给旅客更优......
针对现存密文搜索方案大多不支持对索引动态更新以及无法对搜索后文件进行排名的问题,提出了一种支持动态更新的可排名密文搜索方......
期刊
基于位置的路网Skyline查询可根据用户的需求及用户所处的位置,从大量数据中快速返回给用户期望的数据,但已有的道路网络技术需要......
为快速检索云环境下的加密数据,提出了一种高效的适用于批量数据处理场合的可搜索加密方案.首先,由客户端创建两个倒排索引,分别是......
本文以北京大学数据库教研室开发的CoDB关系数据库为基础,在其上设计并实现了XML全文检索的功能,该检索系统支持元素级别的查询,并......
信息系统本身的运维管理越来越得到重视,基于GIS、3D、倒排索引等技术的基础信息生产管理系统将实际的机房物理环境进行虚拟现实三......
基于Web 2.0的社区系统在互联网上的出现引出了全局表的概念(universal tables),并使得大规模稀疏数据表(large sparse table,LST)......
本文介绍了使用界标和增加/删除网页文档两种当前比较典型的更新策略,并对它们进行了分析比较,对使用界标和插人/删除文档这两种更......
视频匹配主要需要解决两个关键问题:如何对视频内容建模,从而能够用较少的数据量表示视频的内容;如何在拥有大量视频数据的数据库......
本文分析了桌面文本搜索应用的指令级特征,发现该应用具有内存带宽利用率低、CPI值相对比较高、分支预测失效率高的特点,并设计了......
针对现有艺术品流通信息不透明、中心化交易权限不对称等问题,提出一种基于三链的艺术品区块链存证溯源模型。首先,针对艺术品信息......
为解决事故案例非结构化、多源异构、难以共享的问题,提高事故案例在应急救援管理中的利用率,利用网络爬虫技术获取由各地监管部门......
现代互联网搜索引擎普遍使用倒排索引作为存储网页信息的核心数据结构,借助倒排索,引搜索引擎能够高效存储预先抓取好网页信息,从......
全文文本检索及其汉字软件实现研究胡燕导师:曾民族研究员(北京文献服务处) 全文文本检索的基本特点,是系统对文本中的每一个词建......
本文介绍一种基于全文的主题词自动标引方法。该方法将切分关键词和标引主题词融为一体,合理地构造了词典。本文还给出一个确定标引......
针对传统搜索引擎在搜索过程中产生的临时文件多、占用磁盘空间大的问题,本文改进了搜索引擎的数据结构,采用索引压缩技术减少了临......
随着科学技术的发展,科技文献资料急剧增加,同时由于现代科学技术学科相互渗透,科技文献资料学科分散相互交叉等,给科研人员查找......
长期以来视频侵权问题层出不穷,而检测视频相似度是视频侵权的重要手段。针对现有视频相似度检测方法中存在的多特征关系难以关联......
本文回顾了通用的信息检索技术,尤其是向量空间模型及其改进、倒排索引技术。分析了现有方法的长处和不足。基于对语料的统计分析,......
大数据时代背景下,如何快速准确地从海量音频库中检索感兴趣的内容已经成为当前亟待解决的问题。传统的基于文本的音频检索并不能......
伴随着互联网的飞速发展,互联网的内容从文字逐渐向着图片视频等多媒体形式方向发展,特别是近年来移动互联网的普及使图片应用的限制......
该文介绍了搜索引擎发展的现状和它所面临的问题,详细介绍了我们初步实现的FlyingSender中文搜索引擎的具体框架体系结构,并着重描......
在大数据时代,海量数据使得压缩技术变得越来越重要。同样地,对于搜索引擎来讲,高效的压缩算法将会提升倒排索引的查询性能和空间利用......
随着Internet的迅猛发展,网上信息资源原来越丰富,网络已经成为人们获得信息的必要途径和重要手段,但网络信息具有海量、分布、动......
Internet高速发展使人们越来越依赖于通过互联网获取各种信息,CNNIC的最新报告显示互联网第一入口是即时通信的比例是39.7%,看新闻则......
在个人计算机普及的今天,个人计算机成为人们处理个人信息的主要工具。随着个人计算机中硬盘容量越来越大,如何有效地检索个人计算机......
索引技术是现代信息检索、搜索引擎和数据挖掘的关键技术之一。对于大规模文本检索系统,倒排索引是目前为止最高效的数据索引方法。......
利用质谱数据搜索蛋白质序列数据库是当前最常用的规模化蛋白质鉴定方法。近年来,蛋白质序列数据库的规模正在以指数级增长;质谱数据......
随着XML逐渐成为数据表示和数据交换的标准,XML在越来越多的领域得到了广泛的应用,XML文档的数量也在逐渐增多,如何从大量的XML文......
随着信息时代的到来,在各式各样的现实应用中,由于度量误差、数据不完整性等原因,产生了大量的不确定数据,不确定数据扮演着十分重......
随着移动通信产业的快速发展,移动网络覆盖范围不断扩大,移动用户数量的不断增加。当前,提高移动网络质量和改善移动网络用户体验......
倒排索引是Web搜索引擎的核心数据结构,也是目前为止被认为最高效的大规模文本索引方法。随着互联网络的发展,数据规模和用户数量相......
信息检索系统是互联网中最常见的应用之一,例如Web搜索引擎、在线文献检索系统等等。在这些系统中,倒排索引是最常见也最重要的数据......
模式匹配问题在计算机科学中出现的最早且人们对它的研究也最广泛,随着需要处理的文本规模越来越大,在文本中进行的搜索越来越复杂,模......
本文论述了XML及其相关技术的发展历程、技术要点及行业应用。由于信息表示的独立性,XML可用于数据交换;由于其层次结构特性,XML更多......
搜索引擎是传统的信息检索(InformationRetrival)技术与Web结合的产物,是一个集多种技术于一体的综合性系统。倒排索引是其中的一项......
商用搜索引擎对查询请求的处理速度有很高的要求,尤其是在因特网已发展到数百亿网页规模的背景下,如何在保证返回结果质量的前提下......
随着互联网技术的飞速发展,网络信息呈爆炸式增长,导致信息过载问题越来越严重,大量无关的冗余信息增加了用户获取准确信息的难度。而......
随着数字电视的普及,数字电视节目越来越多,因此如何有效地在大量电视节目中快速找到用户喜欢看的节目成为一个紧迫的研究任务,一......
由于我国经济的快速发展,大城市中交通拥堵成为了普遍的现象。找到一条方便快捷的路径,顺利地到达目的地,成了人们出行的迫切需要......
P2P技术和搜索引擎相关技术是当前科研院所、公司争相研究的热点。P2P的分布式网络结构具有可扩展性、健壮性、负载均衡等特点,与传......