二级索引相关论文
随着大数据时代的来临,对于海量数据的管理和检索,提出了更高的技术要求。HBase作为Hadoop框架下的分布式No SQL数据库,以其强拓展......
大规模人群行为数据,是通过高清摄像头采集的公共场所行人的群像数据,采集到的原始数据需要进一步进行数据分析,进而判断大规模人......
期刊
随着信息化战争的快速发展,获取预警数据的手段和能力得到了提升,我国预警领域的数据建设得到广泛关注。当前面临的主要问题包括:......
时空数据是一种同时具备时间、空间以及其他属性的大数据,在生产生活中发挥着积极作用。研究海量时空数据的高效存储与查询具有重要......
近年来,随着信息技术的蓬勃发展,社交网络、电子商务,网络游戏等已经成为一种重要的市场行为,随之而来的是网域空间虚拟资产数据的......
互联网时代的到来进一步加速了数据的爆炸式增长。越来越多的企业意识到大数据的巨大潜能,以及为企业发展带来的巨大影响。伴随着......
科技以追风逐电的速度渗透到各行各业,使数据量出现爆炸式增长,为减少存储成本与网络开销,重复数据删除技术被越来越广泛地应用于......
为了提高在HBASE中查询海量数据的效率,很多厂商提出了使用二级索引方式以提高查询效率的方案。传统HBASE二级索引方式存在占用资......
在大数据处理领域,Hadoop与HBase构建的开源处理框架的应用越来越广泛,HBase作为分布式、列式存储的海量数据库,被应用于各种海量......
日志是反映系统运行状态和用户行为的重要数据,面对海量异构的日志数据,如何提供可靠的存储以及高效快速的查询以支持日志分析工作......
身处在互联网和信息化的时代,我们周围每天都会产生大量的信息,伴随着身边的信息量呈爆炸式的形式增长,传统的关系数据库已经不能......
随着各领域信息化水平的不断提高,人们通过网络交互信息的能力增强,互联网上的数据量迅速增长,海量数据的存储和高效检索问题亟需......
范围查询是数据库支持的重要功能之一.在分布式数据库中,范围查询具有结果不唯一且数据量大的特点,因而中间结果的传输成本较高;同......
随着互联网上XML文档的大量增加,如何高效地索引、存储和检索这些XML数据成为一个非常值得深入研究的课题.目前,在XML关键词检索方......
针对HBase仅在行键上进行索引优化而非行键列查询的问题,提出一种基于协处理器的HBase分类二级索引方案。设计基于协处理器的索引......
针对Hadoop Database(Hbase)仅支持主索引结构,即通过主键和主键的range来检索数据的问题,提出利用Counting Bloom Filter的新变体建......
二级索引方案是分布式存储研究的重要分支之一,基于通用目标设计二级索引方案可避免单一业务编程繁琐问题,使实施人员更多地关注业......
由于EB(extreme binning)使用文件的最小块签名作为文件的特征,它不适合处理主要包括小文件的数据负载,会导致较差的重复数据删除......
HBase一直是大数据领域常用的非关系型数据库。随着HBase数据库中存入的数据量不断增长,对数据库里的数据进行查询变得越来越困难,......
HBase大数据存储模式解决了海量空气质量监测数据的存储及基于行键的查询问题,但不能满足空气质量监测业务人员做基于值的查询,如......
摘 要:本文主要对如何基于HBase构建二级索引查询引擎进行研究探讨。首先分析说明了HBase查询灵活性上存在的问题,接着简单介绍二级......
如何高效地处理XML查询,是目前研究的热点。由于当前方法存在过多扫描无用节点引起效率下降的问题,本文设计了一种XML数据的二级索引......
云计算为充分发挥计算性能提供了解决方案,为了能更好支持云计算,对其进行监控成为了一个重要的问题。随着监控数据的增加,快速、......
随着科学研究中产生的空间数据尤其是二维数据量级的增长和NoSQL型数据库技术的发展,越来越多的空间数据被存储到NoSQL数据库中.Le......
随着大数据时代的到来,海量数据对传统数据库技术提出了存储和检索性能的挑战。HBase是开源No SQL数据库,适合于各种非结构化和半......
目前处理时态大数据连接操作多数运用分布式系统,但现有的分布式系统尚不能支持原生的时态连接查询,无法满足时态大数据低延迟和高......
在基于上下文的自适应可变长度编码(CAVLC)解码算法中,对非结构化自适应可变长度编码码表进行解码时需要反复查找码表进行码字匹配,从......
近来,WWW作为一种电子多媒体出版的工具受到了广泛的关注。毋庸讳言,近代史上还没有哪一种技术的发展为个人赋于了如此强大的能力,......
目前,各领域对图数据的分析、应用需求日益增加,且对结构复杂、耦合度高的大规模图数据的管理面临着速度低下和空间开销大的双重挑......
最近,我看到美国的《世界年鉴1998》,翻了一下,觉得有几个特点,可以供我国年鉴界参考。一、内容丰富,容量大。《世界年鉴1998》全......
针对HBase不提供二级索引和华为的hindex方案难以满足海量数据检索速度需求的问题,文章设计了基于Solr的HBase二级索引方案SIHBase......
元数据是描述文件基本特征的数据,文件系统管理员和用户都需要通过文件元数据来定位需要的文件。随着数据量的爆炸式增长,文件规模......
随着互联网应用的高速发展和云计算的兴起,数据的生产速度越来越快,数据中心内每秒钟都有大量较小文件的生成、分析和返回。海量数......
随着GPS、GLONASS、Galileo和BDS等全球卫星导航系统(GNSS)的逐步建设和完善,世界各国都建立了自己的连续运行参考站(CORS)系统,并......
近年来随着风电技术的快速发展和普及,风电机组的装机容量迅速增长,风电机组在日常运行过程中沉积了大量生产、运维数据,有效利用......
中文分词是中文信息处理的基础,在诸如搜索引擎,自动翻译等多个领域都有着非常重要的地位。中文分词词典是中文机械式分词算法的基础......
大数据技术随着互联网的发展及信息量爆炸增长的趋势应运而生。面对异常庞大的数据,多种分布式文件系统为大数据的存储提供了解决......
随着互联网的发展,微博对人们生活的影响日益加深.由于微博用户的激增,微博数据量已经非常庞大,且每时每刻都在急速增长.面对这种......
本刊今年18期曾发表林穗芳同志的专文:《为书籍编制索引,是出版者应尽的职责》,文章强调编制索引的重要意义,同时指出,编制索引的......
针对重复数据删除算法指纹对比I/O瓶颈问题,提出一种基于相似聚类的二级索引重复数据删除算法.首先计算所有数据块的Simhash值,基......
随着现代化工业的发展,制造企业规模越来越大,生产技术也变得越来越复杂,因此,需要对整个生产过程进行监控,将分散使用的仪器、仪表、控......
HBase是存储海量非结构化数据的数据库,在主键检索时具有较高的性能,但其在非主键检索时只能进行全表扫描,效率极其低下,且HBase对......
图书馆的书目查询系统是建立在读者与馆藏、馆员与馆藏之间的一座重要桥梁,是图书馆与社会相联接的一条纽带,它的质量高低直接影响......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......