二级索引相关论文
随着大数据时代的来临,对于海量数据的管理和检索,提出了更高的技术要求。HBase作为Hadoop框架下的分布式No SQL数据库,以其强拓展......
大规模人群行为数据,是通过高清摄像头采集的公共场所行人的群像数据,采集到的原始数据需要进一步进行数据分析,进而判断大规模人......
期刊
随着信息化战争的快速发展,获取预警数据的手段和能力得到了提升,我国预警领域的数据建设得到广泛关注。当前面临的主要问题包括:......
时空数据是一种同时具备时间、空间以及其他属性的大数据,在生产生活中发挥着积极作用。研究海量时空数据的高效存储与查询具有重要......
近年来,随着信息技术的蓬勃发展,社交网络、电子商务,网络游戏等已经成为一种重要的市场行为,随之而来的是网域空间虚拟资产数据的......
互联网时代的到来进一步加速了数据的爆炸式增长。越来越多的企业意识到大数据的巨大潜能,以及为企业发展带来的巨大影响。伴随着......
科技以追风逐电的速度渗透到各行各业,使数据量出现爆炸式增长,为减少存储成本与网络开销,重复数据删除技术被越来越广泛地应用于......
为了提高在HBASE中查询海量数据的效率,很多厂商提出了使用二级索引方式以提高查询效率的方案。传统HBASE二级索引方式存在占用资......
时态数据是无处不在的,现如今海量的时态数据正在被生成。海量时态数据的管理非常重要,并且具有挑战性。面对海量的时态数据,分布......
日志是反映系统运行状态和用户行为的重要数据,面对海量异构的日志数据,如何提供可靠的存储以及高效快速的查询以支持日志分析工作......
身处在互联网和信息化的时代,我们周围每天都会产生大量的信息,伴随着身边的信息量呈爆炸式的形式增长,传统的关系数据库已经不能......
随着各领域信息化水平的不断提高,人们通过网络交互信息的能力增强,互联网上的数据量迅速增长,海量数据的存储和高效检索问题亟需......
范围查询是数据库支持的重要功能之一.在分布式数据库中,范围查询具有结果不唯一且数据量大的特点,因而中间结果的传输成本较高;同......
随着互联网上XML文档的大量增加,如何高效地索引、存储和检索这些XML数据成为一个非常值得深入研究的课题.目前,在XML关键词检索方......
针对HBase仅在行键上进行索引优化而非行键列查询的问题,提出一种基于协处理器的HBase分类二级索引方案。设计基于协处理器的索引......
针对Hadoop Database(Hbase)仅支持主索引结构,即通过主键和主键的range来检索数据的问题,提出利用Counting Bloom Filter的新变体建......
二级索引方案是分布式存储研究的重要分支之一,基于通用目标设计二级索引方案可避免单一业务编程繁琐问题,使实施人员更多地关注业......
由于EB(extreme binning)使用文件的最小块签名作为文件的特征,它不适合处理主要包括小文件的数据负载,会导致较差的重复数据删除......
HBase一直是大数据领域常用的非关系型数据库。随着HBase数据库中存入的数据量不断增长,对数据库里的数据进行查询变得越来越困难,......
摘 要:本文主要对如何基于HBase构建二级索引查询引擎进行研究探讨。首先分析说明了HBase查询灵活性上存在的问题,接着简单介绍二级......
云计算为充分发挥计算性能提供了解决方案,为了能更好支持云计算,对其进行监控成为了一个重要的问题。随着监控数据的增加,快速、......
随着大数据时代的到来,海量数据对传统数据库技术提出了存储和检索性能的挑战。HBase是开源No SQL数据库,适合于各种非结构化和半......
目前处理时态大数据连接操作多数运用分布式系统,但现有的分布式系统尚不能支持原生的时态连接查询,无法满足时态大数据低延迟和高......
在基于上下文的自适应可变长度编码(CAVLC)解码算法中,对非结构化自适应可变长度编码码表进行解码时需要反复查找码表进行码字匹配,从......
目前,各领域对图数据的分析、应用需求日益增加,且对结构复杂、耦合度高的大规模图数据的管理面临着速度低下和空间开销大的双重挑......
针对HBase不提供二级索引和华为的hindex方案难以满足海量数据检索速度需求的问题,文章设计了基于Solr的HBase二级索引方案SIHBase......
元数据是描述文件基本特征的数据,文件系统管理员和用户都需要通过文件元数据来定位需要的文件。随着数据量的爆炸式增长,文件规模......
随着互联网应用的高速发展和云计算的兴起,数据的生产速度越来越快,数据中心内每秒钟都有大量较小文件的生成、分析和返回。海量数......
随着GPS、GLONASS、Galileo和BDS等全球卫星导航系统(GNSS)的逐步建设和完善,世界各国都建立了自己的连续运行参考站(CORS)系统,并......
近年来随着风电技术的快速发展和普及,风电机组的装机容量迅速增长,风电机组在日常运行过程中沉积了大量生产、运维数据,有效利用......
中文分词是中文信息处理的基础,在诸如搜索引擎,自动翻译等多个领域都有着非常重要的地位。中文分词词典是中文机械式分词算法的基础......
大数据技术随着互联网的发展及信息量爆炸增长的趋势应运而生。面对异常庞大的数据,多种分布式文件系统为大数据的存储提供了解决......
随着互联网的发展,微博对人们生活的影响日益加深.由于微博用户的激增,微博数据量已经非常庞大,且每时每刻都在急速增长.面对这种......
随着现代化工业的发展,制造企业规模越来越大,生产技术也变得越来越复杂,因此,需要对整个生产过程进行监控,将分散使用的仪器、仪表、控......
为解决配电网调度监控系统数据体量不断增大导致数据检索速度越来越慢的问题,结合数据同步技术与倒排索引机制,提出了一种二级索引......
HBase是存储海量非结构化数据的数据库,在主键检索时具有较高的性能,但其在非主键检索时只能进行全表扫描,效率极其低下,且HBase对......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
随着社区居民生活水平以及健康理念的不断提高,以居民健康信息为核心的数据管理平台在互联网技术的推动下逐渐成为当前医疗信息化......
针对HBase不提供二级索引、自带Coprocessor(协作器)不稳定及海量数据检索速度较慢等问题,设计了一种新的基于Elasticsearch的HBas......
在大数据时代,具有海量数据存储能力的HBase已被广泛应用。HBase只对行键进行了索引优化,对非行键的列未建立索引,这严重影响了复......
在大数据(Big data)的今天,互联网正朝着移动化进一步发展,社交网络等新兴内容也在不断兴起,人们可以很方便的获取到想要的信息。......
近年来,随着大数据场景的兴起,RDBMS由于其自身的扩展性和可用性限制无法满足企业需求。No SQL数据库的出现弥补了传统关系型数据......
变电设备状态监测数据体积大、价值密度低,传统数据处理方法不能很好地满足状态监视、评估与诊断等应用快速查询的需要。文中通过......
随着互联网技术的兴起和普及,文本复制检测技术成为自然语言处理领域兴起的一个研究热点,它在保护知识产权方面的重要性日益明显。......
在海量数据不断产生的现今,用户本地存储所面对的压力日益增加。利用云服务器来存储用户数据,能够极大缓解用户本地的存储压力与运......
后勤综合保障监控数据有着实时性、流速快、海量以及多维度的特征,对于监控数据的多维度检索、分析和预警都有较高的实时性要求。......