ArchDB:一个高可靠高性能海量归档流数据库

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:vbwu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,在科学实验、网站安全、内网审计等诸多领域,监视在线事务或跟踪用户行为会产生大规模归档流数据.这些归档系统规模可达PB级(10~(15)B).在如此规模下存储和分析这些结构化数据至少带来3个挑战;1)数据可靠性问题;2)高效存储和分析高速持续的流数据问题;3)高性能和高可靠目标之间的冲突问题.在分析归档流数据特征的基础上,提出了一种新的高可靠数据库体系结构ArchDB.ArchDB由两部分组成:其一负责加载和查询较小规模的当前数据;其二负责存储和查询大规模的历史归档数据.通过优化设计ArchDB中的数据分布策略、数据块尺寸和归档时机、数据存储和归档流水化机制来高效可靠管理大规模数据.实验结果表明ArchDB既能加倍数据加栽性能,又能加速恢复过程,其加速效果取决于恢复并发度.
其他文献
中国企业年金目前仍处在发展的幼稚期,不具有为证券市场持续提供资金的能力。无论是从利益主体还是从制度特征上看,中国企业年金与美国401(K)计划都有本质的不同,所以,现阶段
面对农民工的返乡潮,可持续发展的压力,后工业社会的如期而至,城市如何实现华丽转身,从容器变为磁体,成为上海及许多城市发展的课题.文章从加拿大蒙特利尔市和意大利布雷西亚
连续数据保护(continuous data protection,CDP)是一种数据的连续时间点的保护技术,它能在故障瞬间完成任何时间点的故障恢复,起到业务的快速连续地运行的作用.与传统的数据
本文阐述了技术标准的著作权及其归属,监督和管理政策,依据我国著作权法、标准法及相关政策,从科技出版的角度,指出出版社依法对技术标准类图书享有专有著作权,同时细致地阐
本文首先引入我国原料奶拟需求量的概念;然后建立了我国原料奶拟需求量的预测模型,预测得到2011-2013年的我国原料奶拟需求量分别为4746.6万t、4977.6万t和5212万t;最后基于灰
Double-skin facades (DSF) are a technique developed for colder climates, so few people think about whether or not it can also be used for hot-summer and cold-wi
  本文对世界钴资源的储量与分布、主要生产国的产量、钴金属的应用及供需平衡等作了较为详细的介绍,同时对中国钴资源的供需情况及面临的问题进行了分析。指出随着新建项目
XML文档近似连接操作是在两个XML文档集合中发现近似的XML文档,其在基于XML数据的信息集成、XML数据清洗等系统中有着广泛的应用.然而,目前XML文档近似连接操作的一个显著问
膨胀岩的判别与分级是膨胀岩研究的重要内容.本文在分析和总结了前人研究成果的基础上,提出了一种以膨胀岩中亲水矿物成分的含量为基础控制指标,以岩块的干燥饱和吸水率、极
互联网的迅猛发展,以及人们的内在文化需求,促进了群众文化的衍变,其影响显而易见。一方面大大地促进了文化的传播和发展,促进了文化市场的繁荣,极大地便利了人们的文化生活;