面向读写分离、批量更新存储机制的高效分布式索引

被引量 : 0次 | 上传用户:haivi2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于日志结构合并树(Log-Structured Merge-Tree, LSM-tree)[1]思想实现的分布式数据库,采用读写分离、批量更新的存储架构管理数据。它能够有效地解决高负载的集中写入问题,并实现海量数据的可扩展存储。但这类架构的数据库在数据访问支持上还存在不足,其中不支持高性能的非主键查询是主要问题之一。索引是传统的提高非主键查询性能的技术。当下,对于读写分离架构的数据库,创建二级索引主要挑战是,数据更新增量全部存储在内存中并动态更新,而磁盘又存储了大量的基线数据。分布式环境下如何实现统一而高效地基于这两部分数据的索引构建,并能够支持数据的动态更新,保证索引与数据的一致性,是本文所要面对的问题。本文针对这样的问题,提出一种面向读写分离存储架构的索引方法,实现对海量数据的高效索引构建,同时使索引适应于系统的负载均衡和可扩展性。本文工作的主要贡献如下:1.解决了读写分离架构下对海量数据高效索引构建的问题。设计了适用于分布式系统的底层存储结构,保证在动态更新状态下的索引正确性;设计了索引延迟生效机制,实现不阻塞事务的索引构建,提高数据库的可用性;设计了基于采样的两阶段排序和多线程并行调度算法,加快基线数据的索引创建。2.提出了读写分离架构下索引高效维护和查询优化策略。设计了该架构下索引的维护和查询算法,并使用移除索引恢复日志的方法优化索引的维护,以及通过冗余列避免回表查询的额外开销优化索引的查询处理。3.验证了在典型架构的数据库中本文所有方法的有效性和正确性。本文的索引方法在开源数据库OceanBase[2]实现,并开展充足的实验。用大量模拟实验评测各种性能指标。并且,该索引技术已经在某银行的UAT[3]环境中用真实业务场景测试。两种评测都充分证明了本文方法的有效性和正确性。
其他文献
把黄帝铸鼎之荆山定在富平西南,或泾阳县与三原县交界处的嵯峨山,或河南灵宝县阌县南,均不妥。由于首山为山西省南部之中条山,而中务山富含铜矿,将黄帝铸鼎之荆山定为与中条山仅一
对在用桥梁的结构性能进行可靠性分析,给出其现在以及今后服役期内的承载力可靠度水平,有利于公路建设和决策部门对桥梁的维护工作做出经济合理、切实有效的抉择。 本文依据
结合继电保护工作的实际,建立继电保护作业人员安全风险状态的层次型指标体系。根据模糊综合评估理论,针对指标体系建立状态因素集、模糊权重集和评语集,从而建立了模糊评估
本文在对“重庆市居民日出行调查”进行统计分析的基础上,利用重庆市现有土地资料和规划用地资料、以及城市交通系统数据,对重庆市轨道交通宏观客流进行了预测分析。预测时采用
《诗经》是先秦时期第一部诗歌总集,也是第一部文学艺术档案汇编,其中表现和表达的各种事和情感为我们进一步研究《诗经》挖掘其文化价值和艺术内涵提供了丰富的材料。本文重
地理教学中培养学生的思维能力,教师必须努力做到“五多”。 1.多使用直观教具和形象性语言,从发展形象思维入手。地理教材本身,为地理思维的发展提供了丰富的材料,但天地之
聊城杨氏海源阁在清代藏书史上占有重要地位,杨氏三代编的善本书目和普通本书目,一方面反映了杨氏藏书的辉煌,另一方面又是目录学研究领域不可多得的创获.经王绍曾先生的全面
“特留份”制度的产生源于对遗嘱自由的限制,当今世界各国不仅都在立法上对于遗嘱自由进行了一定程度的限制,而且从法律上规定被继承人应当为配偶和其他近血亲保留必要的遗产
随着互联网金融不断创新,网络融资为解决小微企业融资困境开启了新的途径。以阿里巴巴为代表的电子商务平台的业务发展趋向多元化和综合化,已经开始推行网络借贷业务。本文以