HRCP:一种面向并行复杂事务处理的高性能数据划分策略

来源 :第三届CCF大数据学术会议 | 被引量 : 0次 | 上传用户:Phoenix_Ex
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  数据划分是分布式数据库实现并行化事务处理所面临的首要挑战.通常,传统数据划分方法没有考虑所执行数据划分的逻辑一致性.这造成分布式数据库中单一事务经常需要在不同节点间分布式执行,导致系统整体分布式事务率高、事务吞吐率较低等一系列问题.本文基于位图索引框架提出一种采用水平属性排序编码的数据划分策略(HRCP):在保证划分后数据库各节点数据一致性和均衡性的同时,降低了分布式事务率,提高了系统的事务吞吐率.在此基础上,本文设计完成一套高效的分布式数据管理原型系统distBit.本文通过翔实的实验对比了HRCP和主流数据划分策略,发现HRCP在保持高事务吞吐率的同时,拥有接近基于机器学习的数据划分策略的低分布式事务率表现.此外,distBit还可并行、高效地完成多种事务的执行:即使单节点的复杂事务(包含聚集类查询)处理效率也高于传统方法5倍以上,在并行化后其效率还可显著提升.
其他文献
该论文共合成了26个新化合物,其中包括13个新型的侧链含芳香杂环(噻吩基、呋喃基、喹啉基)的半夹心茂钛络合物以及13个相应的新型三甲基硅基取代的芳香杂环-茂配体.这些新型
根瘤菌NGR234能够与多种豆科植物通过形成固氮根瘤而建立共生关系。有些宿主植物对根瘤菌分泌的Ⅲ型效应因子产生阳性的反应(如大叶千斤拔和非洲山毛豆),有些植物则以消极的方
肺癌(lung cancer)居于恶性肿瘤首位,在中国其发病率与死亡率都是最高的。肺癌分为非小细胞肺癌(non-small-cell lung cancer)和小细胞肺癌(small-cell lung cancer),其中非小
  本文提出了一种新的集成学习方法。这种方法分为两个步骤,第一步通过使用不同的概率校准方法对原始分类器给出的概率进行校准,第二步使用前一步生成的若干校准后的概率进行
会议
  小麦蚜虫是危害小麦的主要害虫.其发生程度预测特别是短期预测一直是植物保护领域难以解决的科学问题.传统预测方法多仅采用温湿度,预测结果与实际发生匹配度不高.基于大
  AAC(Advanced Audio Coding)是一种高效音频编码标准,目前已逐步取代MP3,在移动互联网中得到广泛应用,基于AAC压缩域的隐写给互联网信息内容的安全传输带来了新的挑战。
会议
天然产物是药物的重要来源。放线菌(Actinomycetes)在产生抗生素方面具有独特的优势,大约75%的抗生素都是由放线菌产生,从植物内生放线菌的次级代谢产物中,可以分离到许多结构新颖,生物活性多样的化合物。红树植物生长于海岸潮间带,其独特的生存环境赋予它丰富的微生物资源,是当前倍受重视的药用新资源。本论文对采集自福建省漳州市浮宫镇九龙江口、福建省厦门市集美和海沧三个地点的两种红树植物(秋茄和桐
松材线虫病是一种由松材线虫引起的林业毁灭性病害,在我国多个省市严重发生,造成了巨大经济损失。迄今为止,国内外对松材线虫病开展了大量的研究,但针对松材线虫本身的基础性
本研究选取了鼎湖山南亚热带森林演替早期:马尾松(Pinus massoniana),中期:荷木(Schima superba)、黧蒴(Castanopsis fissa)和顶级阶段的优势树种:黄果厚壳桂(Cryptocarya concinna)、肖
二氧化碳氧化乙烷脱氢制乙烯工艺是一个具有环境和资源替代式经济双重效益的绿色过程.采用CO作为温和氧化剂参与反应,不仅可以提高乙烯选择性;还可以减少温室气体CO排放,实现