【摘 要】
:
提出了一种并行连接查询处理算法CoLocationHashMapJoin(CHMJ).首先,设计了多副本一致性哈希算法,将具有连接关系的表根据其连接属性的哈希值在机群中进行分布,在提升了连接
【机 构】
:
中国科学院计算技术研究所,中国科学院国家智能计算机研究开发中心,中国科学院研究生院,腾讯公司数据平台部
【基金项目】
:
国家自然科学基金(60903047)
论文部分内容阅读
提出了一种并行连接查询处理算法CoLocationHashMapJoin(CHMJ).首先,设计了多副本一致性哈希算法,将具有连接关系的表根据其连接属性的哈希值在机群中进行分布,在提升了连接查询处理中数据本地性的同时,保证了数据的可用性;其次,基于多副本一致性哈希数据分布,提出了HashMapJoin并行连接查询处理算法,有效地提高了连接查询的处理效率.CHMJ算法在腾讯公司的数据仓库系统中进行了应用,结果表明,CHMJ连接查询的处理效率比Hive系统提高了近5倍.
其他文献
随着信息技术在社会各领域中发挥着越来越重要的作用,信息编码技术作为信息系统中的一个重要环节,已经引起国内外研究专家的广泛重视。农村公路的飞速发展,大量繁重的公路信
目的:本研究旨在探索一种快速有效的封闭牙本质小管的方法。首先利用羧甲基壳聚糖和溶菌酶(CMC/LYZ)包裹无定形磷酸钙(ACP)形成羧甲基壳聚糖/溶菌酶-无定形磷酸钙纳米凝胶(CMC/LYZ
数学是幼儿园教育的重要组成部分,它的发展情况很大程度上会影响到幼儿后续发展的成功与否。关于入学准备的研究是近年来教育研究领域的一个热点,幼儿数学入学准备也备受关注
<正>4月20日,在工信部、上海市经信委、江苏省南通市等各级政府部门的指导和支持下,互联网办公室·imo运营中心和尚易企业邮箱召开"中国企业‘微成本’信息化模式暨imo企业即
【目的】分析总结针刺治疗脑病的主穴选用规律。【方法】收集近10年来毫针或电针治疗脑病的文献,利用Excel软件建立穴位处方数据库,采用SPSS 17.0和Clementine 12.0软件对数
以山东省近几年的负荷和用电量数据为基础,在利用统计方法和散点图分析了各种气象因素对电力负荷和用电量的影响后,得出了影响较大的因素为气温的结论。据此开发了用于分析气
随着新课程的不断深入实施,信息技术给课堂教学带了变革,最显著的就是交互式电子白板逐渐走进课堂。就交互式电子白板的功能以及交互式白板教学中教师角色的转变进行了论述。
随着信息化的发展,各应用系统之间共用数据越来越普遍。Kettle就像水壶一样,各种数据流入壶里,然后以一种指定的格式流出,这就使得完成数据同步工作变得高效稳定、安全可靠。
随着城市化的快速发展,城市的不断扩张,小城镇面临着提高土地利用率、发展新产业、原有住房拆迁等问题。而当今小城镇的住宅建设或是对大城市的邯郸学步,或是毫无目的的乱拆
教学模式一般建立在某一种或多种教学方法之上,它可以是分别针对各个阶段的多种教学方法的组合,也可以是以某一种教学方法为核心的范式。纵观对外汉语教学教学历史,存在着大