【摘 要】
:
随着信息时代的飞速发展和用户数据量的快速增长,数据库的性能变得越来越重要。主存哈希连接算法作为数据库连接操作的一种实现,具有速度快、应用范围广的特点,一直受到国内外学者的普遍关注。根据哈希连接算法是否针对硬件架构特性进行优化可以将其分为两大类型,分别是硬件非敏感哈希连接算法和硬件敏感哈希连接算法。新一代众核处理器Knights Landing Processor(KNL)具有与多核处理器不一样的架
论文部分内容阅读
随着信息时代的飞速发展和用户数据量的快速增长,数据库的性能变得越来越重要。主存哈希连接算法作为数据库连接操作的一种实现,具有速度快、应用范围广的特点,一直受到国内外学者的普遍关注。根据哈希连接算法是否针对硬件架构特性进行优化可以将其分为两大类型,分别是硬件非敏感哈希连接算法和硬件敏感哈希连接算法。新一代众核处理器Knights Landing Processor(KNL)具有与多核处理器不一样的架构特性,为哈希连接算法的优化带来了新的机遇和挑战。本文根据KNL的架构特性对两类哈希连接算法进行优化,并比较它们在KNL上的性能表现。硬件非敏感哈希连接算法的核心是依靠多线程技术并且避免复杂的硬件优化过程,得益于现代处理器体系结构的优秀设计,其简单有效的实现具有不错的性能表现。为了进一步提升性能,本文使用AVX-512指令集、缓存行对齐和数据预取等技术手段对其进行优化,同时针对SNC-4缓存聚集模式优化了共享哈希表的内存分配方式。为了提高哈希连接算法的访存性能,硬件敏感哈希连接算法使用分区的方式限制哈希表的大小,使其能够驻存在本地缓存中。本文主要根据KNL的架构特性,使用多轮分区、软件缓冲等方式提高分区性能,并使用AVX-512指令集对连接过程进行优化。最后,为了充分利用高带宽的多通道内存(MCDRAM),本文对这两类哈希连接算法设计了不同的内存分配优化策略。在本文的实验中,根据KNL的硬件架构特性进行优化后,硬件非敏感哈希连接算法的性能提升了3.7倍,硬件敏感哈希连接算法的性能提升了2.1倍。在KNL平台上,未做任何优化的硬件非敏感哈希连接算法,其性能表现远不如硬件敏感哈希连接算法;而根据硬件架构进行适当优化后的硬件非敏感哈希连接算法,其性能表现要优于硬件敏感哈希连接算法。由此可见,为了提升哈希连接算法的执行效率,硬件架构特性仍然是不可忽略的因素。
其他文献
多元化的宽带互联网通信业务,如高清视频点播(HD)、视频通话、远程医疗、电子商务、在线游戏、虚拟现实(VR)、无人驾驶等,已经完全融入大众的日常生活。人们对数据传输速率的需求呈爆发性增长。这些不同网络环境中的数据通信的需求增长将推动整个光通信系统基础的物理层的带宽需求呈爆炸性增长。由于高速率的光纤通信系统存在接收光信噪比(OSNR)和光纤非线性效应的限制。近年来,可在有限光信噪比条件下,提高信道容
人类在复杂场景中可以快速地辨识感兴趣的区域,进而完成对场景的理解,这是由人类视觉系统存在的视觉注意机制完成的。视觉信息主要来源于接收到的图像或视频数据信息,当注视
目的:在化学领域研究中,尤其是有机化学领域,天然药物有效成分一直都是科学家研究的热点。迄今为止,临床应用的药物中,与天然化学成分相关的药物依然占领着主导地位。但是由
图像检索是机器视觉的重要研究方向,在电子商务、公共安全等领域有广泛的应用。近年来随着深度学习的发展,基于内容的图像检索技术取得了显著突破。这种“以图搜图”的检索方
目前,神经网络已被证明是数据挖掘中一种重要的分类技术,然而,神经网络映射后得到的新空间在不同程度上影响了点的分布并进一步影响分类性能。在之前的研究中,形成的空间被称为“分区空间”,它可能是不规则区域或超球体的内部区域。因此,分区空间的质量也成为神经网络分类器评估的一部分。作为可再划分分区空间的神经网络分类器,最近邻分区方法通过在分区空间中生成任意形状的边界来改进神经网络分类器,但是最近邻分区方法存
背景:舌癌是最常见的口腔鳞状细胞癌,临床上常以手术结合药物对舌癌患者进行综合序列治疗。但目前临床传统化疗药物,如顺铂等(Cisplatin,CDDP),大多存在严重不良反应,加重患
目的:通过对比分析经穴与非经非穴针刺对功能性便秘(Functional Constipation,FC)患者边缘系统脑区低频振荡振幅(Amplitude of Low-Frequency Fluctuation s,ALFF)和静息态功
随着线上信息数据的大量增长,“信息过载”成为不可忽略的问题,推荐系统是克服此问题有效的手段之一。其中,用户与商品间关系的建模在推荐系统中扮演着重要的角色。但现存的方法中,大多数模型是采用了一种线性的方式对此建模,这可能会限制模型的性能。尽管最近的一些工作已经运用深度学习技术去捕捉用户与商品间的非线性关系。但当神经网络被使用时,这里仍存在两个潜在的问题。第一个问题是随着神经网络层数的增加,整体算法的
圆周SAR(Circular SAR)是能全天时全天候工作的一种新兴成像雷达,其雷达随着载体在某一高度做圆周运动,天线波束中心始终指向成像区域中心。在这种运动模型下,雷达能够全方位的获得目标的反射信息,使得方位向的频谱信息扩展到最宽,不仅获得了更多目标信息,也大大提升了方位向的分辨率,有着传统直线SAR无法比拟的优势。现有的圆周SAR成像算法中,时域的后向投影算法(Back Projection,
背景:重症肌无力(myasthenia gravis,MG)是一种自身免疫性疾病,由针对神经肌肉接头突触后膜蛋白的自身抗体导致神经肌肉接头传递障碍。重症肌无力在发病年龄、受累肌群、病程