数据中心应用评测和优化体系研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:a873322604
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据的爆炸式增长促进了数据中心的蓬勃发展。越来越多的公司和科研单位利用数据中心来挖掘大数据中潜在的价值。而在数据中心规模下,即使很小的性能提升也能立即带来巨大的收益。因此潜在而巨大的收益成为一个推动数据中心系统研究的主要驱动力。但是一些数据中心系统固有的特性,如繁杂而多样的应用、第三方库和软件栈的大量使用以及高效地处理海量数据等特性,为数据中心之上的研究增加了新的维度。同时,作为研究的基础,数据中心基准测试程序集的缺乏也加剧了量化研究的困难。  针对以上问题,本文提出并构建了一套面向数据中心研究的基准测试程序集。我们对其中的应用进行了深入的分析。而后基于提出的数据中心基准测试程序集,我们对当今处理器的设计参数在性能、能耗和总体拥有成本等方面进行了详细的评测。最后,我们对运行在SMT处理器平台上的数据中心应用进行了优化。  本文的主要贡献和创新如下:  (1)基于目前没有被广泛接受的数据中心基准测试程序集这一事实,本文提出了一套面向数据中心研究的基准测试程序集—DCBench。本文广泛调研了互联网中主要的应用领域。然后从这些主要的应用领域中选取频繁使用的操作和算法作为代表性应用。我们将这些应用进行整合并发布了一套面向数据中心的基准测试程序集。  (2)本文提出了一套通用的方法来量化数据中心基准测试集中软件栈的行为。为了研究软件栈的行为影响,我们采用主元分析和聚类算法分析了基于不同软件栈的数据中心应用间的相似性。实验结果表明,软件栈对应用程序行为有很大的影响,这种影响甚至超过了算法对程序行为的影响。同时实验结果也证实了软件栈在基准测试程序集中的重要性。  (3)本文对数据中心基准测试集中的应用在微体系结构层面进行了深入的行为特征分析。本文采集了数据中心应用在微体系结构层上的行为特性数据并和传统的基准测试集进行了对比。我们发现数据中心应用在行为特性上和传统的桌面、高性能、服务器、片上多核处理器应用存在较大的差别。针对这些特性,本文在微体系结构层为面向数据中心应用的处理器设计提出了相应的优化建议。  (4)本文利用构建的数据中心基准测试集对当今主流处理器的设计参数行了综合考量。基于构建的数据中心基准测试集,我们在性能、功率、能耗效率、总体拥成本等方面评估了包括流水线执行方式、指令发射方式、动态超频和同时多线程技术在内的主要处理器设计参数。研究发现对于大部分数据中心应用而言,配备同时多线程和动态超频技术的强核心多核处理器更有优势。无论从性能还是能耗方面,强核心多核处理器都优于弱核心众核处理器架构。  (5)本文在当前SMT处理器平台上提出并实现了一套自动优化框架来加速数据中心应用。借助于机器学习算法,我们采用了一个基于预测的动态调优架构—PBDST(Prediction-BasedDynamicSMTThreading)来自动调整SMT处理器核心中的线程数。我们将该框架在软件栈层次实现从而保证了对上层应用的透明。实验结果表明,该方法相比于系统默认的SMT模式取得了最高56.3%,平均16.2%的性能提升。
其他文献
随着现场总线在工业控制领域的应用,数控现场总线以其数字化双向传输、高可靠、数据交换量大的特点,已经成为数控系统实现高速、高精、多轴联动控制的重要手段,是国内外数控系统
随着网络规模的不断扩大,网络空间安全处于越来越重要的地位。NetFlow作为一种收集和监控网络流数据的网络协议,广泛应用于网络数据的采集、监控、安全以及网络流量计费等服务,
Agent的信任和多Agent系统是人工智能和电子商务领域中重要的研究方向。人类社会中的信任是人类解决复杂问题的有效机制之一,信任在多个领域中都得到了广泛的研究。在多Agent
随着数码相机和网络社交媒体的飞速发展,互联网上图像数据规模急剧增长,如何快速有效地从大规模图像数据中找到所需要的图像已成为用户的迫切需求。因而,图像检索成为许多现实世
学位
无线传感器网络(WSN)融合了传感器技术、通信技术和数据处理技术,因其巨大的应用前景而受到学术界和工业界的广泛重视。对于大多数无线传感网络,由于节点数量众多,有时还处于不
数控系统实时性和可靠性的实现很大程度上要依赖于底层的操作系统。目前“蓝天”系列数控系统中所采用的开源RTLinux实时系统不支持当前主流的Linux2.6内核,并且已经停止维护
学位
粗糙集理论是一门处理不确定性知识的理论和工具。它非常适用于不完整、含噪声、不确定知识的表达、学习、归纳。它的有效性已在许多科学与工程领域的成功应用得到了证实。粗
非真实感绘制(Non-Photorealistic Rendering, NPR)是计算机图形学中的一个重要领域,其目标主要在于表现图形的艺术特质,模拟艺术作品。一般情况下,非真实感绘制涵盖了对目标