面向大数据的异构并行处理技术研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:jinshuxian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,大数据在全球迅猛发展,引起了学术界、业界和各国政府的高度关注。大数据的发展带来了重大的发展机遇与技术挑战。一方面,通过有效地管理大数据并分析提取其价值,能够为行业提供高附加值的应用和服务,实现巨大的经济和社会价值。另一方面,大数据在带来发展机遇的同时也带了巨大的技术挑战。传统的计算技术在处理大数据时将面临诸多的技术困难。因此,需要设计并开发面向大数据处理的机器学习、数据挖掘算法,并研究提升大数据处理性能的技术和方法,高效的完成大数据的分析处理和价值发现。
  同时,当前国际上计算能力的发展异常迅速,超级计算机系统、异构并行处理系统、异构并行处理等技术蓬勃发展。如何高效的利用异构并行系统的异构计算资源进行大数据处理和分析也是亟需研究的问题。
  本文拟深入研究大规模异构计算环境下大数据计算系统架构,提出面向大数据的基于异构并行计算资源的大数据内存计算系统框架模型,深入研究提升该平台易用性的编程框架,以及提升该平台处理性能的异构资源调度技术、高效的通信方法等。同时为了提升大数据平台的应用范围,深入研究了基于大数据系统的、特别是融合异构计算资源的并行机器学习算法,研究提升大规模机器算法性能的计术和方法。一方面,异构并行计算资源,特别是超算资源强大的计算能力的充分利用将大大提升大数据处理的性能。另一方面,此系统架构的提出将有利于推动超算资源在大数据处理方面的应用。
  总体而言,本文的主要研究工作和贡献分为以下四个方面。
  1.提出了一个可使用GPU加速的内存计算框架GFlink。
  不断增长的主存容量和大数据的发展推动了内存大数据处理框架的发展管理和处理。但是,目前这些平台是基于CPU的系统。本文提出了GFlink,一个面向大数据的基于异构CPU/GPU集群的内存计算框架。我们提出的框架使原始的内存大数据处理平台Flink从CPU集群扩展到了异构CPU/GPU集群,大大提高了Flink的计算能力。此外,我们充分考虑了平台的可编程性和易用性,采用了一系列手段来提升系统的性能,如高效的JVM-GPU通信策略、三阶段流水线执行的策略、GPU缓存方案和自适应的位置感知调度方案。大量实验结果表明,GFlink能够有效利用GPU的高计算能力,并且基于GFlink的应用程序性能明显优于基于Flink平台的性能。
  2.提出了一个面向大数据的异构并行内存计算系统FlinkCL。
  为了进一步提升系统的可编程性和易用性,我们提出了一个面向大数据的异构并行内存计算系统FlinkCL。我们提出的架构使用四种技术:异构分布式抽象模型(HDST),即时(Just-in-time,JIT)编译技术,分层局部规约(HierarchicalPartialReduction,HPR)和异构任务管理策略。程序员只需要用简单的接口编写Java代码,Java代码即可自动编译为OpenCL内核并在CPU和GPU上执行。这些处理对程序员来说是透明的。我们通过一组有代表性基准测试程序全面评估了FlinkCL。我们的研究结果表明,FlinkCL在保持可编程性和易用性的同时,大大提升了大数据处理的性能。
  3.提出了一个基于MapReduce模型的并行近似SS-ELM算法。
  因其良好的泛化性能和学习速度,极限学习机(ExtremeLearningMachine,ELM)算法近年来被广泛应用,特别是用于处理大规模数据。半监督极限学习机(Semi-supervisedExtremeLearningMachine,SS-ELM)算法将ELM算法扩展到半监督学习领域。但是,原来的SS-ELM算法需要在处理数据之前将数据存储在内存中,如果数据量很大,单机的串行的SS-ELM无法进行有效的处理。为了解决这个问题,本文首先提出了一种基于MapReduce模型的高效并行SS-ELM(ParallelSS-ELM,PSS-ELM)算法,并采用了一系列优化手段以提升其其性能。然后,提出了一种并行近似SS-ELM(ParallelApproximateSS-ELM,PASS-ELM)算法。PASS-ELM基于近似的相邻相似性矩阵算法,利用局部敏感哈希(LocalitySensitiveHashing,LSH)算法来计算近似相邻相似矩阵,从而大大降低了算法的时间复杂性。实验结果证明了所提出的PASS-ELM算法可以有效地处理大规模的数据集,而且不会显著影响结果的准确性。
  4.基于GFlink平台提出了一个并行层次化ELM算法。
  层次化极限学习机(HierarchicalExtremeLearningMachineELM,H-ELM)算法把ELM从单层隐藏层前馈网络扩展到了多隐藏层前馈网络,大大增强了ELM算法的应用范围。通常为了训练层次较深的多隐藏层前馈网络,需要比较大的训练集。因此,如何利用H-ELM来在处理大数据方面值得进一步探索。我们提出了一种基于Flink和GPU的并行层次化极限学习机算法(GPH-ELM)。采用了几种优化方法来提升其性能,如基于缓存的方案、合理的数据划分策略等。实验结果证明了我们提出的GPH-ELM算法可以有效的处理大规模数据集,且具有良好的加速比和可扩展性,可充分利用集群中CPU和GPU的计算能力。
  通过对上述面异构计算环境下大数据计算系统体系结构研究,以及异构计算环境下面向大规模数据集的并行机器学习算法方面的研究,本文取得了一系列研究工作成果。
其他文献
本文使用阳离子胶体金(CCG)标记中国仓鼠卵巢细胞(CHO-K1)的阴离子场,并采用双光子荧光显微成像和荧光寿命成像技术对其进行成像。金纳米微粒在飞秒激光的扫描照射下可以产生光热效应,这种纳米尺度的微效应在不影响细胞活性的前提下可以暂时提高阳离子胶体金标记细胞膜位点的通透性。基于这种效应,我们将10k道尔顿的荧光探针大分子(FITC-D)递送到CHO-K1细胞的内部。
计算机视觉领域中包含了各种各样的图像分析与处理技术,目标跟踪是它的一个重要组成部分。现有的目标跟踪算法中,存在着精度与速度的矛盾,往往精度高的算法速度较慢,而速度快的算法精度较低。对于不同场景下的要求,需要对速度与精度进行权衡。在超高速目标跟踪场景下,要求跟踪速度必须极快并且精度不能过低,因此研究一种计算速度极快并且精度尚可的目标跟踪算法具有重要的意义。  弹载应用场景对目标跟踪平台的体积和功耗有
介绍通信集成电路相关的硅基CMOS工艺、GaAs HBT与HEMT工艺、SiGe HBT与BiCMOS工艺,介绍东南大学射频与光电集成电路研究所利用多种工艺实现的光纤通信集成电路部分研究成果。
随着网络信息技术迅猛发展,人们尽管有越来越多获取信息的方式,还是抵不住信息过载问题的影响——越来越难以准确、快速地定位到所需要的信息。个性化推荐系统是缓解信息过载问题,满足用户个性化需求的重要手段。针对推荐系统中传统基于用户的协同过滤推荐算法的数据稀疏、冷启动问题,提出了SUBCF_CK算法。相较于传统算法,SUBCF_CK算法主要改进工作如下:为减轻用户-项目评分矩阵的稀疏问题对推荐效果的影响,
学位
基于视频流的图像拼接技术是提取一段视频中的若干关键帧,将关键帧重叠区域的图像进行特征点配准、边界缝合后生成一张完整的拼接图像,该技术在计算机图形学、视频监控、无人机航拍图像、遥感影像等领域展示了广阔的应用前景和价值。随着计算机技术和信息化的快速发展,图像拼接技术可以准确高效地将视频流中的关键信息以图像的方式展现出来,满足实时性的要求。铁路交通监控视频就是其中的典型代表,通过研究图像拼接技术,及时发
学位
随着科学技术的发展、网络化系统的兴起及各类移动设备的普及,人类社会迈向了大数据时代,知识发现和数据工程在广泛的社会活动中发挥着不可或缺的作用。然而,许多现实应用的领域,所学习的数据呈现类的不平衡分布,即一些类(少数类)的样本数目显著地少于其它一些类(大数类)。绝大部分的标准学习算法假设相等的错分代价,当面对复杂的不平衡数据时,它们不能为代表领域价值的少数类提供理想的预测精度。因此,不平衡数据的学习
学位
本文受启发于和企业的智慧医疗合作项目,围绕心脏病的发病特性和心脏病监控中的数据处理问题展开,伴随着云计算、边缘计算等新的计算模型的出现,重新思考现有心脏病监控方式的缺陷,依赖云计算模型提出了新的心脏病监控方式,并针对这一新型心脏病监控方式中的数据处理问题,重点关注了动态心电图的降噪问题以及动态心电图的心律失常检测问题,主要内容介绍如下:  (1)远程心电监控系统;首先综述了国内外关于远程心脏病监控
信息与通信技术领域的不断发展,推动了无人驾驶汽车领域的巨大的进步。无人驾驶汽车有效解决了用户对出行日益提高的安全、便捷、舒适和高效等个性化需求,有着巨大的商业前景和应用价值。无人驾驶技术相关的传感器数据处理,环境感知,深度学习,决策和控制,给无人驾驶汽车的计算能力带来了巨大的压力,因此它对硬件成本和能量的需求也进一步增加。无人车要想成为普通大众买得起的消费品,就必须要降低硬件成本。同时道路汽车功能
学位
在过去十年中,随着无线通信技术与传感技术的进一步发展,无线传感器网络(WirelessSensorNetwork,WSN)在世界各国学术界、工业界和商业界均备受关注,并取得了广泛的进步与应用。在无线传感器网络应用中,位置信息对传感器节点的监测活动至关重要,离开位置信息,感知数据往往是毫无意义的。例如环境监测、目标跟踪和地理路由协议实现等应用都要求节点提供自身准确的位置信息,由此可见,节点定位对无线
优化问题涉及工业、金融、经济、工程等多个领域。优化问题由三个主要的部分组成:目标函数F、变量x=x1,x2,...,xn以及约束条件集。基于这些准则,我们将文献中提出了许多优化问题进行了分类。例如考虑要优化的变量类型时,优化问题可以分为连续优化问题、离散优化问题,甚至可以是混合优化问题。根据约束条件的存在与否,优化问题可以分为只存在边界约束的无约束优化问题,也可以分为存在附加等式或不等式约束的约束
学位