一种支持海量存储系统的高性能通信协议

来源 :2014全国高性能计算学术年会 | 被引量 : 0次 | 上传用户:liyanfeiwoshi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一种支持海量存储系统的高性能通信协议.链路负载均衡机制,针对链路负载情况和权重进行评价并选择:链路容错机制,结合退避算法和P坚持算法实现基于超时机制的链路监测和恹复机制,与简单超时机制相比,至少提升10%性能:消息重传确认机制,采用滑动窗口机制缓存请求信息标识符和应答消息,仅处理对系统产生影响的写操作,避免读操作产生的大量数据对内存的消耗,相比较NFS的重复请求高速缓存而言,减少缓存信息造成的内存开销,保证了容错机制的高性能.
其他文献
近几年来的科技与应用的高速发展对高性能计算提出了强烈的需求和严峻的挑战,异构众核系统因其良好的性价比和高能效表现被越来越多广泛应用于高性能计算领域.Nvidia GPU和Intel Xeon Phi是常用的两款具备通用计算能力的众核处理器,不过传统的异构众核平台大多由CPU+GPU或者CPU+Xeon Phi的单一模式构成.蒙特卡罗方法是众多期权定价算法的核心,在本文中面向由CPU、Nvidia
高性能计算机的并行处理技术发展促进了并行可视化,互联网带宽的增长催生了远程可视化,使得基于高性能计算机可视化服务器的多用户远程可视化研究受到重视,应用需求日益迫切.本文根据建立基于高性能计算机的大规模高性能计算数据远程可视化系统任务要求,研究了高性能可视化服务器采用传输图像途径与客户端进行信息交互的关键技术,设计实现了基于WebSocket技术定义初始化、交互浏览、交互修改等多种协议,可有效支持远
指令缓存占了处理器较大比例的能耗,增加小容量L0指令缓存可降低取指能耗.本文提出了一种L0指令缓存技术:基于推断技术的0级指令缓存.使用命中推断和缺失推断技术减少了L0缓存tag比较.根据程序跳转次数和方式,给出了四种基于推断的L0指令缓存结构.以上结构较标准L0指令Cache设计相比不仅能减少比较时间,同时也能节省tag比较的能耗.实验结果表明,对于所选取的SPEC2006测试程序,较标准L1指
传统的协同过滤算法存在准确率较低以及计算延时性问题,本文提出一种基于标签与协同过滤的并行推荐算法:通过计算标签的TFIDF值,降低流行标签的权重,根据用户的历史行为预测用户对其他资源的偏好值,最后依据预测偏好值排序产生Top-N推荐结果.论文不仅在理论上对算法的计算效率与复杂性进行了分析,而且通过MapReduce实现了该算法,并在实验中与Mahout的协同过滤算法进行了对比分析,实验结果表明在该
本文对描述多相流流体运动的格子玻尔兹曼方法(LBM)进行了并行优化.根据LBM高度并行性的特点,采用消息传递并行机制实现了LBM并行程序,并通过多线程并行优化手段,实现了该程序的MPI+OpenMP混合并行.在LBM并行程序的基础上,针对程序的强可扩展性对总问题规模为400*400*400在多组进程上进行了测试,由两组测试结果可以看出程序的性能热点部分所得加速比接近理想加速比,体现了LBM程序良好
OpenFlow采用数据平面与控制平面分离的架构,由软件实现的OpenFlow控制器对网络进行集中控制.这种分离架构中由于交换机需要和控制器进行交互,因此必然产生一定的时间开销.本文实验表明数据流建立过程中的信息交互导致数据包传输延时至少增长2倍,严重降低网络性能.由此,量化分析OpenFlow网络中流建立开销具有重要意义.本文分析流建立开销产生的原因,并对导致数据包传输时延增长的影响因素进行量化
末级Cache对于多核处理器具有至关重要的作用,研究目的是对末级Cache的结构及使用策略进行优化,以提高多核处理器的性能.以8核处理器为研究对象,提出了一种基于内核分组的Cache结构,该结构将8个内核分为4组,将末级Cache资源分为固定私有Cache,动态私有Cache以及动态共享Cache,并给出了相应的结构布局与动态划分策略,以保证尽可能小的访问延迟以及尽可能大的Cache利用率.基于全
本文提出了一种基于信息内容保护的信息安全模型.该模型利用将汉字笔画抽象为有向图的方法,设计了汉字笔画图抽象的具体方案,实现了对汉字字形结构的动态描述:建立了动态汉字字形描述库,设计了汉字字形的生成算法,实现了汉字字形的Web存储和在客户端的特征字形的输出.为汉字信息的云端存储和云端数据安全性保护提供了一种解决方案.
BH树算法的并行实现和应用是N体问题的研究热点.本研究重点以MPI和OpenMP混合编程模型实现了BH树算法的并行,并采用正交递归二分法(ORB)实现进程间的负载均衡,并行后的代码在双路CPU上获得了20.6倍的性能提升.同时,将并行后的代码移植到CPU多核和MIC的异构平台上,利用CPU和MIC协同计算、cache优化等技术进行优化,优化后的异构平台上单节点性能相当于双路CPU的1.4倍,且具有
复杂网络的可视化是复杂网络研究中的重要手段.近年来也有很多学者致力于对布局算法的改进[1],但是大多数改进算法都是只针对布局效果或计算效率的其中一个方面.随着Web2.0时代和大数据时代的来临,作为研究对象的复杂网络的规模越来越大,这对复杂网络可视化布局算法的布局效果和运算速度都提出了新的挑战,因此,本文主要研究大尺度网络如何在有限的显示面积中快速合理的显示的问题,指出较大规模的网络数据,即使压缩