【摘 要】
:
传统虚拟机调度算法未充分考虑并行任务的执行效率问题,当多个虚拟机联合执行并行计算任务时,虚拟机管理器仍采用时分复用方式分配物理CPU(PCPU),导致并行任务串行化,效率大大降低.现代多核处理器平台具备多个可用的计算核心,满足多个虚拟机并发执行的需要,本文针对多核平台下的并行虚拟机调度问题,提出了一种基于任务特征的虚拟机调度算法CON-Credit.该算法的核心思想是在调度并行任务(如MapRed
【机 构】
:
School of Information Science and Engineering,Hunan University,Changsha 410082,China
论文部分内容阅读
传统虚拟机调度算法未充分考虑并行任务的执行效率问题,当多个虚拟机联合执行并行计算任务时,虚拟机管理器仍采用时分复用方式分配物理CPU(PCPU),导致并行任务串行化,效率大大降低.现代多核处理器平台具备多个可用的计算核心,满足多个虚拟机并发执行的需要,本文针对多核平台下的并行虚拟机调度问题,提出了一种基于任务特征的虚拟机调度算法CON-Credit.该算法的核心思想是在调度并行任务(如MapReduce调度模型)时,实现虚拟CPU(VCPU)与PCPU之间的直接映射,使得执行并行任务的虚拟机可以充分利用底层的硬件资源,实现真正意义上的并行执行.基于这种思想,CON-Credit算法将处理器核按动态方式分别分配给执行普通任务的虚拟机和执行并行任务的虚拟机,前者仍使用传统的虚拟机调度算法,而后者则采用定制的同步算法.相关实验显示,CON-Credit调度算法有效的提升了并行任务的执行效率,虚拟机系统的整体性能得到优化.
其他文献
图数据划分方案的优劣是提升并行算法计算效率的重要因素。本文面向GPU程序,定义了一套性能参数和图数据显示参数,为CUDA程序员开发了可视化交互平台,用于交互式调整参数,探究程序性能与数据划分方案之问的关系。该工具针对GPU异构体系结构下的CUDA程序对数据凝聚性读写的特殊要求,对数据以块为单位着色和标号显示,帮助程序员通过观测图的整体布局,调整数据划分控制参数,优化分块效果。在系统实现方面,采用J
计算机体系结构设计同时具有艺术性和工程性。片上多核处理器为新型计算机体系结构的设计提供了机遇为了使构思有线索可循,本文给出了基于多核处理器的计算机体系结构构思的对立统一模型,它是体系结构设计思想和方法的模型,而不是一种关于某种具体结构的设计结果。其中从对立统一的观点探讨了多核处理器对计算机体系结构的影响,应用、工艺和体系结构之间,多核CPU、FPGA、GPU之间,多发射、流水线、Cache、乱序执
数据挖掘并行算法,应该以不牺牲挖掘效率和挖掘质量为前提。通过对数据挖掘原理和并行化的深入研究,在考虑到挖掘效率,负载平衡,运行环境,节点状态等多方面因素的基础上,提出了一种新的基于动态调度的数据挖掘并行算法,该算法以规模较小的子数据集为并行挖掘单元,各个并行单元之间采用全局通讯模式—Master-Worker模式来进行互相通信,降低了并行挖掘的通信成本,提高了挖掘的效率,缩短了挖掘的时间,同时该算
通过将Orthodir(m)算法两个向量内积改成几个连续内积,改变算法数据相关性,提出了改进的Orthodir(m)算法(IOrthodir(m)算法)。改进的算法具有与原算法相同的收敛性。理论分析当处理器数目达到一定数量时IOrthodir(m)算法计算速度快于原算法,扩展性方面也要优于Orthodir(m)算法。同时实验表明IOrthodir(m)算法优于Orthodir(m)算法。
学科研究热点对科研工作者具有重要的指导作用。常规的学科研究热点检测方法面临检测成本高、检测信息相对滞后等问题。为此本文提出一种基于学术会议征文的学科研究热点检测方法,并借助CNKI学术趋势对其进行评估。实验结果表明该方法是有效可行的。
开发了一个高效率和易扩展的基于GPU(图形处理单元,Graphic Processing Unit)的并行分子动力学模拟程序.程序能够在GPU 上处理固相共价晶体中原子间的多体相互作用.通过测试,开发的代码在Mole-8.5 和天河-1A 上都取得了良好的并行效率和优秀的浮点操作性能.可以预计,晶体硅的大规模分子动力学模拟在计算其宏观性质、表界面现象和反应沉积方面具有巨大的应用潜力.
借鉴无损压缩编码中的GAP和GED预测器模板,改进该模版并应用在图像边缘检测中,提出一种新颖的基于多方向梯度边缘预测器(MGEDP)模板的动态阈值控制的边缘检测算法。以图像中心划分四个区域,采用并行技术同时多个方向应用MGEDP预测器模板,分别预测错误值;利用错误反馈信息构建预测误差图像;然后利用大津算法(OTSU)计算阈值;分类误差图像边缘;细化边缘,最后合成边缘图像。实验证明,该算法应用并行技
本文提出一种并行编程语言CC$,尝试解决分布式众核并行计算机的编程困难.CC$的编程模型以Multi-BSP模型为基础,将分布式众核并行计算机的硬件架构抽象为三层.数据按照存储的层次和共享范围分为五类,以便在不同层次上提供共享.CC$还提出一类虚拟指令解决不同层次之间的数据交换,实现数据访问的逻辑化描述.并行程序按照三层Multi-BSP超步嵌套执行.测试表明,CC$程序的运行效率高,易学易用,大
多尺度现象及相关理论方法是复杂物质系统研究中重要的科学问题。传统的量子力学或分子动力学方法都难于处理多尺度体系中存在的现象。第一原理离散变分线性标度(DVM-DAC)算法是一种有效的大尺度体系计算方法。它采用分而治之的方案,获得了O(n)的计算复杂度。但由于计算规模及材料复杂性等因素,在实际研究中依然存在相当的计算瓶颈,难以满足大尺度物性研究的需要。发展了一种基于DVM-DAC的混合粒度并行算法并
分布式文件系统伴随着云计算的发展逐渐受到重视.parallel-NFS做为主流的分布式文件系统,吸引了大量国内外研究人员的兴趣.本文描述了parallel-NFS的系统框架和工作原理,提出了parallel-NFS不能满足动态增减存储节点问题,分析了产生问题的原因,进而提出了一种parallel-NFS存储节点动态伸缩的方案,该方案已经在国家超级计算天津中心的超级计算机集群系统中得到了验证.