影响CUDA程序功耗的主要因素研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:pxh504705648
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于GPU自身有大量的运算单元,其在众多领域都得到了广泛的应用。然而GPU带来高性能的同时功耗也明显高于CPU。功耗带来了芯片的可靠性下降,系统的稳定性下降和计算成本的增加等问题是不容忽视的。本文以CUDA编程模型、CUDA软件体系及其存储器模型为研究基础。首先通过分析得出影响CUDA程序功耗的因素为线程组织结构、线程块数量和CUDA程序的变量存储位置(全局存储器和共享存储器)这三个方面。然后以CUDA SDK中的向量加法和矩阵乘法为例在功耗评估平台GPUWattch上对CUDA程序实例进行软件模拟,最后对实验结果进行分析。实验表明:线程组织结构、线程块数量和CUDA程序的变量存储位置对CUDA程序功耗是有影响的。线程块数量与功耗的关系是开始是随着线程块数量的增加而减少,然后到达某一最小值后,又随着线程块数量的增加而增加;CUDA程序的变量存储于共享存储器和全局存储器下的功耗得出合理利用共享存储器,可以降低CUDA程序功耗。
其他文献
模糊C均值算法(FCM)是当前比较流行且应用广泛的一种模糊聚类算法,已经成功应用于模式识别、图像处理等诸多领域。但是,它存在着需要聚类数目先验知识、对初始值敏感和易陷入
随着计算机技术的不断深入发展,信息和数据处理能力的不断提高,多层次的复杂分布式结构越来越多的出现在大型信息/数据系统当中。相比于传统集中式系统的单一结构,多级分布式
文本蕴涵识别在自然语言处理的各种应用中具有重要作用,是当前的研究热点问题之一。本文针对中文文本蕴涵关系自动分类问题,提出了以下三种方法:1.基于特征融合的中文文本蕴
科学工作流作为一种新的应用泛型具有众多优点,例如可提高科学实验过程的自动化,在很大程度上能节约人员和资源的的消耗。科学工作流的任务一般具有数据量大、计算复杂的特点
中药提取是中药制药的工序之一,中药提取的目的是提取药材中药效成分,避免药效成分的流失和无效成分的溶出。由于中药提取是在封闭的容器内进行,中药界大都通过经验判断提取
随着音乐喷泉在实际应用中的需求不断提升,而现有音乐喷泉产品仍处于曲目单一、固定的状态,不能灵活根据实际需求来改变喷泉的形式。要改变现状,必须借助计算机来对音乐信号
在无线信道多媒体通信系统中,信号在多媒体信道中的传输编码效率与码流抗误码性能是无线信道数据传输过程中的主要矛盾。在信源编码中,减少编码冗余会提升编码的效率但相应的
随着互联网的广泛应用,人们的生产和生活越来越离不开计算机。但是,人们在享受到信息技术飞速发展带来的便利的同时,也遭受到了网络安全事件的困惑。为此,计算机安全专家和学
P2P(Peer to Peer)技术在Internet中占有举足轻重的地位,近年来迅速成为计算机网络界关注的焦点;但是P2P技术发展的同时带来了网络带宽的大量占用、知识产权纠纷、安全威胁等
针对农村生活污水监管处理设施数量多又分散、污水处理量难以实时统计、设施管理难、资金投入大、处理效率低等问题。以物联网和云计算技术为基础,研究了污水流量计和物联网智能网关的通讯技术和硬件设计技术,研究了基于物联网技术的监管数据平台,最后将系统在桐庐农村生活污水项目中应用,取得了较好的效果。物联网智能网关硬件核心平台选用基于Arm9内核的S3C2440芯片组,固件平台采用Linux操作系统,物联网智能
学位