GPGPU多核流体系结构与功耗模拟研究

被引量 : 0次 | 上传用户:wdtt5200
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着微处理器技术的不断进步,单芯片多核处理器已成为微处理器发展的主流。其中,多核流处理器不但展现出巨大的计算性能潜力,而且在面积利用率、平均功耗和可编程灵活性上也有着显著的优势。GPGPU作为简单多核流处理器的典型代表,对数据密集型和高度并行性的计算进行加速能够获得显著的效果,在科学计算和工程领域有着广泛的应用。通过研究GPGPU的体系结构,可以探索体系结构的未来发展方向,为自主研制高性能的通用流处理器提供可借鉴的思路。模拟器是研究处理器体系结构的一种有效手段。GPGPU的简单多核流体系结构作为一种新型的体系结构,既有多核处理器结构特征,又有流体系结构特征,与传统的微处理器体系结构有着很大的不同,需要研究新的模拟技术和方法。为此,本文对目前在学术界广泛使用的NVIDIA公司的GPGPU进行了相关研究。本文通过研究GPGPU的发展和及其体系结构的典型特点,并结合GPGPU的编程模型CUDA和多线程流执行模式,详细探讨了GPGPU多核流体系结构模拟器的主要思想。本文充分利用了现有模拟器GPGPU-Sim的实现技术和方法,通过软件扩展和功能完善,结合功耗模拟器Wattch的应用接口和算法,建立起GPGPU的体系结构级功耗模型。实验表明,本模拟器能够可靠地对GPGPU的功能进行模拟验证。在性能上,分配到GPGPU上执行的线程数量越多,填入流处理核就越充分,GPGPU的加速特性体现得越明显。流处理核的数量是决定GPGPU性能的主要因素,此外,流水线的配置、DRAM调度方式和时钟频率等因素都会影响GPGPU性能。同时,不同存储层次和编程模型对GPGPU的性能也有很大影响,对于访问数据规整和执行流程唯一的应用程序而言,在没有数据Cache和最大化使用对齐访问机制下,有最好的执行性能,而面对更加通用的计算领域,则是使用数据Cache的体系结构更有优势。另一方面,GPGPU功耗在硬件上随流处理核增加,在应用中随线程增多而增加,不同的存储层次和编程优化方式都在一定程度上影响了系统的功耗。
其他文献
传统的相位差测量仪需要采用多片中小规模集成电路,不仅电路复杂,测量相位差的精度不高,而且使用的频率范围窄,因此在实际应用中存在着不足之处。利用AT89C51单片机实现相位
<正> 酒,是世界各国人民共同的宝贵财富。不少民族把酒当作“生命之水”;宗教信徒称酒为“神之血液”,推崇备至。酒自诞生以来,一直在世界的经济生活领域中占据着重要地位。
期刊
细菌的耐药性问题日益严峻,给临床治疗带来极大困难。研发新型抗耐药菌药物成为目前的研究热点。头孢菌素作为重要的抗生素药物,在筛选新抗生素困难重重的情况下,对其进行适
针对学生公寓存在的频繁更换门锁造成大量资金浪费,以及安全性差、维护量大、无法监控等问题,提出在学生公寓中以指纹门锁取代现有机械门锁的"换锁"方案,进而介绍了指纹门锁
一个真正依法执政、民主执政和科学执政的服务型政府,是不会惧怕网络和网络监督的。正好相反,执政党和政府可以借助于这种监督,来建立与社会之间的良性互动关系
随着品牌竞争深入与普遍,品牌维护中资金缺口问题与常规工具效力下降问题日益突出。本文结合整合营销理念提出应在品牌维护工作中引入整合机制,使企业内外原有的单项职能活动
<正> 随着知识经济在全球化过程中重要性的日益凸显,而推动知识经济发展的重要指标则是学习型创新体系的建构与完善,因此,学习型创新体系的发展对于区域经济发展、尤其是对以
在新疆多民族地区开展实习支教工作有特殊的意义,新疆独特的语言、文化、政治、经济、教育、自然条件决定了在新疆多民族地区开展实习支教工作与疆外地区有不同之处,文章就新
促进"十二五"区域协调发展的基本思路是"加快中西部、升级东部、强化东中西部的关联度"。具体来讲,就是加快中部崛起、促进东部产业和城市的高级化、加快三大经济圈内东中西
简要叙述了新能源汽车动力总成台架的系统结构及新能源常用设备的集成方法,并结合试验说明了该台架能进行道路负载的模拟并在NEDC工况下动态运行。