面向iGPU的功耗模型研究与实现

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:lelouchX
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
异构体系结构的出现,推动了高性能计算领域的飞速发展,异构芯片已经成为高性能计算系统的主流选择。目前处理器的发展遇到了诸多瓶颈,单核已经无法满足需求,并且功耗墙也限制了单核的发展,多核技术的出现在一定程度上缓解了这些问题,但并没有得到真正解决。随着处理器功能越来越强大,片上资源越来越丰富,功耗问题正变得愈加严重,已经成为限制处理器发展的瓶颈因素,解决功耗问题成为当今处理器领域的研究热点。处理器的功耗大小在很大程度上是由其所在状态决定的,当处理器运行在较低的频率电压状态下,其功耗就会降低。根据这一现象,人们提出了动态频率电压调节(DVFS)技术,在满足应用性能需求的前提下,尽量将处理器调整到较低的频率电压状态下,从而降低处理器运行的功耗与能耗。进行DVFS所必须的参数是处理器的当前与其他状态下功耗大小,需要根据此参数与调整策略确定目标状态。本文针对异构处理器APU中集成GPU(iGPU)的功耗预测,提出了基于回归统计方法的功耗预测模型,并展开相关研究:第一,提出了一种基于回归统计方法的iGPU功耗预测模型。本文首先结合APU中iGPU的体系结构特点,分析了iGPU功耗的主要组成部分,包括计算类部件、本地内存以及全局内存的功耗。针对以上三种功耗,我们选择了尽量多的性能计数器以覆盖以上三类部件,使得功耗计算更加全面。随后我们提出了基于回归统计方法的功耗预测模型,运行Rodinia测试集中的OpenCL测试程序,利用CodeXL采集程序运行过程中的功耗信息以及性能计数器信息。由于功耗采样与kernel性能计数器采样周期不同,导致在建模时二者无法直接匹配。我们提出一种kernel扩展方法调整kernel的运行时间,使二者的时间尺度尽量一致。之后,将采集到的程序运行时信息作为输入,利用SPSS构建功耗模型。结果表明,iGPU功耗预测模型的预测误差仅为2.12%。同时,模型的相关系数以及调整后的测定系数均在0.95以上,表明模型中的自变量与因变量存在较为明显的线性关系,验证了模型的理论基础。第二,提出了两种精简的功耗预测模型以及具体的构建方法。APU进行DVFS对实时性较高,这就对预测模型的延迟控制提出了要求。同时,由于APU集成了CPU与GPU,片上资源空间十分有限,如果功耗模型中引入了过多的性能计数器会给APU的硬件设计与使用带来额外的负担。针对以上问题,我们提出了单精简模型与多精简模型。单精简模型主要是研究了性能计数器种类对预测模型精度的影响,结果表明计算类性能计数器在模型中最为重要,全局内存类性能计数器的重要性次之。多精简模型研究了性能计数器数量对模型的精度与稳定性的影响。结果表明,当预测模型中性能计数器大于等于12个时,模型的稳定性比较好,预测误差也在5%以内,具有很高的可用性。相比于初始模型,多精简模型计算量减少了20%,模型的延迟明显降低,进一步提升了模型的实时性。综上,本文围绕异构芯片APU中的功耗预测问题展开研究,提出了基于回归统计方法的功耗预测模型,该模型预测精度较高,具有一定可用性。为了满足实时性的需求,本文提出了多精简模型,在保证较高模型精度的前提下显著降低模型的开销与延迟。本文的工作具有一定的理论和应用价值。
其他文献
闪存固态盘由于高性能、低功耗、高并发以及相对成熟的工艺,目前被广泛使用在各种存储系统中,尤其是移动端和高端服务器中。但由于闪存介质特性,闪存固态盘具有有限次的擦除
大气气溶胶光学特性是大气科学的一项基础性研究,其对了解气候效应等具有无与伦比的意义。中亚地区作为全球典型的干旱区,每年作为沙/盐尘暴策源地向周边甚至跨海洋广大区域输送了大量沙尘粒子,获取中亚干旱区气溶胶光学特性长时间序列上的变化对评估“一带一路”沿线地区气溶胶对气候变化的影响意义重大。本文利用全球气溶胶自动观测网(AERONET)、太阳-天空辐射计观测网(SONET)和自设站点所获得的观测资料分析
目的:使用DSM-5第三部分人格替代模型,评估双相障碍抑郁发作患者的人格维度及人格特质,探讨人格维度及人格特质是否对双相障碍患者的治疗疗效存在影响。方法:以2018年6月至2019年9月期间在南京脑科医院住院治疗的51名双相障碍患者(首次HAMD得分大于15分,且YMRS得分小于5分)作为研究对象,使用DSM-5人格障碍替代模型评估被试的人格维度及人格特质,在治疗开始、治疗2周、3周及4周对研究对
在数据挖掘和机器学习中,特征选择是解决“维数灾难”的有效方法。特征选择结果的好坏与分类精度和模型的泛化性能有着较大的相关性。研究高效的特征选择算法对高维数据的聚
随着科技进步及社会发展,汽车普及引发的城市交通拥挤问题严重影响了社会的平衡,目前已成为现代社会进步的瓶颈之一,解决道路拥挤及交通安全问题已势在必行。智能交通系统(In
OFDM雷达信号是近年来新兴的一种宽带雷达信号,因其波形设计灵活、距离分辨率高、抗干扰能力强、频谱利用率高、易于实现数字化等优点,在雷达系统中具有广泛的应用前景。但是
近年来我国频繁发生雾霾天气,PM2.5中除一次粒子外,还有以铵盐为主要成分的二次粒子,城市地区大气中氨排放有相当部分比重来自机动车。除柴油车SCR系统产生的氨泄漏以外,轻型
研究背景炎症性肠病是消化系统常见慢性病,近年来发病率迅猛增加,在中国的发病率居亚洲之首。该病具有病程迁延、症状反复发作的临床特点,目前尚无根治方法,需要长期有效的慢病管理。既往研究多关注炎症性肠病患者的单个症状如腹痛、疲乏等,而在临床实践中患者常会出现相互伴随的多个症状,降低了患者生活质量,也给社会带来较重的经济负担,因此症状群的理念在炎症性肠病患者的症状管理中越来越受到关注。症状的评估对管理患者
火箭橇是一种沿地面固定轨道高速滑行,能模拟武器系统部件高速飞行、航天器发射与在轨动态飞行的一种地面试验设备。火箭橇在轨道上以超音速滑行过程中,滑车与轨道耦合作用属
作为5G新波形技术的重要候选方案之一,滤波器组多载波(Filter Bank Multicarrier,FBMC)技术受到了广泛的关注。相比正交频分复用技术(Orthogonal Frequency Division Multipl