面向交互式应用的嵌入式CPU性能分析与评估

来源 :东南大学 | 被引量 : 0次 | 上传用户:sea0972
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能手机与平板电脑等移动智能终端设备的迅猛发展,交互式应用逐渐替代传统计算密集型应用,成为决定用户体验的关键因素。交互式应用,如高清视频,高保真音频,高分辨率3D动画,动态网页渲染等,强调人机交互,重视用户体验,其行为特性与传统桌面机存在较大差异。对面向交互式应用的嵌入式CPU性能进行量化分析与评估,有助于掌握交互式应用的程序特性及其对处理器的需求,为设计高性能嵌入式处理器提供参考。  本文选用学界广泛使用的时钟周期精确Gem5仿真模型作为研究平台,其仿真数据具有真实可靠性。本文详细分析了乱序超标量处理器的流水线设计及其所使用的关键技术,通过在Gem5 ARMDetailed模型上运行具有代表性的交互式网页渲染测试集Bbench,分析基线流水线配置下交互式应用的程序特性;同时根据数学解析模型定量分析各类缺失事件引入的开销,并以此构建其CPI(每条指令占用时钟周期数)栈,以分析运行交互式应用时处理器的性能瓶颈。论文发现,交互式应用测试程序Bbench的动态指令流中,简单整型计算和存储操作占到了总指令的97%,而基线处理器设计中有限的功能单元数目会直接导致结构冒险,从而限制稳定状态下程序的CPI。此外,由于结构冒险与缺失事件的影响,Bbench的CPI高达2.46,其中由L1 D-Cache引入的缺失开销对CPI的贡献率达到25.74%。  本文还评估了物理寄存器堆、ROB(重排序缓冲区)以及功能单元等微结构的结构冲突事件对交互式应用性能的影响。通过对处理器微结构的探索与评估,本文发现物理寄存器堆和ROB资源不足会频繁引起Rename级阻塞,采用过饱和的处理器微架构设计可以显著提升交互式应用的性能。当内部物理寄存器的数目从96增加到256时,CPI从3.16下降为1.91。ROB窗口容量从10增加到120的过程中,CPI逐渐下降,最终稳定在2.27左右:随ROB窗口的增大,指令的发射效率成平方根增长,成为限制CPU性能进一步提升的主要因素。
其他文献
电磁量能器(Electro-Magnetic Calorimeter,简称EMC)是北京谱仪(BESIII)的一个重要组成部分,主要用于精确测量电子和光子的能量和位置信息。EMC前端电子学的性能是决定电磁量
本论文主要研究了VLSI中微米特征尺寸Al互连线在电热条件、互连线制备和随后的热循环过程中的应力分布;得出了互连线应力状态随电流密度、温度、钝化层材料、热循环过程等的变
随着信息技术的发展,管理信息系统已成为当今社会各个领域不可或缺的管理工具,它可以提供便捷、准确和全方位的服务,帮助管理人员对各类信息数据进行有机的系统管理。体育信息化
本文结合教育教学实践,在调查研究的基础上,对影响中职学生幸福感的因素进行了分析,并对中职学校的教育工作者如何让学生幸福成长进行了阐述。
目的:构建MCL1基因(myeloid cell leukemia-1)沉默表达载体,稳定转染含双微体(double minutes,DMs)的卵巢癌细胞系UACC-1598和不含双微体的卵巢癌细胞系SKOV3中,探讨MCL1基因在这
求解两个大素数的乘积在计算上非常容易,而要分解两个大素数的积求出它的因子则是世界上公认的数学难题。RSA算法正是一种基于大数因子分解的算法。RSA算法在数据加密和数字签
学位
本文在对超高频电子标签的相关理论和技术进行深入分析的基础上,根据ISO/IEC18000-6TypeA型协议,对工作在915MHz频段的电子标签的模拟前端电路进行了研究和设计。 首先对整
目的:研究遗传性因素对房颤的影响。利用β-受体激动剂可以诱导心肌损伤,使心肌细胞出现凋亡与坏死,但其作用机制一直不是很清楚。MiRNA作为心血管疾病潜在的诊断生物学标志和新
最近几年来,无线通信技术逐渐走向成熟,随之无线通信系统也被广范的应用在军事、民用等各个方面。射频电路是无线通信系统的前端装置,随着小型化设备需求增加,对射频电路的要求也