【摘 要】
:
传统单核架构下,“存储墙”问题已成为性能提升的瓶颈之一。异构多核系统芯片系统中,数据的存储、传输与交换需要更加高效的存储架构,导致存储与计算之间的矛盾更加突出。尤
论文部分内容阅读
传统单核架构下,“存储墙”问题已成为性能提升的瓶颈之一。异构多核系统芯片系统中,数据的存储、传输与交换需要更加高效的存储架构,导致存储与计算之间的矛盾更加突出。尤其在高密度计算类应用中,转置类运算占据较大比重,如何设计高效的转置运算单元对SoC整体性能有重要作用。 本文在基于二维网格NoC的多核SoC环境下,设计基于DDR2/DDR3存储器的接口电路及转置电路,研究实现高效的大矩阵转置方法。 论文的主要工作如下: 1.设计实现基于包-电路连接协议的SDRAM接口电路。整体结构由输入信号处理模块、输出信号处理模块、异步FIFO调用及DDR2/DDR3 SDRAM控制器组成,其中输入与输出信号处理模块实现网络包与存储器时序的匹配,异步FIFO实现跨时钟域的传输,DDR2/DDR3 SDRAM控制器将时序信号转换成存储器可以识别的信号,并发送到存储器。 2.设计一种基于分块式转置算法的的转置簇。针对现有矩阵转置算法中效率较低的问题,设计基于分块式转置算法,并用Verilog RTL实现转置簇。转置簇通过控制外部存储器地址,读写存储空间每个分块内的数据,可以实现行写行读操作,且突发传输的所有数据均可以作为有效数据。分析结果得出基于DDR2 SDRAM存储器的分块式算法效率相比分块映射算法效率提高36.5%。 3.提出一种补齐式准原地转置算法。针对现有分块转置算法中的存储空间利用低的问题,利用方阵对角线对称位置小块数据互换的思想实现大规模矩阵的原地转置,提出一种补齐式准原地转置算法,提升存储资源利用率:以短边为基准将矩阵补齐以便划分成数个方阵,再对每个方阵划分小方阵。利用分块读写的思想每次转置一对小方阵,实现行写行读,既提高存储器读写效率,又可以提高存储空间利用率,实验结果表明,相比非原地转置算法,存储空间最大降低49.5%,且对行列相差悬殊的矩阵具有良好的转置效率。
其他文献
船舶推进器与汽轮机、航空发动机等装置都是通过叶轮叶片来工作的,叶片形状由复杂空间曲面所构成,其加工成形精度直接影响整个动力装置的性能效率.高精、高效是数控技术研究
Through a cloud-resolving simulation of the rapid intensification (RI) of Typhoon Meranti (2016),the convections,warm core,and heating budget are investigated d
电力系统最优潮流(Optimal Power Flow,OPF)问题起源于经典经济调度理论,被定义为“在考虑多种约束条件下确定电力系统控制变量最优设置的问题”。 根据实际调控手段,由于有载调压变压器分接头的存在和补偿电容/电抗器成组投切的离散特性,使得严格最优潮流问题成为一个离散变量和连续变量共存的混合整数非线性规划(Mixed-Integer NonLinear Programming,M
目的:探讨雷火灸配合耳穴压豆干预老年心脾两虚型失眠患者的效果.方法:将120例老年心脾两虚型失眠患者随机分为观察组与对照组,每组各60例.观察组基于子午流注理论给予雷火灸
本文以运行于铁路配电所的JY200变电站综合自动化系统的研发为工程背景,提出了在该系统中采用实时操作系统(RTOS)的分析和设计方法。RTOS是一段在嵌入式系统启动后首先执行的背景程序,用户的应用程序就是运行于RTOS之上的各个任务。RTOS根据各个任务的要求,进行资源管理、消息管理、任务管理、异常处理等工作,从而合理地调度多任务,充分地利用系统资源,保证实时性的要求,因此,在应用系统中采用RTO
针对目前《中药化学》实验课设置中的问题,提出基于“三级训练”的《中药化学》实验教学改革这一思路.三级训练包括一级“基础实验技能训练”、二级“验证性实验”、三级“综
狂证与热秘关系密切,火热之邪侵袭为狂证与热秘的共同病因,故均以清热泻火为主要治法.从热秘的认识方面入手,阐明了热秘是狂证发生的重要原因,狂证会加重热秘程度.并从肠-脑
风邪是心悸的重要发病因素,心悸突发突止、心中悸动不安的发病特点与风邪“善行数变”“风胜则动”的特性类似.风药是临床应用广泛的一类药物,具有“升”“散”“透”“窜”
目的:研究中医临床护理“障碍性”路径教学法在肾内科实习带教中的应用效果.方法:将60名护生随机分为观察组和对照组,每组各30名.观察组采取中医临床护理“障碍性”路径教学
高压断路器在电网中起控制和保护作用,是电力系统中重要的电力设备之一.由于断路器的品种多、数量大,定期检修制度往往给正常运行带来事故隐患,而且一旦发生故障造成的损失巨