嵌入式Flash缓存预取加速技术研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:suna_lili82
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
嵌入式Flash由于成本、存储密度等优势日益成为微控制器中重要的程序、数据存储器。然而嵌入式Flash相对较慢的读取速度,制约着微控制器的整体性能,因而提升Flash中指令和数据的读取性能十分重要。当前研究主要采用缓存和预取技术对Flash进行读取加速,但是仍存在两个问题:1)缓存的行大小是固定的,不利于适配各种应用程序;2)当前预取技术主要是顺序预取,准确率相对较低。因此如何进一步优化缓存和预取技术对微控制器中嵌入式Flash的读取加速有重要的工程意义。本文首先针对缓存适配性低的问题,提出缓存行长自适应技术;在程序运行的过程中,硬件根据所观察到的程序局部性的变化对缓存的行大小进行动态重构,使缓存行长在运行时向更优的大小变化,以取得更好的加速效果。其次,针对缓存访问过程中存在功耗浪费和缺失代价高的问题,提出路命中预测技术,通过预比较和路预测结合的方式进行优化。再次,针对顺序预取准确率低的问题,提出跨步预取技术,对常数步长访问类别中未被缓冲的数据进行预取,而不受步长大小的影响,并且避免对不规则访问进行不必要的预取,节省功耗。再者,针对低频时读取Flash速度慢的问题,对Flash控制器的架构进行改进,实现了低频时对Flash的连续单周期读取。最后,设计并实现了一款嵌入式Flash控制器,并集成到SoC系统中,搭建了验证平台进行功能仿真和FPGA验证。实验结果表明,采用缓存行长自适应技术后,CPU运行Core Mark的性能提升高达103%;采用路命中预测技术后,CPU运行MD5的性能进一步提升了2%。采用跨步预取技术后,DMA读取Flash中数据的速度提升高达50%。控制器的面积仅增加8%,功耗降低了23%。
其他文献
随着移动互联网等超宽带通信业务的高速发展,后5G和6G时代的用户数据流量将呈现指数级的快速增长。为了解决容量升级的挑战,无线通信正在向更高的载波频率发展。太赫兹波(Terahertz,THz)是频率位于0.1 THz~10 THz之间的电磁波,具有带宽大、方向性好、穿透特性强等优点,是实现超高速无线通信的理想载体之一。目前,太赫兹无线通信系统的实现方案主要可分为光子学方案和电子学方案,而基于光子学
时间敏感网络既能满足工业通信低时延、低抖动、高可靠的数据传输需求,又完全兼容现有的以太网体系,是支撑工业互联网发展的重要通信平台。时间触发流是时间敏感网络中负责传输实时数据的关键流量,其传输严格遵循门控调度表,选择不同的传输路径会影响调度的成功率。随着工业互联网中智能设备类型和数量日益增长,时间触发流种类和数量也越来越多,这对时间敏感网络容纳时间触发流的能力提出了新的挑战。当前一般采用负载平衡路由
随着智能化社会的飞速发展,芯片作为智能设备的核心,复杂度和灵活性不断上升。为了缩短开发流程,提高迭代效率,同时保证芯片的功能正确性,芯片验证的速率与效率成为了重中之重。通用验证方法学(Universal Verification Methodology,UVM)作为目前被工业界应用最广泛的验证方法学,对于减少验证成本,缩短验证时间,保证验证效率具有很大的优势。本论文基于UVM验证方法学,分别为RI
习近平总书记高度重视和关心青年的成长,在重大场合多次提及青年问题,逐渐形成习近平青年观,为青年工作指明了方向。“新时代”赋予了习近平青年观更加鲜明的内涵,学习习近平青年观为青年自身发展和社会发展提供了有效的行动指南。
NOR型闪存具有读取速度快、与CMOS集成工艺兼容等优点而被广泛应用于各种领域,更多应用环境迫切需要更大容量更小尺寸的NOR型闪存,然而由于特征尺寸的不断缩小,浮栅器件逐渐濒临物理尺寸极限,这对存储器的工艺以及其可靠性都提出了更大的挑战。本文基于量产平台开展了55/50 nm ETOX NOR型闪存的可靠性和干扰特性研究及其工艺优化。针对NOR型闪存耐擦写特性的研究,通过TCAD模拟仿真和流片测试
异构多核处理器因其出色的计算性能和并行任务处理能力,被广泛地应用于智能手机、自动化机器人、可穿戴设备等移动嵌入式电子产品中。然而,受限于电池技术的缓慢发展,移动设备在性能提升的同时,还要满足一定的能耗限制。常用的DVFS技术虽然能降低能耗,但也带来了性能的降低。因此,需要通过合理的任务调度方法在DVFS的基础上进一步优化异构多核处理器的性能与能耗。针对此问题的研究主要集中于如何在一定的能耗约束下,
随着工业4.0时代的到来,嵌入式微控制器在工业自动化发展中发挥着越来越重要的作用。现代化应用场景对芯片性能的需求逐渐提高,相比单核处理器芯片,嵌入式多核So C能够带来几乎成倍的性能提升。同时,芯片也持续向小型化、轻量化和低功耗等特性发展,使得单个器件的敏感性增加,出错概率提高,给芯片的可靠性带来严峻的挑战。嵌入式多核So C如何在不同的计算或控制应用中充分发挥硬件资源优势是值得探究的问题。嵌入式
随着信息通信技术的快速迭代,未来的通信网络将会是感知、通信与计算协同融合的网络。在下一代通信技术中,通信网络将赋能万物互联,实现可感知、可辨识、可计算、可控制、可管理,满足各行各业的应用需求。本文聚焦于感知与通信融合进行研究,结合现有的一些技术,探索毫米波成像和多用户通信相关的技术,主要内容如下:首先,在智能反射面的辅助下,本文提出了一种基于像素块划分和块稀疏信号恢复的新型毫米波计算成像方案。首先
在部分并行或者全并行LDPC译码器架构中,随着稀疏校验矩阵维度的增加,计算和存储第二最小值已经成为制约译码器吞吐率和面积的关键因素。针对上述研究背景和问题,本文主要做了以下工作:1、本文提出一种自适应权重MS算法(awMS)。该算法不需要计算第二最小值,而是通过第一最小值计算得到。本文通过引入一个与校验节点输入有关的线性方程和一个随迭代次数变化的自适应系数来计算第二最小值,提高纠错性能,加快收敛速
人口老龄化为世界各国带来挑战的同时,也推动了环境辅助生活概念的产生与智慧养老事业的发展。建立基于环境和生物智能感知的室内日常生活监测系统可以将老年人的身体情况及时反馈给远程家属,从而实现辅助照护。为避免摄像头和可穿戴设备等传统感知方式造成的隐私暴露和身体侵入感,超宽带雷达不失为一种选择。本研究借助超宽带雷达实现室内人体目标检测与跟踪、动作识别、运动参数提取以及初步的日常活动能力评估,主要工作如下: