面向IoT应用的低功耗自适应循环缓存的设计

来源 :东南大学 | 被引量 : 0次 | 上传用户:hy1330
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电池供电的物联网设备对内部微控制器(Microcontroller,MCU)的功耗有较高需求,缓存(Cache)可以有效降低CPU对主存储器的访问次数从而提高性能降低功耗。物联网设备执行程序具有单一且多为循环代码的特点,循环缓存(Loop Cache)采用较小存储容量缓存频繁执行的循环代码从而减少CPU对主存的访问,有效降低MCU功耗的同时提高CPU性能。然而,已有的Loop Cache结构仅能将循环代码中的有限分支或顺序执行的指令进行缓存,在面对包含大范围指令跳转的子函数调用循环代码指令时,缓存中的指令不命中就需要从主存中重新加载,严重影响MCU系统功耗。因此,如何通过Loop Cache的结构和电路设计降低MCU系统功耗成为亟待解决的关键问题。本文研究Loop Cache结构和存储体电路的设计,提高缓存命中率,降低缓存读写功耗。基于嵌入式微处理器基准联盟(EEMBC)的Core Mark基准程序分析,本文提出了一种支持子函数调用的循环缓存ASFLC(Adaptive Sub-function Loop Cache)结构。针对基准程序中子函数调用导致缓存失效的问题,通过识别循环代码中子函数跳转的特征指令,支持缓存多个子函数嵌套调用,大大提高程序访存命中率。同时,为了解决低功耗Loop Cache在低电压下由于驱动能力弱而导致的读写稳定性降低问题,通过对写操作增加解耦合装置以及将读位线与锁存器隔离的方法,提高存储单元在低电压下的读写稳定性,设计了一种适用于ASFLC设计的解耦合低功耗存储单元DLP14T(Decoupling Low Power Bit Cell)电路,进一步降低ASFLC工作时的动态功耗。本文基于SMIC40nm低电压工艺设计ASFLC结构和存储单元,Core Mark测试基准仿真的命中率达到62.38%,与传统动态循环缓存(DLC)结构(40.03%)和自适应循环缓存(ALC)结构(41.01%)相比,命中率分别提高22.35%和21.37%。后仿真结果显示,低电压高稳定的解耦合存储单元可在0.55V~0.75V进行稳定的读写操作,最低功耗是在0.55V电压,工作频率为24MHz时,读功耗为215.5n W。整个ASFLC的面积为1455.3μm2,约占整个MCU面积3.7%。比较ASFLC寄存器容量为5X256Byte,DLC和ALC为1280Byte时,在24MHz主频的条件下运行Core Mark,MCU系统中的CPU功耗,本文提出的ASFLC结构与DLC和ALC结构相比分别降低13.70%和13.25%。
其他文献
研究背景:随着纳米技术不断发展,纳米材料的应用也逐渐增加。纳米ZnO颗粒具有特殊的物理化学特性,因此在食品和化妆品等领域均有应用。纳米ZnO颗粒进入机体后,能够通过血脑屏障,并进入大脑,因此纳米颗粒的暴露,可能导致神经系统炎症,甚至引起神经退行性疾病。炎症小体被认为与多种炎症性疾病有关,其中包括神经退行性疾病。现阶段纳米ZnO颗粒引起炎症小体激活的相关研究相对较少。因此,探索纳米ZnO颗粒对炎症小
在工程实践中,高速公路的改扩建工程通常采用不中断交通流的建设方式,这种施工方式会对施工区的交通安全和交通流运行带来影响。传统限速控制方法对于施工区交通流难以实现前置的自适应变化,无法提前阻止拥堵产生,具有一定滞后性,影响了施工区道路的实际通行效率。为此,本文提出了一种基于强化学习的可变限速控制方法以消除或缓解施工区交通拥堵问题。基于高速公路施工区的定义、布局及施工形式,研究高速公路施工区的车辆运行
随着半导体产业的持续发展,尤其在低电压场景下,工艺波动对集成电路的影响愈加严重,特别是由数以千万计的重复性单元构成的SRAM电路。为保证其良率要求,SRAM单元必须具有极低的失效率(1×10-6~1×10-8)。针对上述小概率事件,传统的统计方法面临着仿真次数过多的问题,而一些先进的基于重要性采样的方法,如HDIS(High Dimensional Importance Sampling)算法和A
膨胀显微镜是一项基于聚电解质水凝胶均匀放大生物样本的超分辨成像技术,解决了其他超分辨成像技术中仪器昂贵、操作复杂、样本局限的问题。膨胀显微镜可直接与常规光学显微镜集成,且具有使样本透明化、可与多重免疫荧光染色兼容的优势。然而,膨胀显微镜的成像保真度仍然面临质疑。一方面,样本预处理过程中水凝胶材料的均匀膨胀无法得到保障;另一方面,图像处理过程中采用的图像配准法存在主观性强、操作难度大、分析时间长的问
背景颈椎病作为成人最常见的颈脊髓神经功能损伤的病因,根据已有报导得知黄韧带肥厚作为颈椎病的主要病因之一,严重影响着广大中老年人群的日常生活质量。目前关于黄韧带肥厚研究的主流观点认为黄韧带组织退变及局部节段的异常活动双重因素导致黄韧带肥厚的发生,然而在对其具体的相关危险因素的讨论中存在一定争议。基于目前黄韧带肥厚相关危险因素中存在的争议以及黄韧带肥厚相关因素研究绝大部分存在于腰段黄韧带领域,而颈段黄
城市交通拥堵日益严重,现行交通管理模式主要通过交通分配及交通信号控制缓解交通拥堵。其中,交通分配通过城市交通路网管理影响出行者的路径选择,实现路网交通流在空间上的分离;而交通信号控制通过直接配置路网中的交通信号机,调整其信号配时参数,实现交通需求在时间上的分离,区域交通信号控制主要通过协调交通路网的信号系统提升路网的畅通性能。因此,区域交通信号控制可以和交通分配的过程相互作用、相互制约,形成协调交
不良天气条件对公路交通安全有着直接的影响,尤其是雨雪天气等导致路面积雪、冰、湿滑是交通事故的主要原因,而对于广阔的交通线路,复杂的道路状况,目前的公路气象监测方法要么效率低下浪费资源,要么成本高昂不便于大面积推广应用。本论文基于图像识别算法设计了一种能够实时获取路面气象状态信息并分类路面状况的方法。本文设计了两种基于图像识别的路面气象状态分类算法,同时编写了路面气象状态监测软件。实现了远程控制监测
龙芯2K1000B是拥有自主知识产权的64位双核高性能嵌入式处理器,成功应用于多款智能终端产品和工业手持设备中。移动智能终端产品体积重量有限,电池容量有限,系统级功耗优化一直是终端产品设计的重要研究内容。为了降低2K1000B移动智能终端的系统功耗,论文选取该设备的主要工作场景,即视频硬件解码和待机场景,设计和实现了系统级功耗管理方法。首先,为了评估和分析系统级低功耗策略的运行效果,论文设计并实现
目前信息资源构成中仍然存在大量的文档资料,随着信息技术的不断发展,如何借助计算机技术对文档资料进行数字化处理、存储和管理已是必然趋势。在日常生活中,表格是一种很普遍的文档存储形式,在实际应用中很多领域如银行、邮局、公检法机构等,都会产生大量的表格数据,需要消耗大量人力资源将表格数据录入到数据库系统中。如何利用OCR(光学字符识别)技术对表格数据进行识别和处理已经成为办公自动化过程中必不可少的一部分
随着现代通信技术、计算机技术以及集成电路制造技术的快速发展,以5G、物联网为首的新技术的出现,对信息处理的速度有了更高的要求。数模转换器(Digital-analog converter,DAC)作为实现数字量转变为模拟量的重要器件,其性能已经成为制约通信系统传递信息的速度的瓶颈之一,因此高速DAC的研究与设计具有十分重要的意义。本文首先分析了电阻型架构、电容型架构以及电流型架构DAC的特点,选择