基于近端策略优化的阻变存储硬件加速器自动量化

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:qingquan528
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
卷积神经网络在诸多领域已经取得超出人类的成绩.但是,随着模型存储开销和计算复杂性的不断增加,限制处理单元和内存单元之间数据交换的“内存墙”问题阻碍了其在诸如边缘计算和物联网等资源受限环境中的部署.基于阻变存储的硬件加速器由于具有高集成度和低功耗等优势,被广泛应用于加速矩阵-向量乘运算,但是其不适合进行32b浮点数计算,因此需要量化来降低数据精度.手工为每一层确定量化位宽非常耗时,近期的研究针对现场可编程门阵列(field programmable gate array,FPGA)平台使用基于深度确定性策略梯度(deep deterministic policy gradient,DDPG)的强化学习来进行自动量化,但需要将连续动作转换为离散动作,并通过逐层递减量化位宽来满足资源约束条件.基于此,提出基于近端策略优化(proximal policy optimization,PPO)算法的阻变存储硬件加速器自动量化,使用离散动作空间来避免动作空间转换步骤,设计新的奖励函数使PPO自动学习满足资源约束的最优量化策略,并给出软硬件设计改动以支持混合精度计算.实验结果表明:与粗粒度的量化相比,提出的方法可以减少20%~30%的硬件开销,而不引起模型准确度的过多损失.与其他自动量化相比,提出的方法搜索时间短,并且在相同的资源约束条件下可以进一步减少约4.2%的硬件开销.这为量化算法和硬件加速器的协同设计提供了参考.
其他文献
通过信息素养测试系统对民族地区乡村教师信息素养情况的调研,分析民族地区乡村教师信息素养的现状,提出构建民族地区师范生信息素养课程体系,介绍具体构建方法与过程,以有效提高民族地区师范生信息素养.
针对计算机专业课程思政存在的问题,提出依托基层教学组织提升教师队伍育人能力,以OBE理念重构融合课程思政的教学体系,以自编或引入的方法建设专业课程思政资源,通过搭建计算机专业课程思政微信小程序平台,拓展专业思政渠道,延展专业课程思政时空.结合数据结构课程的思政改革和实践,介绍专业课程思政的具体实践并说明成效.
针对当前软件人才培养中综合能力、人文素养等缺失的现状,提出基于工程教育专业认证标准,构建一个以学生为中心、以毕业要求为目标并融入思政教育的人才培养模式,探讨软件专业毕业要求与思政元素、课程教学和评价考核的映射及实施,介绍思政案例库的建设,并以面向对象的分析与设计课程为例阐述具体教学实施,通过效果说明该教学模式的有效性.
列举智控类课程中所蕴含的思政元素,介绍在智能控制与计算智能相关的专业课程教学中开展课程思政的具体方法和案例,深入分析其中存在的一些问题并给出应对措施.
随着新能源发电规模不断扩大,火力发电对电网稳定运行发挥的作用日益突出,因此提高火电机组安全运行水平,对电网多类型机组协调及稳定运行具有重要意义.以历史数据中相似特征数据段为基础展开的生产过程异常根源分析等技术受到广泛重视,其中提高相似特征数据段查找效率及准确性一直为研究重点.论文研究了相似趋势特征历史数据段查找问题,通过采用历史数据符号化表示转换技术,实现了数据段趋势信息和数幅值变化信息的融合,提高了相似特征数据段查找结果的效率和准确性.最后,论文通过数值仿真验证了所提方法的有效性.
电子病历实体识别是智慧医疗服务中一项重要的基础任务,当前医院诊疗过程中采用人工分析病历文本的方法,容易产生关键信息遗漏且效率低下.为此,提出一种结合BERT与条件随机场的实体识别模型,使用基于双向训练Transformer的BERT中文预训练模型,在手工标注的符合BIOES标准的语料库上微调模型参数,通过BERT模型学习字符序列的状态特征,并将得到的序列状态分数输入到条件随机场层,条件随机场层对序列状态转移做出约束优化.BERT模型具有巨大的参数量、强大的特征提取能力和实体的多维语义表征等优势,可有效提升
以数据库发展史为教学单元,提出以“明理、增信、崇德、力行”为思政教育主线的课程思政案例设计思路和案例框架,阐述信息技术支撑的多元交互教学方法,介绍具体教学实施过程,通过2021秋季学期数据库技术课堂学习测评数据及学习感受数据的汇总分析,说明课程思政案例教学效果.
为了在密码学课堂教学的同时融入课程思政教育,通过分析现有教学现状和存在问题,提出基于哲学思想、技术路线及加解密处理环境的教学导图,结合学科内容特点,分析和总结密码学教学内容中所蕴含的哲学和人文思想,探讨如何在教学中引入传统文化经典中的词句,力求课程和思政的有机统一.
为了更有效地评估学生的团队协作能力,以PBL学习模式为基础,提出构建一个集在线学习和能力评估为一体的平台,结合在线教学与数据挖掘手段,阐述该平台的特点和优势,以复旦大学某班级的教学实践为例,说明该平台的可行性和应用效果.
新兴的非易失性内存(non-volatile memory,NVM)具有字节寻址、持久性、大容量和低功耗等优点,然而,在NVM上进行并发编程往往比较困难,用户既要保证数据的崩溃一致性又要保证并发的正确性.为了降低用户开发难度,研究人员提出持久性事务内存方案,但是现有持久性事务内存普遍存在扩展性较差问题.测试发现限制扩展性的关键因素在于全局逻辑时钟和冗余NVM写操作.针对这2个方面,提出了线程逻辑时钟方法,通过允许每个线程拥有一个独立时钟,消除全局逻辑时钟中心化问题;提出了缓存行感知的双版本方法,为数据维护