【摘 要】
:
传统基于规则的自动驾驶方案由于难以全面覆盖场景、保守的驾驶策略存在很大的局限性,随着人工智能和硬件算力的高速发展,基于深度强化学习的决策方案展现了更多的鲁棒性和灵活性。然而,庞大的计算量还是对边缘设备上的实现带来了巨大的挑战,利用神经网络的冗余性,量化部署能够以极小的精度牺牲带来计算、存储和访存上的优势。但不同的网络结构差异造成了网络之间、层与层甚至单层内部的权值和特征图的分布都可能大不相同,单一
论文部分内容阅读
传统基于规则的自动驾驶方案由于难以全面覆盖场景、保守的驾驶策略存在很大的局限性,随着人工智能和硬件算力的高速发展,基于深度强化学习的决策方案展现了更多的鲁棒性和灵活性。然而,庞大的计算量还是对边缘设备上的实现带来了巨大的挑战,利用神经网络的冗余性,量化部署能够以极小的精度牺牲带来计算、存储和访存上的优势。但不同的网络结构差异造成了网络之间、层与层甚至单层内部的权值和特征图的分布都可能大不相同,单一精度的加速器难以获得精度和资源的最优平衡。针对这些问题,设计了一种支持混合精度运算的深度强化学习自动驾驶决策算法的硬件加速器,主要工作内容如下:1.设计了一种计算位宽可配置的MAC单元,能够实现不同精度的运算,支持多精度的神经网络模型部署。2.通过引入存储块与计算块的可重构映射,优化不同网络结构下的共享数据流;在计算阵列内部和计算单元内部增加多级存储,提高复用数据流。3.为了解决单层网络内精度与计算位宽难以双赢的情况,提出了一种高位数据编码方式在单层网络内部实现混合精度运算,避免特征图分布不均情况下量化所带来的截断误差。4.为了增加加速器的灵活性,设计了专用指令集,参数化控制硬件的重构、计算信息,降低不同模型不同精度的网络的部署难度。5.在FPGA上完成加速器的硬件实现,以SLAC自动驾驶决策网络作为部署模型,使用CARLA自动驾驶仿真平台进行实验。所设计的加速器在SLAC自动驾驶决策网络上测试达到有效算力18.3GOPS,是CPU的10.7倍,GPU的3.3倍;能效比2.197GOPS/W,是CPU的104倍,GPU的28倍;对于层内混合精度特征图计算方法进行测试分析,实验表明可以通过较少的延迟成本有效降低量化所带来的误差。
其他文献
视觉同步定位与建图(Simultaneous Localization and Mapping,SLAM)系统对于智能移动机器人实现自主探索与导航具有重要意义。目前的视觉SLAM系统面临着传统方法的发展已经饱和难以继续提升。传统方法有着计算流程专用固定、鲁棒性差、不同场景适应能力差、硬件加速困难等问题。现在相关研究多集中在用基于卷积神经网络(Convolutional Neural Network
在各类ADC中,逐次逼近型模数转换器(SAR ADC)具有面积小、能效高的结构特点,且对先进CMOS工艺表现出了优于其它架构的适应性,受到广泛关注。以现代数字医疗成像为代表的数据采集系统对ADC的转换精度提出了更高要求,如何提高SAR ADC的转换精度并保持低功耗优势是该领域的研究热点。论文以16位1 MSPS高精度低功耗SAR ADC为研究对象,首先调研了高精度和低功耗SAR ADC的研究现状,
为了满足人们日益增加的生产和生活需求,各种无线通信系统和电子产品的功能越来越多,所需微波器件的种类和数量急剧上升,对微波器件的通用性和可扩展性提出了更高的要求。为了提高器件的通用性,一种有效的解决方案是采用微波器件重构技术。微波器件的重构包括性能重构和功能重构,其中功能重构的覆盖范围更广,但目前微波器件的研究主要集中在性能重构,功能重构方面的研究较少。本文研究功能重构平面微波无源器件,主要研究内容
具有无创、便携等优异特性的光电容积脉搏波描记技术(PPG)是下一代个性化移动医疗和可穿戴设备应用研究热点,而以可见光背景辐射为代表的扰动大大降低了PPG脉搏波的精度。为了获得稳定、准确的脉搏波信号,需要提升PPG光电探测器的抗干扰能力。传统的窄带近红外探测器依赖额外的滤光片或有机的光活性吸收层,这与器件小型化的发展趋势背道而驰。肖特基二极管以其简易的制备工艺和优异的整流特性,在光电探测领域具有广泛
恒虚警率(constant false alarm rate,CFAR)检测是雷达在干扰背景下检测目标的重要自适应算法。二维恒虚警算法随着参考窗口尺寸增大,运算量很大,仅靠软件实现并不能满足较高的实时性的需求。本文重点研究了基于FPGA的兼容多种检测算法的高速可配置二维恒虚警检测器的硬件加速设计,主要研究内容和取得成果包括:首先,探讨了经典的恒虚警算法,介绍均值类和有序统计恒虚警算法的理论基础和处
近距无线通信、电子对抗等领域的飞速发展,对模数转换器(ADC,Analog-to-Digital Converter)的功耗和速度提出更高要求。传统ADC多为电压域ADC,面积和功耗较大,为了降低功耗,从电压域转到相位域是一个有效的选择。本文在充分调研相位量化ADC原理基础上,研究实现基于电荷重分配结构的两步式Ph-ADC(phase domain ADC)。同时,由于相位域ADC本身的IQ偏移(
由于多光谱光电探测器对目标具有识别能力,因此在光通信、视觉监控、刑事侦查等领域有着重要的应用价值。随着光电探测系统的小型化,多光谱光电探测更趋向于在单个像素点上实现。与宽带光电探测器不同,大多数多光谱探测器需要在探测波长附近具有窄带响应。目前,虽然可以通过改变光敏材料的组分和厚度调整窄带探测的响应波长,但难以通过偏压对探测波长实时调整。本文介绍了一种具有窄带探测能力的波长可调多光谱硅(Si)光电探
紫外探测,尤其是深紫外探测,在民用和军事领域有着广泛的应用。目前市场所用的硅基和超宽禁带半导体材料的深紫外光电探测器有着成本昂贵、制备复杂等缺点,因而开发一种简单高效的深紫外探测成为这一研究领域的热点。本文通过化学气相沉积法可控制备高质量的GaSe纳米带,实验发现超薄GaSe纳米带可用于高灵敏度的深紫外光电探测。具体研究结果如下:1、利用Silvaco Technology Computer Ai
随着量子计算和云计算等技术的发展,传统密码方案面临巨大的安全风险,人们对数据安全和隐私保护越来越重视。同态加密方案在加密的同时兼顾计算,可以有效解决云计算安全问题。基于环错误学习(Ring Learning With Error,RLWE)问题的后量子密码具有抗量子攻击和结构简单等优点,使得RLWE同态加密方案成为密码学研究的热点。由于RLWE同态加密方案的计算量较大,资源使用较高,为了满足高资源
10族过渡金属硫属化物是一类新近发现的二维材料,包括Pt S2,Pt Se2,Pt Te2,Pd Se2,PdTe2等。这些材料具有高载流子迁移率、可调窄带隙和优异的环境稳定性,在实现高性能近红外和红外光探测方面具有潜在的应用前景。目前,该类材料通常采用分子束外延、微波辅助合成、湿化学以及机械剥离等方法制备,工艺复杂、成本较高,难以满足大规模应用的需求。此外,金属卤化物如Cs3Cu2I5等类钙钛矿