面向AIoT芯片的实时OCR关键技术探究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:khsim
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
OCR的应用场景广,相关商业产品非常多,但是基于深度学习OCR模型在边缘设备中如何做到实时推理缺乏公开化的研究。基于深度学习的OCR模型通常由CNN和RNN/LSTM构成,模型计算量大、权重参数多,导致在边缘设备上推理OCR模型需要大量的计算资源才有可能达到性能要求。CPU和GPU这样的通用处理器无法同时满足处理速度和功耗要求,并且成本非常高。随着深度学习的普及,神经处理单元NPU在许多嵌入式和边缘设备中变得普遍,它具有高吞吐量和卓越的计算能力来处理神经网络所涉及的矩阵运算。在本研究中,利用压缩算法对OCR模型进行压缩,减小其网络冗余度和内存大小,然后将压缩后OCR模型部署在NPU上,并且根据OCR模型的网络结构进一步设计加速策略,满足OCR模型在AIoT芯片上的实时推理需求。具体工作如下:(1)本文提出了基于块的细粒度权重剪枝,解决了权重剪枝在边缘设备中带来的工作负载不均衡和剪枝率低的问题,并且采用动态渐进剪枝法,在模型训练过程中动态地更新修剪阈值,从而恢复原始模型的精度。(2)单个压缩算法的压缩效果有限,本文将剪枝和量化两种压缩算法相结合,采用基于KL散度模型量化方法,解决了硬件上浮点运算困难,以及参数分布不均衡产生极值对量化造成误差的问题。(3)根据OCR模型的网络结构进一步设计加速策略。针对神经网络加速器无法对LSTM层进行运算,提出了一种能量化部署LSTM层的方法,将LSTM转化成加速器能处理的常规层。由于在硬件上实现精确的非线性函数是相当困难的,所以使用分段多项式拟合和LUT查找表相结合的方式获取激活函数运算结果,提高模型在硬件设备上的推理速度。实验结果表明,通过剪枝-量化的压缩的方式可以将OCR模型的32位浮点型参数量化成8位,并且剪枝率达到78%。综合模型精度、模型大小和模型推理时间的比较,在模型精度下降不到3%,文字检测CTPN模型大小从67.6MB压缩为12.52MB,与在CPU和GPU上的实现相比,NPU在延迟上分别实现了36.35倍和7倍的加速;文字识别CRNN模型大小从15.87MB压缩为3.13MB,而与CPU和GPU相比,CRNN模型在NPU上延迟分别实现了28.87倍和6.1倍的加速。
其他文献
在组织幼儿科学区活动的时候,发现教育评价实践存在着"重结果、轻过程""重鉴别、轻改进""重终结评价、轻过程评价"等问题。活动结束后,教师组织幼儿进行分享的一些谈话缺乏深层次的互动与探讨,使得幼儿没有充分表达自己的观点,更谈不上观点之间的碰撞与交流。阐述在组织幼儿科学区活动时对每一个细节过程实施多元评价,最终促进幼儿多元发展。
采用自我控制量表、宿舍人际关系诊断量表和囤积行为量表,分析大学女生宿舍人际关系。结果显示,自我控制水平越低,大学女生宿舍人际关系困扰越多,囤积行为越严重。大学女生宿舍人际关系困扰越多,囤积行为越严重。低自我控制水平能预测高囤积行为,也能够预测较多的大学女生宿舍人际困扰。囤积行为在自我控制与大学女生宿舍人际关系之间起部分中介作用。因此,大学女生良好宿舍人际关系的建立要考虑到囤积行为产生的中介作用,避
传统意义上的纪录片被视为直接呈现现实、修辞和理性论证的电影类型,安诺斯·厄斯特高则在其纪录片中揭示情绪和自我的重要作用,把现实变成一种叙事与想象空间。透过厄斯特高的“心灵纪录片”,本文尝试讨论情感结构和叙事结构如何影响纪录片,以及观众的心灵与自我如何在纪录片的制作和接受发挥作用。
在我国明确提出“双碳”目标的背景下,文章从十大行业中选择100家上市公司,结合ESG报告研究碳会计信息披露现状及成因,并从碳会计信息提供者、使用者、监督机构角度提出合理化建议,以期提高碳会计信息披露的质量。
<正>乡村旅游是未来的发展方向同时也是近些年来基于乡村振兴化发展的趋势,乡村旅游的发展首先要基于乡村原有的文化以及地理特质,而这种地理特质是因地制宜化的设计与发展,将乡村的人文与其景观建筑等相互结合,形成乡村旅游建筑中的重要特色。这也是景观建筑对乡村发展的促进作用,让乡村体现其自身的文化属性并且充分表达出来。
期刊
采用了复合干法工艺制得了复合铝塑膜产品,避免了热法制备铝塑膜工艺中高温高压的制作条件。测试结果表明,制备复合铝塑膜有效地保持了铝箔的冲深性能和产品外观,常态剥离力达17.6 N/15mm,耐电解液剥离力14.2N/15mm,极限冲深为7.3mm,解决了铝塑膜的耐电解液问题,提高铝塑膜耐冲深性能,具有良好的实际应用价值。
盐胁迫是影响作物产量和质量的非生物胁迫之一,而江苏沿海滩涂面积位居全国沿海城市之首,盐碱地又是我国重要的土地资源,提高盐碱地的利用效率显得至关重要。为缓解盐胁迫对作物生产带来的威胁,我们可以通过种植耐盐品种、添加外源激素等措施来解决这一难题。紫花苜蓿是优质的多年生饲草作物,具有一定的耐盐性,但在高盐胁迫下的生长状况受抑制程度仍较为显著,盐碱地栽培技术较为缺乏。褪黑素是一种抗氧化剂,被称为“最强的内
<正>前言本标准由中华人民共和国农业部提出并归口。
会议
网格化分布式新安江模型(GXM)在洪水预报中发挥了重大作用,但在进行洪水过程模拟时,模型数据量与计算量巨大,GXM的计算时间随着模型预热期的增加呈指数增长,严重影响GXM的计算效率。因此,提出一种基于网格流向划分与动态优先级有向无环图(DAG)调度的GXM并行算法。首先对模型参数、模型构件、模型计算过程分析,从空间并行性的角度提出了基于网格流向划分的GXM并行算法,该算法实现了GXM的并行计算并提