面向场景字符识别关键算法的多平台异构加速研究

来源 :电子科技大学 | 被引量 : 2次 | 上传用户：qqQQ106942397

【摘要】

：

随着智能手持设备的广泛普及与人工智能高速发展,图像和视频成为主要的媒体信息传递方式。图像和媒体信息中包含了大量的自然场景,其中的文字信息具有重要的应用价值。场景字

【作者】

：

贺江

【机构】

：

电子科技大学

【出处】

：

电子科技大学

【发表日期】

：

2017年01期

【关键词】

：

异构计算 HOG CNN 场景字符识别

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着智能手持设备的广泛普及与人工智能高速发展,图像和视频成为主要的媒体信息传递方式。图像和媒体信息中包含了大量的自然场景,其中的文字信息具有重要的应用价值。场景字符识别技术引起了学术界的广泛研究,在信息检索、智能交通、实时翻译、网页检索等方面有着广泛的应用。由于自然场景图像中的文字背景复杂、光照变化、多变字体等因素,使得其检测与识别算法更加困难。随着场景字符算法的复杂性和图像处理工程规模的增长,大量的数据处理将消耗过多时间和能量,急需更快和高能效的解决方案。本文针对场景字符识别中的文本定位和字符识别两个关键步骤中最常用的HOG算法和CNN算法。针对场景字符识别应用下HOG算法和CNN算法串行实现存在高时延的缺陷,根据不同的设备特性并行设计和优化了异构平台的加速方案。在CPU+FPGA和CPU+GPU这两种常用的异构加速平台上加以实现和对比。本文首先设计了HOG算法的两种加速方案。对多内核(multiple kernels)HOG加速方案进行数据访问优化。在此基础上,针对FPGA设备的特点进行循环展开和向量化优化,对GPU设备规约增加并行。对于单内核(single kernel)HOG加速方案同样进行数据访问优化,对FPGA设备和GPU设备采用不同的方法克服局部内存写冲突。从系统层面设计了HOG特征提取和SVM特征分类的主机和设备间流水方案。其次设计了CNN算法的加速方案。在设备端通过卷积内核和全连接内核对该算进行加速。卷积内核通过合并卷积、池化和激励多种运算来减少内核数目和访存开销。同时利用神经网络权值共享的特点将数据高速缓存到设备端的片上内存。在此基础上,针对FPGA设备的特点通过向量化和资源整合优化,对GPU设备通过访存聚合优化。全连接采用矩阵乘法的一维并行方式,通过设备端的循环展开进行优化。GPU设备还通过规约增加并行。经实验对比,单内核HOG加速方案在两种平台上均比多内核HOG加速方案性能更好。针对单内核HOG加速方案,GPU异构平台获得更高的加速比,其速度是FPGA的4.1倍;FPGA异构平台获得更高的能效比,其能效是GPU的1.9倍。针对CNN算法,GPU异构平台获得更高的加速比,其速度是FPGA的4.7倍;FPGA异构平台同样获得更高的能效比,其能效是GPU的1.6倍。

其他文献

移动社会网络文件分发服务研究与实现

移动社会网络是一种通过网络节点移动相遇采用“存储-携带-转发”方式并结合节点的社会属性和移动特性等实现信息在网络中传输的新型网络应用场景。随着无线通信技术的发展和

学位

移动社会网络文件分发文件块分布文件副本限定系统实现屏幕共享

基于稀疏阵列的二维波达方向估计

基于稀疏阵列的DOA估计由其在阵列孔径方面的优势和其在民用通信与军事应用中存在的潜在价值，近几年受到了广泛的关注和研究。本文首先对已有的基于稀疏阵列和常规满阵的DOA估

学位

二维波达方向估计稀疏均匀线阵递归网格划分互相关矩阵传播算子

基于小波的频谱检测技术研究

随着无线业务通信量的快速增长,频谱资源的日渐稀缺也显露出来。认知无线电技术是解决频谱资源紧张的有效途径,其核心思想非授权用户是通过发现频谱空穴,并尽量避免对授权用

学位

认知无线电技术小波频谱检测数字电视信号无线通信

基于SNMP技术的网络音频处理系统的设计

近年来，随着网络技术和音频技术的飞速发展，对音频处理的要求也越来越高，很多场合需要传输高质量的音频，比如剧场、大型会议、体育场等。这使得网络音频处理技术的优势更加突出，可

学位

SNMP技术以太网网络音频处理

压缩感知重构算法研究

压缩感知(CS)是近年来兴起的一种异于奈奎斯特采样的新型采样理论。在这个理论下，信号的采样能够突破奈奎斯特采样定理的限制，采样频率不再受信号频率的制约，而只与信号结构有关

学位

压缩感知重构算法匹配追踪量子粒子群斜投影线性调频信号

绿色节能通信网络中基站与用户的联合最优接入控制

随着移动网络的快速发展,移动蜂窝网络的能量消耗成本和碳的排放量剧烈增长,能量利用率已经成为了未来绿色节能蜂窝网络的设计准则。在一个典型的蜂窝网络中,基站消耗的能量

学位

绿色蜂窝网络基站节能联合最优控制结构式求解随机策略

基于PWNN和粒子滤波的室内定位跟踪系统设计与实现

基于Wi-Fi(Wireless Fidelity)的位置指纹定位技术优势很多,比如简单方便而且精度也十分理想。尤其是硬件方面Wi-Fi设备已经得到广泛应用,因此成为本文研究的出发点。本文依

学位

Wi-Fi室内定位指纹航迹推算PWNN粒子滤波

基于混沌调制的混沌激光通信系统实验研究

迄今广泛使用的RSA公众密钥加密体制面临着被破解的威胁,寻求一种更加保密的光纤通信方式显得十分迫切。混沌激光通信作为一种物理层硬件加密方式的保密激光通信技术,在过去

学位

混沌激光通信混沌调制开环混沌同步结构光纤信道波分复用

面向智能电网的海量终端接入技术研究

智能电网能提高能源效率、实现电力存储和远程控制、提高供电的安全性和可靠性等等,是未来电网的发展方向。智能电网下的通信模式是机器对机器(Machine to Machine,M2M)通信,由于LTE技术良好的通信性能,M2M通信中常采用LTE作为无线通信手段。但是直接将LTE应用于M2M环境还有很多问题需要解决,其中一个最重要的问题就是接入过载引起的冲突问题。由于M2M通信的一个突出的特点是具有海量

学位

智能电网M2MLTE接入过载冲突ACB

一种新型车轮传感器的研究

近年来我国铁路正在处于飞速发展的过程中。随着发展的增快,庞大的铁路运输能力需要有更高安全性的保障以及高效率调度的支撑才能稳步前进。目前国内的铁路计轴系统是以轨道

学位

电涡流传感器交流电桥计轴电路

面向场景字符识别关键算法的多平台异构加速研究

与本文相关的学术论文