论文部分内容阅读
随着人工智能从概念到产业化的逐步落地,越来越多的产业开始与AI相互融合,迸发出新的活力。在嵌入式机器视觉前端设备中进行复杂的视觉处理及分析是一个必然的发展趋势,这就对嵌入式视觉系统的计算性能提出了更高的要求。将特定的图像处理算法设计为专用硬件加速器,集成在嵌入式片上系统中,完全通过硬件逻辑来实现所要求的功能,通过硬件并行性增加图像处理计算的并发性,能够极大地提高嵌入式机器视觉系统的数据吞吐量和图像处理和分析的能力。在基于低成本通用处理器的机器视觉系统中加入专用硬件加速器的方案不仅可以提高嵌入式视觉系统的视觉处理能力,同时可以保持系统的灵活性。因此,嵌入式机器视觉系统的硬件加速研究有着重要的意义。本文主要针对视觉识别应用需求,研究基于ARC HS嵌入式多核处理器平台的视觉识别算法硬件加速技术。主要工作及贡献如下:首先,本文研究了软硬件协同设计方法和ARC HSDK嵌入式开发平台以及用于快速验证硬件设计的HAPS-DX平台,提出了基于ARC HS处理器的人脸识别硬件加速系统的功能要求和总体框架,设计了基于多核ARC处理器平台的硬件加速方案,用以提升嵌入式前端对人脸检测与识别处理的性能。其次,研究了基于Haar特征的Adaboost人脸检测算法和Eigenface、Fisherface、LBPH三种人脸识别方法,使用Open CV开源视觉库在PC机上进行这些人脸检测算法的检测率和人脸识别算法的识别率的测试实验,并在ARC HSDK平台上进行了检测和识别速度的测试实验,发现人脸检测算法严重影响系统的实时性,提出对人脸检测算法进行硬件加速实现。然后,采用软硬件协同设计思想,针对Adaboost人脸检测算法进行硬件加速设计,针对人脸检测功能模块中关键的图像缩小模块和图像子窗口积分图计算模块以及Adaboost级联分类器模块的并行性结构进行了设计优化;同时对硬件加速模块进行了AXI4总线接口设计,满足了与嵌入式平台的高效通信的需要。利用AXI Tunnel接口,建立了嵌入式平台与硬件算法模块的总线通信接口,并对基于Linux系统的接口通信驱动程序进行了设计,满足了在软件层次访问硬件加速协处理器的需要。最后在基于FPGA的HAPS-DX硬件原型验证平台上进行了进行视觉识别系统软硬件协同验证,对人脸检测硬件加速器进行功能和性能测试实验,实验表明基于ARC HS处理器的人脸识别硬件加速系统可以完成预定的人脸检测和识别功能,并且以640*480分辨率的图像输入时,在不影响检测率的情况下,人脸检测硬件加速器的检测速度比软件实现性能提升达到11倍。