论文部分内容阅读
随着神经网络的快速发展,深度学习算法在众多场景中实现了应用。同时,作为未来生活的新形态,物联网的使用率正迅速增长,在物联网设备中实现深度学习算法成为一种新的应用场景,具有重要的价值及意义。为了解决深度学习算法在物联网设备中应用所受到的计算资源、存储资源以及隐私性的约束,目前已提出了针对深度学习算法特性的加速器。人脸识别技术是深度学习领域发展最成熟、应用最广泛的技术之一。近年来人脸识别技术准确率不断提升,但较高的参数量给资源有限的物联网设备带来了巨大挑战。为了解决物联网设备中应用人脸识别技术的难点,本文提出了在专用加速器上快速且低功耗地实现人脸识别的技术方案,研究内容主要分为三个方面。1.设计轻量级人脸识别算法。本文针对人脸检测和特征识别分别选择了基于MTCNN的人脸检测算法和基于MobileNet的特征识别算法。同时本文对于模型进行了进一步压缩优化,实现硬件端的增速降耗。2.实现轻量级人脸识别算法在硬件中的映射。本文基于一款某实验室自主研发的面向物联网应用的通用加速器,设计了专用的编译器,实现轻量级人脸识别算法在该通用加速器上的映射。3.面向轻量级人脸识别算法的硬件实现与优化。考虑硬件通用性和片上面积等各方面对于算法实现的限制,本文首先对算法中特殊的算子从离线编译的角度进行拆分改动,然后在综合考虑硬件约束的前提下,对指令进行了拓展,从而完成算法的实现及优化。综上所述,本文探讨了面向物端专用人工智能加速器的实时人脸识别技术方案,该技术方案选择了轻量级人脸识别算法,并对算法进行了压缩优化,同时将算法映射在硬件上,并进一步改进和优化,从而快速且低功耗地实现人脸识别。该技术方案虽然主要面向本文中提及的专用人工智能加速器,但方案可根据算法及硬件的特点进行特殊场景的改进,对于其他深度学习算法和加速器架构具有良好的适应性。本文研究成果对于其他深度学习算法在加速器上的实现具有重要的参考价值,对于深度学习算法在物联网设备中的应用和推广具有重要意义。