论文部分内容阅读
计算机视觉技术已经广泛应用于在工业控制、自主导航、环境监控、人机交互、信息处理等诸多领域。近些年来,计算机视觉领域的快速发展离不开深度卷积神经网络带来的革命性突破。无论是在学术界还是工业界,将卷积神经网络部署于嵌入式平台都是一个热门且非常具有挑战性的任务。然而卷积神经网络不仅需要大量的计算能力,也需要较高的内存读写能力,嵌入式平台与传统计算平台不同,其所能利用的资源更为受限。基于嵌入式平台的应用通常需要算法提供实时性的结果,一旦模型过大,其推理时间就会超过约束,成为整个系统的性能瓶颈。另一方面,不同的部署平台拥有着不同的计算特性,适用于一个平台的高效卷积神经网络在另一个平台下也许会运行得非常缓慢。为解决此问题,本文提出一种基于平台感知的全新结构搜索算法,用来寻找特定平台下的高效卷积神经网络结构。首先,本文介绍了神经网络的理论基础,讲述了人工神经网络与卷积神经网络的结构与理论部分,使读者对于计算机视觉任务与卷积神经网络有了基础概念。随后介绍了常用的构造轻量级卷积神经网络的设计思路与使用技术,并将适用于图像分类任务的轻量级网络设计推广到语义分割任务上。随后,本文重点介绍了提出的偏序关系剪枝算法,为了能够在近乎无限大小的搜索空间中有序搜索,本文首先提出了一种全新的结构化搜索空间的方法,并将构造的搜索空间进行编码,以提供给算法进行搜索。本文介绍了搜索策略的设计,并提出该搜索空间中的偏序假设并予以实验验证,依据偏序关系,便可得到偏序关系剪枝算法的详尽搜索步骤。同样地,可以构建语义分割任务解码器的搜索空间,并使用该算法搜索高效的解码器结构。最后,本文通过一系列实验对偏序关系剪枝算法的结果进行验证。在ImageNet数据集与NVIDIA TX2平台下,本文提出的DF系列模型取得了非常优异的性能与速度,在相似的推理时间下,DF系列模型超过了人类手工设计的轻量级网络与常用卷积神经网络的性能5%以上,在相类似的性能下,DF系列模型取得了超过38%的推理速度提升。在语义分割任务中,DF-Seg系列模型也获得了目前为止TX2平台上最好的性能与推理时间折中,超越了人类手工设计的轻量级语义分割模型。上述实验结果表明,本文提出的算法可以有效地在特定平台与规定时间约束下获得一系列高效卷积神经网络,在TX2平台上搜索到的DF系列模型在嵌入式平台也具有非常优秀的性能,有着广阔的应用前景。