论文部分内容阅读
神经网络是人工智能(AI)领域中使用非常广泛的一种深度学习算法,由于在网络训练和推理过程中通常需要大量的运算,故运算通常由具有强大计算性能的GPU服务器完成。然而,嵌入式设备通常计算能力有限,这严重影响了AI在嵌入式系统的应用,而计算棒的出现,为嵌入式设备中应用AI技术提供了一种实现途径。本文以智能机器人目标检测需求为背景,围绕基于深度学习的目标检测算法在Intel二代神经网络计算棒实现为目标,做了以下三个方面的工作,具体如下:首先,以浙江省创新机器人比赛为背景,完成了比赛场景的目标检测数据集IRC3的制作,并利用YOLOv3网络进行了训练和测试,实验表明:YOLOv3网络在IRC3数据集上的平均测试准确率为98%,能够较好地检测出IRC3数据集中的苹果、木块和啤酒罐三类物体,满足预期需求。其次,完成了卷积神经网络的卷积层数和浮点计算量两个关键因素影响Intel二代神经网络计算棒性能(推理时间)的实验测试,结果表明:卷积网络的浮点计算量与计算棒所需推理时间接近于线性正比关系且增长幅度较大,其影响较大;卷积网络层数与计算棒所需推理时间接近于分段正比关系且增长幅度较小,其影响较小。最后,根据上述的计算棒性能测试结果,将深度可分离卷积思想引入到YOLOv3网络中,提出了一种计算量较少且网络层数增多的改进型YOLOv3网络——Depwise-YOLOv3网络,并将该网络模型部署于实验平台,测试表明:在Pascal-VOC和IRC3数据集上,Depwise-YOLOv3网络与YOLOv3网络的检测准确率大致相同,且前者的推理时间减少了约33%。目前,Depwise-YOLOv3网络所部署的实验平台是以外接计算棒的笔记本电脑,可进一步开展以实际机器人应用系统为平台的Depwise-YOLOv3网络部署与测试等相关工作,为实际应用提供技术保障。此外,可以从计算棒原理上,进一步开展对计算棒特性研究,以便针对计算棒可以开发出更高效的深度学习算法。