论文部分内容阅读
随着5G、AI时代的到来,智能视觉传感网络系统得到快速发展,在新零售、城市大脑、工业物联网等多个领域均展现出巨大潜力。在实际应用场景中,深度学习依赖海量数据,采集标注成本高;同时应用场景一般要求算法精度高、检测结果反馈时延低,还要求支持部署大规模识别库。针对以上难点,本文提出采用云端和边缘计算结合的架构模式,将部分计算过程前置到边缘端计算处理器上,在感知前端对海量非结构化的图像数据完成目标检测工作,然后将获取的检测目标送往云端识别处理,以此来降低时延、提高识别精度并支持大规模识别库的部署;同时,通过合成方法获得整个检测识别算法训练所需要的数据,可以显著地降低数据采集成本。整体方案框架包括数据合成、多目标检测、细粒度分类三大模块,具体方法如下:数据合成方法包括图像分割网络M-Unet(Multi-path Dilated Convolution U-Net)算法、图像合成策略、CycleGan(Generative Adversarial Networks)算法。本文提出的M-Unet相比于传统的U-Net网络,增加多支路空洞卷积并联模块(Multi-path Dilated Convolution:MPDC)、全局池化网络(Global Convolution Network:GCN)、Soft Dice损失函数,提升不同尺寸目标的分割性能;合成策略通过角度、遮挡、尺度、背景四个参数设置合成规则;基于合成的图像,通过CycleGan进行风格转化,最终得到真实场景的数据集,极大的降低了采集标注成本,将该方法用于后续检测识别的业务,具有很大的实际应用价值。视觉传感器终端的多目标检测方法中,研究了两阶段目标检测算法FPN的实现过程,提出了基于正负样本优化策略的M-FPN(Modified Feature Pyramid Network)。具体方法为通过基于扰动的候选框改善技术,在提升IoU筛选阈值(即正样本质量)的同时,对候选框进行扰动从而增加高质量的样本数量,经过实验验证在MS-COCO目标检测数据集上平均检测精度mmAP提升了1.2%,证明了该优化策略的有效性。同时本文进一步证明了合成数据在目标检测识别业务中的可行性,mAP(平均精度)、cAcc(整单准确率)、mCIoU(平均交并比)等指标分别达到96.63%、56.92%、93.32%,相对直接数据合成方案分别提升了15.9%、47.43%、23.52%,提升效果显著。基于ResNet_FPM的细粒度分类算法以ResNet-50作为基础网络,增加了FPM(Feature Part Module)特征模块,将特征向量切成多个表示部件的分块,每一个子特征张量会经过全局平均池化(Global Average Pooling)、全局最大池化(Global Max Pooling)、全连接池化(Fully-Connected Pooling)操作后形成D维的输出向量,然后将各个模块输出向量进行拼接得到最终特征向量用于分类,识别准确率提升了4.1%;最后叠加使用了特征金字塔方法,识别准确率提升了4.2%,显著的提升了细粒度识别的准确率,可达99.8%。