基于SSD目标检测算法的研究与应用

来源 :华南农业大学 | 被引量 : 0次 | 上传用户：sa753159

【摘要】

：

【作者】

：

毛亮

【机构】

：

华南农业大学

【出处】

：

华南农业大学

【发表日期】

：

2019年01期

【关键词】

：

目标检测特征融合由粗到细感受野块轻量级网络 SSD

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

目标检测是计算机视觉中最基础的部分,也是该领域的研究难点和热点之一。近年来,随着深度学习的快速发展,基于回归方式的Single Shot Detector（SSD）算法,即直接预测边界框坐标和类别的单阶段目标检测算法,具有实时性好、准确率高的优点,得到广泛的关注。然而,在实际工程应用上,现有SSD算法仍然存在小目标、部分遮挡目标和低分辨率目标检测精度低,以及在低成本GPU硬件平台或嵌入式芯片上模型参数量和计算量大、运行效率低的问题。为解决这些问题,研究检测精度更高且检测速度更快的目标检测算法,应用到实际场景的目标检测中,不仅能满足实际工程应用需求,还能促进SSD算法的大规模使用,同时加快目标检测技术的发展,具有重要的理论和现实意义。本文深入研究SSD算法的基础理论,采取将深层和浅层特征进行上下文语义信息融合的方法,提升小目标检测精度;采取将锚点框的回归分解为两步的由粗到细的方法,提升部分遮挡目标检测精度;采取用感受野块代替主干网络和多尺度特征提取网络中的部分卷积层的方法,提高目标的特征提取能力,提升低分辨率目标检测精度;采取用深度可分离卷积代替标准卷积的轻量化方法,在低成本硬件平台和嵌入式芯片上部署,进一步提出新的目标检测算法,满足于不同场景下的目标检测需求,如通用目标检测、渔场监控下的行人和增氧机检测、监控场景下车辆标志物检测和挖掘机检测。本文的主要研究内容和创新工作包括以下几个方面:（1）详细分析了低成本GPU下SSD目标检测算法的检测性能。首先,分析其关键技术、训练技巧和评价指标;然后,在公共数据集PASCAL VOC和低成本GPU硬件平台及嵌入式芯片上进行测试。实验结果表明,现有SSD算法存在对小目标、遮挡目标和低分辨率目标漏检的情况以及在低成本硬件平台和嵌入式芯片上部署时检测效率不高的问题,主要原因是特征提取能力不够、模型参数数量和计算量过大等,为SSD算法的改进或优化指明了方向。（2）提出了基于上下文特征融合的快速目标检测算法。针对现有SSD算法在低成本硬件平台上模型参数数量和计算量较大、运行效率低的问题,引入Mobile Net V2,利用深度可分离卷积替换标准卷积,实现轻量化处理。然后结合DFPN,实现信息流从较深和较小的特征图重定向到较浅的特征图,将浅层和深层语义信息特征图进行融合,增强上下文信息,提高特征表达能力。最后,将本算法、Mobile Net V2SSD（Sandler et al.,2018）和Tiny-DSOD（Li et al.,2018）在PASCAL VOC测试集和低成本硬件平台及嵌入式芯片上进行对比测试。实验结果表明,本算法的m AP为74.51%,相比其他算法分别高出4.46%和2.55%;同时在GTX1060上,其每帧检测时间为11.8ms,与Tiny-DSOD算法基本一致,说明本算法有较好的检测精度,同时保持实时性。（3）提出了基于由粗到细的目标检测算法及应用。深入研究由粗到细的方法,将其引入到SSD算法中,对锚点框选取采用先粗后细的预测机制,提出融合上下文特征信息的锚点框优选fused-ARM模块。然后,采用TCB特征融合模块将深层和浅层进行特征融合,增加特征再提取模块FRM,增强特征提取能力。最后,在PASCAL VOC测试集和低成本硬件平台上进行对比测试,本算法的m AP为80.7%,FPS分别为27.7fps和37.9fps。同时,将其应用在渔场监控场景下的行人和增氧机检测中,m AP分别为90.1%和90.6%。在增氧机检测区域内,利用Harris算法检测水花角点和Lucaskanade光流法计算角点的光流量,得出水花角点帧间平均位移,再用Support Vector Machine（SVM）算法实现增氧机工作状态检测,平均准确率为99.78%,说明本算法不仅可适应于不同光照、角度和拍摄距离条件下的增氧机工作状态检测,同时具有较强的鲁棒性和实时性。（4）提出了基于感受野块的目标检测算法及应用。根据锚点框与感受野的关系对锚点框参数进行优化,然后,采用上下文融合的思路将RFBNet算法相邻的浅层特征图进行融合。最后,在PASCAL VOC测试集上进行对比测试,本算法的m AP为80.4%,相比于RFBNet算法和SSD算法分别提升1.8%和3.6%。同时,将其应用在车辆标志物数据集中,m AP为94.03%,同样比其他算法分别提升了1.87%和10.65%。说明本算法在检测精度上有较好的优势,对低分辨率目标具有较强的鲁棒性。（5）提出了面向嵌入式芯片的轻量级目标检测算法及应用。采用DDB构成主干网络,提高特征的表达能力,设计多尺度特征提取模块BDM。然后,在PASCAL VOC测试集上进行测试,m AP为69.5%,并在嵌入式芯片上验证,其每帧检测时间为145.2ms,相比于Mobile Net V1SSD和Tiny-DSOD算法分别加快了70.8ms和11ms。同时,将其应用在监控场景挖掘机数据集上,m AP为90.6%,然后,在挖掘机目标检测区域内,对同一品牌挖掘机工作装置的各种姿态建立混合Local Binary Features（LBF）形状回归模型,再利用上述模型预测挖掘机工作装置的形状信息,构建挖掘机的工作状态特征描述子。最后,利用SVM分类器实现挖掘机工作状态检测,准确率为93.53%,说明本方法具有很好的检测精度,且克服了光照变化以及多姿态导致的形状变化影响。上述研究工作的结果表明:本文在现有SSD算法的基础上,结合特征融合、由粗到细和感受野块的技术,能够提升算法的检测精度,解决小目标、部分遮挡目标和低分辨率目标的检测精度低的问题;同时,结合轻量化技术,能够解决在低成本GPU硬件和嵌入式芯片上的模型参数数量和计算量大、运行效率低的问题。因此,本文以SSD算法为理论基础,研究检测精度高、同时保持良好实时性的算法,拓宽了其应用场景,是一个非常前沿的研究方向。

其他文献

赵孟頫鹊华秋色图跋文

会议

儿童评价根本育人功能实现的维度、困境与出路

儿童评价根本育人功能是引导儿童自在本质的全面实现,基于马克思"人的本质"理论,其具体的实现维度包括引导儿童内在自然生命力的发展,显明儿童之为人的"类"生命特性,以及确证儿童现实的社会本质属性。但受各种主客观条件的制约,现实儿童评价未能重视儿童发展的过程性,未能显现儿童生命的主体性、现实性,未能发挥对儿童全面发展的指引性。长期偏离儿童自在本质的儿童评价将带来儿童的"异己性",使儿童个体的对象物成为个

期刊

儿童评价育人功能儿童本质异己性

职业院校“三全育人”体育教学的探索与研究

新课改对职业院校体育教学提出更高的要求,如何培养优秀人才成为体育教学必须高度重视的问题,在体教融合和"三全育人"背景下,职业院校体育教育改革势在必行。文章在分析职业院校"三全育人"体育教学重要价值的基础上,重点就如何在职业院校体育教学中落实"三全育人"提出了针对性的策略,旨在为职业院校体育教育改革、创新、发展提供参考价值。

期刊

职业院校体育教育“三全育人”体育教学教学创新

基于机器视觉的家禽异常行为检测方法研究

近年来,家禽疫病频发严重地冲击了家禽业,不仅对养殖户造成巨大的经济损失,同时也严重的威胁到人类的健康。因此,家禽疫病已经成为了家禽饲养户乃至国家所关注的重点问题。目前,家禽疫病的监测主要是以人工巡检为主,饲养人员通过观察家禽姿态、羽毛、鸡冠、粪便和声音等特征对家禽健康状态进行初步诊断。人工巡检耗时费力,且容易漏检,同时养殖场内粉尘多、气味浓,长时间逗留有可能对工作人员的身体造成损伤。鉴于此,本文将

学位

机器视觉家禽行为图像分割目标追踪图像识别

基于现场视频的猪只行为识别

猪的行为是猪的语言,是诊断其健康的依据之一。正常的环境和生理状态下,猪只表现出休息、行走、进食、饮水等正常的行为。当生存环境和生活状态发生改变时,猪只的行为则可能出现异常。猪只的行为识别可借助视频监控的方式来完成。目前基于视频自动化监管猪只的研究多集中在猪只的检测和识别上,对行为的研究尚处于初步阶段。论文从猪场的视频数据出发,采用图像处理、深度学习的方法,研究猪只各类行为的自动化提取策略。在生猪养

学位

猪场视频图像处理猪只检测姿态分类行为识别

火龙果碳同化特点及其对干旱和低温逆境响应的研究

火龙果（Hylocereus）是典型的景天酸代谢（CAM）植物,高度抗旱,但对低温敏感。因其商品价值高、抗旱耐瘠薄,已发展成为贵州喀斯特山区农民脱贫致富的重要支柱产业。火龙果作为优稀果树,已在国内广泛栽培,但与之相关的生理基础研究十分薄弱。关于火龙果响应干旱和低温逆境胁迫的交互影响的生理研究尚欠缺。本研究针对贵州喀斯特地貌的火龙果产区干旱、冬季低温的限制因子,以盆栽‘紫红龙’火龙果茎为试验材料,研

学位

火龙果碳代谢干旱低温遮荫转录组

4个菜心NAC转录因子调控ABA诱导的采后叶片衰老的机制分析

菜心（Brassica rapa ssp.parachinensis）是我国华南地区具有较高经济价值的叶菜类蔬菜之一,口感清爽又含有丰富的植物蛋白、维生素和氨基酸等营养物质,因而备受消费者的青睐。然而,菜心采后叶片极易衰老黄化、萎蔫而失去商品价值,导致严重的经济损失。因此,深入研究菜心采后叶片衰老的调控机制,对生产上改进菜心采后品质保持技术措施,减少生鲜损耗具有重要意义。植物激素对叶片衰老具有重要

学位

菜心叶片衰老ABAGANAC转录因子激素交互

枇杷成花时间调控的分子机制研究

高等植物是一个非常复杂的生物体,并进化出了复杂而精密的成花转变遗传机制,从而使得植物能够准确地响应内部和外部信号,并将它们整合在一起,以促进在对其自身有利的时间内开花。而不同的物种在不同的进化过程中又形成了各自特殊的调控机制,枇杷（Eriobotrya japonica Lindl.）这一蔷薇科木本果树,在开花时间（季节）上显得特殊,它进化出了不同于苹果、梨、李等果树的开花策略。秋冬开花给了枇杷较

学位

枇杷成花转变延迟开花基因功能验证赤霉素

β-糖苷酶在鸳鸯茉莉和拟南芥花色素苷降解中的机制分析

花色素苷是园艺作物的主要色素,可以保护植物光合作用并免受紫外光伤害,对一系列的人类疾病具有显著的预防和保健功能,因此花色素苷相关研究受到研究者的广泛关注。国内外对植物花色素苷的种类、化学结构、呈色机制、生物合成途径,关键酶基因的克隆与表达,影响花色素苷的内外因子等的研究已十分详尽,但对花色素苷降解规律的研究非常罕见。花色素苷降解在植物花、叶片与果蔬的颜色调控中发挥重要的作用,探讨花色素苷降解规律及

学位

鸳鸯茉莉拟南芥花色素苷降解β-木糖苷酶转录组代谢组

转录因子调控辣椒素类物质形成的遗传和分子机制研究

辣椒素、二氢辣椒素及其类似物简称辣椒素类物质是辣椒属（Capsicum spp.）果实胎座中的一类特有异生代谢产物。辣椒素类物质赋予辣椒果实辣味,具有抵抗病原菌和食草动物损害辣椒果实的功能。辣椒素类物质在其他领域具有广泛的应用价值。辣椒基因组测序发现辣椒素合成途径相关基因在其近缘的茄科植物番茄和马铃薯中也存在。比较转录组学分析发现辣椒素合成途径关键基因在辣椒花后16天至绿熟期果实的胎座中高度表达,

学位

辣椒遗传图谱辣椒素类物质MYB转录因子WRKY9转录因子遗传变异极辣辣椒

基于SSD目标检测算法的研究与应用

与本文相关的学术论文