室内视频目标检测算法的研究与实现

来源 :沈阳航空航天大学 | 被引量 : 0次 | 上传用户:lhongbo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前基于深度学习的目标检测取得了显著的进展,但对于室内场景下视频目标检测的相关问题如遮挡、目标密集、类模糊等还有待于进一步提升,此外视频检测也需要达到实时的推理速度及对前后帧关联匹配。针对于室内场景中单类别目标检测中存在的遮挡、目标密集等问题,将CSPNet和Darknet结合提出了CSPDarknet特征提取网络。为了解决室内场景中待检测目标密集、遮挡严重的问题,使用了四层特征图产生更多锚框;为了解决监控视频视角引起的目标尺度、外观变化问题,采用路径聚合网络来融合不同特征图的锚框;为了加快训练过程中锚框的收敛,防止网络出现过拟合,使用了Si LU激活函数;为了进一步修正基于锚框的预测框位置,使用CIo U损失作为训练阶段预测框的预测框回归损失函数。为了进一步解决室内场景下多类别目标检测中存在的类别模糊等问题,提出了一种结合Transformer层的特征提取网络Trans Net。为了改善多类别在检测过程中遇到的类模糊问题,将特征提取网络的最后一层替换为Transformer层;为了解决数据集存在的类别不平衡问题,使用焦点损失函数作为多目标分类损失函数;为了改善多类别模型参数增加导致的推理时间延长,使用了DIo U-NMS算法对视频检测进行加速;为了使视频中检测前后帧一致,提出一种前后帧匹配算法来优化视频检测结果。在本文的数据集上对提出的模型进行训练和验证,室内单类别目标检测模型精度更高,适合对室内单种类目标检测准确率要求高的场景,室内多类别目标检测能够同时对多个类别进行检测,适用性更加广泛。同时本文提出的模型满足实际应用中视频检测所需的实时性。
其他文献
铝-钢双金属复合铸件兼具铝的低密度和钢的高强度的优点,在工业领域得到广泛应用。但由于铝和铁的热膨胀系数与熔点差异较大、两者表面均易形成氧化膜、界面易形成硬脆的铁铝金属间化合物相等原因,不对嵌件采用镀覆技术很难在复合铸造过程中形成连续致密且性能良好的冶金结合界面,这制约铝-钢双金属复合材料的应用。本文采用改良座滴法研究了锡锌合金镀层和纯镍镀层对铝硅熔体与Q235钢润湿行为的影响,并结合热浸镀铝硅实验
学位
图结构聚类是管理和分析图数据的一个基本问题,作为一个快速且精确的图结构聚类算法,pSCAN算法被广泛运用于不同的图应用中,用于发现有意义的聚类。但是对于缺乏专业知识的用户来说,由于无法提供合理的聚类参数,使用pSCAN算法来进行查询可能无法获得用户所期望的结果,例如非期望节点被聚类到指定的簇中。用户就会提出why问题,为什么存在非期望节点被聚类到指定簇中,怎样使非期望节点从指定簇中消失。对图结构聚
学位
基于人体骨骼序列的动作识别任务旨在根据完整序列推断已完成的动作的类别,是一种事后动作分析方法。与动作识别不同,动作预测任务根据已观测的部分序列尽可能早地识别正在执行的动作的类别,能够实现在线动作分析。动作识别与动作预测广泛应用于体感游戏、智能驾驶、人机交互以及智能医疗等领域。在基于人体骨骼序列的动作识别中,如何从骨骼序列中提取有效的动作特征表示对判断动作类别十分重要。为此,本文提出了一种早期融合图
学位
遥感图像融合的目的是通过融合低空间分辨率多光谱图像与高空间分辨率全色图像,获得一幅既包含丰富色彩信息又包含清晰纹理信息的高空间分辨率多光谱图像。最近,深度学习方法已经在遥感图像融合领域获得了巨大的成功,但是仍然存在不能灵活地处理判别通道之间不同级别的信息,导致光谱和空间信息丢失的问题和缺少真实参考图像,需要额外制作数据集的问题。针对这两个问题,本文提出了两种改进的基于深度学习的多光谱图像和全色图像
学位
随着工业的发展,能源消耗不断上升,保证燃气轮机的高效燃烧同时,降低污染物的排放成为燃气轮机发展的关键。本文以单头部双级旋流干式低排放(DLE)燃烧室为研究对象,进行了不同状态参数和结构参数的点熄火性能、燃烧及污染排放特性试验,找到了当量比、空气进口温度、进口压力、两级旋流流量比和火焰筒掺混孔孔径的影响规律,研究结果如下:点火位置靠近回流区中心边缘时点火成功率高,点火性能好。头部空气量增大会恶化燃烧
学位
融入知识的工艺文本命名实体识别是以某型飞机装配所遵循的工艺文本作为数据集,该工艺文本数据集来源于工艺标准、工艺大纲、工艺规范和指导书的操作说明语句,共包含工程图纸、零件、零件号、结构特征等12类实体。在民机装配过程中所有的整体都是有很多个组件共同构成,会造成不同场景不同工序下的相同实体不相同类型的情况,也存在命名不规范、命名构成方式相同的情况,会使工艺制造人员在工艺制造过程中不能够迅速且高效的辨别
学位
对工业装备进行实时智能故障诊断和预测,在故障初期及时发现故障并采取措施,是保障工业系统的安全性和可靠性的重要途径。在故障诊断领域,数据不均衡是目前面临的难点问题,使用生成模型GAN进行数据增强是解决这一问题的主要方法。但GAN在训练过程中存在不稳定现象,容易出现梯度消失/爆炸或模型崩塌等。针对上述问题,本文以滚动轴承为例,从以下两个方面进行实验研究:(1)为了提高生成数据的质量,本文提出一种基于组
学位
近年来,随着大数据和云计算的发展,图像数据的信息安全逐渐受到人们的关注。为了确保网络上图像数据的可靠安全传递,对图像信息的加密是必然选择。然而,目前大部分有关图像加密的算法都具有算法混沌序列过于单一,以及迭代计算过于繁琐等问题。面向当前图像信息加密的迫切需求,本文基于DNA计算,利用DNA序列对图像信息进行编码,基于剩余数制与二次剩余,设计了两种DNA图像加密算法,以求克服上述问题。首先,本文在D
学位
无人机相互协同共同组成编队集群能够发挥出单无人机所不具有的优势,更加胜任复杂、多任务等场景下的工作。针对集群执行多种不同类型任务的需求,本文对其中最重要的编队集群的控制问题进行研究,实现具有不同功能的异构无人机编队集群的聚集和保持,主要工作内容如下:(1)基于谢尔宾斯基(Sierpinski)三角形设计了一种子编队内同构,编队间异构的集群。在有任务发生时,具有对应功能的子编队可以分离出集群完成对应
学位
作为中华优秀传统文化的文言文,因为小初文言文学习的差异性,成为初中语文学习的重难点。语文课程标准特别强调不同学段的“系统性”与“进阶性”。基于小初衔接,聚焦文言文核心知识教学,是凸显“系统性”与“进阶性”的有效路径。文章以统编版小学高年级教材为例,总结基于小初衔接的文言文教学的核心知识。
期刊