基于Jetson TX2的深度学习小目标检测

来源 :天津大学 | 被引量 : 0次 | 上传用户：rudy_luo

【摘要】

：

【作者】

：

韩煜蓉

【机构】

：

天津大学

【出处】

：

天津大学

【发表日期】

：

2019年2期

【关键词】

：

目标检测

【基金项目】

：

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

作为计算机视觉领域的基本问题之一，目标检测系统实现了对图像中每个目标对象的分类，同时在目标中心点四周绘制大小适当的边界框来对目标进行定位。目标检测任务是视频分析、场景理解等其他计算机视觉任务的重要基础。近年来，得益于深度学习技术的飞速发展，智能安防、自动驾驶等领域的研究进展迅速，新目标检测算法层出不穷。目标检测技术的突破使得对快速准确的目标检测系统的需求越来越多，诞生了系列算法。
　　虽然目标检测算法已经取得了很大进步，仍存在以下挑战：目标对象会发生旋转和尺度变化，尤其在尺寸极小时，由于小目标携带的信息量少，特征提取困难，无法进行精确的对象定位；目前常用的目标检测算法在高性能计算机上依然存在着检测精度和速度无法兼顾的问题，导致难以在可移动开发板上找到精度和速度的平衡点。
　　本文提出以小目标检测精度和速度相均衡为基础的深度学习目标检测算法，实现JetsonTX2(TX2)嵌入式开发平台和深度学习目标检测算法的优势结合，更符合现实应用的需求。针对常用行人检测数据集中小目标样本较少的问题，采集并标注了训练数据集，与常用行人检测数据集进行联合训练和效果对比。同时，本文基于YOLOv3-Tiny算法进行改进，考虑到YOLOv3-Tiny网络结构相对简单且用于输出预测结果的特征图感受野较大，在网络中增加了卷积层并根据特征金字塔的思想对高层和低层特征图进行融合。此外，在网络中使用深度可分离卷积代替普通卷积，构建了轻量化的小型卷积神经网络，使网络更适合于资源受限的嵌入式平台。最后，针对开发平台的硬件特性进行了内存调度优化和线程设计，避免了不必要的拷贝操作，在TX2开发平台上实现了速度和精度的折中。
　　实验结果表明，本文所提出的算法在TX2开发平台上实现了小行人目标检测，且对小行人目标的检测效果优于常用的目标检测算法。此外，本文所提出的算法网络结构简单，在计算效率上更有优势，而且本文所提算法的模型权重较小，在资源加速方面具有良好的性能，在嵌入式开发平台上的精度和速度之间达到了较好的平衡，具有更强的开发性和实用性。

其他文献

基于特征融合和显著性传播的协同显著性检测

协同显著性检测是指从一组图像中检测出共有的、显著的前景目标，在场景分割和目标跟踪等领域起着重要的作用。如何计算图像内和图像间显著值是算法中最关键的步骤，然而现有很多算法没有探索更多的表征图像内和图像间关系的特征信息，故当图像组背景环境复杂、前景目标混乱不易区分时，无法准确地检测出前景目标。　　为了探索更有效的特征信息、弥补颜色特征的局限性，本文提出了一种基于对象性和多层线性模型的协同显著性检测算法

学位

协同显著性检测

基于视觉特性与统计分析的无参考图像质量评价

随着多媒体技术和互联网的发展，图像逐渐成为一种简单高效的信息承载方式，在人们的日常生活中发挥着至关重要的作用。然而，图像在获取、处理、传输和存储的各个阶段都有可能产生质量退化效应，不仅影响用户的视觉体验，而且不利于后续的应用。因此，通过分析和建模提出有效的图像质量评价方法具有重要意义。图像信号通过人眼接收并传递给视觉皮层，人眼视觉系统决定了图像以何种形式被解释和理解，从而产生美观与糟糕等主观判断。

学位

图像质量评价

基于手绘草图的跨域图像检索技术研究

基于草图的跨域图像检索旨在根据输入的手绘草图与数据库中彩色图像的相似性度量返回彩色图像排序结果。该检索可以在基于文本的图像检索不准确或基于内容的图像检索中彩色图像难以获得的情况下，通过输入手绘草图完成图像检索任务。虽然相对于传统的图像检索算法，现有的草图检索算法效果得到了较好的提升。但是草图与彩色图像的特征映射与跨域检索等问题仍然没有得到较好的解决。因此，本文从网络结构与多损失函数优化两个方面，提

学位

图像检索

认知雷达识别隐身目标研究

近年来，隐身技术发展迅猛，在战争环境中占有不可替代的位置，因此反隐身技术的研究更是迫在眉睫。认知雷达不只具备对环境相应变化的感知能力，而且更具备处理自适应、能力自提高的优势，将认知雷达应用于反隐身技术中，让其根据对环境的感知进行自我调整从而能够极大的提升反隐身能力。本文将研究认知雷达识别隐身目标的方法，建立认知雷达认知-反馈-决策-响应的闭环体系，提出一种认知雷达跟踪识别隐身目标的框架，将分布式卡

学位

认知雷达

基于神经网络的视频目标检测算法研究

随着计算机视觉技术以及人工智能的发展，近几年图像的目标检测取得了巨大进展，得到了工业界和学术界的广泛关注。图像的目标检测需要检测并且识别出指定目标的物体，也是视频目标检测主要技术之一。随着智能视频处理技术的发展，对视频序列进行目标检测逐渐进入人们的视野中，并且在实际的监控领域中成为其它技术的基础。如何有效的提高视频序列中目标检测的性能具有非常重要的研究价值。针对这一问题，本文从目标检测中图像分类的

学位

目标检测

基于子图学习的三维模型检索方法研究

图匹配问题是多媒体领域中一个基本的问题，在目标检测、目标追踪、三维模型检索等领域都有重要的作用。本文提出了一种基于子图学习的图匹配算法，通过引入惩罚项来优化子图的选择，从而降低传统图匹配问题中离群点对匹配结果的影响，提高了匹配精度。　　本文还基于子图学习的图匹配算法提出了基于图匹配的三维模型检索算法。本文对三维模型提取多个角度的二维视图，将三维模型检索的问题转换为图匹配的问题，然后利用子图学习的算

学位

三维模型检索

基于群智能算法的多无人机任务分配和协同路径规划

从军事、工业、农业到人工智能等多个领域，无人机得到越来越广泛的应用。在所有对无人机的应用研究中，任务分配和路径规划是最基本的两项技术。近年来，已经提出了多种任务分配和路径规划方法，并且取得了一定的进展。任务规划根据对应用场景的整体把控，对无人机作出合理的任务分配方案，帮助无人机更好地完成任务。路径规划则根据无人机到目标点的距离等因素为无人机规划出最佳的飞行路线。因此对任务分配和路径规划方法的研究对

学位

无人机

面向数据收集的水下节点部署和网络路由技术研究

水声传感器网络作为探索海洋、开发海洋的一种新的方式，在海洋监测、临海预防等多个领域有着广泛的应用前景，已引起各国越来越多的关注。作为海洋监测的重要工具，水声传感器网络的核心是能够有效收集所需要的海洋环境信息。因此，本论文针对数据收集时的节点部署和路由关键技术展开研究。　　针对现有节点部署方法未能很好实现网络覆盖和连通的联合优化，无法有效收集数据并传输的问题，本论文设计了一种基于深度可调节节点的部署

学位

水声传感器网络

基于深度学习的手写体中文识别方法

手写体中文的自动识别是中文文档数字化的前提和基础，在历史文档识别、手写笔记转录等方面有着重要的应用价值。手写体中文具有书写随意、结构复杂、相似性强、数目众多、缺乏统一规范等特点，这使得其自动识别成为一个具有挑战性的问题。　　本文首先分析了手写体中文自动识别领域的研究背景与意义，对国内外的研究现状做了综述；介绍了深度学习的基础理论知识、卷积神经网络的构成，以及常用的网络模型。　　其次，论文在经典Le

学位

手写体中文识别

基于深度学习的微多普勒雷达图像去噪和人体行为识别

利用微多普勒雷达对人体行为进行识别，在灾后搜救、智能家居、无人驾驶、安全监控等领域都有广泛的应用，具有极大的研究价值。面向实际应用，本文开展了微多普勒雷达图像去噪和人体行为识别的研究，分别提出了去噪模型和人体行为识别模型，并利用雷达仿真数据和实测数据对所提模型的性能进行了评估，主要研究内容及创新性工作如下。　　为了去除微多普勒雷达图像中的噪声，提出了一种基于生成对抗网络(Generative Ad

学位

微多普勒雷达

基于Jetson TX2的深度学习小目标检测

与本文相关的学术论文