基于深度学习的行人检测方法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:maxine1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人检测作为计算机视觉任务中的重要组成部分,被广泛应用于智能监控、自动驾驶、无人机搜索等多个领域。由于检测场景复杂多变,行人较为密集,容易受到尺度、姿态、遮挡等方面的影响,要实现实时、高效地检测仍存在着一定问题。本文主要针对行人检测任务中小尺度行人特征信息提取不充分和遮挡行人特征提取困难问题进行研究,同时兼顾检测准确性和实时性,主要研究工作如下:针对小尺度行人特征提取过程中浅层特征丢失严重导致检测精度较低问题,本文提出一种以YOLOv4模型为基础的行人检测方法。该方法首先通过kmeans++聚类算法对文中使用的数据集进行聚类,同时在训练中使用Mosaic数据增强;其次利用Focus模块替换特征提取网络中的下采样卷积,去缓解特征提取过程中因下采样导致特征丢失情况,同时引入注意力机制增强特征提取网络的特征提取能力;然后在PANet网络的基础上进行扩展,同时在特征融合网络中使用本文构建的Res_C模块去替换部分卷积堆叠层,增加特征融合网络对特征提取网络提取的特征层的利用率;最后增加模型检测头,利用更多的检测头去检测行人,可以有效增强多尺度行人检测效果。通过在Wider Person和City Persons数据集上进行测试,与原YOLOv4模型相比,平均精度分别提升4.29%和3.24%,检测速度达到30fps,验证了该方法的高效性和实时性。针对遮挡行人因特征提取困难导致检测效果较差问题,本文提出了一种以YOLOX模型为基础的行人检测方法。该方法首先利用一次聚合思想对主干特征提取网络进行改进,增强主干网络的特征提取能力,同时引入一种基于位置和通道注意力机制的协调注意力模块,加强主干特征提取网络对遮挡行人的特征表达能力;然后使用特征对齐模块和特征选择模块对特征融合网络进行改进,利用特征对齐方式增强多尺度特征融合效果;最后使用CIo U损失函数作为回归损失函数,利用改进后的非极大抑制算法对行人候选框进行滤除。通过在Wider Person和City Persons公开行人数据集上进行测试,与原YOLOX模型相比,平均精度分别提升3.59%和5.05%,检测速度达到32fps,证明了改进模型的有效性和实时性。
其他文献
风能作为二十一世纪的主要绿色能源,在非再生能源中占有举足轻重的地位。风能发电设备不断更新和发电技术水平不断提高,风能发电已成为最成熟、最具规模化发展潜力、最具商业化潜力的新能源发电技术。随着风电接入系统的比例持续增大,风电并网运行对电力系统的不利影响日益突出。因此评估风电接入的电力系统可靠性显得尤为重要,以实现风能充分利用和风能与电力系统可靠性的统一。针对风电功率预测不准确问题,本文提出了改进烟花
学位
在线学习系统提倡因材施教,能够根据学生的知识掌握情况为其提供个性化的学习内容和学习路径。然而面对海量的试题资源,学生很容易陷入“信息迷航”的困境。因此,如何为学生推荐合适的试题是智慧教育领域亟待解决的关键难点。知识追踪能建模学生随时间不断变化的知识状态,预测学生在未来试题上的表现,为试题推荐提供决策依据。为此,本文基于深度学习提出了两种知识追踪模型用于试题推荐,一种为输入仅包含知识点信息的试题序列
学位
智能电网是电网系统的智能化,具有应用场景广泛、业务种类繁多、传输稳定性的特点,是目前世界电力系统的发展趋势。电力线通信(Power Line Communication,PLC)因其覆盖范围广、布线简单的特点是智能电网的主要通信技术。但由于其信道特性,电力线通信存在较强的信道衰减和脉冲噪声。无线通信因布线灵活、可扩展性好的特点也成为智能电网的通信技术之一。但由于智能电网网络拓扑结构复杂,接入用电设
学位
随着多功能移动终端的普及,智能识别、增强现实(Augmented Reality,AR)及电子医疗等新型应用逐渐向移动网络渗透。然而,由于移动用户(Mobile User,MU)的计算及缓存能力有限,难以为资源密集型应用提供高质量服务。移动边缘计算(Mobile Edge Computing,MEC)技术可解决上述问题。MEC融合了无线通信网络和云计算技术,通过在网络边缘部署MEC服务器支持MU任
学位
短波通信以其通信距离远、技术成熟、成本低等优势使得其被广泛应用于商业、工业、军事等国民经济的各个部门。尤其在军事领域,它一直是军事作战主要的通信方式之一。而移动自组织网络的组网简单灵活、无需架设基础通信设施、自愈性强等优势,使得其和短波通信相结合形成的短波自组网具有重要的应用价值。短波自组网中节点组网需要路由协议的支持,本文以优化链路状态路由(Optimized Link State Routin
学位
现如今,全球导航卫星系统(Global Navigation Satellite Systems,GNSS)取得了快速的发展,导航定位等功能在我们日常生活中的应用也越来越普遍,随着这些发展所带来的不仅有我们生活方面的便利,还有越来越拥挤的导航频段。为了在一定程度上缓解频段拥挤的问题,二进制偏移载波信号(Binary Offset Carrier,BOC)以及由其所产生的衍生信号随之产生,但是在解决
学位
随着无线通信作为网络的主要接入方式所需要承载的数据量越来越大,无线频谱资源作为提升网络速率的关键因素日益紧缺。可以缓解频谱资源紧张和提高设备近距离通信速率的太赫兹通信技术受到越来越多的学者的关注。太赫兹无线个域网是一种使用太赫兹波作为通信载波进行近距离超高速通信的无线网络系统。但由于太赫兹波信号在空气中衰减严重的特性,其传输距离受到限制。太赫兹无线个域网双信道媒体接入控制(Media Access
学位
自由空间光通信(Free Space Optical Communication,FSOC)系统容易受到大气湍流的影响,导致传输的光束产生波前畸变,影响通信质量,因此研究如何更好地补偿波前畸变对FSOC系统具有重大意义。无波前传感自适应光学(Wavefront Sensorless Adaptive Optics,WFS-less AO)是当下可以有效校正波前畸变的技术之一,它将成像清晰度或者接收
学位
表情识别是智能化人机交互领域中的关键技术,有助于机器更好地理解人类的情感状态和意图。其中,面向图像序列的动态表情识别凭借着时间变化关系在描述面部表情时具有更大优势,成为当前热门研究方向。但研究发现还存在着一些问题,如现有方法提取到的特征无法精确表征面部表情,易受光照变化的影响,且现有损失函数难以有效区分高相似度表情类别。因此,本文采用融合特征提取方法和改进损失函数对动态表情识别展开分析和研究。1.
学位
随着信息化技术的革新和发展,产生了大量的互联网用户数据,传统的集中式学习具有很高的风险和成本,日益严重的隐私安全问题促进了联邦学习(Federated Learning,FL)的诞生。同时,随着边缘网络的发展、硬件设备计算和存储能力的提升,大量的网络服务下沉到网络边缘,边缘计算(Edge Computing,EC)得到了普及。得益于此,联邦学习的技术理念能够很好地应用于边缘计算当中,然而本地模型可
学位