复杂场景下步态识别研究与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:huangsheng200888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
步态识别是通过人的步态特征对行人身份进行识别,步态特征相较于其他生物特征有着明显的优势,即在远距离或低视频质量情况下的可辨别能力。由于人的走路姿态是一种长时间的行为习惯,这种习惯不容易隐藏和改变,步态特征难以伪装和模仿,可以用于行人身份的识别。近年来,随着人工智能和深度学习的发展,人们更倾向于利用人工智能技术来处理识别领域的一些问题,步态识别逐渐走进人们视野,在安防和刑侦领域都极具发展潜力。很多资料已经证明步态识别的性能与受试者本身外观的变化有关,例如穿大衣、背包、携带其它物件等。识别结果还受环境影响,其中受摄像头和行人行进方向的角度影响较大。为了解决行人外观变化、视角变化对步态识别性能的影响,本文提出了一种基于视角增强的多任务学习步态识别方法,设计了新的损失函数,开发了步态识别应用系统,实现了模型的可视化应用。论文的主要贡献如下:(1)提出了一种用于步态识别的视角和步态双流结合方法,该方法通过联合学习使模型利用角度信息的先验知识,更好地观测步态规律信息,同时对步态特征分块处理,从局部特征中捕获更多细粒度信息,解决跨视角识别性能不佳的问题。该方法在CASIA-B数据集中的正常状态行人正确率达到95.5%,背包状态的行人正确率达到87.9%,穿大衣状态行人正确率达到71.7%,比基础网络模型(Gait Set)分别提升0.5%,0.7%和1.3%。(2)设计了融合交叉熵损失和三元组损失的新损失函数,借助交叉熵损失增大类间距离,同时借助三元组损失缩小类内距离,使模型学习到更多有区别的特征。该方法比基础网络模型(Gait Set)在正常状态和背包状态的行人的数据集上,正确率分别提升1.2%、3.0%。结合视角和步态双流结合方法与新损失函数,比基础网络Gait Set的正常状态、背包状态和穿大衣状态下的数据集分别提升了1.2%、3.1%和1.4%。(3)设计和实现了基于Python语言的集目标检测与追踪、对象分割和步态识别功能于一体的步态识别应用系统。使用烽火科技集团有限公司的数据集进行测试显示,Top1正确率达到84%,Top5正确率达到93%。
其他文献
随着船舶维修和建造速度的加快,以及规模化生产对质量和技术要求的不断提高,船舶检测精度及装配速度成为衡量维修及建造技术水平的重要指标。船舶轴系对中过程的位姿测量对于轴系的精准装配至关重要。本文以船舶轴系位姿测量过程中轴系法兰的三维成像为研究对象,构建自动扫描系统并规划合理扫描轨迹。论文的主要研究工作如下:1.针对轴系法兰的轮廓特点,设计了一套自动扫描系统。系统由激光三维扫描仪和工业型机械臂组成。机械
学位
当前的LPWAN技术在面对海量终端设备的接入需求时,存在网络容量不足、接入成功率低、协议复杂等问题。一种基于大规模MIMO免授权随机接入的新型LPWAN技术Tur Mass,利用频分复用和空分复用显著提高系统的网络容量。针对导标信号和捕获方案,Tur Mass系统对信号带宽、调制方式、捕获灵敏度、捕获最大时间延迟等提出了9项设计指标。本文针对这些系统需求进行导标信号和捕获方案进行设计。针对Tur
学位
正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)技术,作为无线通信中进行高速数据传输的核心技术,具有抗多径干扰能力强、频谱利用率高等多种优点。但是,OFDM系统具有高峰均功率比(Peak-to-Average Power Ratio,PAPR)的特性,当发射信号的峰值超过高功率放大器(High Power Amplifier,HPA)的
学位
深度学习在各个领域的蓬勃发展给人类带来了巨大的利益和便利,包括图像识别、文本分类和图数据分析。但同时深度学习也存在着一定的安全隐患。有许多研究工作表明,深度神经网络(Deep Neural Networks,DNN)容易受到对抗攻击(Adversarial Attack)的影响,即恶意攻击者制造若干与正常样本差异很小的对抗样本混入到目标网络中,便能使得网络输出错误的结果。尽管有许多例如计算机视觉、
学位
无迹卡尔曼滤波(Unscented Kalman Filter,UKF)作为一种稳定无偏且可用于非线性系统的估计方法,广泛应用于组合导航中。但是在噪声条件恶劣的情况下,噪声模型难以准确建立,导致UKF的性能严重下降,无法满足组合导航的需求。本文研究了新息自适应无迹卡尔曼滤波方法,可提升全球卫星导航系统(Global Navigation Satellite System,GNSS)和惯性导航系统(
学位
物联网的广泛应用推动了低功耗广域网(Low Power Wide Area Network,LPWAN)技术的快速发展,LPWAN技术的低功耗和低成本特性导致通信系统中存在较大的频偏,以及终端可能存在小范围的移动导致系统出现多普勒衰落现象,频偏和多普勒衰落是影响LPWAN系统性能的主要原因之一。由于当前LPWAN技术的解决方式中存在不足,如基于扩频技术(Lo Ra)的频谱利用率不高以及基于差分相位
学位
信息技术的快速发展为网络研究提供了新的方法,社区发现和节点角色划分作为网络研究领域两个重要的方向在近些年来逐渐被研究人员关注,它们在不同的领域有十分广泛的应用。现实世界中的网络往往是多层网络,多层网络相较于单层网络,能包含更多的信息,更大程度的反映真实的情况,本文针对多层网络社区发现和有向加权图的角色划分进行研究,主要贡献包括:1)现有关于多层网络社区发现以及节点角色划分任务的公开数据集缺少社区和
学位
随着移动互联网的快速发展,网络中用户数增多和服务的多样化,对网络系统中有限资源的调度分配方法提出了更高的要求。对基站的调度技术而言,如何通过更好的调度算法提升系统的整体性能,成为了第五代移动通信移动技术的重点研究内容。由于MIMO技术充分利用了空间复用增益,能够有效提升系统性能,而得到广泛应用。因此,应用MIMO技术的5G网络系统中用户调度算法的性能评估是本文的主要内容。而目前多用户传统调度算法完
学位
采用深度学习技术进行医学影像分析是当前的热点研究问题,其研究成果将辅助医生诊断并有利于促进人类健康。针对从三维CT影像中识别新型冠状肺炎和肺动脉栓塞这两个重要问题,为减轻医学专家的手工标注工作量,本文研究了在弱标记情况下(即只给定患者级别标签)深度网络设计与训练方法。新型冠状肺炎是近年来最重大的传染性呼吸道疾病之一,在全世界范围内已造成三百多万人的死亡。在新冠疫情初期缺乏病灶标注且计算资源受限情况
学位
随着信息技术的日新月异,自然语言处理在机器翻译、智能问答、文本分类等领域有着广泛的应用前景,为人们的生活带来很多便利。自然语言处理技术需要将海量的非结构化文本,加工处理成可被计算机学习和理解的数据对象。作为自然语言分析的基础,标注文本数据成为研究自然语言处理算法的一个必要步骤。本文详细介绍了一个众包文本标注系统,本系统为自然语言处理的研究人员以及文本数据标注者提供了一个语料标注的平台,满足多种标注
学位