【摘 要】
:
人体动作识别在视频信息检索、公共视频监控、人机交互、科学认知等方面有着重要的应用价值,是计算机视觉、模式识别和机器学习等众多学科的交叉研究领域。在机器学习领域中,通常的建模方法建立的模型有生成式模型和判别式模型。对于以时间序列数据表示的人体动作,本文的研究聚焦于可解释性较好的生成式模型中用于处理时间序列的隐马尔科夫模型。由于人体动作识别的性能依赖于动作的表示方式,针对传统隐马尔科夫模型简单地以离散
论文部分内容阅读
人体动作识别在视频信息检索、公共视频监控、人机交互、科学认知等方面有着重要的应用价值,是计算机视觉、模式识别和机器学习等众多学科的交叉研究领域。在机器学习领域中,通常的建模方法建立的模型有生成式模型和判别式模型。对于以时间序列数据表示的人体动作,本文的研究聚焦于可解释性较好的生成式模型中用于处理时间序列的隐马尔科夫模型。由于人体动作识别的性能依赖于动作的表示方式,针对传统隐马尔科夫模型简单地以离散分布或者单高斯分布作为动作的表示形式,本文利用高斯混合分布作为人体动作数据的统计分布,以此对人体动作进行更精确地描述。针对大多数传统参数模型在根据数据寻求合适的模型结构上存在一定不足,本文提出了遗传非参数最小长度描述准则-鲍姆韦尔奇(Minimum Description Length-Baum Welch,MDL-BW)方法来优化基于高斯混合分布的隐马尔科夫模型结构。隐马尔科夫模型的结构优化包括模型参数个数的优化和参数值的优化。针对传统的用于训练隐马尔科夫模型的鲍姆韦尔奇算法在寻求最优解时容易陷入局部极值以及无法优化隐马尔科夫模型参数个数的问题,该方法通过结合遗传(Genetic Algorithm,GA)算法随机搜索的特点和自适应思想来扩大隐马尔科夫模型参数值解的搜索空间,结合非参数思想以自动寻求隐马尔科夫模型的合适参数个数,同时以最小描述长度MDL作为模型优化准则来寻求隐马尔科夫模型在全局上的最优结构。人体动作数据仿真结果表明高斯混合分布能更好地拟合人体动作数据所服从的复杂概率分布。仿真数据、语音数据以及人体动作数据的仿真结果表明遗传非参数MDL-BW方法相较BW方法等同类方法在隐马尔科夫模型结构的寻求上具有更好的效果,进一步提高了基于高斯混合分布隐马尔科夫模型的人体动作识别准确率。
其他文献
动力电池安全性和可靠性是国际前沿研究课题,它决定着新能源汽车的市场和未来。运行工况分析、状态估计、一致性维护、全生命期内安全监测是解决该问题的重要途径。频繁模式挖掘具有单次线性扫描、低时/空复杂度、实时响应、适应性强等特性,为动力电池全生命周期的安全评价和可靠性分析提供了独特的解决方案。本文以新能源电动汽车为研究对象,以提高电池组状态估计准确性、一致性维护的有效性为目标,利用频繁模式流挖掘技术,开
多孔材料是在某种特定材料中含有大量的孔隙,并且所含孔隙是被用来达到所期待的性能指标。因为具有可焊接性、导电以及传热等优点,在航空航天、汽车、造船业、铁道业和建筑业等领域的应用越来越广泛。例如在航空航天中,常被用作轻质、传热的支撑;能焊接,黏胶或电镀到结构体上,可用作夹层承载结构;替代蜂窝结构,可以降低费用,并提高性能。截顶圆锥壳是火箭推进系统的主要构件之一,在航空航天、卫星和潜艇等领域也应用广泛。
随着5G通信技术的普及,万物互联不再是一句口号。在整个物联网系统中,传感器设备扮演着举足轻重的角色,受到了广泛的关注和研究。同时,在光纤通信技术的推动下,光纤传感器技术应运而生并成为传感器领域的重要研究方向。光纤声音传感器作为一种先进的声信号敏感技术,其原理是将声音信号分别调制于光的强度、波长和相位等参数中。本文针对基于正交相位解调技术的正交法布里-珀罗(Fabry-Perot,FP)腔光纤声传感
社会的发展和科技的进步对光电探测器的性能不断提出新的要求,例如高灵敏、快响应、低功耗和宽光谱等。为了满足这些要求,科研人员需要不断地寻找新的光电响应材料、构造新的器件结构和开发新的工艺技术。本论文基于碳纳米管和还原氧化石墨烯这两种具有宽谱光电探测能力的碳基薄膜上,制备并研究了“铯钨青铜纳米片修饰碳纳米管薄膜”和“金属/悬空还原氧化石墨烯薄膜/金属”两种薄膜型光电探测器的性能。(1)提出使用具有强红
肝星状细胞在力学刺激下会被激活,而肝星状细胞的活化被认为是肝纤维化形成的关键所在,所以研究肝星状细胞的活化机制对于肝纤维化的预防和治疗都具有关键作用。由于肝星状细胞在体内会受到肝窦细胞以及实质细胞等施加的局部刺激,但现有力学刺激及测量方法均不能满足在施加力学刺激的同时对细胞响应进行测量。磁性微柱阵列由于可同时作为驱动器和传感器成为细胞力学中十分有利的工具,但现有制备方法均有不足,且尚无使用磁性微柱
在光电子学中,伴随着能量释放的激子-激子湮灭是典型的非辐射复合现象。该现象会导致光致发光量子产率显著地下降,从而严重地降低了光电子器件的最大效率,所以在半导体制造中一般会对其进行严格抑制。近年来,科学家们提出了多种抑制方法,其中激光辐照法、引入缺陷法和施加应变法已经成为了抑制二维过渡金属硫族化合物中激子-激子湮灭的有效手段。然而,这是以损坏材料的原子结构为代价的,因此也限制了以上方法的实际应用。为
随着风电行业的迅猛发展,同时也暴露出风电机组故障及不良运行状态等一些突出问题,这些问题影响了风力发电效率,并且造成了极大的经济损失。风电变桨轴承作为风电机组传动系统和影响风电发电效率的关键部件,是发生故障频率较高的部位,提高对变桨轴承的振动监测能力已迫在眉睫。加速度作为振动中重要的监测参数,可以判断设备的安全运行情况,利用加速度传感器可以很好地实现对变桨轴承的振动监测。随着应用场景的复杂性,现有的
近年来,深度神经网络模型在计算机视觉、自然语言处理、语音识别等领域取得了令人瞩目的成果,推动了人工智能的发展。然而,为了处理日益复杂的智能任务,神经网络模型结构变得越来越深且越来越宽,其对应的参数量和计算量也在成倍增长,这对于神经网络模型的部署带来了巨大的挑战。大量的研究工作对神经网络模型的参数、结构、输入样本等进行了分析,尝试从不同的方向探索如何压缩模型的参数量以及减少模型执行的计算量。现有的深
拉曼光镊(Laser tweezers Raman spectroscopy,LTRS)是一种单细胞特性检测技术,它继承了光学镊子能够在液相环境中对透明微粒进行无损操控的能力以及拉曼光谱强大的检测分析能力。利用该技术可以实现在生理环境下对单个细胞的俘获与操控,同时完成对细胞分子化学结构的检测。在当前世界疫情严峻形势的大背景下,检验检疫是进行国际间贸易的必要环节,而血液的鉴别又是检验检疫流程中的重要
双足机器人相比于其他的移动机器人,其适应性和灵活性更强,在复杂的地面环境更容易实现稳定行走。对双足机器人的研究有助于探索人类行走的规律,为康复医疗器械和高危作业等方面的研究提供理论基础。Geyer所提出的双足弹簧负载倒立摆(Spring-Loaded Inverted Pendulum,SLIP)模型,相比于传统的刚性腿双足机器人模型,更能体现人类行走的主要特征,具有更低的能耗,和更加自然的行走步