基于骨骼定位的人体动作识别算法研究与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:jy860500
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为一种重要的信息传递方式,人体动作识别具有重要的理论研究价值,在智能家居、智能监控、视频游戏等领域有着广阔的应用前景。尤其是在更贴近日常生活的智能家居中,每个人都希望能够更加直观的操作家电,这种交互实现的前提就是计算机要能够通过观察动作理解人的意图。最初,动作识别技术的研究基于二维图像展开,但是由于二维图像缺少了一维距离信息,使得特征提取和表示受到很大的局限性,很难从中挖掘出更多的细节信息。所以有人基于二维图像进行三维重建,然而三维建模过程十分复杂。随着深度传感器的出现,结合深度图像和普通光学图像可以方便的获取三维场景信息,且避免了三维重构的复杂。基于上述分析,本课题使用微软提供的Kinect深度传感器,在其骨骼定位功能的基础上,设计适用于家居中的人机交互动作,对识别算法进行研究并实现。本文在了解Kinect SDK功能的基础上,重点研究其骨骼跟踪功能,利用API获取关节点三维数据并构建了人体骨架模型,这是后续研究的基础。基于骨架构建用于描述人体运动的特征模型是识别的关键步骤,所以本文针对人体结构特点构建特征向量,使用特征向量夹角和模比值的组合构建特征模型描述人体运动中的角度和相对位置变化,并使用数据集对特征模型的区分度和聚集性进行了验证。对于动作识别算法的研究是本文的重点。本文根据特征模型的特点选取了支持向量机(Support Vector Machine,SVM)算法用于动作识别。在对SVM原理了解的基础上设计识别流程,对其中的参数优化方法进行了仿真和比较,对比分析得出基于遗传算法的参数搜索速度最快。在算法应用阶段,本文设计了一个特征采集系统,并针对应用环境设计了一套应用于智能家居中的交互动作。将SVM方法应用于动作识别,经过特征数据提取、归一化、主成分分析、参数确定、训练过程后对动作数据进行测试分类,对优化前后的分类结果进行了分析,实现了对动作的准确分类。
其他文献
目前,不同的网络往往采用不同的语音编码标准,因此在两个异质网络之间进行语音通信时,需要将一种语音编码格式转换为另一种语音编码格式,即进行语音编码转换。传统的语音编码转换
对于部分下颌骨肿瘤需行颌骨部分切除,致使下颌骨缺损,从而造成形态缺陷与功能障碍,为了恢复下颌骨缺损骨的形态与功能,临床上多采用新鲜游离自体骨移植者居多,这不但给患者
本文对信源信道联合编码技术在图像无线传输中的应用进行了研究,提出一种基于不等差错保护,并与码率的动态分配机制有机结合的信源信道联合编码的方案。本文的主要内容包括:
腮腺涎瘘主要发生在腮腺区手术和损伤后,包括导管瘘和腺体瘘.对腮腺导管瘘一般多主张手术治疗.对腮腺腺体瘘治疗方法多样.我科采用表皮生长因子局部涂布并加压包扎十例腮腺腺
目的:观察不同剂量舒芬太尼应用于胆囊切除手术后病人静脉自控镇痛中的镇痛效果及副反应情况.方法:60例择期胆囊切除手术病人,随机分为A组、B组和C组,术后行静脉自控镇痛舒芬
WiMAX是一项基于IEEE 802.16标准的宽带无线接入城域网(Broadband Wireless Access Metropolitan Area Network,BWAMAN)技术,其基本目标是提供一种在城域网一点对多点(PMP)的
目的:评价地塞米松复合吗啡在开胸术后病人硬膜外自控镇痛(PCEA)的临床效果.方法.45例ASAⅠ~Ⅱ级择期开胸手术病人,随机分为3组.对照组(A组,n=15);术前地塞米松组(B组,n=15):
临床上,盆腔手术要求麻醉时间长,肌肉完全松驰,单纯腰麻或硬膜外麻醉难以完全满足手术要求.近年来,我们采用蛛网膜下腔麻醉(SA)和连续硬膜外腔麻醉(CEA)联合阻滞应用于子宫全
随着电子技术的不断发展,无线电业务的应用领域迅速扩大,这对目前空中无线电频谱的管理和监测提出了新的挑战,无线电管理部门必须进一步加强对无线电波的管理和监测,不断扩大无线
目的:观察低钙透析液(DCa1.25)联合钙拮抗荆(可力洛)对终末期肾病血液透析患者冠状动脉钙化的影响.方法:60例血清矫正钙≥9.5mg/dl且iPTH≤150pg/ml患者随机分为DCa1.25mmo/L