基于人体三维骨架特征的动作识别算法研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:Pinger605
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算机视觉领域中,视频人体动作识别技术的研究是相当重要的,具有极大的挑战性。深度图像技术的发展,特别是能获取深度信息的Kinect深度摄像头的出现,为人体动作识别提供了新的解决思路和方案。研究人员可以快速准确地从深度图像获取骨架关节的三维位置,还原人体的三维骨架模型。本文基于人体骨架模型,提出了两种基于人体三维骨架特征的动作识别算法。两种方法分别基于特殊正交群以及特殊欧氏群,创新性地提取了时空维度上的不同人体部位特征,进行了相应特征优化和特征融合,利用不同的分类方法成功实现了三个数据库上人体动作的精确识别。论文具体工作和创新点如下:(1)本文提出了基于特殊欧氏群的前向特征融合动作识别算法。该算法利用特殊欧氏群中的矩阵来表示人体三维骨架任意一对身体部位的相对位置关系,提取相对几何速度(RGV)特征。然后,该算法利用前向特征融合的方法,形成最终的运动骨架时空描述子(STMSD)。经过特征优化之后,该算法把样本数据送入SVM模型进行分类。(2)本文提出了基于特殊正交群的后期特征融合动作识别算法。该算法利用特殊正交群中的矩阵来表示人体三维骨架任意一对身体部位的相对旋转关系,提取相对旋转速度(RRV)特征。经过特征优化之后,该算法将RRV和相对关节位置(RJP)、关节角(JA)进行后期特征融合,即针对三种特征分别训练三个SVM,加权结合三个模型的预测结果得到最终分类结果。(3)本文在特征优化流程的设计上也做出了一定的贡献。特征优化流程主要包含三个过程,分别是特征处理,时间建模和降维。特征处理通过插值和归一化的处理,可以得到具有相同时间长度的数据样本,规范化数据。时间建模利用动态时间规整(DTW)或者傅里叶时间金字塔(FTP)进行处理。动态时间规整对动作序列进行配准,减少数据噪音。傅里叶时间金字塔移除高频傅里叶系数,更好描述动作时间结构。最后,降维通过主成分分析(PCA),实现精确度和效率的平衡。
其他文献
在如今信息爆炸的互联网时代,信息检索的重要性不言而喻。我们几乎每时每刻都在进行着信息检索。比如在搜索引擎上查询网页,在视频网站上观看视频,在论文库里寻找论文。一个好的搜索引擎能够直接检索出我们想要的结果,从而避免人们花费大量的时间寻找自己想要的信息。而对于搜索引擎而言,最重要的部分就是排序模型,排序模型将结果依次排序,把相关度最高的信息排到前面。本文旨在提出一种新的学习排序模型,能够学习出最优的排
随着我国经济进入结构性减速通道,经济增长进入“新常态”,航运市场面临新的挑战,银行、财团等金融机构纷纷减少对于船舶企业的融资业务,仅有的业务也大多面向国有大型船东。对于中小航运企业来说,资金压力日益加重。然而这些企业却有着大量的融资需求,这对于主要服务于中小航运企业的独立第三方融资机构而言是新的业务增长点。如何克服自身的劣势,规避市场风险,通过提升竞争力为广大中小航运企业解决融资难的问题,同时也使
【目的】随着近年来内镜技术的进步,鼻内镜应用于甲状腺相关性眼病(Thyroid Associated Ophthalmopathy,TAO)眶减压术的优势不仅达到微创、安全、有效,大众知识的普及使患者相较于传统眶减压术外进路下操作的手术接受度较高,这也是鼻内镜眶减压术近年来普遍化的可能原因之一。希望借由鼻内镜眶减压术的优势,在TAO患者的病程中能够尽早干预,力求在出现危重症状或需要紧急手术之前的时
随着抖音、豆瓣、微博等兼具社交性质和媒体性质的社交媒体平台的兴起,如何解决这些平台上的“信息过载”问题成为了个性化推荐的发展方向之一。传统的协同过滤算法只考虑了用户评分的相似度,存在比较严重的“冷启动”问题和稀疏性问题。而一方面,用户社交关系能帮助我们更好地发掘用户之间的相互关系;另一方面,引入“用户-标签”信息有利于挖掘用户的潜在兴趣偏好。基于以上分析,本文希望通过同时引入社交网络信息和项目标签
有一天,小狐狸散步的时候,在路边看见了一颗闪光的白石子。小狐狸很高兴,心想:我每天都捡一个漂亮的小东西回来,放到箱子里,让它成为一个百宝箱。第二天,小狐狸捡到了一个漂亮的蝴蝶结。第三天,除了一个从树上掉落的松球,路上没有别的什么好东西。第四天,小狐狸捡到了一粒纽扣。第五天,他捡到了一面小圆镜。小箱子里的东西渐渐堆满了。森林里的小动物们纷纷跑来打听。
期刊
目的分析声带真菌感染的临床特征。方法回顾性分析7例声带真菌感染患者的临床资料。结果 7例患者症状均为声音嘶哑,术前喉镜检查发现新生物位于右侧声带2例,左侧声带2例,双侧声带前段者3例;5例新生物呈灰白色隆起,2例为光滑新生物;5例局部麻醉纤维喉镜下行声带肿物摘除,2例全身麻醉支撑喉镜下行声带肿物切除;7例患者术后声音恢复好;术后组织病理检查诊断均为真菌感染,其中1例合并细菌感染;随访1~4 a,均
针对摘钩作业时间短,需要在机器人和车厢同步时准确识别目标把手和测距的问题,提出使用双目立体视觉技术配合机械臂自动摘取车钩的方法并对视觉部分进行深入研究:通过图像预处理和模板匹配技术识别目标把手,在利用特征检测和匹配算法恢复双目摄像机间的位姿信息,并对双目摄像机的位姿信息进行校正.为了克服立体匹配时光照不均的影响,提出了基于局部融合的立体匹配算法获取视差图,最后使用三角测量计算列车分解区域中目标把手
近年来,从医学图像中提取描述图像的定量特征来为临床问题提供决策支持的做法,受到了广泛的关注;这种方法被称为影像组学。通过与统计分析、机器学习等方法相结合,影像组学能够有效地应用于计算机辅助诊断系统,提高诊断、预后的标准化和准确性。本论文首先研究了影像组学特征的快速计算方法,在CUDA平台上开发了基于GPU(Graphics Processing Unit)的影像组学特征快速计算工具cu Radio
目前冠状动脉相关的疾病已成为威胁人类健康的主要疾病之一,呈现高发病率和死亡率。而冠脉微循环功能障碍是诱发这些疾病的重要因素。临床上根据微循环功能障碍的程度来确定治疗过程中的给药策略或者判断是否需要手术等。微循环功能评估是临床治疗的基础,临床医生常通过对冠脉造影图像的定性观察、手动测量或者利用磁共振成像等手段来评估。前者精度不高,后者操作复杂费用昂贵。冠脉造影是常用的冠脉疾病的诊疗手段,通过对冠脉造
那年冬天,我在浙江绍兴遇见了一群热心人。我们去公园玩,没想到在一个转弯处汽车突然倾斜了,哥哥赶紧刹车,往后倒车,汽车却不动。姐姐下车一看,叫道:“一边轮胎卡在台阶下了!”我们赶紧下车查看。这时,好几个路人围上来说:“经常有外地车卡在这里,每次都是我们帮忙推车。”说着,他们马上召集了附近的一群好心人,大家齐心协力帮助我们推车。大伙儿弓着腰,后腿绷直,使出了全身的力气,哥哥也发动了车,小心地往后
期刊