基于RGB-D图像序列的人体行为识别研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:zy198187
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体行为识别在智能监控、人机交互、虚拟现实、视频检索等方面有广泛的应用前景,而受到学术界和工业界的广泛关注。传统的基于可见光(RGB)图像序列的人体行为识别极易受到光照变化、阴影以及复杂背景等因素的干扰。随着价格低廉以及容易操作的彩色-深度(RGB-D)摄像机(Kinect)出现,越来越多研究学者将Kinect所采集的深度(Depth)图像用于人体行为识别研究。与RGB图像相比,Depth图像对光照、阴影以及其它环境变化不敏感,但是Depth图像缺乏足够的颜色、纹理信息。因此,利用RGB和Depth图像之间的互补特性能够显著提高人体行为识别的精度和鲁棒性。而RGB和Depth图像的结合也为人体行为识别带来新的挑战,如不同模态图像之间潜在的语义关联性、互补性以及它们的显著差异性、表达内容多样性等。面对以上挑战,国内外研究学者围绕RGB和Depth图像的融合开展人体行为识别的研究。然而,现有的行为识别方法仍存在以下问题:(1)传统底层特征方法由于需要人工设计,使得其对行为数据拍摄场景、光照、姿态等因素的泛化能力不足,同时由于不同模态图像表现差异,使得RGB底层特征对Depth图像中目标的纹理、边缘、形状等描述能力不足;(2)非流形学习的多模态关联表达方法忽略了多模态数据间的拓扑结构,导致学习到的联合表达不能充分表达原始多模态数据间的语义关联;(3)已有的深度学习方法需要构造远大于原样本数量的样本对来学习RGB和Depth模态数据间的语义关系,从而使得获取语义一致表达的过程复杂且耗时。针对上述问题,本文将RGB与Depth图像之间的语义相关性作为潜在信息,以关联学习为切入点开展了 RGB-D人体行为识别研究。论文的主要研究内容和创新工作如下:(1)在特征提取阶段,提出了一种基于耦合二值特征学习和关联约束的RGB-D行为特征提取方法。首先针对传统3D LTP无法获得持续变化的时空外观信息和运动信息,基于多个相邻帧的像素值变化研究了一种三维像素差(深度差)向量计算方法。其次,在提取的像素差和深度差向量基础上,针对传统三维二值特征的泛化能力和在Depth图像上的描述能力不足问题,在耦合二值特征学习算法中加入新的关联损失项,减小二值特征在RGB和Depth图像上的差异。在三个RGB-D数据集(包含几百个样本数据)上的实验结果表明,基于学习到的局部二值特征和VLAD编码方法得到的全局时空纹理特征对拍摄场景固定、较少类内变化的行为具有显著识别性能。(2)在特征表达阶段,提出了一种基于多图约束的RGB-D多模态特征联合表达方法。针对同一行为的RGB和深度模态数据具有相同的语义信息问题,本文提出一种双层非负矩阵分解方法将RGB和Depth图像的多种特征分解到同一个共享语义子空间。针对样本在不同模态数据间存在的拓扑结构,利用稀疏表示模型和图相似度理论创新性地提出两种稀疏图构造方法,并将稀疏图正则约束加入到双层非负矩阵分解模型。通过在四个不同规模的数据集上进行实验,验证了该多模态特征联合表达方法不仅能有效提升单一的RGB或Depth图像序列下多种复杂人体行为的识别性能,也能用来区分RGB-D图像序列下多个相似的人体行为。(3)在行为识别阶段,提出了一种基于双流Siamese网络的RGB-D行为识别方法。为了能够解决人体行为在同一模态和不同模态下的类内差异、类间重叠问题,本文基于Siamese 3D CNN和对比损失函数提出一种跨模态深度特征的语义度量方法。针对Siamese网络和对比损失需要构造大量样本对和训练时间过长问题,引入类内参照样本,并基于距离关系的传递性设计了两种中心对比损失函数。通过在NTU RGB+D数据集以及两个RGB-D手势数据集上的实验,验证了所提出的Siamese 3D CNN能够用来识别多重类内变化因素(拍摄视角、光照、拍摄背景)下的人体行为或动作。同时相比于传统的对比损失函数,基于中心对比损失函数的Siamese 3DCNN在计算速度上有着巨大优势。本文提出的RGB-D行为特征提取及表达方法从不同角度解决了当前RGB-D行为识别中存在的问题,不仅提升了人体行为在RGB和Depth模态下的语义一致表达,而且显著提高了 RGB-D行为识别的性能。此外,本文的研究成果对多模态数据的语义一致性研究是一种很好的探索和尝试,为跨模态数据的语义探讨提供了重要参考。
其他文献
目的 研究左心房(LA)相关CT参数对心房颤动射频消融术后复发的预测价值.方法 选择2019年5月~2020年5月接受射频消融治疗的80例房颤患者,随访术后1年房颤复发情况并分为复发组(n=28)和未复发组(n=52).比较两组患者术前LA容积(LAV)、LAA容积(LAAV)、LAA开口面积(LAA CSA)、右上PV开口面积(RSPV CSA)、右下PV开口面积(RIPV CSA)、左上PV开口面积(LSPV CSA)、左下PV开口面积(LIPV CSA)的差异,采用ROC曲线分析不同指标对房颤复发的
目的 研究分析磁共振神经突定向扩散与密度成像(NODDI)联合T2*加权磁敏感动态增强灌注加权成像(DSC-PWI)对脑胶质瘤分级诊断的临床价值.方法 选取2019年12月~2021年5月我院临床高度怀疑胶质瘤并术后病理明确的患者29例作为研究对象,其中Ⅱ级及以下为低级别胶质瘤(LGG)共12例,Ⅲ级、Ⅳ级为高级别胶质瘤(HGG)共17例.患者于干预措施前行常规MRI扫描、NODDI及DSC-PWI扫描,利用后处理软件获取患者NODDI各参数图[神经突内容积比(ICVF)、神经突起方向分散程度(ODI)和
纤维化或纤维化相关的细胞外基质异常聚集是组织慢性损伤的常见结果.由于无创早期诊断技术的敏感性和特异性偏低,而且缺乏无创的纵向评估纤维化疾病进展的方法,以及目前为止对于纤维化治疗的临床终点仍无定论,从而导致纤维化疾病临床管理进展受阻.因此,开发对纤维化和纤维化进程监测的无创性影像学新方法是满足临床需求的有效手段.笔者将以用于通过磁共振成像(MRI)、正电子发射断层扫描(PET)和单光子发射计算机断层扫描(SPECT)对纤维化和纤维化进程监测为目的开发和使用的显像剂进行总结.
卵巢扭转(ovarian torsion)是妇科常见急腹症之一,指卵巢及血管蒂沿悬韧带完全或部分旋转导致血供受损.早期诊断、及时解除扭转对保留输卵管、卵巢功能,减少并发症有重要意义[1].本文报道一例剖宫产术后纤维粘连带致卵巢嵌顿合并蒂扭转,分析其 MR 表现及临床病理学特点并复习相关文献,加深对卵巢蒂扭转的认识.
肝脏是罕见的异位妊娠(ectopic pregnancy)部位,其发生率极低.由于肝脏特殊的生理解剖结构,肝脏异位妊娠可引起肝区疼痛、肝破裂,甚至失血性休克.笔者回顾性分析一例肝脏异位妊娠患者的临床及影像资料,以提高对该病的认识.rn病例资料 患者,女,28 岁,因右上腹疼痛十余天,加重 1 d 入院.无恶心、呕吐,无黑便、便血等,自诉停经 30余天.查体:右上腹压痛,无明显肌紧张和反跳痛.肝区叩痛.妇科检查未见阴道流血、流液,无肛门坠胀感.一周前曾两次至当地医院就诊,彩超提示肝回声不均匀,肝内未见异常病
期刊
肝脏未分化胚胎性肉瘤是一种罕见的高度恶性肿瘤,儿童多发,术前影像学特征及肿瘤标注物检查缺乏特异性而诊断困难,确诊主要依靠术后病理.现报道 1 例并进行复习文献,旨在提高对儿童肝脏肿瘤的认知.rn病例资料 患儿,男,10 岁,因剑突下疼痛半个月余入院.为间断性隐痛,不向他处放射,伴有头晕、纳差,偶有恶心、呕吐,呕吐物为胃内容物.专科检查:皮肤巩膜无黄染,肝右肋缘下 2 cm 可扪及,剑突下可扪及包块,大小约11.0 cm×10.0 cm,质硬,触压痛(+),无反跳痛,活动度差,移动性浊音(-).
病例资料 患者,女,65 岁,2 个月前无明显诱因下出现咳嗽,胸骨下轻微疼痛,无咳痰咳血等,自行口服止咳药未见好转.遂于当地医院行CT 检查示胸腺区域肿块,考虑胸腺瘤可能.为求进一步诊治,遂来院收治入院.rn影像表现:CT 增强显示前纵隔胸腺区域肿物,大小约4.0 cm×3.0 cm,密度尚均匀,形态不规则,可见分叶,平扫约53 HU ,增强后约 86 HU ,包膜欠光整,周围脂肪间隙模糊(图 1a、1b ) ,肿块局部与主肺动脉血管壁分界不清,与心包上缘分界不清,肿块上缘包绕侵犯左侧锁骨下静脉及左侧颈内
临床资料 患者,女,23 岁,视物模糊、重影1 个月余.rn现病史:1 个月前出现视物模糊在外院就诊.脑脊液:白细胞 40×106/L,单核细胞 88%;蛋白 75.6 mg/dl,隐球菌、革兰氏染色、抗酸杆菌未发现.入院后行头颅及眼眶MRI 增强:未见明显异常;胸部CT 示右肺上叶前段结节,性质待定.鼻咽MRI 示鼻咽黏膜增厚,双侧咽后及颈鞘血管旁多发淋巴结显示,部分肿大.鼻咽肿物病理:局部鳞状上皮乳头状瘤样增生伴细胞轻度非典型增生.临床诊断左侧外展神经麻痹,予激素冲击治疗,患者眼球外展较前好转.出院后
期刊
近年来,随着互联网技术的蓬勃发展,海量有价值的图或网络数据不断涌现。图中的节点或边之间普遍存在较强的关联性,例如,社交网络中用户间的消息传递,网络安全中网络节点间的攻防对抗,文献引用网络中文献间的引用等。该关联性可被表示为“序列模式”,针对其的挖掘研究具有重要的科学价值,不但能够总结出关联特性及分布规律,并用于分类、预测等实际应用场景;而且能够与图结构特征相结合,进而可提升图计算的效率与精度。基于
近些年,互联网作为底层的基础设施也正在经历着重大的技术变革。为了能够保证在互联网之上运行各种各样的创新型应用程序,研究学者提出了网络虚拟化技术。利用网络虚拟化技术,能够对底层物理网络设施中包括计算、网络、存储以及频谱等多维异构资源进行抽象池化,支持以按需服务的方式为各种各样的终端用户提供满足一定服务质量的网络服务。虚拟网络映射问题是网络虚拟化技术中的核心问题之一,其主要目的在于在有限的物理网络资源