基于多视角拉普拉斯图的RGB-D情绪识别

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:cdl872
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类的情绪识别技术是目前人机交互,计算机视觉与模式识别领域一个重要的研究领域。在该领域已经有较多出色研究。现有研究多数是基于单一视角进行的,例如基于生理信号的情绪识别,基于语音的情绪识别,基于RGB图片或视频的情绪识别。然而在许多情绪识别场景中,人的情绪可以从多个角度、甚至通过多种传感器得到观测,因此近年来多视角学习已经与情绪识别越来越多地联系了起来,如何统一地充分利用不同视角提供的丰富信息且克服其差异性,是这类研究的重点和难点。多视角学习又被称为数据融合或数据整合,主要包含三类方法:联合训练,多核学习与子空间学习。作为一类被广泛研究的算法,子空间学习认为不同视角下分布的数据来自不同的空间,且这些空间均由一个潜在的公共子空间获得,子空间学习的目标就是获取该公共子空间且得到各视角样本在公共子空间中的表示。另一方面,RGB-D摄像机近些年在工业界和各类室内场景中得到了广泛应用。RGB视角关注于常规的色彩变化与差异,Depth视角关注于空间信息与深度,RGB视角与Depth视角在情绪识别方面的联合运用有着很强的必要性和重要性,然而这方面的研究目前还较少。基于以上,为了将RGB视角与Depth视角充分联合并运用于情绪识别领域,本文对基于拉普拉斯图的子空间学习方法进行了探索。在对经典子空间学习及维数约减方法深入分析研究的基础上,本文取得了如下创新成果:(1)MvLE(Multi-view Laplacian Eigenmaps)基于拉普拉斯图将拉普拉斯特征映射(LE)扩展到多视角和有监督形式,并提出其Out-of-Sample方法,应用于RGB-D情绪识别。提出样本近邻标签袋(Bag of Neighbors,BON)模型用于度量RGB视角与Depth视角的相似性和差异性,构建全局拉普拉斯图来记录两个视角中所有样本相互之间的距离,并寻找可以保持样本间距离关系的最佳子空间。为延续良好的非线性性,使用双隐层网络对其进行Out-of-Sample扩展。该方法也适用于更多视角的应用场景。(2)MvLLS(Multi-view Laplacian Least Squares)基于拉普拉斯图将偏最小二乘(PLS)扩展到多视角和有监督形式,并提出其Out-of-Sample扩展,应用于RGB-D情绪识别。该方法使用BON判断样本之间的联系性,为了尽量保持原始样本的分布特性,使用降维(DR)方法将其统一到相同维度进行度量并建立全局拉普拉斯图。该方法中运用迭代法获得了良好的鲁棒性,还可在运算中估计子空间的本征维度。为保持样本在原始空间分布的局部特性,并且构建了基于局部线性嵌入(LLE)的Out-of-Sample方法。该方法同样适用于更多视角的应用场景。两种方法均具有很好的可扩展性和鲁棒性,甚至可以在不同视角样本数量不同或类别数量不同的情况下正常运行。综上,本文主要提出了两种基于拉普拉斯图的子空间学习方法及其Out-of-Sample方法用于RGB-D情绪识别,并将传统LE和PLS扩展到多视角场景。实验结果表明,相比于同类型方法,本文的工作具有良好的鲁棒性,并且具有较好的可扩展性,可以有效描述并保持局部关系和类别判别关系,而且样本在所得子空间中的低维表示具有良好的分类特性。
其他文献
自2015年实验上观察到光子Lieb晶格中的光局域态以来,Lieb晶格因其存在平坦色散带而逐渐引起诸多学者的关注。平带光子晶格即在紧束缚近似下拥有平坦能带的光子晶格,其特殊拓
随着多媒体信息的爆发式增长,人们对多媒体检索的效率和准确率要求越来越高。在多媒体检索过程中,多媒体对象特征提取是所有检索方法的基础。而特征的长度决定了大多数检索算
随着现代保险行业业务范围的拓宽,保险在当今社会已经发展成为一股重要的力量,与经济的联系越来越紧密。然而,保险行业是一个风险高的行业,存在着信用风险、流动性风险、利率
货币金属(CuI、AgI、AuI)因为有独特的d10电子构型,可以抵抗金属间的相互作用力,增强金属间的相互作用,因此可以构筑多样的金属簇合物。由于Cu(I)离子在空气中容易被氧化、自组装过程难以控制等原因,炔铜(I)簇的构筑有待进一步发展。我们利用不同的合成方法,构筑了一系列的炔铜簇,并通过单晶X射线衍射确定了其结构。研究的主要内容有:(1)利用归中反应的方法,以Cu(II)盐、Cu(0)粉末和叔
近年来,随着计算机性能的不断提升与互联网文本所蕴含的信息的快速增长,将Web信息结构化、知识化,构造由概念、实体、关系所构成的语义网络——知识图谱,并基于此构建自动问
互联网的普及给人们的生活带来了巨大地改变。现如今,在社交平台上分享自己的日常动态成为人们生活的一部分,但由于用户疏漏等原因,这种分享行为背后,有时会造成个人隐私泄露
自1972年光催化产氢现象被发现以来,半导体光催化技术被看做是应对能源危机与环境污染这两大全球性挑战的最重要手段之一。为推动光催化产业的规模化、工业化,有必要对光催化材料的制备、表征及其基本原理进行深入的研究与探索。基于火焰喷雾热解技术(FSP)在制备纳米催化剂方面具有快速、可控、高通量等优点,但两相甚至多相结构催化剂的火焰合成与调控仍是亟待解决的难题。本文首先采用FSP合成了具备高产氢活性的Cu
随着信息社会的到来,公民享受着个人信息所带来的便捷服务,同时也有着信息被泄露的担忧。信息一旦被泄露,随之而来的是网络诈骗、敲诈勒索等相关犯罪,严重危害公民的人身安全
由金属配位键构建的配位分子容器具有的独特内空腔结构,可以为客体的包容提供特殊化学微环境,使其具有许多独特的应用,例如:小分子传输、气体存储和分离、传感、催化以及客体
土壤碳库是陆地生态系统最重要的碳库之一,其微小的变化都可能对全球气候产生重大影响。森林土壤的碳氮循环过程与其林下植被相互影响,研究林下植被和土壤之间的相互作用如何影响森林土壤碳储存具有重大意义。因此,本研究以亚热带常绿阔叶林和寒温性针叶林为对象,通过去除森林地面苔藓植物,来探究其土壤理化性质,土壤有机碳(SOC)及微生物磷脂脂肪酸(PLFAs)特征,为森林土壤的碳氮循环过程及影响因素提供科学依据。