【摘 要】
:
人脸表情信息在人类日常交流沟通中扮演极为重要的角色,人们通过分析表情信息了解对方的情感与状态。随着现代信息技术的发展,机器学习、图像处理、人工智能等领域的研究得到了很大的突破,越来越多的软件应用和生活场景开始对人脸情感的自动识别产生了需求。目前的机器学习算法对人脸表情的初步判定已经有了很好的结果,但是仅仅简单地获取人脸喜怒哀乐的信息并不足够,更多的脸部肌肉细节和表情强弱程度正被需要。脸部动作编码系
论文部分内容阅读
人脸表情信息在人类日常交流沟通中扮演极为重要的角色,人们通过分析表情信息了解对方的情感与状态。随着现代信息技术的发展,机器学习、图像处理、人工智能等领域的研究得到了很大的突破,越来越多的软件应用和生活场景开始对人脸情感的自动识别产生了需求。目前的机器学习算法对人脸表情的初步判定已经有了很好的结果,但是仅仅简单地获取人脸喜怒哀乐的信息并不足够,更多的脸部肌肉细节和表情强弱程度正被需要。脸部动作编码系统(FACS)为人脸表情信息提出脸部动作单元的概念(AU),前人的各种方法在AU强度的检测上没能获得很好的结果,这些方法包括神经网络分类算法、聚类算法和稀疏表示算法等等,主要原因在于AU强度各级别之间的区分度较低且个体之间的人脸差异较大。同时,高强度的AU样本量过少也是阻碍这些方法发挥效果的原因之一。为更好的解决上述这些问题,本文充分挖掘了AU激活和AU之间较强的相关特性,在特征提取阶段提出了一种新的基于区域和特征融合的特征提取方法。本文对每个AU针对性地选择出相关性较强的区域,对该AU的特征提取只在相关性强的区域中进行。同时作为补充,我们通过数据分析考察AU之间的相关性,对相关性较强的AU的对应区域也进行特征提取。在强度估算阶段本文提出了一种新的AU强度计算方法,即先对高AU强度样本和零AU强度样本进行一次SVM二分类得到分类超平面,然后根据待测样本到分类超平面的距离通过有序回归判断AU最终的强度。该AU强度计算方法不仅利用了强AU和弱AU之间较强的可分性,而且考虑了不同AU强度间的递进相关性,充分发挥了分类和回归方法在AU强度检测方面的优势。在DISFA、FERA2015数据集上的实验结果表明,本文方法具有可行性和鲁棒性,其AU强度的计算效果优于当下的各类神经网络。
其他文献
目的分析声带真菌感染的临床特征。方法回顾性分析7例声带真菌感染患者的临床资料。结果 7例患者症状均为声音嘶哑,术前喉镜检查发现新生物位于右侧声带2例,左侧声带2例,双侧声带前段者3例;5例新生物呈灰白色隆起,2例为光滑新生物;5例局部麻醉纤维喉镜下行声带肿物摘除,2例全身麻醉支撑喉镜下行声带肿物切除;7例患者术后声音恢复好;术后组织病理检查诊断均为真菌感染,其中1例合并细菌感染;随访1~4 a,均
针对摘钩作业时间短,需要在机器人和车厢同步时准确识别目标把手和测距的问题,提出使用双目立体视觉技术配合机械臂自动摘取车钩的方法并对视觉部分进行深入研究:通过图像预处理和模板匹配技术识别目标把手,在利用特征检测和匹配算法恢复双目摄像机间的位姿信息,并对双目摄像机的位姿信息进行校正.为了克服立体匹配时光照不均的影响,提出了基于局部融合的立体匹配算法获取视差图,最后使用三角测量计算列车分解区域中目标把手
近年来,从医学图像中提取描述图像的定量特征来为临床问题提供决策支持的做法,受到了广泛的关注;这种方法被称为影像组学。通过与统计分析、机器学习等方法相结合,影像组学能够有效地应用于计算机辅助诊断系统,提高诊断、预后的标准化和准确性。本论文首先研究了影像组学特征的快速计算方法,在CUDA平台上开发了基于GPU(Graphics Processing Unit)的影像组学特征快速计算工具cu Radio
目前冠状动脉相关的疾病已成为威胁人类健康的主要疾病之一,呈现高发病率和死亡率。而冠脉微循环功能障碍是诱发这些疾病的重要因素。临床上根据微循环功能障碍的程度来确定治疗过程中的给药策略或者判断是否需要手术等。微循环功能评估是临床治疗的基础,临床医生常通过对冠脉造影图像的定性观察、手动测量或者利用磁共振成像等手段来评估。前者精度不高,后者操作复杂费用昂贵。冠脉造影是常用的冠脉疾病的诊疗手段,通过对冠脉造
那年冬天,我在浙江绍兴遇见了一群热心人。我们去公园玩,没想到在一个转弯处汽车突然倾斜了,哥哥赶紧刹车,往后倒车,汽车却不动。姐姐下车一看,叫道:“一边轮胎卡在台阶下了!”我们赶紧下车查看。这时,好几个路人围上来说:“经常有外地车卡在这里,每次都是我们帮忙推车。”说着,他们马上召集了附近的一群好心人,大家齐心协力帮助我们推车。大伙儿弓着腰,后腿绷直,使出了全身的力气,哥哥也发动了车,小心地往后
在计算机视觉领域中,视频人体动作识别技术的研究是相当重要的,具有极大的挑战性。深度图像技术的发展,特别是能获取深度信息的Kinect深度摄像头的出现,为人体动作识别提供了新的解决思路和方案。研究人员可以快速准确地从深度图像获取骨架关节的三维位置,还原人体的三维骨架模型。本文基于人体骨架模型,提出了两种基于人体三维骨架特征的动作识别算法。两种方法分别基于特殊正交群以及特殊欧氏群,创新性地提取了时空维
随着公路通车里程的增长与汽车数量的增加,交通事故导致的伤亡与损失的数量也急剧上升。其中有很大比例是因驾驶员的疏忽造成汽车偏离车道。车道偏离警示系统(Lane Deflects Warning System)因会提前预测偏离并警告驾驶员,可大大降低此类事故的发生率而正在成为国内外研究和开发的重点。本文论述的题目是基于图像的车道偏离警示系统的设计与实现,本文的主要工作包括以下几方面:在车道偏离警示系统
在计算机图形学领域,对于动物的毛发以及人的头发的模拟仍然是一个非常前沿并且具有挑战性的工作。这主要是由于在模拟环境中往往需要对数十万根头发进行模拟,同时要保证各自的运动特性以及考虑头发和头发之间的交互碰撞。传统的交互毛发解决方案上往往通过运用简化的动力学表征或者降低整体的模拟自由度来达到保证模拟的实时性。在本篇论文当中,我们提出一种实时地、基于GPU通用计算的毛发模拟方法。该方法旨在高效地模拟毛发
随着科技领域的发展,人类对大规模数据处理的需求越来越高。无论是图象数据,文本数据,语音数据,还是其他类别的数据,计算机通常都是将数据向量化再进行处理。由于此类数据的海量性和高维度性,使得处理起来困难,计算代价高。因此诞生了很多算法用于解决这个问题。流形学习就是一种研究在流形假设下的机器学习问题的方法,它通过学习数据样本的空间结构信息实现对数据的降维处理。本文分别利用流形学习和张量表示改进传统的非负