双模态语音识别的视频特征快速提取方法研究

来源 :长春理工大学 | 被引量 : 0次 | 上传用户:oo789458
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
双模态语音识别技术已成为国内外研究热点,通过将唇动信息加入到原有语音识别系统中,以提高语音识别率。本文重点研究双模态语音识别技术中视频特征的快速提取方法,采用了局部限制模型的方法(CLM)来实现。首先建立唇部形状模型,对数据库的唇部进行标定,然后对标定数据进行Procrustes分析,并利用主成分分析算法(PCA)对Procrustes后的数据进行分析,建立唇部形状模型。其次,建立了唇部强度模型,在标定特征点周围提取图像作为训练数据,用线性支持向量机对数据进行训练来建立强度模型。最后,利用建立的模型对测试图像唇部进行特征提取。实验结果表明,CLM可实现唇部特征的提取工作,选用的19个特征点唇部标定方案相比以往标定方法可更快速地提取唇部特征。
其他文献
电力系统无功优化问题是系统安全、经济运行应解决的主要问题。无功功率的优化能有效地降低网损,改善电压质量,从而协调和统一电力系统稳态运行情况下的安全性、经济性和电能质量要求。本文阐述了有功网损及电压水平与无功功率间的关系;简单介绍了发电机、并联电容器、静止无功补偿器等常见的无功控制装置;建立了以静态电压稳定裕度最大、有功网损最小、节点电压平均偏移量最小为目标函数的多目标无功优化的数学模型。介绍了生物
遥感图像变化检测技术是指对同一地区不同时相获取的遥感图像进行分析、处理,找出变化差异并进行评估的过程。遥感图像变化检测技术作为遥感图像解译的主要技术之一,已经广泛应
近年,使用视觉信息和算法对物体运动的捕获技术已经成为开展科研、实验验证、远程医疗、体育训练以及电影制作等领域的重要技术。但是,由于常规视觉信息缺乏鲁棒性,使得测量
单帧图像超分辨率重建是以一幅低分辨率图像作为输入,使用信号处理技术重建一幅高分辨率图像的过程。基于学习与基于重构的方法是两类十分有效的单帧图像超分辨率重建方法,本文
在我国船舶工业的发展过程中,船用曲轴质量的好坏直接影响船舶的安全和可靠性,因此船用曲轴被称为船舶发动机的“动脉”。船用曲轴是由镦锻装置来制造,精确控制左右哈呋模具
随着能源的日趋消耗,风能和太阳能等清洁能源和可再生能源被越来越多地得以利用。风力发电技术的逐渐成熟,使得风能被越来越多的国家关注并投入开发。变频技术作为风力发电的关
伴随着公共事业(水、电、燃气)在中国的蓬勃发展,老百姓对生活环境提出了更高的要求;在政府政策的鼓舞下,家居智能化得到了高速的发展。作为智能化产业链中的一环——智能抄表系
本文主要研究了图像重构的相关问题,包括图像插值、图像超分辨以及图像去块。本文针对图像超分辨问题和图像去块问题做了三个方面的工作,包括基于非局部残差增强的图像插值方法
近年来,多目标优化问题吸引了越来越多不同背景的研究人员的注意力。而应用中的大多数多目标优化问题往往是随时间动态变化的,这类问题被成为动态多目标优化问题。由于动态多目
本文主要基于按摩手法中的生物力学知识,利用压力分布测试系统,以按摩手法中典型的一指禅,滚法和掌按法为研究对象,采集按摩手法的力和压强等数据。首先通过采集大量的专家数