唇读发声器中视觉信息的检测与处理

来源 :天津大学 | 被引量 : 0次 | 上传用户:huyuszsz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为恢复那些后天致残、但仍然具有正确唇形特征语言残障者的语音表达能力,探索建立一个基于视觉信息的唇形识别发声系统,本研究把从嘴唇图像序列中提取的视觉信息作为一种特殊语言加以分析识别。在研究中,对视觉信息检测与处理中的一些基本问题,如视觉信息与语音信息的对应关系,嘴唇区域和唇形轮廓所包含的信息量,最佳唇读系统特征向量的选取,以及自动有效地提取与识别唇形特征的方法进行了深入分析。论文的主要研究内容包括:1.通过分析正面和侧面视角下人脸图像的特点,建立一种新的非对称唇形轮廓描述模型,其中既包含嘴唇高度、宽度等信息,又包含嘴唇突出度信息,同时计算各个参数对时间的导数,来获得唇形轮廓的动态信息,通过组合不同的特征参数,分析参数选择对识别效果的影响,基于独立汉字发音的实验表明,该模型能够将识别效果平均提高25%以上。并且据此模型设计建立了基于常用汉字、面向残疾人的汉语双模语音数据库。2.基于运动检测和数学形态学方法对唇动序列的灰度图像进行处理,得到唇形区域和唇形轮廓,然后从唇形区域提取嘴唇宽度的投影W ,外唇轮廓的高度H ,嘴唇突出度的投影信息F ,并且考察它们对时间的导数关系,得到dW /dt , dH /dt , dF /dt等差分特征参数,组合形成6维几何特征向量。3.利用离散傅里叶变换(DFT)和离散余弦变换(DCT)分别得到描述唇形轮廓特征的傅里叶描述子和离散余弦变换描述子,然后将两类描述子作为唇形轮廓的特征向量,采用隐马尔可夫模型(HMM)进行学习和识别,分析了两类描述子刻画唇形轮廓特征的能力。4.采用特征融合技术提高特征向量分类识别能力,用串联加权组合的方法,将唇形区域几何特征向量和由离散余弦变换描述子表述的唇形轮廓特征向量融合形成新的特征向量,应用HMM对其进行学习和识别,分析不同加权因子下的识别效果。5.选用二阶HMM来对唇形特征参数序列进行学习和识别,利用了各帧唇形特征向量之间的上下文相关性,更符合汉语发音方式,通过实验分析比较了一阶HMM和二阶HMM对相同特征向量的识别能力。
其他文献
作为信息系统中重要的数据存储中心,数据库在各类故障下的可生存能力正受到越来越多的关注和考验。事务级恶意入侵是一种传统数据库安全机制无法完全避免并且很难及时发现的
从立冬到立春是年中最冷的季节,阴气日盛而至极,阳气微极而复萌,因此在冬季一切活动都要顺应自然,老年人的晨练更不能除外.
介绍了以可编程序控制器为核心、采用比例积分微分算法和脉宽调制原理的挤出机温度控制系统,系统以西门子公司的S72300可编程序控制器为核心,完成温度的采集及自动调节。本温
城市化是区域经济发展的重头戏,是解决农村剩余劳动力的重要渠道。近几年,铜仁地区城市化发展取得一定成绩,第二产业和第三产业比重接近60%,城镇化接近30%,但发展过程仍存在比较多制
本文详细阐述了辽宁东部山区如何实施农业机械化
流体系结构是一种致力于缓解存储墙问题的新型体系结构,它综合利用大量的运算单元、有效的多级存储层次和多种并行技术,在媒体处理和信号处理等领域都获得了很高的性能。科学
目的 观察与评价阿帕替尼联合替吉奥在晚期胃癌二线及以上治疗中的临床疗效.方法 将40例经过-二线化疗效果不理想的晚期胃癌患者按照随机对照原则分为治疗组 (阿帕替尼联合替
第二次世界大战中的一个中秋之夜,英国“莱西”号军用运输船在顺利完成一次运输任务后,正乘着月色航行马六甲海峡中,准备经中国海返回香港。这年的中秋之夜天气格外好,以往多风多
目的观察急性肠系膜上静脉血栓形成诊断过程中采取CT平扫技术的临床作用。方法按照入院顺序抽取急性肠系膜上静脉血栓患者65例,对其进行CT平扫,分析扫描结果。结果11例高密度,61
目的 探讨不稳定膀胱逼尿肌兴奋性、收缩性改变及不稳定膀胱的发病机制。方法 对前列腺增生患者行前列腺摘除术取逼尿肌组织 ,根据尿动力学检查结果分为逼尿肌稳定组 (DS)