基于隐含马尔可夫模型的计算机唇读算法研究

被引量 : 0次 | 上传用户:selene1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机唇读是指计算机系统通过分析说话者的唇部图像推断其说话内容,该技术在语音识别人机交互聋哑人辅助等领域有着诱人的应用前景计算机唇读技术主要包括唇部定位唇动特征提取唇动识别三个方面本文针对这几个方面进行了研究:本文建立了一个包含3位说话者6种指令语句共180条语料的计算机唇读数据库建库的过程分为音视频语料录制裁剪解析三步最后一步,为了得到音视频语料中的图像序列,本文开发了基于微软DirectShow的视频帧捕获存储软件本文研究了利用模板匹配进行唇部定位的方法基于对面部灰度稳定分布的认识,本文构建了一种人脸灰度模板该模板在结构上左右对称,由13个子区域组成,子区域大小符合面部器官比例,子区域间的灰度关系反映面部器官亮度状况定位时,模板滑动检测,直至匹配到人脸图像,即可根据模板结构划分嘴唇区域实验证明该方法稳定有效本文提出了基于关键点检测的口型特征提取方法两个嘴角点两个上嘴唇尖点一个上嘴唇外沿中点一个下嘴唇外沿中点被选为关键点算法先使用邻域灰度最小像素搜索法检测嘴角,然后在混合梯度场中利用跳跃Snake方法定位上嘴点,最后定位下嘴唇点以检测到的嘴唇关键点为依据即可获得高度宽度面积等口型参数实验证明该方法能够提取到准确的口型特征本文实现了基于隐含马尔可夫模型的唇动识别和语意推断,提出了将单个字的隐含马尔可夫模型和二元语句网络相融合进行句子级唇语识别的方法在融合而成的语句网络隐含马尔可夫模型中,Viterbi算法被用来进行语意解析相对于传统的孤立识别方法,本文提出的融合识别方法可以重复利用单字模型构造不同的语句模型,大大减少前者在大词量情况下的模型训练量
其他文献
脑梗死又称缺血性卒中,是由于脑部供血动脉细小或阻塞导致脑部供血不足而使脑组织坏死的疾病总称,老年人发病率较高。近年来对脑梗死伴认知障碍的研究很多,大多是采用银杏叶胶囊
为获得数量多及活力好的原代肝细胞,本试验分别采用原位二步法与半原位法分离鸡的肝细胞。应用MTT法比较了两种分离方法的细胞活力,应用电镜观察了分离细胞的超微结构,并分别
我国森林覆盖率为16.55%,人均森林面积约为世界平均水平的1/5,为少林国家。而现有木材加工企业利用率不高,加之木制品的大量出口,使森林遭到更大破坏。应采取提高木材综合利用率水平
目的 观察内侧象限乳腺癌改良根治术联合^125I粒子植入对预防乳腺癌局部复发及转移的近期疗效。方法 对10例乳腺癌患者行改良根治术中,沿内乳区纵形顺序植入^125I粒子,并随访3~1
以中低温煤焦油轻油和重油为实验原料,采用常压蒸馏获得170~200℃、200~240℃、240~270℃、270~300℃、300~320℃、320~340℃、340~360℃和360~390℃煤焦油馏分油;利用配有油
近年来随着中国经济的腾飞,民航业高速发展。同时随着空域的开放,航班量的增加,外国航空公司在中国境内的安全问题也日益凸显,飞错航线、落错跑道、通讯中断等不安全事件时有
百年大计,教育为本。教育在一定程度上决定了一个国家的发展潜力与发展实力。而教师作为传道、授业、解惑者,在学校教育中起着至关重要的作用。因此,如何培养教师,培养怎么样的教
目的评价调补肺肾(补肺健脾法、补肺益肾法和益气滋肾法)三法对COPD的疗效及其远后效应,并探讨其作用特点及远后效应机制。方法大鼠随机分为对照组、模型组、补肺健脾组、补肺益
本研究是关于正念训练对幸福感影响的研究。目的:验证正念训练对主观幸福感和心理幸福感是否有显著影响。方法:采用完全随机实验设计,将招募的被试随机分配到实验组和对照组,实验
随着国际海事组织(IMO)制定的一系列国际造船新规范、新标准的实施,造船企业在国际国内市场上的竞争越来越激烈,且竞争已由资本、资源和劳动力转向技术含量愈来愈占主导地位的创