基于稀疏DBN和双向LSTM的视觉语音识别算法

来源 :数据通信 | 被引量 : 0次 | 上传用户:fa2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
唇部视觉信息作为语音识别的辅助信息一直受到广泛关注,为更好的提取唇部视觉信息,提出一种基于稀疏深度信念网络(Deep Belief Network,DBN)和双向长短期记忆网络(Bidirectional Long Short-Term Memory,BiLSTM)的视觉语音识别算法。该算法通过在DBN的目标函数后引入混合的范数和范数来实现DBN的稀疏表示,以此稀疏DBN对唇部视觉信息进行稀疏瓶颈特征的提取,再将提取的瓶颈特征送入BiLSTM进行特征的学习分类。实验表明,该算法能有效的识别唇部视觉信息。
其他文献
虚拟机迁移技术能够使云平台上的服务器资源得到更合理地分配和管理,在负载均衡,服务器故障、维护或整合等方面起到了重要的作用.预拷贝算法以其稳定性优势成为目前主流的虚
目的:观察全髋关节置换术后针灸止痛的疗效。方法:60例按照随机数字表分为A组与B组各30例。B组术后8、16、24、36、48、60、72h服西乐葆,A组术后8、16、24、36、48、60、72h
目的:探讨腹腔镜下行子宫肌瘤切除术的疗效及影响因素。方法:选取我院51例要求保留子宫行子宫肌瘤切除术患者的临床资料,将术中出血、手术时间、术后排气时间以及术后住院时间等
目的:分析护理干预对胸腰椎骨折患者腹胀及便秘的预防效果.方法:随机抽取2012年4月至2014年11月诊治的70例胸腰椎骨折患者,分为研究组和对比组.每组各45人,对比组患者使用传统
本文以强酸型阳离子交换树酯为催化剂,通过酯化反应合成了三乙酸甘油酯,并系统地研究了树脂型号及其用量,乙酸与甘油的摩尔比,反应时间等因素对合成三乙酸甘油酯产率的影响。
目的:探讨腹腔镜胆囊切除术围手术期的临床护理效果。方法:选取2014年1月至2014年12月期间我院收治的腹腔镜胆囊切除术患者50例,回顾分析患者的临床资料与围手术期护理措施。结
航空遥感技术用于研究土地资源利用与农村生态环境及其变化动态效果显著。本文论述了用航空遥感技术在詹店镇应用中解决的几个问题,介绍了利用黑白和彩色红外航片解译土地资源利用类型与农村生态环境要素的经验和方法,指出了航空遥感技术在研究生态环境中的局限性,提出了在河南6个典型地区开展土地资源与农村生态环境监测研究的建议。
本文研究了间歇法从钼酸盐中取钼时,各种因素对提钼率的影响,找出了一较适宜的操作条件,对100ppm的含钼溶液,当外相水溶液PH=2.00,内相NaOH浓度Cio=0.9800mol,Roi=3/1,Rew=1/3,搅拌
色淀是将一种色料沉降或吸附到某种不溶性底物上形成的物质。食用色淀是由相应的水溶性色素吸附于氧化铝水合物基质上,经色淀化而成。它通过附着、分散或与待着色的食品、药
本文将小麦引入粗细沙潮土区,实行小麦套作花生一年两熟,进行了套作栽培的最佳配置方式研究。结果表明:小麦行距40厘米,亩播量10公斤,5月中旬套作花生,花生行距40厘米,亩密度