基于稀疏DBN和双向LSTM的视觉语音识别算法

来源 :数据通信 | 被引量 : 0次 | 上传用户:fa2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
唇部视觉信息作为语音识别的辅助信息一直受到广泛关注,为更好的提取唇部视觉信息,提出一种基于稀疏深度信念网络(Deep Belief Network,DBN)和双向长短期记忆网络(Bidirectional Long Short-Term Memory,BiLSTM)的视觉语音识别算法。该算法通过在DBN的目标函数后引入混合的范数和范数来实现DBN的稀疏表示,以此稀疏DBN对唇部视觉信息进行稀疏瓶颈特征的提取,再将提取的瓶颈特征送入BiLSTM进行特征的学习分类。实验表明,该算法能有效的识别唇部视觉信息。
其他文献
虚拟机迁移技术能够使云平台上的服务器资源得到更合理地分配和管理,在负载均衡,服务器故障、维护或整合等方面起到了重要的作用.预拷贝算法以其稳定性优势成为目前主流的虚
目的:观察全髋关节置换术后针灸止痛的疗效。方法:60例按照随机数字表分为A组与B组各30例。B组术后8、16、24、36、48、60、72h服西乐葆,A组术后8、16、24、36、48、60、72h
色淀是将一种色料沉降或吸附到某种不溶性底物上形成的物质。食用色淀是由相应的水溶性色素吸附于氧化铝水合物基质上,经色淀化而成。它通过附着、分散或与待着色的食品、药