基于BiLSTM-Attention唇语识别的研究

来源 :计算技术与自动化 | 被引量 : 0次 | 上传用户:yp7611
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了解决唇语识别中唇部特征提取和时序关系识别存在的问题,提出了一种双向长短时记忆网络(BiLSTM)和注意力机制(Attention Mechanism)相结合的深度学习模型。首先将唇部20个关键点得到的唇部不同位置的高度和宽度作为唇部的特征,使用BiLSTM对唇部特征序列进行时序编码,然后利用注意力机制来发掘不同时刻唇部时序特征对于整体唇语识别的不同权重,最后利用Softmax进行分类。在公开的唇语识别数据集GRID和MIRACL-VC上与传统的唇语识别模型进行实验对比。在GRID数据集上准确率至
其他文献
电解铝行业阳极焙烧过程会产生大量烟气,单一的净化方案无法满足对烟气中各污染物的高效去除,需进行多级烟气治理。通过对多种多级烟气治理方案比较分析,得出电捕法+熟石灰干
实时数据处理子系统是试验指挥控制系统的重要组成部分。基于软构件技术对其进行设计并部分实现,为今后试验指挥控制系统跨平台开发和使用提供了可行的技术方案和实施途径。
智能化生产环境让生产的效率和质量都得到了显著提高。然而,智能化生产化境中复杂的组成结构和交互行为也放大了系统中危机事件的危害程度,进行有效的危机管理具有很强的必要