链接时序分类相关论文
在当今这个大发展、大融合的社会,需要人们能够说一口标准的国家通用语,以便对话双方能够精准理解,因此提升国家通用语发音水平已......
维吾尔语是黏着语,词汇量较多,容易出现未登录词问题并且属于低资源语言,导致维吾尔语的端到端语音识别模型性能较低.针对上述问题......
针对脱机手写体书写随意、字符分割困难和识别精度依赖字典等问题,提出了一种基于CTC-Atention脱机手写体文本识别算法。利用卷积......
近几年来,基于端到端模型的语音识别系统因其相较于传统混合模型的结构简洁性和易于训练性而得到广泛的应用,并在汉语和英语等大语......
文字作为人类语义信息的直接表达,在日常生活中有着重要的作用。图像中的文字通常可以直接反映出内容信息,其识别受到越来越多研究者......
随着计算能力的提升和大数据语料的不断积累,语音识别技术飞速发展,准确率大幅提高,应用的场景也越来越广。语音识别作为连接人类......
随着Wi-Fi感知技术的发展,出现了大量使用Wi-Fi信道状态信息(channel state information, CSI)进行动作识别的应用。然而大多数的......
目前,端到端的语音识别系统因其简洁性和高效性成为大规模连续语音识别的发展趋势.本文将基于链接时序分类的端到端技术应用到日语......
随着智能手机的出现,终端的应用便成为了当今技术的发展潮流。苹果公司在智能手机里引入了语音识别的技术,掀起了人机交互的热潮。......
语音识别是实现自然人机界面的必备技术,在语音搜索等方面的应用取得了很大成功。藏族是我国重要的组成部分,对藏语语音识别技术的......
现阶段基于链接时序分类技术的端到端的大规模连续语音识别成为研究热点,文中将其应用于藏语识别中,取得优于主流的双向长短时记忆......
计算机辅助语音训练系统需要检测非母语者的错误发音,并提供详细的指导性反馈,有助于第二语言学习者更有效地提高发音水平.利用深......
端到端的语音识别通过用单个深度网络架构表示复杂模块,减少了构建语音识别系统的难度.文中对传统的混合链接时序分类(Connectioni......
针对传统声学模型存在模型组件复杂且不能统一进行训练,数据必须进行预对齐的问题,提出基于一维门控卷积神经网络与CTC的中文端到......
随着人工智能领域研究的深入以及大数据语料的不断积累,语音识别技术得到突飞猛进的发展,神经网络开始大规模应用于语音识别技术,......
自动语音识别技术是使人与人、人与机器更顺畅交流的关键技术。随着新型的社交媒体逐渐普及,互联网上的数据量大量增长,使得传统语......
基于长短时记忆(LSTM)神经网络在语音识别方面的良好性能,本文引入了一种新的深度LSTM方法.该方法利用深度控制门控函数连接多层LS......