【摘 要】
:
主流神经网络训练的交叉熵准则针对声学数据的每个帧进行分类优化,而连续语音识别需以序列级的转录准确性为性能度量指标。针对这一差异,构建一种基于序列级转录的端到端语音
【机 构】
:
海军航空大学信息融合研究所,中国人民解放军61923部队
【基金项目】
:
国家自然科学基金重大研究计划(91538201);泰山学者工程专项经费(ts201511020)
论文部分内容阅读
主流神经网络训练的交叉熵准则针对声学数据的每个帧进行分类优化,而连续语音识别需以序列级的转录准确性为性能度量指标。针对这一差异,构建一种基于序列级转录的端到端语音识别系统。以音素为基本单元建模,并采用连接时序分类(CTC)的目标函数改进长短时记忆网络的结构。在解码过程中引入词典和语言模型,并在前端增加音调特征以丰富声学特征。利用序列区分度训练技术提升CTC模型的建模效果。实验结果表明,该系统的识别效率和识别准确率得到提高,词错误率最低可降至19.09%±0.16%。
其他文献
水资源保护性煤炭开采是煤矿绿色开采的重要内容之一,也是目前我国煤炭开采迫切需要解决的重大课题。在分析结构关键层内涵的基础上,提出了广义隔水关键层和保水开采的基本概
以某厂连续法邻苯二甲酸二辛酯(DOP)装置由5万吨/年扩产至10万吨/年的项目为背景,着重研究酯化工序的改造。酯化是DOP生产的关键工序,酯化釜是关键设备,把实验研究与计算机模拟
目的分析中西医结合疗法对糖尿病性下肢动脉粥样硬化病理变化产生的影响。方法选取2018年1月至2019年1月本市中医院的120例2型糖尿病性下肢动脉粥样硬化患者,将其分成研究组
近年来,随着我国道路建设的高速发展和人们生活水平的不断提高,城市机动车保有量连年持续增长,机动车已成为各城镇居民出行的主要交通工具之一。与此同时,由于交通信息数据量
个案管理是社会工作的一种专业社会方法。它强调以团队的方式来共同协助案主解决问题、满足需求。四川5·12地震后,高校学生辅导不足、学生需求面广,个案管理尤显重要。提
填海造地4km2,斥资27个亿,在历时4年的磕磕绊绊中,大连国际会议中心终于以令人震撼的姿态展现在世人眼前。回顾那四年,中外设计团队的合作经历了从一开始因沟通障碍、设计管
本文从明清涉海小说的概念出发,探讨这类小说中主人公们所遇到的海洋宝物,对它们进行分类,并归类总结它们的特征,最后探析海洋宝物在涉海小说中所起到的不同作用,以期对中国
针对低资源的濒危语言进行了端到端语音识别模型的建立与研究,能够为濒危语言的保护和传承探索出新的途径。采用动态双向长短时记忆网络与连接时序分类模型构造端到端的语音
<正> 小学生学习写作要经历“从模仿到迁移,进而到创造的阶梯层次”,这是从认知结构方面来讲的;另外,小语教材五、六、七册中,安排了《习作例文》,对其训练亦安排了从自然段
专业合作社作为农村产业化经营和发展的一条重要途径,是实现农业生产方式现代化发展和改革的方向。近年来,在农业领域已经形成了一批以不同作物为主的专业合作社组织。针对重