端到端语音识别中编解码器的研究与优化

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:yyttuuabc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别技术被视为可以使人与人、人与机器更加顺畅交流的桥梁。在实际生活中,语音技术可以帮助不同的语言使用者进行交流,如语音到语音的翻译系统;或是用于改善工作环境、提升工作效率,如:语音输入。随着技术的发展,端到端语音识别方法因为结构简单、解码速度快、准确率高而受到了人们的广泛关注,并成为了目前的研究热点。本文围绕优化端到端语音识别的结构和丰富端到端语音识别的语言知识展开相关研究,主要工作和创新点如下:在端到端模型中,编码器用于提取语音特征,但由于语音信号的独特性,编码器在提取特征的过程中往往存在冗余,而且冗余特征的提取也会降低提取速率。针对这一问题,改进了编码器的结构:使用三角形结构的编码器结构。此外,针对循环神经网络存在的过拟合问题,引入dropout正则化方法。解码器端联合连接主义时序分类(Connection Temporal Classification,CTC)和Attention共享编码器提取的高级特征进行训练和解码。最后,在voxforge数据集上验证了模型的性能,在没有使用语言模型的情况下将字符错误率降到了12.9%。端到端语音识别的语言知识仅来源于训练语料,相比专业的语言模型在语言知识的获取上有所不足且在一定程度上影响了识别结果的准确性。因此,本文在端到端模型的基础上,提出一种适用于端到端语音识别的外部语言模型。本方法使用独立循环神经网络作为语言模型的基本单元,其特点在于本模型可以获得更长的上下文从而获得更低的困惑度。此外,针对独立循环神经网络存在的过拟合问题,设计一种新的正则化方法——Ind Drop,将dropout技术应用在层与层之间的全连接上同时保持时间序列上的连接。对于softmax层计算量大的问题,引入对数双线性模型来缓解这一问题。模型在PTB基准数据集得到了87.3的困惑度,在将语言模型应用在端到端模型后,改善了语音识别的性能表现,相比不使用语言模型的情况下,将语音识别的性能提升了3.4%。
其他文献
量子点(QDs)因具有量子产率高、荧光寿命长、吸收光谱宽、发光光谱窄等优点,在照明和显示等领域有着广阔的应用前景。自1994年科学家首次将Cd Se量子点引入发光二极管(LED)以
物联网(Internet of Things,IoT)技术的普及给人们的生活带来了极大的便利。然而,物联系统中存在着“云服务信任”问题,这是因为物联用户对物联设备的控制权是建立在对物联系
以凤凰山矿XV1306工作面为研究对象,9#煤邻近层采空区瓦斯涌出占15#本煤层瓦斯涌出的30~50%,而且15#煤层瓦斯含量偏大,上隅角瓦斯经常超限,影响矿井安全生产。结合凤凰山矿XV1306 工作面地质资料分析,本文提出外错高位钻场近水平扇形钻孔采空区瓦斯治理方案。论文依据XV1306工作面顶板岩层地质柱状图,运用组合岩梁理论分析了采空区覆岩并依此为依据进行了三带划分,9.82m直接顶k2石灰
量子点作为一种准零维纳米半导体材料,具有独特的发光特性。比如激发光谱范围宽,发射光谱窄并且对称,具有较大的斯托克斯位移等。因此利用量子点代替传统荧光粉作为下转换材
研究发现,估计90%的人类肿瘤中存在着Cyclin D–CDK4/6–INK4–Rb通路的异常,这条通路的异常改变,加速了细胞周期G1期进程,使得肿瘤细胞增殖速度加快从而获得生存优势。因此,研究一种新型的CDK4/6抑制剂成为了治疗癌症的有效策略。礼来分子LY2835219(Abemaciclib)是一种新型的CDK4/6抑制剂,对治疗乳腺癌具有很好的活性,但其较差的选择性极大地限制了后期的开发和
近年来高速铁路不断发展,车桥之间的动力相互作用问题引起了人们的关注。目前,考虑到车辆和桥梁的振动,已经提出了精细的车-桥相互作用模型,以评估列车过桥引起的桥梁动力响应,但仍有部分问题尚未解决:传统车-桥耦合模型和移动集中力模型中没有考虑轨道结构的影响;经典的移动集中力模型用于评估桥梁的动力响应时,通常会高估桥梁的振动,这一现象的内在机理未被完全揭示;传统的车-桥耦合模型只能借助数值模拟的方法求解,
随着2017年核心素养版的英语新课程改革的实行,教育者们提出了更多符合实际且更有利于培养学生各方面能力的要求。作为推进新课程改革的强劲动力,职前英语教师不断接触到最新
有机发光二极管(Organic Light-Emitting Diodes,OLEDs)具有自发光、响应度高、色域宽、对比度强、视角广、功耗低等特点,是未来显示照明领域的发展趋势。针对OLEDs主要面临成
为了解决目前阻化剂只有单一阻化的作用,加入一种具有耗氧作用的材料,形成一种具有阻化和耗氧双重作用的材料,即铁系脱氧型阻化剂。通过实验的方法,改变铁系脱氧型阻化剂成分的配比和实验温度,得到铁系脱氧型阻化剂耗氧速率与氧浓度的关系以及耗氧速率的规律。分别在不同粒径的煤样中加入铁系脱氧型阻化剂和阻化剂,得到铁系脱氧型阻化剂对不同粒径煤样的阻化效果;改变实验温度,得到不同温度下铁系脱氧型阻化剂的阻化效果。通
近来自动驾驶、无人物流等技术方兴未艾,同时定位与地图构建是这些技术重要的基本理论,是进行其他智能业务的前提。激光与相机是在本领域中广泛使用的传感器,用以获取装备周