神经网络在发音纠错算法中的应用研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:snowmansoft
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机软硬件技术和语音识别技术的发展,基于语音识别技术的计算机辅助发音训练系统(CAPT系统)在教育领域的应用越来越广泛,而如何为用户的口语发音提供准确有效的反馈是当今CAPT系统研究的核心课题。在这一背景下,本文围绕声学模型的建模方案及其在纠错算法中的应用,进行了系统而深入的研究,并且根据系统性能的实际需求,将神经网络模型引入到系统,同时也对系统的纠错算法进行了改进。   本文的主要工作包括以下三个部分:一、根据以往CAPT系统的评测结果和中国人英语发音的常见错误,划分易混淆音素集,以便于后期针对这些易混淆音素集进行更精细的评测;二、针对HMM模型对易混淆音素辨识能力较弱的缺陷,提出用神经网络为易混淆音素建立模型,进而提高系统对易混淆音素的辨识能力;三、分析传统的对数似然度纠错算法的缺陷和不足,将神经网络模型引入到纠错算法,进而提高系统的纠错能力,优化系统的整体系能。   经过以上三方面的改进,CAPT系统对用户发音的纠错性能得到了很大程度的提高。实验结果表明神经网络模型对易混淆音素的辨识能力远高于HMM对易混淆音素的辨识能力,将神经网络模型引入到传统纠错算法以后,在保证音素识别正确率不变的前提下,系统纠错性能有很大的提高。
其他文献
流媒体作为一个新兴的网络业务,在网络服务中所占的份额越来越大,地位也随之变得更为重要。然而面对日益增长的用户群,服务器的服务能力与网络带宽成为C/S架构的流媒体系统的
图论中的一个经典难题——图染色问题,属于图论的一个分支,也是科学计算与工程设计中的基本问题。现实世界中有很多问题都可以转化为图的问题来解决,例如比赛安排问题、网络
近年来,随着计算机和信息技术的飞速发展,信息技术已融入人们生产、生活的各个方面,信息系统的安全性日益成为人们关注的焦点。同时,传统信息安全技术的弱点也逐渐暴露出来,
网络技术的飞速发展使个体之间信息的交换越来越频繁、音频、视频等数字产品通过网络传播和其他媒介被用户获得。但是信息安全的问题也随之而来,数字产品被人们任意的复制、
随着互联网技术在21世纪的迅速普及和发展,互联网对于社会经济的发展产生了深远的意义,人们的生活越来越离不开互联网。近年来,电子商务的出现,通过网络进行的电子商务交易行为更
自然场景的时变过程模拟一直都是计算机图形学领域的重点内容之一,而建筑物场景的时变效应模拟则是其中一个重要的组成部分。建筑物场景时变效应模拟技术涉及计算机图形学、虚
现实世界中众多的复杂系统都可以抽象的表示为复杂网络,而社区结构是复杂网络最显著的结构特征。从某种程度而言,整个网络的功能往往取决于社区间的相互作用。通过跟踪社区结构
随着计算机的普及和计算机网络技术的不断发展,单个计算机或局域网内部之间的资源共享已经难以满足现代信息通信需求。同时,计算机应用的领域不断扩张,迫切的需要一种能够在
笔段网格汉字字形形式化描述方法用预先定义好长度、方向的直线段——笔段作为描述字形的基元,来统一描述一切可能汉字字形骨架异同;描述的字形有效基元量少,字形比对计算效率高
贝叶斯网络是继模糊逻辑、可信度方法和神经网络等方法之后提出的不确定知识表示模型,是研究不确定性问题的重要方法之一。目前,贝叶斯网络参数学习采用的方法主要是精确计算和