语音识别技术的研究及其在发音错误识别系统中的应用

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:cxcqjf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
二十世纪五十年代以来,语音识别的技术发展迅速。作为一门交叉学科,语音识别己经形成了完整的理论体系,基于PC平台的语音识别系统的研究也在技术上获得了一些成功。尽管目前各种各样的语音识别产品相继涌现,但在许多特定领域,由于其环境的特殊性,往往需要专门开发,以适应实际需要。因此,针对英语学习过程中,学习者往往缺乏标准且有效的口语训练的问题,设计并实现了一套具有示范、评分、报错功能的发音错误识别系统。首先,本文根据语音识别系统的基本构成模型,介绍了预处理、特征参数提取到模型的训练与匹配所涉及的数字信号处理、模式识别等方面的基本技术。其次,介绍了连续语音识别搜索算法的基本原理,对常用的基于动态规划思想的Beam剪枝搜索算法进行了深入研究,分析了该算法的不足,从两方面对Beam剪枝搜索算法进行了改进:使用自适应的裁剪门限代替固定的裁剪门限,提出了基于活动模型数变化的状态层自适应剪枝搜索算法,根据搜索初期阶段模型最少驻留帧数和活动模型数变化的关系自适应的改变裁剪门限;另一方面,提出了基于当前搜索路径的最高概率得分和平均概率得分变化的词层自适应剪枝搜索算法。最后将状态层和词层相结合的自适应剪枝算法与语音识别引擎相结合,利用SAPI接口调用优化后的语音识别引擎来完成了发音错误系统的设计与开发。实现了语音合成、语音识别和评分报错功能,并给出具体的工作流程和实现的关键代码。测试结果表明本系统较好地满足了连续语音识别的要求,学习者经过训练之后,其识别率可以达到81.2%,这也验证了状态层和词层相结合的自适应剪枝算法是可行的。
其他文献
随着新兴电子商务平台和微博、微信等社交媒体的广泛使用,人们在享受互联网技术带来种种便利的同时,也用文字记载了自己的心情、状态、评价和观点,通过挖掘海量微博和评论文
2007年中国网络购物市场十分受关注,越来越多的企业加入网络购物行业,特别是大量传统零售厂商纷纷进军B2C电子商务。B2C购物将成为未来网络购物市场新的增长动力。但目前中小
随着Internet的迅速发展,越来越多的政府部门把关键业务转移到网络上来运行,不断增长的业务量使得网络服务器不堪重负。而单纯靠增加服务器硬件设备来升级系统并不是很现实的
为了阅读宇宙边缘的信息,我国研制了500米口径球面射电望远镜(FAST)。FAST将是世界上最大最灵敏的单口径射电望远镜,其三项自主创新开创了建造巨型射电望远镜的新模式。FAST是一架坐落于贵州大窝凼的可动抛物面射电望远镜,其获取的观测数据将服务于宇宙起源和演化、探索生命起源等多科学目标的研究。FAST是一套500米大小的大型设备,观测细节繁琐,需要为观测用户提供一个规范和可视化观测过程的上层、易
以信息技术为先导的经济信息化、商务信息化、政府信息化等社会变革,对政府公共管理和服务提出了新的挑战,政府运行原理、实现机制和具体手段都围绕着信息化发生了适应性转变,这
无线传感器网络技术作为一种全新的信息获取和信息处理、传输技术,具有组网快捷、灵活,且不受网络约束的优点,可用于紧急搜索、灾难救助、军事、医疗等领域,具有广泛的应用前景,被
智能手机在给人们的生活带来了便利的同时也遭受到了严重的安全威胁,恶意扣费、隐私窃取、系统破坏等层出不穷的恶意攻击手段给手机用户造成了严重损失。Android作为一个开源
空间数据挖掘是指从空间数据库中提取用户感兴趣的空间模式与特征、空间与非空间数据的普遍关系及其它一些隐含在空间数据中的普遍的数据特征。聚类分析是数据挖掘中的一种非
脑电信号的分类是脑机接口中的关键问题。因为脑电的个体差异较大、信号幅度微弱,又是非平稳的时变信号,所以对其进行特异性分析总结是比较复杂的工作。提高脑电信号分类的准确
网络安全在现代社会中非常重要。近些年来,防火墙成为了网络安全研究中的一个热点。通常,防火墙也是企业级用户的首选网络安全工具。随着越来越多的个人用户接触互联网,个人计算