基于音素的语音可懂度评价方法的研究与实现

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:adupt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着全球文化交流的日益频繁,人们越来越明白熟练掌握一门外语的重要性。口语训练是语言学习的基本要求,而计算机辅助发音训练系统也随之成为语音识别应用中的一个重要研究方向。对于我国英语学习者口语发音评价的重要指标之一是语音可懂度,但目前在音素级自动语音可懂度评分与人类专家评分相关性差距较大。此外,由于非母语学习者发音错误的多样性,在对学习者发音检测过程中,相似音素发音易出现混淆,传统基于概率统计的检测方法很难覆盖到所有的错误音素类型,无法准确有效地反馈音素级的纠正建议来帮助学习者提升语音可懂度水平。针对上述问题,本文首先分析了目前常用发音检测技术的特点和局限,为了解决学习者由于汉语发音习惯产生的错误发音规律性问题。本文采用一种基于音素偏误发音网络的方法对学习者发音中的错误发音的音素进行检测,并研究出一种循环随机音素识别检测方法提高音素识别正确率和准确率,并使用SVM分类器对发音错误类型进行判别分类,结合语音可懂度评价方法,为学习者反馈纠错建议。实验表明,使用本文改进的音素识别检测方法,提高了音素语音特征识别的正确率和准确率。在对学习者语音可懂度评分时,针对目前常用语音可懂度评价方法与人类专家评分相关性差距较大的问题。本文首先分析了基于AI指数、语段特征以及音素得分评价方法原理及特点。研究一种新的基于音素组合特征的语音可懂度评分方法,即通过线性组合的方式得到新的声学特征测量得分来对语音可懂度评分,并实验验证了本文语音可懂度评分方法与人类专家评分的相关性。最后本文将发音问题检测方法与语音可懂度评价方法应用于实际在线原型系统中,设计了针对非母语学习者的语音可懂度评估系统。实验测试表明,通过该系统对英语发音进行检测和纠正错误音素后,学习者语音可懂度评分有了明显提高,进一步验证本文所提方法的有效性和实用性。因此本课题在计算机辅助发音领域有着一定的参考价值和应用价值。
其他文献
蒸汽发生器是核电站的重要设备,水压试验是蒸汽发生器制造中的重要工序。本文主要依据~%CC--MB5000标准要求对核电站蒸汽发生器水压试验的过程进行介绍,并从质量控制和监督验证
国际货币基金组织(IMF)在达沃斯论坛首日发布《世界经济展望》,分别下调2019年、2020年全球经济增速预期0.2个和0.1個百分点,至3.5%和3.6%。这是继2018年7月、10月两次调降预期后的第三次下调。IMF总裁克里斯蒂娜·拉加德在达沃斯论坛上强调,2019年全球经济增速放缓的风险加大,但并不会呈现衰退的趋势。
本文根据R&D投资经济效果的计量模型,对中国基于国际贸易和国家间直接(无形)外溢技术知识的存量进行了测算,并据此对中国技术知识总量的产出弹性系数和边际生产率进行了实证研究。
近年来自外技术性贸易壁垒已经取代反倾销,成为我国出口商品面临的最大非关税壁垒和贸易摩擦的根源。本文认为,我国出口商品频遭技术性贸易壁垒的根源,在于我国技术标准过低以及
英国首相特雷莎·梅定于1月21日向英国议会下院提交新的“脱欧”方案,而议员们也可以提出替代方案,以期最终形成共识,打破当前僵局。分析人士认为,各方将由此展开新一輪博弈,但鉴于英国国内各派之间、英国与欧盟之间的分歧难以调和,“脱欧”前景仍不明朗。目前来看,“有协议脱欧”依然是英国和欧盟最优先考虑的方案,但能否最终达成一份为各方所接受的协议,仍存在很多不确定性。
[秧歌起源]  秧歌与高跷,是乐、舞、技三者结合的典型,其历史久远,形式多样.……
期刊
本文从倒签提单和预借提单、伪造提单、以保函换正本提单、无单放货四种国际货物海上运输中出现的现象分析海运提单风险的产生原因,进而提出应对措施。希冀为国际海上贸易防
[阅读概述]  人生要活得精彩,生活要有质量,那就必须看书读报.  看什么书呢?当然是看经典,看名著.美国著名作家梭罗说:"书是世界的宝贵财富,是国家和历史的优秀遗产."看
期刊
本文在肯定外资对中国国民经济增长与发展作出重要贡献的同时,从科学发展观的视角,对中国外资数量扩张型增长模式的形成厦其负面效应加以分析,提出中国必须从促进区域协调、优化
摘要:目前,全球多个国家或地区实施了负利率政策。本文对负利率的理论与实践进行了梳理。在此基础上,围绕负利率政策对宏观经济及金融体系的影响,从五个渠道进行了辨析。结合我国经济运行现状及金融供给侧结构性改革目标,阐述了几点启示及建议。  关键词:货币政策 负利率 宏观经济 金融体系  在后金融危机时代,各国普遍采用宽松的货币政策来刺激经济,辅之以较低的利率水平;在低利率仍难以刺激需求的情况下,一些欧洲