语音合成技术在口吃矫正中的研究与应用

来源 :天津大学 | 被引量 : 0次 | 上传用户:zikao0606
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
口吃是一种常见的语言障碍,随着计算机科学技术的发展,人工智能的应用逐渐走进医疗领域,如何将矫正口吃通过计算机智能来实现,是当今人工智能领域研究的一个新的课题并具有重要研究意义。本文基于口吃矫正的需求,开发了口吃矫正语音合成系统(The StutteringVoice Synthesis System,简称SVSS)。分析了语音合成所用到的关键技术,设计了系统总体功能框架;该系统包含六大功能模块,文中重点对口吃语音识别和矫正语音合成这两个模块所用到的关键技术进行分析与算法设计;针对口吃语音的特点,提取语音特征参数,构建开发系统所需的参数模型库,成功开发出符合用户需求的SVSS系统。本文首先对口吃语音进行特征分析,结合口吃语音特点对患者语音进行预处理,包括防混叠滤波与预加重处理、语音信号数字化、加窗与分帧,最后进行端点检测。文中提取MFCC参数作为语音的特征参数,采用LPC分析方法进行语音压缩,建立HMM训练模型,利用Viterbi算法修正谱包络参数,并用k-means算法进行优化,使训练模型能输出最佳匹配结果,将匹配结果结合已有的韵律参数进行分析,成功开发出SVSS系统。由于口吃矫正需要较高音质的合成语音,单一的韵律模型满足不了实际的需要,最后提出一种改进的共振峰模型,采用LPC-共振峰算法来调整合成语音的共振峰,以提高合成语音的自然度。文中采用MOS评分法,验证LPC-共振峰算法的性能,结果表明合成的矫正语音的自然度和流利度都较为理想。最后总结了开发SVSS系统所做的主要工作,并对系统应做的功能扩展进行展望。
其他文献
《兰亭序》为王羲之传世最有名行书作品,世称天下第一行书。书于东晋永和九年三月三日,为其与谢安等四十一位名士在会稽山阴兰亭“修禊”时所作诗集的序言。 “Orchid Pavil
简述了海河流域滩涂的自然资源概况和开发现状,分析了目前存在的对生态系统和自然资源产生不利影响的5个问题。为了使滨海地区在发展经济的同时重视湿地的生态价值,从总体规
四、微观选址风电场的微观选址对风电项目具有非常重要的作用。微观选址的好坏,不仅影响风电场的发电量,还对机组的寿命和故障情况有影响。微观选址的影响因素主要包括风速、
日本玩具巨头商多美,最近开始发售“皮卡丘汽车”玩具。这次同车发售的还有很多主题的多美。以前这类产品只有在名古屋宠物伴侣商店可以买到,但是由于Pokemon(口袋妖怪)的相关产
阐述海河口排泥场现状及存在的问题,指出其综合治理和开发的必要性与可行性,提出相应的对策和建议,建立统一的河口综合治理开发管理体制和运行机制,以供土和吹填造地为契机,
文章介绍了海宁市博物馆概况及展陈现状,提出了提升博物馆公共服务能力的对策与建议.要巩固博物馆基本陈列和特色展览;拓宽横向合作和纵深发展;推进数字化博物馆建设.
针对目前城市固体废物管理中存在的主要问题,利用"智慧城市"概念构建了智慧城市固体废物管理系统。阐述了智慧城市固体废物管理的概念,分析了智慧城市固体废物管理系统的需求
2001年3月以乡(镇)为单位进行了新疆居民户食用碘盐监测,共入户调查17 973户居民,其中食用碘盐的12 478户,占69.4%;食用非碘盐的5 495户,占30.5%;北疆地区调查7 672户,其中碘
关于肾综合征出血热临床、疫源地和疫苗等研究报告相继发表,但对其分布形成原因、演变规律、为何在北半球呈带状分布尚未系统报告和研究,本文试从地球演化、生物进化等化石进行
江西九江大湖塘矿集区是2010年新发现的超大型钨铜钼多金属矿,成为世界最大钨矿之一。该矿床的成功勘查,有可能改变我国钨矿的分布格局和工业布局。大岭上钨矿属于九岭成矿带武