基于语音识别和语音合成的汉语语音转换技术研究

被引量 : 0次 | 上传用户:baihe143
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音转换是语音信号处理领域一个比较新颖的技术,它是改变一个说话人的语音,使之听起来像是另外一个人的语音的技术。这项技术结合了语音信号处理领域的各种技术,如语音信号分析,语音识别,语音合成,语音增强等。本文以开发汉语语音转换系统为目的,采用HMM语音识别和语音合成方法,研究汉语语音转换技术。根据汉语的特点,本文选择声母和韵母为语音识别和语音合成的基本单元。一个完整的语音转换系统由语音识别、参数转换和语音合成三部分组成。论文的主要工作包括:1.阐述语音转换系统的框架和实验数据准备,包括在考虑声母、韵母和音节覆盖率的前提下收集挑选1000句录音语料,邀请4位发音人录制语音库,录音格式转换,语音校对,对语音库中的语句进行语音识别,并从语音识别结果中提取声韵母时间信息。2.对语音识别结果进行人工校对、调整,在对声母时长进行统计的基础上产生韵律标记,生成单音子和三音子训练标注文件,为训练HMM合成器设计上下文属性和问题集,并在HTS-2.0平台进行HMM合成器的训练。3.按上述方法,产生两个说话人的HMM模型,将待转换语句的标注文件分别通过两个模型产生声学参数,再利用插值的方法生成第三人,也称为“虚拟人”的声学参数。4.将生成的“虚拟人”的参数通过STRAIGHT语音合成器产生语音波形,并对常规语音合成的语句和经过参数转换后产生的语句分别进行MOS评测和ABX评测。语音合成器的自然度和语音参数转换算法是本文语音转换效果的决定因素。实验结果表明:(1)本文语音合成器的初步MOS主观评测平均为集内4.2,集外3.9,说明语音合成的自然度已基本到达可以接受的水平。(2)采用声学参数插值实现语音转换后,经过ABX主观评测,结果表明该系统能够实现语音转换功能,可以控制转换后的语音更偏向两个源说话人中的某一个,且能综合两个源说话人的个性特征信息。
其他文献
手写汉字识别是人机交互智能接口的重要组成部分,对于实现办公自动化、提高计算机的输入效率具有重要意义。由于汉字类别数量大、结构复杂、相似字多、书写风格多样等原因,手写
为认真研究如何在社会进步、经济转型新常态下,维护好女职工的合法权益,中铁二局女职委开展了一次专项调研,旨在摸清当前女职工权益维护工作中存在的突出问题和原因,找准女职
汉语同义词数量丰富,交际和行文中恰当使用同义词会使会话和文章增色不少。对于母语是汉语的人来说,选择合适的同义词来表达感情是非常简单的一件事情,但是对于第二语言是汉
企业的文化建设与企业的核心竞争力有着极其紧密的关系。在当前激烈的市场竞争条件之下,加强企业的文化建设是企业科学发展观的重要体现,当前企业的文化建设已经发展成为我国
目的分析有效护理人工髋关节置换术患者的方法。方法将我院2011年1月~2013年1月期间治疗的54例行人工髋关节置换术的患者随机平均分为对照组与实验组,分别给予常规护理及针对
随着我国市场经济的发展,互联网事业方兴未艾。而在这一过程中,政府管理模式的创新也同样必须紧贴时代脉搏,将电子政务作为创新的主要突破点,为信息时代背景下的政府职能的顺
1894年朝鲜东学党起义爆发后,清军派出叶志超和聂士成率部入朝助剿。在中日朝三国在撤军问题上争执不休之际,大批日军突然进入朝鲜。清政府为支援先期赴朝的清军,派出军队沿
贯彻落实中央大规模培训干部的战略任务,提高干部领导实践科学发展的能力是新时期党校教育的中心任务。通过对广州地区部属单位领导干部培训工作的调研,肯定了党校教育在提升
<正>在临床骨科中,色素沉淀绒毛结节性滑膜炎属于发病率较低的稀有疾病,现代医学界将这种疾病简称为PVNS。PVNS主要发生在骨骼的关节部位,病人患上这种疾病后,骨骼关节的滑膜