说话人声音转换方法的研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:tm7749
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  本文总结出了一种基于音素绑定码本映射的新方法,实验表明该方法大大改善了频谱的过平滑所带来的影响,从而使合成语音音质得到了很大的提高。同时,本文应用基于决策树的韵律转换方法以实现复杂的汉语韵律转换。主观测试表明本文中的方法仅需少量的训练数据便能够有效地对说话人特征进行转换,同时保持良好的语音音质。   本文介绍与讨论一种基于TrainableTTS框架的说话人声音转换技术,研究基于TrainableTTS框架的汉语语音说话人声音转换技术,然后利用参数生成算法,合成阶段用到的参数能直接从自适应后的HMM中得到。初步试验表明,用10句自适应语句便能使转换后得到的语音很接近于目标说话人的风格。
其他文献
多输入多输出技术(MIMO,multiple-input multiple-output)由于能够提高无线通信系统性能,取得了飞速发展。但是多小区MIMO系统中,由于多个用户使用着同一信道资源,所以系统中
  本论文的主要工作是:分别从结构与算法两方面来研究CDMA系统的空时联合处理技术,重点在于空域处理及其性能;对现有的空时RAKE接收机的结构进行了详细的研究,并对其性能进行了
3G技术的出现推动了移动通信的快速发展,在一定程度上改变了人们的生活和工作方式。但随着人们需求的不断提高,3G技术逐渐无法满足人们的需求。于是国际标准化组织3GPP提出了
先进音频编码方法AAC(Advanced Audio Coding)是目前压缩效率最高,音质最好的音频感知编码方法。本文介绍了AAC编解码原理,针对其特有的编码工具进行了详细的分析探讨。根据A
随着移动互联网的普及,为了解决移动信息业务数据量快速增长与无线网络传输容量受限之间的矛盾,网络融合技术作为一种有效途径,受到越来越多的关注与研究。此外,从绿色通信的
MPEG-2是标准清晰度数字电视和高清晰度数字电视的图像编码标准。自从1994年标准推出至今,以MPEG-2为标准的各种应用迅速进入人们的日常生活中,使人们深刻感受到它的存在,深刻影
因特网的快速发展和DWDM 在传输领域不可替代的优势,使得下一代互联网必然具有光分组传输和交换的特点。而在已知的几种光分组交换技术中, 光突发交换(OBS)以其灵活性(与OCS
人体运动的跟踪与分析是近年来图像处理与计算机视觉领域中备受关注的前沿方向,属于图像分析和理解的范畴。这一课题在虚拟现实、智能监视系统、感知接口、高级用户界面、运动
小波作为图像处理的一种有效手段已经被人们广泛应用,而且经过提升后的第二代小波已经成为图像压缩标准JPEG2000的重要组成部分。小波提升就是在传统小波的基础上,将传统小波
  本文对OFDM信号的频率同步和信噪比估计进行了研究。文章将高斯信道中的传统方法扩展到线性时变信道中。高斯信道中最大似然(ML)和最小方差无偏(MVU)方法扩展到线性时变