【摘 要】
:
语声转换是指对一个说话人(源说话人)的语声信号进行变换,使其话音中含有另外一个说话人(目标说话人)的语声个性特征。人通过语音信号主要来传达其中的语义信息,除此之外语声
论文部分内容阅读
语声转换是指对一个说话人(源说话人)的语声信号进行变换,使其话音中含有另外一个说话人(目标说话人)的语声个性特征。人通过语音信号主要来传达其中的语义信息,除此之外语声中还包含说话者的个性化信息。VC系统设计的宗旨就是要改变语声的个性化信息但要保证原有语义信息不变,使一个人的语音经系统变换后如同另一个人发出的语音。论文主要研究高质量语音转换系统中的关键技术,主要工作包括:1、高质量的语音转换系统在达到基本的语音转换要求外,还要解决系统合成语音的机械不自然等问题;从语音的发声机理出发研究适合VC系统的语音分析模型,对应的语声参数以及用于VC系统中的转换算法。着重研究基于高斯混合模型GMM的语音转换系统的主要算法,并对其进行了仿真实现,给出了主客观测试结果。2、针对传统VC系统普遍存在的语音自然度低的问题,提出并实现了一种基于音长变化的语音转换系统的改进算法,通过对转换后的参数插值变换来改变语音的音长。听音测评结果表明经过改进后的转换语音自然度和可懂度都有相应的提高。3、在采取上述改进算法的GMM语音转换系统中,选取更利于人耳声音感知的美尔倒谱参数MFCC进行变换操作;给出了转换前后语音的MFCC三维图以及语音波形图,实验结果表明采用改进算法后的转换语音和目标语音较为接近,VC系统的质量得到了提高。
其他文献
多输入多输出系统(MIMO)的核心原理是利用多根发射与接收天线所提供的空间自由度提升无线通信系统的频谱效率,以提高传输速率并改善通信质量。纵观MIMO的研究成果,大多数集中
传统的CDN网络对内容分发,尤其是流媒体内容的分发起到了关键作用,使VOD成为可能,促进了电信流媒体业务的发展。但是传统的CDN也有其一定的局限性,比如部署成本相对较高,支持
随着新型技术的不断出现以及无线设备数量的增加,无线频谱资源变得日趋紧张,因此如何节约频谱资源、提高频谱利用效率就成为了目前无线通信领域一个重要的问题。认知无线电的
雷达信号处理的发展一直是雷达技术发展的核心。脉冲多普勒(PD)雷达的信号处理单元包括正交采样、脉冲压缩、动目标检测(MTD)、恒虚警检测(CFAR)、解模糊等,其中每步处理的精
图像超分辨率重建是指由单幅或多幅低分辨率图像重建一幅高分辨率图像的技术。这种技术在安全监控、军事和医学等多个领域具有广阔的应用前景。本文首先给出常用的图像观测模
2017年6月13-16日,由中国铸造协会主办的2017第十五届中国国际铸造博览会暨第十二届中国国际压铸工业展览会在上海新国际展览中心隆重举行.本次展会展览面积逾10万平方米,吸
传统基于密码和卡片的身份认证方式已不能满足现代人们的生活和工作需要,指纹识别是根据每个人自身特有的生物特征进行身份识别,具有很高的适用性和可行性。指纹识别算法较多,然
随着多种无线接入技术的发展,以异构网的融合与协同为重要特征之一的无线泛在网络成为未来网络的必然发展趋势,传统的切换控制机制面临新的挑战,需要新的网络选择和切换方法来应
中低信噪比下,Turbo码可获得接近Shannon极限的纠错性能,但由于其最小距离较小,在高信噪比时会存在“误码平台”现象。三维Turbo码针对Turbo码的“误码平台问题”,通过在传统Turb
信道编码和RAKE接收技术均是WCDMA系统物理层的关键技术。本文分别就Turbo码中交织器的等差错保护(EEP)问题和HSUPA中GRAKE接收机的指峰选择算法进行了研究,并提出相应的改进