倒谱本征空间结构化高斯混合模型语音转换方法

来源 :声学学报 | 被引量 : 0次 | 上传用户：littleshrimp1

【摘要】

：

针对非平行语料非联合训练条件下的语音转换,提出一种基于倒谱本征空间结构化高斯混合模型的方法。提取说话人语音倒谱特征参数之后,根据其散布矩阵计算本征向量构造倒谱本征

【作者】

：

李阳春俞一彪

【机构】

：

苏州大学电子信息学院,

【出处】

：

声学学报

【发表日期】

：

2015年01期

【关键词】

：

本征空间倒谱高斯混合模型说话人散布矩阵特征参数高斯分布声学特征转换函数模型匹配

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对非平行语料非联合训练条件下的语音转换,提出一种基于倒谱本征空间结构化高斯混合模型的方法。提取说话人语音倒谱特征参数之后,根据其散布矩阵计算本征向量构造倒谱本征空间并训练结构化高斯混合模型SGMM-ES(Structured Gaussian Mixture Model in Eigen Space)。源和目标说话人各自独立训练的SGMM-ES根据全局声学结构AUS(Acoustical Universal Structure)原理进行匹配对准,最终得到基于倒谱本征空间的短时谱转换函数。实验结果表明,转换语音的目标说话人平均识别率达到95.25%,平均谱失真度为1.25,相对基于原始倒谱特征空间的SGMM方法分别提高了0.8%和7.3%,而ABX和MOS测评表明转换性能非常接近于传统平行语料方法。这一结果说明采用倒谱本征空间结构化高斯混合模型进行非平行语料条件下的语音转换是有效的。 Aiming at the speech conversion under the condition of non-parallel corpus non-joint training, a method based on cepstrum eigenspace structured Gaussian mixture model is proposed. After extracting the speech cepstrum feature parameters, the eigenvector is calculated according to its scatter matrix to construct the cepstrum eigenspace and to train the Structured Gaussian Mixture Model in Eigen Space (SGMM-ES). The SGMM-ES, independently trained by the source and the target speaker, is matched and aligned according to the Acoustical Universal Structure (AUS) principle, and finally a short-time spectral conversion function based on the cepstrum eigenspace is obtained. The experimental results show that the average speech recognition rate of the target speaker who converted speech reaches 95.25% and the average spectral distortion is 1.25, which is respectively 0.8% and 7.3% higher than that based on the original cepstrum feature space. However, the ABX and MOS tests show that the conversion Performance is very close to the traditional parallel corpus method. This result shows that it is effective to use the cepstrum eigenspace-structured Gaussian mixture model to convert speech under non-parallel corpus.

其他文献

髌股关节不稳中胫骨平台后倾角与股骨后髁偏距的相关性研究

目的：对股骨滑车发育不良所致髌股关节不稳患者进行测量分析，测量其胫骨平台后倾角（Posterior tibial slope，PTS）与股骨后髁偏距（Posterior condylar offset，PCO），分析患者PTS与PCO较

学位

髌股关节不稳胫骨平台后倾角股骨后髁偏距滑车发育不良相关性分析

双源CT诊断兔急性肺栓塞实验研究

目的：肺动脉栓塞（Pulmonary Embolism,PE）是指内源性及外源性栓子堵塞肺动脉主干及其分支引起肺循环障碍的临床和病理生理综合征。有文献报道PE患者若不及时治疗，死亡率可达30％，如

学位

肺动脉栓塞CT肺动脉成像双能量肺灌注成像诊断率

STAT1基因对胶质瘤细胞系U251细胞周期的影响及机制研究

目的：探讨STAT1在胶质瘤细胞系U251中的表达情况，以及STAT1与相关蛋白P53、P21、Cyclin A、Cyclin E相关性和变化趋势，进一步探讨STAT1对胶质瘤细胞系U251细胞周期的影响及可能

学位

脑胶质瘤病理机制STAT1基因U251细胞细胞周期基因调控

媒介研究的认识论呼唤

对当代媒介的变革及其呈现的复杂景观给予认识论层面的探讨和分析，揭示其规律，剖析其机制，陈说其利弊，研制应给予的对策，并非单纯是为了回应当代媒介带给精神生活的某些负面影响，而是当代媒介在运行中确有许多必须从哲学方法上去解决的难题：它们大大超出了传统认识论的方法与视界，

期刊

认识论媒介技术媒介研究媒介文化当代精神生活哲学方法媒介系统语符受众

孕马流产原因与防制措施

母马流产是妊娠各个阶段因各种内外因素导致妊娠中断并胎儿排出体外的过程.一般入冬初期(11～12月份)和初春(2～3月份)相对性较为多见.据统计,流产因素具有损伤或者管理性流产(蹄

期刊

母马流产原因防制措施

TACE联合微波热消融术在原发性肝癌治疗中的临床观察

目的：　　比较分析单纯肝动脉栓塞化疗(transcatheter arterial chemoembolization，TACE)及微波热消融(percutaneous microwave coagulation therapy，PMCT)联合TACE治疗原发性肝

学位

原发性肝癌肝动脉栓塞化疗微波热消融术临床疗效

牛消化系统疾病的发病原因与治疗分析

在牛小规模养殖经营状态下,给牛消化系统疾病诊治工作带来一定的困难,因此,加强牛消化系统疾病发病原因与治疗方法探究意义明显.提高牛消化系统疾病诊疗水平不但能够降低疾病

期刊

牛消化系统疾病发病原因治疗策略

320排CT冠状动脉成像对冠心病的诊断价值

目的本研究通过320排器官动态容积CT(Dynamic Volume CT, DVCT)与选择性冠状动脉造影(selective coronary angiography,SCA)对照研究,评价320排DVCT冠状动脉成像技术诊断冠状

学位

320排CT冠状动脉造影冠状动脉疾病体层摄影术

牛网尾线虫病的诊断与防治思路总结

牛网尾线虫病是由胎生网尾线虫寄生于牛等动物的呼吸器官而引起的一类线虫病.此病多数病程缓和,而且病程较长.无继发感染多数不表现突出症状,极易被养殖户所忽视.但是,此病带

期刊

寄生虫病防控牛网尾线虫病

奶牛乳腺炎的病因分析核心研究

奶牛养殖生产期间,奶牛乳腺炎属常见多发病,由此而造成的经济损失甚大.尤其是隐性乳房炎,隐蔽性强、发病率高,属威胁世界乳业发展最严重的诱因之一.文章分析奶牛乳腺炎症状,

期刊

乳房炎危害经济损失

倒谱本征空间结构化高斯混合模型语音转换方法

与本文相关的学术论文