一种基于x-vector说话人特征的语音克隆方法

来源 :信息工程大学学报 | 被引量 : 0次 | 上传用户:wuyinfei1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于SVTTS架构的语音克隆系统采用d-vector描述说话人编码特征,由于该特征提取过程中没有考虑到整段句子的语音信息,从而影响了克隆语音的相似度。针对此问题,提出一种基于x-vector说话人特征的语音克隆方法。该方法采用x-vector作为表征目标说话人的嵌入向量,拼接到合成器中,并通过声码器克隆出目标说话人的语音。实验结果表明采用x-vector的方法提取嵌入向量的相似度更高;与传统方法相比,该方法克隆语音的自然度和相似性分别提升了0.32和0.14。
其他文献
现阶段微课成为当下重要的教学手段之一,得到教育学者们的关注和重视。传统的教学模式是教师在上面讲,学生在 下面听,而微课完全摆脱了这种传统的教学模式,不受到时间和空间
针对多接入边缘计算(Multi-access Edge Computing,MEC)中用户计算卸载决策可能暴露用户特征泄露用户隐私的问题,提出一种基于卸载频率的隐私保护计算卸载方法。首先,分析了
高校要培养高素质人才,积极开展大学生社会实践活动,但由于受传统教育理念和模式的制约,加之社会实践教育经 费紧张、师资缺乏、体制不健全等多种问题,导致严重的“理论重、
首先,阐述了5G技术的超高速率、海量连接、超低延时和超高可靠性特点,分析了在军事传输交换、指挥控制、无人作战等方面的应用潜力;其次,分析5G技术无缝联接各类异构网络、支
课上,对学生核心素养进行培养,不仅是教育改革要求,也是课程价值追求,是学生全面发展的应然要求。同时,对 学生核心素养进行培养,利于调动他们积极性,让他们拥有良好学习动力
多示例学习为语音内容分类提供了一种新思路。提出将语音内容分类任务转化为多示例学习问题,首先通过音素识别器将语音转化为音素序列,其次对音素序列进行tri-phone建模并分
我国自实施全面素质教育后,劳动教育深受教育部门的重视,虽然在学校教育中,劳动教育处在薄弱流程,但教师需 要有效融合劳动教育和各学科教学,培养学生动手能力和意识。语文教
对一新型双旋流燃烧室开展了实验测量,研究了燃烧状态参数2种变化过程对火焰热声振荡特性的影响(过程1:保持甲烷体积流量不变,当量比从0.900逐步减小至0.725再逐步增大至0.92
在分析洋葱网络和折射网络类匿名系统的基础上,设计一种新的基于诱骗路由的匿名通信系统。针对现有折射网络类系统匿名性不强的问题,结合洋葱网络层次化加密思想和“端到中”
根据防空兵部队军事训练的特点规律和实际情况,构建了防空兵部队军事训练软环境评价指标体系,采用层次分析法和模糊综合评价法对防空兵部队军事训练软环境进行评价,实现了定