基于声道谱参数的语音转换算法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:shao402248950
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音转换技术是在保留源说话人语义信息不变的前提下,将源说话人的个性特征进行转换,使之听起来像目标说话人的声音。本文主要研究基于声道谱特征参数的语音转换技术,主要内容包括:(1)针对传统的高斯混合模型没有描述说话人间的非线性关系以及易出现过平滑导致转换语音质量不理想的现象,提出基于高斯混合模型与人工神经网络的混合模型语音转换算法,采用径向基函数神经网络对高斯混合模型的均值参数进行转换,建立新的转换规则。主观和客观测试表明,该方法提高了经典语音转换系统的性能,改进了转换语音的音质。(2)针对运用高斯混合模型进行语音转换时容易出现的过平滑现象,本文将多分辨率小波分析用于语音转换中,并在对特征参数进行多分辨率小波分析前,先进行模糊K均值聚类,以提高转换精度与转换速度。仿真实验表明:该算法在提高转换速度的前提下,提高了转换语音的清晰度与可懂度。(3)针对运用传统方法训练径向基函数神经网络出现的收敛速度慢、易陷入局部最优、泛化性能不佳的问题,提出用自适应粒子群优化算法训练径向基函数神经网络进行语音特征建模,获取说话人谱包络的映射关系。主观和客观实验表明:该算法能够降低转换语音的频谱失真,提高转换语音与目标语音的相似性。
其他文献
进入新世纪后,人们对于随时随地进行高速信息通信的愿望越来越强烈,但由于频谱资源有限,人们开始考虑使用高效的信号处理方法来实现数据的高速率传输。多输入多输出(MIMO)技
本文在安腾平台(IA64)上设计并实现了一种高性能的虚拟I/O模型。该课题对“虚拟化技术”、“虚拟I/O技术”具有极大的意义。虚拟技术,是近年来计算机领域最为热门、最为尖端
新一代无线局域网(WL AN)标准IEEE 802.11ac首次采用多用户MIMO技术,并利用波束赋形技术对发送信号进行预编码来抑制用户间的干扰,使得同一时频资源下系统可以支持多个用户通
数字波束形成技术是现代雷达、电子侦查、无线通信中的研究热点之一,能显著提高雷达、通信等电子系统的性能。数字收发组件高额的成本,限制了该技术的应用发展。通过子阵的划
随着现代电子战不断升级,电子干扰、反辐射导弹、隐形武器和超低空突防成为常规单基地雷达的“四大威胁”。面对“四大威胁”,常规合成孔径雷达与常规的单基地雷达一样,不仅正常
天波超视距雷达(Over-the-Horizon-Radar—OTHR)工作在3—30M的高频频段,利用电离层对高频信号的反射作用自上而下的进行目标探测,它在对付低空和超低空突防、反辐射导弹以及
外观品质是稻米一个十分重要的商品性状,是消费者选购稻米的主要依据。针对我国稻米外观品质检测仍停留在人工目测检验阶段,客观性差、效率低、劳动强度大等问题,本论文采用计算
随着移动通信以及无线接入的迅猛发展,多种RAT之间相互补充,逐渐形成异构的融合网络。为了让用户可以享受到不间断的服务,需要统筹资源管理机制来使得各种无线资源进行融合。
协作通信作为“虚拟MIMO技术”,融合了分集技术和中继传输技术的诸多优点,已成为新一代无线通信标准中的关键技术。使得MIMO技术得到实用化,但是与传统MIMO技术有所不同,协作
基于视觉的人体运动分析是计算机视觉研究领域的重要课题之一,被广泛地应用于智能监控、人机交互以及虚拟现实等领域中。人体运动分析的主要目的是从视频序列中检测、跟踪、