基于GMM的独立建模语音转换系统研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:fchbo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音转换就是对一个说话人(源说话人)的语音信号进行转换,使之听起来像另一个说话人(目标说话人)语音的技术。这项技术几乎囊括了语音信号处理领域的各个方面,它的研究对语音分析,语音编码,语音合成,语音增强,语音识别等方面有重要的促进作用。本文提出了一种基于GMM独立建模的转换方法,主要内容包括:(1)提出了一种独立建模的方法,对源和目标说话人语音特征分别建立GMM模型,解决了传统基于GMM的联合建模转换系统中,需要并行语料,不适应多人转换等缺点。(2)通过输入语音特征矢量,动态确定转换规则,进行语音转换,解决了传统转换系统中,转换函数非动态这一缺陷,使得转换规则更为灵活,从而增强转换精确性。(3)基于线性预测(LP)分析合成平台,对源与目标说话人LPCC特征独立建立GMM模型,对测试语音进行转换,分析得到转换结果,并做出相应评测与分析。(4)基于STRAIGHT分析合成平台,对源与目标说话人STRAIGHT分析得到的谱包络进行建模分析,并对测试语音进行转换,得到结果,并做出评测分析。(5)基于语音结构化(AUS)理论,改进转换系统,成功实现语音转换,解决了在转换系统中,源与目标相同音素聚类的GMM分量如何对齐这一难题,通过系统实验,取得了阶段性成果。(6)以基于GMM的源与目标联合建模的模型为蓝本,比较独立建模的转换系统,相对于同样的测试语音,其结果的差异性。
其他文献
近些年来,计算机技术、嵌入式技术、通信技术、视频压缩技术的飞速发展,为基于嵌入式流媒体技术的应用提供了广阔的空间。稳定的网络流媒体系统需要解决视/音频编解码、网络
H.264是由ISO/IEC与ITU-T组成的联合视频组(JV7)制定的新一代面向未来IP和无线环境下的视频压缩标准,它在视频压缩效率方面比目前其它的视频压缩标准都要高,但是H.264也具有
老鹰等动物能快速、准确地从复杂背景中捕获和跟踪猎物的能力一直是智能跟踪系统发展和追求的目标。通过仿生动物视觉神经信息处理系统实现复杂背景下的运动目标检测与跟踪,
近年来,随着各种高速、超高速飞行器的问世,传统的雷达探测技术面临着严峻挑战,因而对高速目标的检测方法展开研究具有十分重要的意义。脉冲多普勒雷达通常采用长时间积累方
单载波块传输技术是类似于OFDM的高效传输技术。它一方面具有OFDM分块传输、分块处理的特征,另一方面具有单载波传输系统低峰均功率比的优势,同时接收端用复杂度较低的频域均
随着通信技术、嵌入式技术、微机电系统、传感器技术的迅速发展,具有一定感知能力、计算能力和通信能力的无线传感器开始出现。无线传感器网络(WSN)能够协作地实时监测、感知
随着数字图像以及图像数据库数量的快速增长,图像检索已成为信息检索领域中的一个重要研究方向,它的目的是从图像数据库中快速提取出与查询相关的图像或者图像序列,使用户能
本文以基于被动毫米波成像的人体隐匿违禁物品自动检测识别为应用背景,对毫米波图像的检测、特征提取、分类识别展开了深入细致研究。隐匿物品的检测通过预处理实现,包括图像
认知无线电技术是目前解决频谱资源稀缺问题的核心技术,频谱感知是保证该技术得以实施的前提。为了保证授权用户的正常传输,同时满足认知用户的速率要求,必须要求认知用户能
20世纪末,数字多媒体的安全问题成为信息安全领域的研究热点。文本图像作为一类特殊的数字多媒体,在社会生活中具有举足轻重的地位。在当前脆弱的互联网安全机制下,某些重要