基于MFCC和GMM语音转换技术研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:feng1644
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是人们最直接的沟通方式,对语音信号的处理一直是目前最为热门的研究方向之一。语音转换指通过语音处理手段改变一个人的语音个性特征,使之具有另一个人的语音特征,但同时保持原有的语义信息不变。语音转换是语音信号处理一个重要的分支领域,其涉及到了多个学科,包括生理、声学、信号处理等多个学科,在多媒体配音,医学治疗发声器官受损及保密领域都有十分广阔的应用前景。本文考虑在梅尔倒谱系数和高斯混合模型的基础上设计一个语音转换系统。为此,本文首先介绍了语音转换的定义以及研究的现实价值;接着在此基础上对语音转换的两大主要步骤进行了分析:特征参数的提取以及转换函数的确定。梅尔倒谱系数考虑了人耳的听觉特性,高斯混合模型也很好的拟合了转换函数的曲线,二者都是语音转换领域中热门的选择之一;随后本文设计了一个语音转换系统,将系统分为三个部分:提取部分、训练部分和转换部分,对每一个部分的设计与实现都加以详细的介绍;最后,本文设定了不同的测试方向,采用频谱失真度和平均意见得分测试两种方法从主观和客观两个方面对转换的效果做出了评价。
其他文献
The modeling business processes still remains the responsibility of ITpersonnel. This has produced a gap between business process modelingtechnology and busi
随着网络技术的飞速发展,我们的生活,学习,工作和娱乐与网络联系得越来越紧密。我们充分享受网络带给我们的方便的同时,各种各样的病毒,木马等恶意软件也在网络上大肆流行。这些恶
针对现有模型对P2P流量分类准确率较低的问题,本文提出一种基于深度学习结构、半监督的深度置信网络(Deep Belief Networks, DBN)的流量分类方法,构造P2P流量合适的特征空间,
Web Services discovery is the most important task in the Web Services model to get thebest benefit out of this technology. Researchers have developed keyword ba
随着信息技术的发展,企业在生产中积累了大量的生产数据和经营数据,而这些数据大部分被搁置,没有为企业的生产经营提供有价值的指导。为此,本文利用数据挖掘技术对企业的数据信息
以太网交换机作为接入Internet的不可或缺的关键网络设备,由于其高性能、高转发速度及其价格等优势,已经获得了广泛的应用。   因此,在高等学校计算机网络实验室中,注重学生的
学位
以Gnutella为代表的基于无结构型P2P网络的文件共享系统,已经成为互联网上增长最迅速的应用。但是目前主流的无结构型P2P文件共享系统,基于用户体验的考虑,在查询时往往采用洪泛
手持终端是嵌入式领域的重要应用方向,特别是在检测、通信和信息采集等领域。终端对现场多媒体信息的采集和实时的无线传输可以为下一步的执行做好充分的准备,在实际工作和生
塑料喷嘴在现代工业生产中应用十分广泛。然而,由于生产工艺等各种原因,很容易产生各种气泡缺陷,严重影响产品的质量和应用前景。但是,工艺现场使用人工检测塑料喷嘴中的微小
入侵检测系统普遍存在误报漏报率高、海量信息难以分析等缺陷。随着网络攻击的多样化和智能化,单一技术已难以适应当前安全防御的需求。因此,将多种技术融合起来构建新型入侵