基于人工神经网络模型的说话人转换算法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:XM201314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人转换是通过将一个说话人(源说话人)的语音个性特征转换成另一个说话人(目标说话人)的语音个性特征,而保持说话内容和情感特征不变的一门技术。经过转换后得到的声音要听起来像目标说话人的声音,同时保持源说话人的说话内容及情感特征不变。该技术具有重要的理论研究价值和良好的应用前景。本文主要围绕说话人转换中的基频轨迹转换和频谱包络参数转换这两项关键技术进行研究,主要工作和创新如下:(1)对目前已有的基频轨迹转换算法进行实验研究比较,发现目前的转换算法大多是简单的线性变换,而事实上两个说话人之间的基频轨迹是非线性映射关系。针对传统转换算法存在的问题(采用线性变换实现基频转换),提出基于RBF神经网络的基频轨迹转换算法,通过将基频轨迹分成等长的数据段,再分别对其进行建模,找出源和目标之间的映射规则,从而实现基频轨迹的转换。主客观测试表明:该算法既提高了特征参数转换的精确性,也增强了合成语音的自然度。(2)传统的说话人转换算法都是将音段信息参数和超音段信息参数独立开来,分别进行转换,最后再一起合成转换语音。而越来越多的研究表明,两者之间隐藏着很大的关联性,可以从一个参数中提取出另一个参数的信息,将其独立开来分别转换的方法,势必会破坏两者之间的联系,影响转换后的效果。针对这一问题,提出将频谱信息参数和基音频率参数结合起来,组成短时联合谱参数,一起作为特征参数进行训练和转换。实验证明:改进后的转换效果均优于同等条件下的传统算法。(3)通过对传统神经网络用于说话人转换算法的研究,发现影响神经网络转换效果的关键因素是隐含层的中心值和权值矩阵。对求解关键因素的算法加以改进,增强转换的精确性,势必会有效提高神经网络的转换效果,基于这样的分析,提出利用量子遗传算法优化神经网络,进而实现说话人转换。主客观实验的测试结果表明:基于改进算法得到的转换语音既提高了与目标语音之间的相似度,也增强了合成语音的清晰度。
其他文献
无线传感器网络是由大量体积小、能耗低、计算、通信和存储能力有限的传感器节点组成的自组织网络,广泛应用于军事和民用领域,有着非常广阔的研究前景。覆盖和连通是无线传感
在无线室内定位研究中,目前通常使用的是WiFi位置指纹方法,该方法分为离线指纹数据库建立阶段和在线定位阶段,离线阶段首先把楼层划分成网格,将网格中心点定为位置指纹点,逐
嵌入式Linux作为主流嵌入式解决方案,在嵌入式环境下处理蒙文的技术还处于起步阶段,这主要由于蒙文不同于中、英文的语法和书写特点,蒙文要求竖直从左到右排版,而Linux不支持
形式概念分析是应用数学的一个领域,它对哲学上的概念进行了数学化和层次化的解释。概念作为思想和知识的基本单元,成为人工智能学科的重要研究对象,推动了形式概念分析在知
财务会计概念框架已经成为财务会计理论的核心内容。许多西方发达国家和国际会计准则委员会都非常重视对财务会计概念框架的研究,并已纷纷建立起各自的概念框架体系。在构建财务会计概念框架时,采取“两步走”的思路和步骤,即第一步先修改、完善基本准则,使其充当现阶段财务会计概念框架的角色;第二步,等到时机成熟,再将基本准则转化为真正的形式与实质相统一的财务会计概念框架。虽然《企业会计准则——基本准则》已发布,但
财务管理假设是具有十分重要的现实意义的,对于财务人员解决企业财务问题有重大的帮助。例如资金增值假设说明了财务管理存在的现实意义,风险与报酬同增假设又要求财务管理人员不能盲目追求资金的增值,因为过高的报酬会带来巨大的风险。此两项假设为科学地确立财务管理目标、合理安排资金结构、不断调整资金投向奠定了理论基矗风险报酬原理、利息率的预测原理、投资组合原理也都是依据此项假设展开论述的。在企业财务管理中,货币
伴随着社会的快速发展,汽车产业已成为现代社会的一个重要标志。在计算机和电子技术快速发展的背景下,汽车已经和电子技术紧密结合在一起,汽车的机械结构更加复杂,运行性能更
学位
血管内超声是目前临床普遍采用的诊断血管病变的介入性影像手段,特别是对冠心病的诊断起着举足轻重的作用。由于冠状动脉附着在心脏的外表面上,随着心脏的搏动有规律地运动,
学位