面向言语工程的语音转换算法研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:killall2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音语料数据库是语音交互技术和中文信息处理的基础。语音识别系统提高识别率,语音合成系统产生流畅的自然语音,充足可靠和高质量的语音语料库是其性能的重要保证。论文主要研究了语音转换中两个方面的问题。一是如何提高声音转换系统(个性化语音合成系统)的转换语音的质量与目标说话人身份信息;二是如何将纯净语音转换为具有电话语音特征的新语音。对于前一个问题,论文主要从频谱平滑、基频曲线映射和遗传神经网络频谱映射等声音转换关键技术的三个方面进行了研究;对于后一个问题,主要从模拟电话信道条件方面研究了纯净语音到电话语音的转换方法。论文主要取得了以下几个方面的成果: (1)一种基于Sinusoidal参数的语音频谱平滑算法论文针对传统LPC频谱平滑算法中将LPC(LinearPredictiveCoding,线性预测编码)参数和残差分别进行插值而导致平滑后语音质量改善不多的问题,提出了一种将描述语音频谱大尺度信息的LP(LinearPredictive,线性预测)模型参数与擅长表现频谱的细节的Sinusoidal模型参数结合起来进行语音平滑的新算法。该算法先对待平滑语音段的LPC参数进行插值,然后以这些插值得到的LPC频谱包络为目标,使用Sinusoidal+全极点模型对待平滑语音段进行修改,使修改后的语音,不仅频谱包络拟合目标频谱的形状,而且同时保持原语音中的细节性信息,从而避免LP平滑中语音音质下降的问题。实验结果显示,该算法对于拼接单元频谱差异较大的情况表现出很好的效果,拼接点处频谱平滑,语音音质较高。 (2)一种基于汉语音节基频曲线为单位的声调码本映射模型论文提出了一种基于汉语音节基频曲线为单位的声调码本映射模型。该模型以汉语音节的基频曲线所表示的声调模式作为基频信息的转换单位,通过语音切分和对准分别提取各语音单元的基频曲线,用聚类方法分别建立两个说话人的声调码本。根据源-目标说话人语音的时间对准关系,计算各声调模式的对应统计值,由此训练一个汉语声调映射码本。声音转换的评估结果表明声调码本映射模型可以较好地消除孤立基频值映射关系的算法上固有的离散性,反映出目标语音的局部基频动态特性,因此能比较准确地发现不同说话人语音的身份信息对应关系。在短时声学频谱特征转换的基础上,声调码本映射法在汉语声音转换技术中增加了转换语音中目标说话人的身份信息,改善了声音转换系统的性能。 (3)一种基于模拟电话信道条件的电话语音转换模型论文通过分析纯净语音在电话信道中形成电话语音的成因后,发现电话语音的形成是电话信道中各种因素共同作用的结果,从而提出了一种由纯净语音向电话质量语音转换的电话语音转换模型。转换模型采用滤波器技术来模拟电话线路连接中各种模拟传输设备频率响应特性,并对电话信道环境中各种噪音行为和其他电话语音现象进行了仿真。频谱失真分析和MLLR(MaximalLikelihoodLinearRegression,最大似然线性回归)自适应识别实验表明,通过模型参数的合理设置和调整,该模型能有效地实现纯净语音向电话质量语音的模拟转换,由纯净语音转换生成的模拟语音减小了训练语音和测试语音声学性质的不匹配,从而改善电话语音识别性能。该模型为解决由于汉语电话语音资源不足的问题提供了一种可行方案。
其他文献
随着城市建设的迅速发展,供暖已成为我国北方地区城市现代化建设的重要问题之一。但是由于我国的供暖技术比较落后,所以造成了资源的巨大浪费。因此,在智能建筑以及工业和民
虚拟化技术是云计算关键技术之一,云计算中的虚拟化技术主要应用于虚拟机的动态迁移。目前,虚拟机动态迁移只是将虚拟机迁移到目的主机,并没有将所处的网络设置一并迁移,然而大部
本文首先介绍了课题背景、研究目的以及国内外轮缘检测技术的发展现状。 其次,具体阐述了本检测系统的工作原理,提出了利用传感器采集的连续的轮缘厚度信息结合轮缘高获取车
随着机器人技术的迅速发展,国际上对机器人的控制问题已经进行了大量研究,虽然力控制在机器人诞生初期就已经被研究者和工程师注意到它的重要性,并开始大量研究,但是到目前为
管道运输已经成为全国五大运输行业之一,在国民经济和生产中占有重要的位置,目前西部大开发的“西气东输”重大工程已经全面开工,十五期间共有近2万公里的“西气东输”管网将
目前,我国的技术服务行业方兴未艾,整体处于发展初期的低水平竞争状态;而现有的企业竞争理论与我国的实践结合较为欠缺。因此,本文旨在建立我国企业发展核心竞争力的切合实际的理
本文首先对干涉型光纤陀螺工作原理作简要介绍,讨论了光纤陀螺相位调制原理和方波调制方案,接着详细分析了闭环光纤陀螺的锯齿波调制和双斜波调制原理。 其次,本文分析了闭环
手眼视觉用于提供目标物体的图像信息和测量物体的位置和姿态,对于空间机器人捕获物体非常重要。本文在比较各种手眼视觉系统特点的基础上,采用DSP评估板——TMS320DM642,研
随着经济的发展,仪表的使用越来越广泛,电表、水表、煤气表、热能表等大量地出现在人们的生活中。针对不同场合的各种各样自动抄表系统不断涌现,它们不仅替代了烦琐的手工劳
目前世界上对海洋资源的利用与开发力度不断加大,开发海洋资源所需的新型机械装备的开发也愈发受到重视,使得海底油气输送管道的铺设技术和机械装备的研发也发展成了海底资源开