【摘 要】
:
在基于LPC的语音合成系统中,采用混合激励声源模型可以提高合成语音的自然度,但传统混合激励模型的线性相位假设与实际语音不符,因而合成语音的自然度还不够理想。本文提出了一种新的脉冲形状滤波器系数提取算法,该算法利用浊音余量信号波形的周期相似性,并在加权均方误差最小的准则下重构浊音相位信息,从而改进了传统混合激励声源模型.实验结果表明,改进的声源模型与传统模型相比合成语音自然度有了显著改善.
【机 构】
:
中国科学院声学研究所,北京,100080;中国科学院研究生院,北京,100039 中国科学院声学研
【出 处】
:
第八届全国人机语音通讯学术会议(NCMMSC8)
论文部分内容阅读
在基于LPC的语音合成系统中,采用混合激励声源模型可以提高合成语音的自然度,但传统混合激励模型的线性相位假设与实际语音不符,因而合成语音的自然度还不够理想。
本文提出了一种新的脉冲形状滤波器系数提取算法,该算法利用浊音余量信号波形的周期相似性,并在加权均方误差最小的准则下重构浊音相位信息,从而改进了传统混合激励声源模型.实验结果表明,改进的声源模型与传统模型相比合成语音自然度有了显著改善.
其他文献
在噪声鲁棒语音识别研究中,并行模型结合方法因其能够满足非平稳噪声环境且理论上使模型接近背景环境匹配模型而成为语音识别噪声鲁棒性研究的重要方法之一。本文提出了利用前后向差分动态特征取代传统的一阶、二阶差分动态参数的特征构造方法MFCCFwDBwD,大大降低了运算复杂度.实验表明,该特征构造方法在PMC的噪声语音识别中取得了较好的结果.
本文主要以厦门方言为例论述了方言语音语料库的建立意义,讨论建库过程中碰到的问题和解决方法,指出语料库可改进之处及改进方法.
本文基于多次汉语合成语音评测的经验,提出了新的评测方法.根据新方法拟定评测细则,组织新的评测实验.文章报告了2004年在中国人民大学信息学院实施的评测实验结果.
本文对普通话和台湾国语中不同位置的双音节词的音高、音长进行了研究.结果表明,普通话和台湾国语在音高、音长方面均存在差异.音高方面的主要差异是,普通话阳平是"中升调",而台湾国语阳平是"中平调";无论是台湾国语还是普通话中上声音节的"升尾"都表现得很不充分,普通话上声是"曲折调",其后半段的调型特征为"微升";台湾国语上声是"低降调".音长方面的主要差异是,韵律短语边界效应在台湾国语中的作用力更大;
本文提出了WMVN(Weighted-MVN)的方法,通过每一维特征参数进行不同权重的方差规整处理,使得各维特征参数的鲁棒性和区分性达到平衡.我们利用分布最大相似准则训练得到最优权重.Aurora2数据集上的实验结果表明,WMVN的相对错误率下降达到了40.96%,相对传统MVN的31.76%有明显的提升.
本文分析了目前客观音质评价的研究方法,重点对无参考源(Non-Intrusive)方法中的ANIQUE算法(AuditoryNon-IntrusiveQUaityEstimation)进行了研究.该方法针对语音信号的时域包络反映了100Hz左右声门激励以及更低频率由声道产生的调制成份信息,利用语音中的2-30Hz包络调制成份,通过与语音中其他频率调制成份比较,来对语音质量做出评价.
不定长技术使得基于语料库的语音合成系统合成出高自然度的语音,而语音库裁剪方法通常会导致不定长的损失.针对这一关键性问题,本文首先提出NuClustering-VPA算法:对不同粒度的不定长变体进行递阶聚类,根据高阶聚类结果调整低阶变体的聚类,从而保留在声韵上最为重要的变体.
声学回声抵消算法(AEC)是全双工免持通信设备中的关键技术之一。本文利用子带算法的灵活性,结合这二者特点,对传统方法加以改进,为不同子带的自适应滤波器分配不同的阶长,在基本保持原有回声抵消性能的基础上,进一步降低了计算量与所需系统资源.
本文介绍了一种新的语音增强算法,这种算法采用进化规划以均方误差为适应度函数对消噪滤波器进行进化操作寻优,并在进化过程中以阶数变异概率对滤波器阶数进行变异操作,实现阶数和滤波器系数的联合优化.仿真实验结果表明:与传统LMS语音增强算法相比,本文提出的算法具有更好的稳健性和使用方便性.
概念优先组合判断的研究有助于语义块结构和功能的确定,也有助于句类分析系统性能的提高.本文利用HNC概念符号知识深入到词语的语义层面,从概念类别的内涵出发,结合概念间语义相关度计算方法以及句类知识对概念优先组合的各种情况进行了初步分析.文章采取演绎和归纳的方法,得到了关于概念优先组合的并联结构、串联结构和混联结构的发现、内部结构分析及边界确定的相关规则,并实际验证了这些规则的有效性.