语音非线性特性分析及其应用

来源 :南京大学 | 被引量 : 0次 | 上传用户：haidiaiqing

【摘要】

：

语言的声学表现形式——语音一直是人们探究的对象。空气动力学研究表明语音产生过程是非线性的。通过语音信号的非线性动力学特性研究以及语音信号的非线性处理,我们基本了

【作者】

：

赵正敏

【出处】

：

南京大学

【发表日期】

：

2014年期

【关键词】

：

语音非线性分析与处理局部线性化非线性预测递归图分析经验模式分解高阶统计量/谱分析

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语言的声学表现形式——语音一直是人们探究的对象。空气动力学研究表明语音产生过程是非线性的。通过语音信号的非线性动力学特性研究以及语音信号的非线性处理,我们基本了解了语音信号的分形维、Lyapunov指数等“宏观”的非线性特征。但语音是短时非平稳信号。那些基于信号平稳、数据量足够多之假设所得到的分析结果,不能准确细致地刻划语音信号的非线性特征,特别是一些时域或其子空间的微结构特征。语音的非线性分析与非线性信号处理正转向精细结构特性的分析。因此,本文围绕语音的时域及分解子空间的非线性微结构开展研究。这既是认识语音的需要,也是目前电子技术、信号处理技术及计算机科学高度发展的条件下,更有效地应用语音信号处理技术的需要。语音信号的声学原理是研究的基础。首先根据音素的发声机理,讨论浊音的声门振荡模式、清音的湍流声源模式和交互作用模式这三种不同的非线性模式。然后回顾总结已知的语音信号非线性特性。在语音信号分析模型方面,介绍了语音的线性预测模型(Linear Prediction,LP)、非线性回归模型及非线性振子模型,从非线性振子的动力学方程导出了一阶和二阶的局部近似模型,研究了这些模型与LP模型、非线性回归模型之间的关系。这使得由非线性回归模型导出的局部线性预测模型(Local Linear Prediction, LLP)和二阶Volterra模型有了语音声学解释。波形随幅度变化,这是非线性信号的一个特点。语音音素含有振幅时变的起始和结束部分。递归图分析方法是一种适用于短时非平稳信号的图形分析方法。用这种方法分析元音及鼻音信号的起始和结束等暂态部分的特性。这有益于提高那些基于相点距离的非线性分析方法。为了更细致分析语音起始和结束部分的递归特性,我们提出了一种多级阂值递归图的递推方法。这种方法的计算复杂性低于原递归图分析算法。通过分析状态演化进程,提出一种部分自适应多步局部线性预测算法(Partially Adaptive Multi-step Local Linear Prediction, paLLP),并且分析了算法的精度和计算复杂性。和已有的两种非线性递推预测算法比较表明,这种算法有理想的预测精度。而计算复杂性分析表明,这种算法计算量远低于LLP算法。在实验中,以Lorenz混沌序列验证算法的可行性、精度、计算复杂性及抗干扰能力。对元音和鼻音信号的比较性实验结果则表明,在语音的非线性预测中,paLLP算法是一种高效的、高精度算法。和LP算法相比,paLLP算法不仅精度高,而且预测残差中周期性大大减小,这将有益于基于paLLP的码本激励编解码中码书性能的提高。受LD-CELP的启发,我们设计出一种基于paLLP算法的A-B-S(Analysis-by-Synthesis)语音编解码器,介绍了这种编码器的实施原理。作为非线性非平稳信号分析方法,经验模式分解(Empirical Mode Decompo-sition, EMD)也应用于语音信号处理中。EMD的应用使得语音信号的分析可以在其本征模态函数(Intrinsic Mode Function, IMF)子空间中进行,但很多应用中只是直观地选择部分IMF作为后续处理的对象。为了合理选择和应用IMF,本文分析了IMF的非线性特性。由于原始EMD算法筛分过程不稳定,分析中应用加窗平均经验模式分解(Windowed Average-EMD, WA-EMD)方法作语音信号分解。通过预先指定一组期望频率,用WA-EMD算法将语音信号稳定地分解为一组指定个数的IMF。通过估计IMF功率谱的Hurst指数,区分出包含原语音中重要信息最多的IMF。用高阶奇异谱分方法分析各IMF的嵌入维信息。结果表明,除了少数高频IMF,其它的IMF嵌入维都低于原语音信号的嵌入维。最后估计各元音所有IMF的三阶谱和归一化三阶谱,分析IMF的非线性。实验结果表明,包含原语音中信息最多的IMF基本上是线性的。这将简化诸如语音瞬时基音频率的估计等语音处理。本文的研究成果让我们更加深入地认识语音信号的非线性特性,提高语音信号的非线性处理性能。

其他文献

基于梯度折射率器件的波束扫描阵列研究

波束扫描阵列可以实现电磁波的高增益辐射和扫描,但在应用时存在扫描范围有限,系统复杂的问题。梯度折射率器件可以实现电磁波传播方向的调控,将其应用于波束扫描,具有传统波

学位

梯度折射率器件波束扫描阵列变换光学超材料龙伯透镜透镜天线3D打印双折射

当前事业单位财务管理的现状及其对策

引言事业单位财务管理是指事业单位在执行事业计划、开展业务活动过程中,有关经费的筹集、运用、报销、管理和监督等事项.在整个社会再生产中,事业单位属于非生产性部门,它

期刊

基于微课的“翻转课堂”模式特点与教学内容设计

针对目前传统课堂教学存在的问题，利用新兴教学资源方式“微课”和新兴教学模式“翻转课堂”实现课堂教学改革，是网络与信息技术在教育教学领域的深入应用。“微课”体现了以学

期刊

微课翻转课堂改革教学设计micro-lessonflipped classroomreformationteaching design

瑞邦齿泰——自固压磷酸钙根管充填剂充填根管的临床评价

根管充填是将去除牙髓，并经预备的空虚根管充填起来，隔绝根管和根尖周组织交通，防止再感染，它是根管治疗的最终步骤，也是非常重要的步骤。本文论讨应用瑞邦齿泰糊剂充填根管50例与

期刊

瑞邦齿泰糊剂根管充填

磷脂酶A2与高血压大动脉血管重构关系初步研究

目的探讨磷酸化胞浆型磷脂酶A2（cPLA2）及其上游激酶MEK与高血压大动脉血管平滑肌细胞增殖/凋亡失衡的关系,进一步探讨高血压状态下大动脉血管重构的可能机制。方法将4、16、24

期刊

高血压主动脉血管平滑肌细胞胞浆型磷脂酶A2MEKhypertension aorta vascular smooth muscle cells cyt

赢得90后消费者

“90后”正逐渐成劳动力和消费市场的主力，这群在国内经济进入繁荣期之后出生的一代人，他们独特的成长环境形成了与上一代人完全不同的价值观和行为方式，也因此形成了独特的消费

期刊

“90后”消费者消费市场国内经济行为方式成长环境消费模式劳动力

围手术期护理宣教工作的必要性

随着以患者为中心的服务理念出台以来，整体化护理模式的普及，促进以人为本护理服务工作的开展，围手术期患者护理宣教工作越来越受到重视，开展术前护理宣教工作尤为重要，一方面让患

期刊

围手术期护理宣教工作服务理念护理模式服务工作以人为本术前护理心理压力

D-海因酶和水解酶在中华根瘤菌中的增强表达

以质粒pBBR1MCS-5为载体,将D-Case和D-Hase基因以多顺反子形式置于其lac启动子控制下,转入中华根瘤菌,经30℃发酵培养24 h,在不添加诱导剂的情况下,总酶活比野生菌提高了2倍.

期刊

D-海因酶N-氨甲酰基-D-氨基酸酰胺水解酶D-对羟基苯甘氨酸中华根瘤菌

通风空调系统兼作消防补风系统可靠性分析

随着社会的不断发展以及经济的进步,面对商业综合体的日益发展,在通风空调系统兼作消防补风系统检查面临的消防补风出现异常情况的现象,是非常严重的,本文将对其进行一定的分

期刊

通风空调系统消防补风系统可靠性分析

不同农地利用方式土壤砷、汞累积特征分析及评价研究

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

期刊

农地利用土壤砷土壤汞生态风险评价

语音非线性特性分析及其应用

与本文相关的学术论文