汉语普通话易混淆音素的声学区分

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:heigezi123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着世界经济一体化和我国在世界经济中地位的逐步提高,汉语普通话的学习成为国内外越来越多人士的迫切需求,由于学习人数的急剧增多,普通话教学资源显得越来越匮乏。计算机辅助教学,一方面可以节省大量的汉语教师资源,同时又能满足学生随时随地独立学习的要求,是解决上述问题的一种有效手段。目前世界上主流的计算机辅助教学技术是采用语音识别的框架,这种框架的缺点就是声学模型对相似发音的鉴别能力有限,因此对易混淆音素的评估准确程度不高。为了弥补语音识别框架的这一缺点,本文对计算机辅助教学中汉语普通话易混淆音素的区分进行了研究,针对易混淆音素的声学特征,提出了三种新的特征参数,并采用高斯混合模型(GMM)分类方法,形成一个针对易混淆音素区分的识别算法。在易混淆音素的区分框架中,针对发音方法相同发音部位不同的平舌音和卷舌音的区分,提出了采用强频集中区的能量分布作为区别特征的方法;针对平舌音和卷舌音的能量分布不同,通过美尔三角滤波器组提取高低频的能量累积和,提出了基于美尔倒谱系数(MFCC)特征的新参数作为区别特征的方法;针对人耳听觉感知模型,采用了小波包分解的方法,对易混淆音素的频谱特征进行了精细的描述,提出了基于感觉加权线性预测系数(PLP)特征的新参数作为区别特征的方法,使用GMM对新的特征参数进行分类,并且针对不同的模型阶数进行实验,从而达到区分的目的。
其他文献
本文以微波稀布阵雷达项目为背景,主要介绍了该稀布阵雷达数字单脉冲测量的相关问题。本文首先系统介绍了该雷达的工作原理,其中包括双基地的坐标关系变换、工作波形设计和信
非高斯信号处理是近年来发展起来的一个信号处理的新领域。传统的信号处理是基于高斯分布和二阶统计量的理论和技术,这是因为高斯模型比较简单,且在许多应用场合是适用的,在
图像跟踪器研制完成后,存在对跟踪性能进行评估的问题。随着跟踪器在武器系统中应用的日益增多,研究和发展仿真测试技术,对跟踪器的研制和保障工作具有重要意义。通过图像跟
冠状动脉(冠脉)疾病严重威胁着人们生命健康,能够对高危人群做出及时准确的预测评估极为重要。室性心动过速会有生命危险,并且患者的心电图(ECG)上形成了J波。J点偏移形成的J波,由
纹理是自然界物体表面的一种基本属性,是一种重要而又难以定义的视觉特征。纹理分析作为计算机视觉领域的一个基础研究方向,在许多领域发挥着重要作用。而纹理分类作为纹理分
本文主要研究了配电网电力线通信中的正交频分复用技术和动态频谱优化技术。在分析电力线信道特性的基础上,本文对单用户、多用户情况下应用动态频谱优化技术改善配电网高速通信性能进行了研究,实现了一种单用户条件下的快速比特分配算法,对通信信号功率受限条件下的改进算法进行了仿真,该算法在保证比特分配性能的前提下,有效地降低了复杂度。其次,针对电力线信道存在的严重频率选择性衰落以及不同用户之间的信道差异,本文提
智能天线利用数字信号处理技术和先进的自适应阵列处理技术,产生空间定向波束,使波束主瓣对准用户信号到达方向,旁瓣或零陷对准干扰信号方向,删除或抑制干扰信号,从而提高期
无线传感器网络是由大量部署在监测区域内的智能传感器节点组成,通过无线通信方式形成的一个多跳的自组织的网络系统,集成了传感器、计算机和网络三大技术。它可被应用到军事
文本情感分类是文本处理的重要研究领域,对于互联网舆情监管、信息获取、信息过滤等信息内容安全领域的研究具有重要意义。本文对情感分类问题的文本向量表示形式和向量权值
增强现实技术(AR-Augmented Reality)是在虚拟现实技术(VR-Virtual Reality)基础上发展起来的一项新技术,是将计算机生成的三维虚拟物体同真实场景中的物体无缝融合,从而起到