汉语语音识别中决策树参数聚类及结构调整方法研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:geng20516136
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代通信技术的飞速发展,语音识别具有巨大的应用前景,涉及的领域非常广泛。在发达国家,一些基于中小词汇、特定领域的语音识别产品已经投入使用,如声控电话拨号系统、语音记事本、电话服务、语音查询等等。但是在大词汇量连续语音识别方面,距离理想的语音识别性能仍有相当的距离。因此,非特定人、大词汇量连续语音识别已成为目前研究的热点和难点,许多相关的问题需要深入探讨。本文从系统和算法的角度出发,以提高模型参数训练的鲁棒性和系统识别性能为主要目的,对基于语音学决策树参数聚类、决策树结构调整和快速说话人自适应等方面做了重点研究。 本文首先研究了基于语音学决策树参数聚类问题。一方面,针对传统决策树状态聚类受稀少三音子的影响,聚类后捆绑状态数过多、节点数据平衡性差等问题,提出了语音学决策树分级状态聚类算法。该算法首先对稀少三音子进行处理,然后对决策树叶节点进行加权合并。另一方面,针对决策树对应状态间的高斯混合参数存在重叠现象,为提高参数训练的鲁棒性,本文采用高斯参数聚类的策略。由于人们通过听觉器官识别语音信号的过程具有一定的模糊性,使得模糊集的思想在语音识别中得到广泛应用,并取得很好的效果。因此,本文将模糊聚类思想引入模型的参数聚类,利用模糊等价矩阵完成模型高斯参数聚类,并利用模糊聚类软聚类的特点构建异音混合共享模型。 接着,本文针对训练语料与测试语料的决策树结构不匹配会对系统性能和说话人自适应造成影响,首先通过研究识别结果中状态之间发生的混淆情况,提出了利用调整决策树叶节点(状态)结构的算法,横向地对决策树结构进行调整,从而减少由于这种结构不匹配造成的识别率降低。状态结构调整算法的基本思想是:1)利用训练语料对状态结构调整可以提高模型本身的精度;2)在此基础上利用自适应语料对状态结构调整可以使决策树结构包含更多的测试人信息。然后,在研究不同复杂度的语音学决策树对系统性能和说话人自适应影响的基础上,本文提出了一种决策树剪枝算法——基于最小描述长度准则的决策树动态剪枝。该算法利用训练充分的决策树作为初始模型,根据自适应语料的数量动态地选择不同复杂度的模型。决策树剪枝时初始模型的合理选择,自适应语料的充分利用以及最小描述长度准则对随机模型和确定性模型的集成,使得这种决策树动态剪枝算法与说话人自适应相结合时取得了较好的识别结果。 本文最后对快速说话人自适应问题进行了研究。在讨论了最大后验概率估计算法、最大似然线性回归算法以及最大似然模型插值算法优缺点的基础上,提出了变换矩阵线性插值算法,并将该算法与最大后验概率估计相结合。这种结合的算法凭借转移矩阵线性插值算法满足快速说话人自适应的特性,又结合最大后验概率估计算法对特定说话人系统的渐近性,较好地提高了说话人自适应的性能。 本文对所提出方法进行了大量的语音识别实验,实验结果表明所提出的方法均能在一定程度上有效地改进系统性能。同时,本文提出的方法具有很强的通用性,适用于具有背景噪音或不同年龄、不同性别等多种情况下的语音识别。
其他文献
氮素在土壤中的转化直接关系到氮肥的有效利用和环境效应,是农业、环境和生态科学的重要研究内容。土壤中氮素转化主要受微生物驱动,有机质作为支撑微生物活动的碳源和能源物质
基于北京邮电大学通信光电子学实验室的现有条件,结合相关项目,笔者在该文中对RCE/HBT集成光接收器件的设计、制备进行了重点研究;在任晓敏教授的指导下,作者将"圆柱型半导体
图像修复在图像处理技术中是一个研究热点,在诸多方面有着重要的应用,在日后研究领域中依然有着重要的研究价值。本文主要研究了图像修复算法中针对结构性和纹理性的算法,对
开发适应多种现场总线的可通信低压电器已经成为一个重要的发展趋势。现在一些国外大公司新开发的断路器都开始可以与部分现场总线连接;而国内一些公司新开发的可通信断路器基
在工业控制中,对磁场、温度、压力等信号进行实时测量时,通常有两种方式:一种是通过现场总线的方式,将信号传送至远程PC机;另一种方法是将检测到的信号转换成电流信号后进行
“十一五”期间是我国城镇化加速的历史关键时期,快速城镇化意味着我国将迎来重要的城乡社会转型,使得城乡区域的土地利用、生态环境发生明显变化,耕地、淡水和能源相对不足,原生
光碟机以其高容量、低成本、传输速度快及可控性佳等优点,已成为资料存储装置中的首要之选。而且随着存储容量及市场需求的增加,其发展空间具有很大潜力,所以光盘驱动器是目
本论文认真分析了当前城域网的发展趋势及技术特点,对当前城域网的关键技术作了较为深刻的分析和研究,对目前正在发展中的MSTP内嵌技术进行了分析,作者提出了在城域网中实现信道
铁是所有生物正常生长发育所必需的营养元素之一,在长期的进化过程中,高等植物逐渐形成了两种独特的铁高效吸收机理(机理Ⅰ和机理Ⅱ),以适应环境有效铁的缺乏。这两种机理所
随着国内高速铁路技术的不断发展和高速铁路网的不断完善,普通公共移动通信系统与传统铁路模拟通信系统已不能满足铁路运营和旅客出行对移动通信系统的技术要求。为高速铁路网