汉语语音识别中决策树参数聚类及结构调整方法研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户：geng20516136

【摘要】

：

随着现代通信技术的飞速发展，语音识别具有巨大的应用前景，涉及的领域非常广泛。在发达国家，一些基于中小词汇、特定领域的语音识别产品已经投入使用，如声控电话拨号系统、语音记

【作者】

：

徐向华

【机构】

：

上海交通大学

【出处】

：

上海交通大学

【发表日期】

：

2005年期

【关键词】

：

汉语语音识别决策树参数聚类结构调整模糊聚类

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着现代通信技术的飞速发展，语音识别具有巨大的应用前景，涉及的领域非常广泛。在发达国家，一些基于中小词汇、特定领域的语音识别产品已经投入使用，如声控电话拨号系统、语音记事本、电话服务、语音查询等等。但是在大词汇量连续语音识别方面，距离理想的语音识别性能仍有相当的距离。因此，非特定人、大词汇量连续语音识别已成为目前研究的热点和难点，许多相关的问题需要深入探讨。本文从系统和算法的角度出发，以提高模型参数训练的鲁棒性和系统识别性能为主要目的，对基于语音学决策树参数聚类、决策树结构调整和快速说话人自适应等方面做了重点研究。本文首先研究了基于语音学决策树参数聚类问题。一方面，针对传统决策树状态聚类受稀少三音子的影响，聚类后捆绑状态数过多、节点数据平衡性差等问题，提出了语音学决策树分级状态聚类算法。该算法首先对稀少三音子进行处理，然后对决策树叶节点进行加权合并。另一方面，针对决策树对应状态间的高斯混合参数存在重叠现象，为提高参数训练的鲁棒性，本文采用高斯参数聚类的策略。由于人们通过听觉器官识别语音信号的过程具有一定的模糊性，使得模糊集的思想在语音识别中得到广泛应用，并取得很好的效果。因此，本文将模糊聚类思想引入模型的参数聚类，利用模糊等价矩阵完成模型高斯参数聚类，并利用模糊聚类软聚类的特点构建异音混合共享模型。接着，本文针对训练语料与测试语料的决策树结构不匹配会对系统性能和说话人自适应造成影响，首先通过研究识别结果中状态之间发生的混淆情况，提出了利用调整决策树叶节点(状态)结构的算法，横向地对决策树结构进行调整，从而减少由于这种结构不匹配造成的识别率降低。状态结构调整算法的基本思想是：1)利用训练语料对状态结构调整可以提高模型本身的精度；2)在此基础上利用自适应语料对状态结构调整可以使决策树结构包含更多的测试人信息。然后，在研究不同复杂度的语音学决策树对系统性能和说话人自适应影响的基础上，本文提出了一种决策树剪枝算法——基于最小描述长度准则的决策树动态剪枝。该算法利用训练充分的决策树作为初始模型，根据自适应语料的数量动态地选择不同复杂度的模型。决策树剪枝时初始模型的合理选择，自适应语料的充分利用以及最小描述长度准则对随机模型和确定性模型的集成，使得这种决策树动态剪枝算法与说话人自适应相结合时取得了较好的识别结果。本文最后对快速说话人自适应问题进行了研究。在讨论了最大后验概率估计算法、最大似然线性回归算法以及最大似然模型插值算法优缺点的基础上，提出了变换矩阵线性插值算法，并将该算法与最大后验概率估计相结合。这种结合的算法凭借转移矩阵线性插值算法满足快速说话人自适应的特性，又结合最大后验概率估计算法对特定说话人系统的渐近性，较好地提高了说话人自适应的性能。本文对所提出方法进行了大量的语音识别实验，实验结果表明所提出的方法均能在一定程度上有效地改进系统性能。同时，本文提出的方法具有很强的通用性，适用于具有背景噪音或不同年龄、不同性别等多种情况下的语音识别。

其他文献

肥际养分浓度下有机质对红壤水稻土和黑土中氮素转化作用的影响

氮素在土壤中的转化直接关系到氮肥的有效利用和环境效应，是农业、环境和生态科学的重要研究内容。土壤中氮素转化主要受微生物驱动，有机质作为支撑微生物活动的碳源和能源物质

学位

肥际养分浓度有机质含量氮素转化红壤水稻土黑土

单片集成及新型光接收器件的研究

基于北京邮电大学通信光电子学实验室的现有条件,结合相关项目,笔者在该文中对RCE/HBT集成光接收器件的设计、制备进行了重点研究;在任晓敏教授的指导下,作者将"圆柱型半导体

学位

RCE光电探测器InP/空气隙DBROEIC光接收器件时域有限差分法量子效率特征方程

基于偏微分与纹理合成方法相结合的图像修复研究

图像修复在图像处理技术中是一个研究热点,在诸多方面有着重要的应用,在日后研究领域中依然有着重要的研究价值。本文主要研究了图像修复算法中针对结构性和纹理性的算法,对

学位

图像修复TV模型纹理合成图像分解

断路器DeviceNet-Modbus现场总线协议转换器的研究与设计

开发适应多种现场总线的可通信低压电器已经成为一个重要的发展趋势。现在一些国外大公司新开发的断路器都开始可以与部分现场总线连接；而国内一些公司新开发的可通信断路器基

学位

协议转换现场总线DeviceNetModbus断路器

基于GMR传感器的4～20mA两线制收发系统集成电路设计

在工业控制中,对磁场、温度、压力等信号进行实时测量时,通常有两种方式:一种是通过现场总线的方式,将信号传送至远程PC机;另一种方法是将检测到的信号转换成电流信号后进行

学位

GMR传感器电流环运算放大器非线性度共模抑制比

快速城镇化地域生态风险预警与调控研究——以南充市为例

“十一五”期间是我国城镇化加速的历史关键时期，快速城镇化意味着我国将迎来重要的城乡社会转型，使得城乡区域的土地利用、生态环境发生明显变化，耕地、淡水和能源相对不足，原生

学位

生态风险城镇化预警机制

光盘驱动器中马达驱动电路的研究

光碟机以其高容量、低成本、传输速度快及可控性佳等优点,已成为资料存储装置中的首要之选。而且随着存储容量及市场需求的增加,其发展空间具有很大潜力,所以光盘驱动器是目

学位

光盘驱动器马达驱动电压控制模式电流反馈控制

智能城域网关键技术研究

本论文认真分析了当前城域网的发展趋势及技术特点，对当前城域网的关键技术作了较为深刻的分析和研究，对目前正在发展中的MSTP内嵌技术进行了分析，作者提出了在城域网中实现信道

学位

智能城域网虚级联通用成帧协议弹性分组环多协议标记交换传输管理

旱稻中异源表达番茄铁吸收调控基因FER的表形及功能分析

铁是所有生物正常生长发育所必需的营养元素之一,在长期的进化过程中,高等植物逐渐形成了两种独特的铁高效吸收机理(机理Ⅰ和机理Ⅱ),以适应环境有效铁的缺乏。这两种机理所

学位

铁元素吸收机理番茄FER基因转录调控基因异源表达旱稻

GSM-R高线性度功率放大器研制

随着国内高速铁路技术的不断发展和高速铁路网的不断完善，普通公共移动通信系统与传统铁路模拟通信系统已不能满足铁路运营和旅客出行对移动通信系统的技术要求。为高速铁路网

学位

线性化模拟预失真正交平衡高速铁路功率放大器移动通信系统

汉语语音识别中决策树参数聚类及结构调整方法研究

与本文相关的学术论文