汉语语音识别的统计模型研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:carol123450
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文对汉语语音识别的统计建模方法和噪声环境下带噪语音的特性及其识别方法进行了较深入和系统的研究.其主要内容包括以下几个部分:(1)提出了一种新两步端点检测方法.(2)针对基本HMM最大似然训练方法中不合理的模型正确性假设前提,提出了一种结合MLP的鉴别训练方法.(3)以高斯白噪声作为实际噪声的理想化模型,对其予以识别性能和纯净语音LPC倒谱特征的影响进行了深入的研究.(4)提出了一种新的基于多采样率滤波的带噪语音增强方法,通过将聚类思想引入阈值设置,实现了带噪语音各频带分解信号去噪阈值的自适应求取.(5)讨论了一种能够有效抑制噪声的参数估计方法——矩阵惩罚方法,并首次将之引入语音识别,提出了一种基于矩阵惩罚的带噪语音增强方法.
其他文献
该文首先介绍了会议电视系统的总体框架结构:会议电视系统的组网方式、多点控制单元(MCU)结构和多媒体视听终端结构.同时议论介绍了远程访问服务器的基本原理和微软的Netmeet
该论文的研究重点是以IBM公司推出的IBM Power Network Processor NP4GS3为模板,在对其分组调度和队列管理机理进行深入研究的基础上,给出了一套完整的实现方案并进行了详细
由于毫米波成像具有较好的穿透性和较高的空间分辨率,因此毫米波无源成像技术被广泛的应用于遥感、导航和安检等军事或民事领域。本文在分析和总结被动毫米波成像原理及其系
原子时标在当今社会中,特别是军事、航天等领域有着重要的应用。为了提高中国原子时标准确度和稳定度,本文结合当前时间尺度算法研究现状,依据国际计量局(BIPM)计算原子时标的思
现代相控阵雷达由于其优良的性能和灵活的处理功能,获得了广泛的应用。本文主要结合相控阵雷达制导站信号处理机的研制,论述了如何在相控阵雷达中实现动目标显示、动目标检测、
该文主要研究利用分集接收技术和纠错编码技术对抗CDMA卫星移动通信信道衰落的问题,内容主要涉及RAKE接收机、多星分集、多星分集、空间分集、纠错编码及它们的综合应用.
该文就各种经典与现代静止图象压缩方法以及低比特率活动图像编码与传输的原理和方法进行了探讨.针对监控图像背景图像固定,活动内容较少的特点,在对各种视频编码国际标准进
该文重点介绍作者在这个项目中所做的工作,主要包括以下几个方面:1.通过对全数字化实现多载波QPSK调制/解调基本理论的研究,参与了一些算法的讨论和应用DSP实现这些算法的研
目前双耳助听器语音增强模块中主要应用的是自适应波束形成算法进行去噪,该算法对于环境依赖度较高且对于非平稳噪声去除效果较差。因此,本文拟采用一种基于场景匹配的双耳助
该文研究了用ATM技术实现多业务接入平台所需的关键技术.应用这些技术,在此863项目中搭建了一种由两种设备——COT和RT组成的基于环形拓扑的接入平台.这些技术包括基于SDH/SO