汉语非特定人连续语音识别的研究

来源 :北京理工大学 | 被引量 : 0次 | 上传用户：jackfang999

【摘要】

：

该文对汉语非特定人连续语音识别的相关技术作了深入、系统的研究,并设计了面向任务的汉语非特定人连续语音识别系统,主要包括以下内容.（1）从系统设计的角度提出了语音识别系统

【作者】

：

谢湘

【机构】

：

北京理工大学

【出处】

：

北京理工大学

【发表日期】

：

2002年期

【关键词】

：

非特定人连续语音识别隐马尔可夫模型支持向量机

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

该文对汉语非特定人连续语音识别的相关技术作了深入、系统的研究,并设计了面向任务的汉语非特定人连续语音识别系统,主要包括以下内容.（1）从系统设计的角度提出了语音识别系统的统一框架--统一层次模型,具有推进语音识别技术标准化的重要意义.（2）该文系统分析了音素建模对汉语语音识别的重要性,从语音识别的角度,结合现有国际音标体系、传统拼音方案等语音学知识,独立提出了包括50个单元的汉语音素扩展集合,建立了基于音素模型的汉语连续语音识别系统.（3）为了进一步提高音素模型对连续语音流的描述能力,该文对基于HMM的模型细化与共享技术作了系统研究.（4）对设计面向任务的连续语音识别系统中的关键问题（搜索策略、鲁棒性识别、端点检测、建模单元选择等）作了研究,比较了统计语言模型、规则语法模型对任务的描述能力和对语音识别搜索的不同约束能力,论述并实验验证了音节困惑度是衡量汉语语音识别任务难度的合理指标.（5）在语音识别新理论的探索方面,该文研究了统计学习理论在语音识别中的应用,尝试将支持向量机应用于汉语的非特定人数字识别,取得了优于HMM的识别性能,尤其显示出支持向量机在小样本学习下的优势,得到了一系列有价值的结论,并对支持向量机进一步应用于连续语音识别提出了展望.

其他文献

套后成像测井仪测井数据实时压缩算法研究及实现

目前，套后成像测井技术是最新发展起来的套管井水泥胶结质量评价技术。该仪器结合超声兰姆波成像技术和超声脉冲回波技术，在测井过程中每秒会产生3.1M数据，而电缆传输速率现在一

学位

套后成像测井仪数据处理实时压缩算法误差分析

方位多通道SAR幅相一致性定标方法研究

学位

ScanSAR辐射精校正技术研究

合成孔径雷达(SAR)是一种工作在微波波段的主动式遥感器，具有全天时、全天候的突出特征，在军事探测、灾害监测等领域具有重要的应用价值。ScanSAR作为SAR系统的重要成像模式之

学位

合成孔径雷达辐射校正技术扇贝效应辐射不均机理系统噪声

非相干光自干涉数字全息成像技术研究