汉语语音识别中声学建模及参数共享策略的研究

来源 :清华大学 | 被引量 : 0次 | 上传用户：zmaozhao

【摘要】

：

声学建模是语音识别领域中的关键问题之一.该文对汉语连续语音识别中的声学建模技术和参数共享策略进行了深入的研究.主要针对两个方面:一、提出并实现了半连续分段概率模型(

【作者】

：

张继勇

【机构】

：

清华大学

【出处】

：

清华大学

【发表日期】

：

2001年期

【关键词】

：

半连续分段概率模型参数共享策略上下文相关音素模型上下文相关声韵母模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

声学建模是语音识别领域中的关键问题之一.该文对汉语连续语音识别中的声学建模技术和参数共享策略进行了深入的研究.主要针对两个方面:一、提出并实现了半连续分段概率模型(SCSPM);二、研究基于决策树状态共享的上下文相关建模方法,并且分别实现了上下文相关音素模型与上下文相关声韵母模型.具体包括:1、提出并实现了半连续分段概率模型(SCSPM).2.对HTK平台进行了研究和分析,实现了基于HTK平台的声学模型训练和性能评估的有效方法.3、对上下文相关(ContextDependent,CD)声学建模中基于决策树状态共享策略进行了深入研究.4、实现了基于决策树状态共享的上下文相关的音素(CD-Phone)模型.5、研究并实现了基于决策树状态共享的上下文相关声韵母(CDInitial/Final,CD-IF)模型.

其他文献

面向嵌入式实时软件的原型化方法的应用与研究

嵌入式实时软件有着广泛而关键的应用,但描述和检测嵌入式实时软件的需求却是一项十分困难而复杂的工作.针对这一现象,该文提出了一种基于需求规格说明的原型化方法,该方法集

学位

嵌入式实时软件原型化方法需求工程SREE

一种基于虚拟现实技术的分布式仿真平台的研究和实现

虚拟现实技术应用于系统仿真是当前仿真技术的研究热点.该文首先分析了作为系统仿真的重要部分——仿真软件和仿真语言的不足,针对当前虚拟现实技术在视景仿真上的优势,提出

学位

系统仿真虚拟现实分布交互式仿真面向对象软件复用通用接口

Darwin流媒体服务器RTP子系统流控算法的研究与实现

多媒体流量控制技术提高了流媒体在传输过程中的有效性,并且部分解决了现有网络带宽问题.流媒体是指采用流式传输方式在互联网上播放的媒体格式,譬如音频、视频或多媒体文件

学位

多媒体技术流媒体服务器流量控制Darwin服务器RTP

面向对象软件测试方法与工具研究

软件质量问题由来已久,由于在许多关键领域运行的软件质量问题而引发重大损失甚至灾难并不少见.计算机科学家普试图用完全形式化的方法来证明程序同功能规约的一致性,保证程

学位

软件质量问题软件测试方法

基于高可用性系统的研究与开发

近年来，计算机领域内新的技术不断涌现，象集群技术，策略的管理技术，网络技术等等.这些技术使高可用性系统的实现成为可能，而且越来越完善.该文作者参加了一个高可用性系统的实现成

学位

高可用性虚拟操作环境SNMP

基于物联网的电梯音视频监控系统设计与应用

如今物联网技术越来越广泛地应用到各行各业中，针对电梯行业中的安全问题，将物联网等先进技术应用其中，设计一套具备音视频实时传输功能的监控系统，对于当电梯出现故障时、有乘客

学位

电梯音频监控系统物联网视频编码系统设计

Agent组织理论与方法研究

Agent组织是多Agent系统研究的重要问题之一,也是多Agent系统一种有效的求解方式.针对Agent组织研究工作存在的主要问题,该文主要研究了Agent组织的模型.形式语义、组织的承

学位

多Agent系统Agent组织形式语义组织规则递归模型结构设计承诺机制

ebXML中CPP文档扩展模型的研究与应用

该文深入分析了ebXML的体系结构,并通过与其他基于XML进行电子商务的规范如BizTalk、cXML、RosettaNet和cnXML相比较,指出ebXML具有更好的开放性,特别适合于不同规模和不同行

学位

扩展标记语言电子商务合作协议描述文档方案文档文档对象模型组件对象模型

矢量军标与专题图的生成技术研究及实现

该课题的提出是因为第二炮兵某研究所在进行导弹仿真系统研制过程中,需要涉及大量战区、目标区等的显示与标绘,专题图的生成与保存等问题,由于目前国内外的GIS产品大部分都是

学位

地理信息系统专题图矢量军标MapObject控件编码实现

基于内核的分布式Key/Value存储系统设计与实现

大数据是由数量巨大、结构复杂、类型众多的数据构成的集合。大数据的来源广泛，除了互联网这一众所周知的大数据源，最大的数据源实际上是实体行业，如电信、零售、制造、电力等行

学位

存储系统软件设计大数据内核态

汉语语音识别中声学建模及参数共享策略的研究

与本文相关的学术论文