汉语语音识别中声学建模及参数共享策略的研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:zmaozhao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声学建模是语音识别领域中的关键问题之一.该文对汉语连续语音识别中的声学建模技术和参数共享策略进行了深入的研究.主要针对两个方面:一、提出并实现了半连续分段概率模型(SCSPM);二、研究基于决策树状态共享的上下文相关建模方法,并且分别实现了上下文相关音素模型与上下文相关声韵母模型.具体包括:1、提出并实现了半连续分段概率模型(SCSPM).2.对HTK平台进行了研究和分析,实现了基于HTK平台的声学模型训练和性能评估的有效方法.3、对上下文相关(ContextDependent,CD)声学建模中基于决策树状态共享策略进行了深入研究.4、实现了基于决策树状态共享的上下文相关的音素(CD-Phone)模型.5、研究并实现了基于决策树状态共享的上下文相关声韵母(CDInitial/Final,CD-IF)模型.
其他文献
嵌入式实时软件有着广泛而关键的应用,但描述和检测嵌入式实时软件的需求却是一项十分困难而复杂的工作.针对这一现象,该文提出了一种基于需求规格说明的原型化方法,该方法集
虚拟现实技术应用于系统仿真是当前仿真技术的研究热点.该文首先分析了作为系统仿真的重要部分——仿真软件和仿真语言的不足,针对当前虚拟现实技术在视景仿真上的优势,提出
多媒体流量控制技术提高了流媒体在传输过程中的有效性,并且部分解决了现有网络带宽问题.流媒体是指采用流式传输方式在互联网上播放的媒体格式,譬如音频、视频或多媒体文件
软件质量问题由来已久,由于在许多关键领域运行的软件质量问题而引发重大损失甚至灾难并不少见.计算机科学家普试图用完全形式化的方法来证明程序同功能规约的一致性,保证程
近年来,计算机领域内新的技术不断涌现,象集群技术,策略的管理技术,网络技术等等.这些技术使高可用性系统的实现成为可能,而且越来越完善.该文作者参加了一个高可用性系统的实现成
如今物联网技术越来越广泛地应用到各行各业中,针对电梯行业中的安全问题,将物联网等先进技术应用其中,设计一套具备音视频实时传输功能的监控系统,对于当电梯出现故障时、有乘客
Agent组织是多Agent系统研究的重要问题之一,也是多Agent系统一种有效的求解方式.针对Agent组织研究工作存在的主要问题,该文主要研究了Agent组织的模型.形式语义、组织的承
该文深入分析了ebXML的体系结构,并通过与其他基于XML进行电子商务的规范如BizTalk、cXML、RosettaNet和cnXML相比较,指出ebXML具有更好的开放性,特别适合于不同规模和不同行
该课题的提出是因为第二炮兵某研究所在进行导弹仿真系统研制过程中,需要涉及大量战区、目标区等的显示与标绘,专题图的生成与保存等问题,由于目前国内外的GIS产品大部分都是
大数据是由数量巨大、结构复杂、类型众多的数据构成的集合。大数据的来源广泛,除了互联网这一众所周知的大数据源,最大的数据源实际上是实体行业,如电信、零售、制造、电力等行