面向汉语连续语音识别的声学模型建模及搜索技术研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:cheer4you
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉语连续语音识别的研究工作已经开展了多年,如何建立更精确的声学模型和设计高效的搜索算法是亟待解决的两个问题.该文的研究工作围绕这两个问题展开.在声学模型方面,研究并实现了基于决策树聚类的带调三音子模型.主要工作包括:构造了一个优化的汉语基本建模单元集;比较了不同HMM拓扑结构以及不同声调建模方式对识别性能的影响;设计了带调三音子决策树聚类问题集,并实现了基于带调三音子决策树聚类的训练算法.在搜索算法方面,研究并实现了基于三音子模型和二元文法语言模型预测的单遍搜索算法.具体包括:使用词树结构表示词典知识;采用动态裁剪技术提高搜索速度;采用语言模型预测和退化技术使语言模型与声学模型能够在搜索过程中同步,提高了搜索精度.
其他文献
无损图像压缩有在许多领域有重要的应用,如图像需要做进一步的处理(特征提取,图像增强等),重复压缩/解压缩,图像的获取代价昂贵,图像的要求质量未知等。近年来,特别在医学领域和遥感
混沌是近年来在非线性科学领域异军突起的一个分支,混沌的许多迷人的性质使得研究人员开始探讨混沌应用于信号处理方面的可能,从而形成了混沌信号处理研究新方向.该文首先介
该文重点研究了OFDM接收机中的定时恢复和信道估计算法.首先,论文提出了一种包括实现OFDM码元同步和采样进钟同步的定时恢复算法.该算法是基于导频的.在该算法中,我们使用一
在猫初级视皮层神经元的经典感受野外,存在一个感受野外区即整合野,能够对神经元产生的反应起到抑制或易化的调制作用。用电生理与形态学相结合的方法,研究了初级视皮层内268个
医院为人们的健康生活提供了必要的保障,而其在建设的过程中,需要对多方面的因素进行统筹规划以便实现预期的目的.本文主要针对财务管理在医院基建工程中的重要性进行探析,简
本文通过对荣华二采区10
期刊
学位
文章在阐述财务共享管理理念,展示国内外典型经济实体施行财务共享模式所取得成效的基础上,以“因地制宜、量身定制”为工作思路,提出在卫健系统按医疗集团、三甲医院、同城
作为GSM2.5代的主要技术GPRS(GeneralPacketRadioService)是以包交换的方式在既有的GSM系统上传输数据业务的。它改变了GSM系统通过电路交换与短消息方式提供移动数据业务的
行政单位是根据国家的授权二形式行政职能的国家机关,行政单位中包含了司法机关、权力机关等等,行使行政职能.事业单位是一种具有公益性质的单位形式,是国家机关举办的,或者