调型信息在汉语语音识别中的应用研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户：slyde

【摘要】

：

随着统计建模理论的不断完善和计算机运算能力的不断提高,自动语音识别技术近几年来取得了迅速的发展。汉语语音识别技术作为自动语音识别技术中的一种,既存在与其它语言的语

【作者】

：

王鹏

【机构】

：

中国科学技术大学

【出处】

：

中国科学技术大学

【发表日期】

：

2010年期

【关键词】

：

单流隐马尔科夫模型多空间概率分布隐马尔科夫模型双流隐马尔科夫模型调型特征单流区分性训练同步双流区分性训练

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着统计建模理论的不断完善和计算机运算能力的不断提高,自动语音识别技术近几年来取得了迅速的发展。汉语语音识别技术作为自动语音识别技术中的一种,既存在与其它语言的语音识别相同的共性问题,也有自身的特殊之处。调型信息就是其中的一种,较其他无调语言而言,调型对汉语普通话起着构字辨义的作用。因此调型信息对汉语语音识别的性能的提升起着一个关键的作用。由于表征调型信息的基频特征存在着非连续性、超音段特征等一系列特点,如何有效地对调型信息进行建模成为了一个研究热点。本文在单流隐马尔科夫模型(Hidden Markov Model, HMM)的基础上,提出一种双流隐马尔科夫模型的建模方法。在一系列实验中,表明此方法的性能优于传统的单流隐马尔科夫模型以及多空间概率分布隐马尔科夫模型(Multi-Space Probability Distribution-HMM, MSD-HMM)。在此基础上,又将双流建模的思想引入到声学模型的区分性训练中去并扩展出了同步双流区分性训练,从而使调型信息得到了更充分的利用并极大的改善了汉语语音识别系统的性能。文章结构安排如下:第一章为绪论,对自动语音识别的背景和发展进行简单介绍,重点阐述了语音识别的原理以及系统构成。最后引入汉语语音识别的概念,分析汉语语音识别的特点及难点。第二章介绍了基于隐马尔科夫模型框架下的自动语音识别系统。分别对HMM的数学定义,三个基本问题以及基于HTK工具包开发的识别器进行详细说明。第三章对汉语调型信息及其表征特征(基频)进行介绍,并对该特征的两种提取方法:谐波求和法(Sub-Harmonic Summation, SHS)、ETSI基频提取算法进行说明。第四章对调型特征与声学特征相结合的建模方法进行介绍。首先介绍的是传统的单流隐马尔科夫模型;然后介绍了双流隐马尔科夫模型;最后介绍的是为了解决基频特征不连续性而引入的MSD-HMM模型。并在此章中对三种方法的原理和优缺点进行了比较和说明,在实验中表明SHS基频提取算法与双流隐马尔科夫模型相结合的方法优于另外两种建模方法。第五章对单流区分性训练的准则及更新算法进行详细阐述,并对同步双流区分性训练的更新算法进行了推导和证明。在随后的实验中,同步双流区分性训练较单流区分性训练而言在各个任务集上都表现出了较强的鲁棒性和优异的性能。第六章对全文进行总结,并给出将来能够改进的方法以及后续的工作展望。

其他文献

基于PKI的Web单点登录系统的设计与实现

本文以企业在实施Web单点登录过程中的功能需求为出发点,以公钥基础设施PKI为信息安全解决方案,在研究和分析Web单点登录相关技术基础上,提出了一种基于PKI的Web单点登录解决

学位

单点登录公钥基础设施身份认证单点登出

认知无线电中的分布式接入技术研究

随着无线通信业务的不断发展,对频谱的需要持续增长。与此同时,频谱资源的利用率却很低。导致这一矛盾的原因是现有的基于固定网络和业务的频谱分配的方式。为了解决这一矛盾

学位

认知无线电择机频谱接入多信道MAC协议

基于自适应策略的实时目标跟踪方法

传统的视频监控系统可对视频图像进行实时观看、保存及回放等功能,但不能自动的进行报警。然而,智能视频监控通过先进的视觉技术对视频信号进行分析和处理,使得计算机能够过

学位

目标跟踪颜色属性协作模型自适应策略

云计算中深度包检测技术研究

云计算近三年来逐渐成为企业界和学术界的研究热点。通过资源整合技术和多层次虚拟化技术，云计算将大规模计算资源以服务的形式提供给用户，具有良好的可用性与易扩展性，并大大节

学位

云计算深度包检测异步并行云协作框架性能优势

基于蚁群算法的Ad Hoc网络安全路由算法研究

移动Ad Hoc网络的对等体系结构使得其比传统网络面临更多的安全威胁,使得移动Ad Hoc网络安全路由协议成为当前研究的热点。本文围绕Ad Hoc的网络安全问题以及安全目标,提出了

学位

移动Ad Hoc网络安全蚁群算法信任模型

基于体系结构方法的建模工具扩展研究

体系结构是描述系统各组成单元的结构、单元之间的相互关系、约束设计和发展的原则与指南。体系结构技术已经成为美军验证和评估新的作战概念、进行军事能力分析、制定投资决

学位

体系结构体系结构建模工具基于核心实体的设计方法映射工具

光脉冲码调制对布里渊光时域分析传感的影响和分析

布里渊光时域分析(Brillouin Optical Time Domain Analysis,BOTDA)是一种分布式传感技术,可以测量光纤上每一点的温度和应力,因此在桥梁、大坝、油气管道和铁路的健康监测上

学位

布里渊光时域分析光脉冲编码差分脉冲对混合脉宽编码数字图像处理

基于光学遥感图像的目标检测算法的研究与实现

遥感图像目标检测,不论在军用和民用中都非常重要。目标检测具有非常强的目标和图片类型针对性,因此目标检测算法必须要仔细设计才能具有好的效果。本文研究的是遥感图像中的目标检测,主要是桥梁目标和飞机目标检测。此外,还研究了一种岸舰分离算法,主要用于对靠岸舰船进行检测,它是基于港口图像分割结果的,为此,专门研究了一种改进的分水岭分割算法来对港口图像进行分割,它解决了传统分水岭算法过分割的问题。本文主要工作

学位

分水岭变换图像分割桥梁检测飞机检测

基于ARM9的路由器远程控制系统设计与实现

路由器是互联网中的核心设备,广泛分布在全球各个地方,它是互联网络的枢纽,连接着互联网中的各局域网和广域网。随着互联网的高速发展,路由器的功能也变得越来越强大,配置也

学位

路由器远程控制Linux系统移植短信控制socket通信

可重构系统中任务实时调度和实时布局算法的研究

可重构计算是一种兼具通用处理器灵活性和专用集成电路高效性的计算体系结构。为了能够充分发挥可重构系统的高性能和可编程能力,需要将可重构资源和硬件任务的管理纳入到操

学位

可重构硬件操作系统关键部分分割最大剩余空闲矩阵最小路由成本

调型信息在汉语语音识别中的应用研究

与本文相关的学术论文