基于非线性时间谱的语音识别多重外周特征提取算法

来源 :清华大学 | 被引量 : 0次 | 上传用户:A3512516
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
1.简介 特征提取在实现稳健的语音识别中扮演了重要的角色。好的特征应该在类内具有尽可能多的相似性、而在类间则应该尽可能的不同。在设计和开发更先进的语音识别系统中,稳健特征的提取是提高系统性能的重要的手段之一。很显然不同的特征或者特征中的不同参数各自能更好地描述特定的语音类别。 因此现在的问题是怎么才样能找到好的能增强表达语义信息的特征,从而能提高系统的识别率,并增强系统对噪声的稳健性和对说话人的不敏感性。现有的汉语普通话自动语音识别系统中,使用的都是基于MFCC算法的特征。该特征在识别时对发音相近的汉语音节很难区分。鉴于此,将介绍一些对现有的语音识别系统的特征进行改进的算法,这些算法对由清华大学电子工程系开发的THEESP语音识别系统中采用的特征提取方法进行了扩充。 THEESP语音识别系统使用了基于段长分布的隐含马尔可夫模型。这个汉语语音识别系统(M-ASR)在识别过程中是分两个阶段进行的:第一阶段叫做粗识别阶段,在这个阶段中,系统只区分音节而不区分音调;第二阶段叫精识别阶段,在这个阶段中,每个音节的四个音调都会予以考虑。在本论文研究中,用这个中文识别系统作为基线系统。 研究主要集中在从三维的语谱图信号中提取更清晰更有用的信息。最近的研究还表明,把运用不同运算法则提取的语音信号所得到的不同的特征综合起来,是一种有希望提高语音识别性能的方法。因此使用这两种方法完善THEESP这个基线语音识别系统。 在这篇中文摘要中,第二部分详细解释了遇到的问题。在第三部分中,提出了该论文解决问题的最重要最显著的论点。在第四部分是对成绩的总结,第五部分提出对未来研究的一些建议。 2.论文的研究内容 汉语普通话是一种音节结构化的语言。在这种语言中,有很多音节在语谱图上非常相似。由于这种相似性,因此很难区分它们。于是,有必要使用更加复杂的算法正确地区分和识别它们。 一个标准的以及其改进的随机模型语音识别方法能同时提高识别的正确率和计算的速度。梅尔频率倒谱声学特征矢量(MFCCs)、基于段长分布的隐含马尔可夫模型(DDBHMM)是连续大词汇量(CLV)汉语普通话语音识别的系统(M-ASR)的组成部分。 本论文的研究目标就是在中文语音识别系统进行粗识别和精识别的两个阶段都设计一些算法用来提高系统的识别率。改进的方向就是使用新的、有效的和独立的特征去加入或者替换现有的基于MFCC特征的算法,使得那些容易混淆的音节在新的特征空间中的距离能够增大,从而提高系统的稳健性,最终导致识别率的提高。 3.论文的研究方法和创新内容 寻找语音信号的“完美的”表达方法是许多研究人员孜孜以求的目标。本论文的研究中,寻求从不同的角度来研究和处理这个问题。不只用一种单一的特征表示方法,而是用多种不同的特征表示方法,这包括用时间频谱特征的表示方法。 4.结论 在这篇论文中,根据研究工作的先后次序,在论文的五个章节中先后提出并测试了许多算法。论文的研究工作从研究测试语谱图开始,并最终取得了很大的进展。在时间谱特征的基础上,运用特征补偿或是用提取新特征方法,使得现有的THEESP中文识别系统的性能得到了明显的提高。
其他文献
该论文以研制开发数字集群移动通信系统为背景,并鉴于未来移动通信系统传输链路数字化的发展趋势,确定了该文的研究方向为:数字集群系统基于软件无线电的调制解调技术、基于D
该文深入地研究了服务器集群系统的结构、调度算法、性能测试和高可用性.该文的研究工作主要包括以下几个方面的内容和成果:1、对现有的一些Web服务器集群系统的结构进行了归
在卫星通信系统中,需要随时了解卫星内部各种设备的工作状态,而这些工作状态的信号(如电流、电压、温度等)、来自传感器的信号等遥测信号要通过信道传送到地球站;在必要的时
CDMA(Code Division Multiple Access)是在数字技术的分支--扩频通信技术上发展起来的一种崭新而成熟的无线通信技术.在通话质量好、语音和数据传输可靠性高、低辐射、低运营
随着多媒体技术和网络的发展,人们对数字图像在质量、大小应用方面提出了更高的要求.国际标准化组织(ISO)制定了新一代图像压缩标准:JPEG2000(编号为ISO-15444).由于该标准系列还
近年来,因超宽带技术(Ultra-wideband,UWB)具有传输速率高、功耗低、多径分辨能力强、隐蔽性能好等优点,而备受无线通信领域的广泛关注。其优越的特性,使得超宽带技术在雷达
为达到GSM系统中Abis接口传输能力倍增的目的,该文从选择一种更低速率语音编码方案来替代GSM系统中13Kb/s的规则脉冲激励长时预测编码的角度,对此4Kb/s的多带激励(MBE)语音编
此次展览展出了陈智安、方勇、徐钢三位青年山水画家近百幅山水近作精品。  他们三人曾为中国美术学院的同窗,所选择的均为山水画专业,在求学环境、艺术理念、审美追求上有一些共通之处。在山水画探索之路中,三人都理解了前人所说“外师造化,中得心源”的真谛,在自然中感知“真山水之烟岚,四时不同,春山淡冶而如笑,夏山苍翠而如清,秋山明净而如妆,冬山惨淡而如睡。”在“师造化”的过程中,他们并非执著于对自然景物精细
摘要:学生通过课堂学习获得知识,是学生在学校中获取知识的主要途径。教师课堂教学效率的高与低,对学生的知识掌握程度有着重要的影响。现代教学方法中,不管是“学生为主体,教师为辅助”的教学方式,还是其他有效的教学方式。目的就是为了使传统的教学模式得到改善,使学生成为课堂学习的主人,最终达到学生高效学习、教师高效教学的目的。那么,高中数学老师该如何提高课堂教学效率呢?  关键词:高中数学;效率;目的;合作
Ad Hoc网络指的是由若干带有无线收发信机的节点构成的一个无中心的、多跳的、自组织的对等式通信网络,它可以不依赖预先存在的网络基础设施而快速展开,自适应组网,各节点可