基于随机轨迹模型的音素基汉语语音识别研究系统

来源 :东南大学 | 被引量 : 0次 | 上传用户:bbatdead
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文构造了一个基于随机轨迹模型的音素基汉语语音识别研究系统.其主要内容如下:(1)随机轨迹模型的基本理论.该部分首先讨论了隐马尔可夫模型的基本原理,从中指出了基本隐马尔可夫模型的三个不合理假设,并且说明这些假设会导致轨迹折叠现象,降低建模的准确性.由此引入了随机轨迹模型,认为由于人的发音器官的惰性以及惯性,语音表现为是在参数空间中运动的一条轨迹,因此,在识别中对语音的建模应建立在轨迹的基础上.该章最后如何对随机轨建模中理论的具体细节进行了详细的阐述.(2)预处理部分,它由端点检测部分和特征提取部分组成.该部分在分析了传统端点检测的基础上,指出它易受短时冲击噪声以及话间停顿等影响,从而提出了一种新的模糊端点检测方法,提高了端点检测的准确性.在特征提取部分,在语音产生模型的基础上,讨论了线性预测倒谱的基本理论,并且详细说明了其具体实现的细节和流程.(3)随机轨迹模型的训练,这里首先在比较了各种识别基元的基础上,给出了一种基于音素的基元提取方法.然后用分段K均值训练算法训练出各个音素的随机轨迹模型,其中采用语谱图手工分割的办法得到训练的初值,取代了平均分段取初值的方法,使训练后的模型更可靠,更逼近全局最小.此外,在判别算法是否收敛时,采用独立测试集数据作为判别标准,防止对于训练数据过训练.(4)随机轨迹模型的识别,该部分在语句搜索时采用了基于动态规划的分层构筑算法,对语句概率的归一比、搜索范围的减小等实现细节也通过实验进行了讨论.此外还提出了一种树形语法结构与分层构筑算法结合的搜索算法,一次性地得到搜索结果.同时通过减少搜索节点上的状态数,可以在识别率损失较小的情况下,大幅度缩短搜索所需的时间.
其他文献
火烧和刈割是常见的两种人为干扰形式,它们能改变群落结构,干扰演替过程。植物对这两种干扰形式往往呈现多样的响应方式,这不仅和植物的生长特性有关,也和干扰的频度、强度、时期
该论文简述了RDS的研究、发展及应用概况;介绍了RDS可传输的信息及其数据格式;阐述了RDS编解码器的基本原理及其实现方法.在此基础上完成了模型样机的研制,同时在接收机小型
在多年的教学实践中,发现大部分聋生在考试时靠死记硬背,分数不低,题目稍微灵活一点就不行了;在低段时各科成绩还不错,但到高段时成绩就一落千丈;在校是个学习尖子,但一出校门就没有
本文主要以分析新课标下中学体育教学中学生学习兴趣的培养为重点进行阐述,结合当下中学体育教学实际情况为依据,首先分析新课标下中学体育教学中学生学习现状,其次从基于教
《电能计量技术》课程是供用电技术专业(高起专)的一门重要的专业课.学好这门课对学生的逻辑思维能力、系统分析能力、整体线路组装能力等得到显著提高.因为课程涉及知识较多
文章针对目前《建筑设备》教学现状及存在的问题,提出采用任务驱动法教学,以具体的任务为载体,贯彻教师为主导、学生为主体的基本原则,通过任务设计、提出、实施、汇报、评价
在高温条件下的工作人员,需穿着专用防护服,以隔绝热源,减缓热传递速度,从而避免热中暑、烧伤和灼伤的发生.如何设计专用的防护服对高温条件下工作人员的保护显得尤为重要.而
大学辅导员应当具备较强的思想政治意识,时刻保持先进的育人观念,将为人处世与思想道德作为培养学生成才的根本.辅导员的爱岗敬业、尽职尽责,才能时刻以自身为根本,对学生言
随着人们对移动数据速率的要求越来越高,第三代合作伙伴计划(3rd Generation Partnership Project,3GPP)致力于LTE-Advanced项目,联合多点传输、中继、异构网络等技术被广泛研究
作为一种刺激学生左脑和右脑同时思维的教学方法,思维导图可以在很大程度上帮助解决大学公共英语教学中的问题.从思维导图的概念和内容开始,本文通过在实际教学中引入思维导