连续语音的三音子DDBHMM识别方法

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户：

【摘要】

：

针对目前连续语音识别中广泛使用的齐次HMM(hidden Markov model)模型识别精度低的现状,该文提出了三音子DDBHMM(duration distribution based HMM)识别方法。根据汉语的特点

【作者】

：

游展肖熙王作英

【机构】

：

清华大学电子工程系,

【出处】

：

清华大学学报(自然科学版)

【发表日期】

：

2009年04期

【关键词】

：

三音 DDBHMM 识别方法连续语音识别识别错误 hidden 概率值 likely 字间双音

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对目前连续语音识别中广泛使用的齐次HMM(hidden Markov model)模型识别精度低的现状,该文提出了三音子DDBHMM(duration distribution based HMM)识别方法。根据汉语的特点,设计了适用于连续语音识别的三音子。描述了识别中使用的MLSS(most likely statesequence)准则。设计了识别网络并阐明了用于三音子识别的帧同步识别算法。将三音子DDBHMM识别方法与三音子齐次HMM识别方法和双音子DDBHMM识别方法进行了实验对比,结果表明:采用三音子DDBHMM可以使得识别错误率分别下降0.95%和2.29%。说明该方法能够显著地改进连续语音识别性能。 Aiming at the current low accuracy of HMM (hidden Markov model) widely used in continuous speech recognition, this paper proposes a recognition method of DDBHMM (duration distribution based HMM). According to the characteristics of Chinese, designed for continuous speech recognition triphone. Describes the MLSS (most likely statesequence) criterion used in recognition. The recognition network is designed and the frame synchronization identification algorithm for triphone recognition is illustrated. The comparison between the three-tone DDBHMM recognition method and the three-tone homogeneous HMM recognition method and the two-tone DDBHMM recognition method are compared. The results show that the recognition error rate can be reduced by 0.95% and 2.29% respectively by adopting the three-tone DDBHMM. This method can significantly improve the continuous speech recognition performance.

其他文献

删余LDPC与OFDM联合编码调制算法

为了降低正交频分复用(OFDM)系统中信道的时变导致的高误码平台,提出一种联合编码调制算法。该算法利用低密度校验码(LDPC)对删除信道的优良特性,将LDPC编码删余比特进行预编

期刊

联合编码调制算法LDPC子载波间干扰正交频分复用低密度校验码时变信道删除信道编码调制预编码

关于完善社会资金投资高速公路利益相关者财权制衡机制的思考

目前高速公路的权力分配现状,导致了在采取社会投资者经营收费模式过程中的寻租问题突出。本文根据目前存在的问题,提出了完善社会资金投资高速公路中利益相关者财权制衡机制

期刊

财权制衡社会资金利益相关者

胡斯卡：穿越到蓝精灵的国度

当歌谣响起：“在山的那边海的那边有一群蓝精灵，rn他们活泼又聪明，他们自由自在生活在那绿色的大森林……”rn你是否有种寻梦的冲动？

期刊

胡斯卡旅游市场旅游景点旅游风光

朱子学传统与现代社会的危机

人类的需求被过分夸大了,这是错误的幸福观导致的结果。刺激需求、激发需求、创造需求作为经济发展的动力被认为是天经地义,在这样的思想指导下,人类社会的发展一味地朝向无

期刊

集成HIP和SIP的多层次移动管理方案

随着越来越多的移动终端接入到互联网,IP网络如何提供有效的移动管理成为了一个重要的问题。该文提出了一种集成主机身份标识协议(host identity protocol,HIP)和会话发起协

期刊

移动管理HIPSIP移动性管理会话移动终端移动会话发起协议位置管理终端接入身份标识

基于标校源辅助的不相交多目标时差定位

鉴于定位站位置误差会极大地降低多站无源定位的目标定位精度,提出了一种标校源辅助的不相交多目标时差闭式定位算法。算法首先使用标校源减小定位站位置误差,并估计对应的误

期刊

1,4,7-三(2-羟基丙基)-三氦杂环癸烷为配体的Ni(Ⅱ)配合物的合成及晶体结构

氮功能化的大环三胺衍生物在生物无机化学领域具有广泛的应用.然而,对于十圆环的大环三胺1,4,7-三氮杂环癸烷(TACD)来说,它的氮功能化衍生物由于合成困难而研究较少.本文以1,

期刊

氮功能化的大环三胺衍生物Ni(Ⅱ)配合物晶体结构

MPEG视频码流中I帧快速搜索算法

为解决现有数字视频检索算法中存在的效率不高,在实际应用中存在局限性等问题,提出了一种新型的I帧快速匹配搜索算法。该算法充分研究了MPEG(moving picturesexperts group)

期刊

自适应滤波算法快速搜索算法MPEGI帧搜索算法视频处理快速匹配匹配搜索视频检测统计特性检索算法

广西苍梧5.4级地震前区域地震活动图像分析

本文通过对荣华二采区10

期刊

目前大学生消费行为的存在问题与应对策略

随着社会经济的快速发展，人们的消费水平不断提高，消费结构更是发生着翻天覆地的变化，尤其是大学生作为一个重要的消费群体，已经受到全社会的广泛关注。然而，在各方面因素的影响下

期刊

大学生消费行为问题策略

连续语音的三音子DDBHMM识别方法

与本文相关的学术论文