段长在汉语识别系统后处理阶段的应用

来源 :第十届全国人机语音通讯学术会议 | 被引量 : 0次 | 上传用户：xym881110

【摘要】

：

针对传统的隐含马尔可夫模型(hidden Markov model ，HMM)存在的缺陷，该文提出了一种在识别的后处理阶段使用段长模型的方法，并应用在基于HMM的汉语识别系统上。该方法利用归一化

【作者】

：

李曜刘加

【机构】

：

清华大学电子工程系,北京 100084

【出处】

：

第十届全国人机语音通讯学术会议

【发表日期】

：

2009年期

【关键词】

：

汉语识别系统后处理段长模型隐含马尔可夫模型 Markov model 错误和删除识别过程归一化错误率音节数据实验解码分数

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对传统的隐含马尔可夫模型(hidden Markov model ，HMM)存在的缺陷，该文提出了一种在识别的后处理阶段使用段长模型的方法，并应用在基于HMM的汉语识别系统上。该方法利用归一化的段长模型对识别系统的解码结果重新打分，比较前后两次算出的分数从而选出更可靠的识别结果。实验表明，通过该方法将段长模型应用在识别过程中，可以显著提高识别系统的性能，大量减少识别结果中的插入错误。数据显示，该方法使识别系统的音节错误率下降了大约10[％]，识别系统最终的插入错误和删除错误都低于1[％]。

其他文献

多发音方式下的说话人识别研究

人在说话的时候有各种各样的发音方式，如不同的语言；带情感的发音；快速与慢速、大声与小声等等。如果不做任何处理，直接用传统的说话人识别方法来处理，结果会比较差。因此，本论文研

会议

汉语普通话与沈阳方言转换的研究

中国地域辽阔，汉语包括多种方言。方言转换技术可实现方言间语音的转换，丰富语音交流的方式，增强语音交流的可懂性、友好性和趣味性。该文分析了普通话与沈阳方言在声调调类与调

会议

基于分数规整的发音方式鲁棒的说话人识别研究

实际环境下，一个说话人识别系统的性能受到很多因素的影响，说话人自身发音方式的变化所引起的训练与识别语音的不匹配是其中很重要的一个方面。本文以一个含有多种发音方式变化

会议

分数域发音方式方式变化说话人识别系统整体性能实际环境解决方法数据库多因素错误率语音训练实验匹配基线

不同朗读语体重音的韵律特征研究

为满足言语工程需要，基于大规模语料库，选择了记叙文、说明文、议论文、新闻和专题五种朗读语体，在时长、音高方面对其重音特征进行分析。结果表明，各语体在总体特征、重音突显和

会议

朗读体重韵律说明文和议论文新闻记叙文专题语调构造言语工程语料库语速风格

用于哼唱识别精确匹配的线性伸缩动态规划算法

提出一种用于哼唱识别精确匹配的线性伸缩动态规划算法。该算法将哼唱旋律切割成句子,对每一句子进行线性伸缩匹配,同时在句子层次进行动态规划获得最优路径。该算法更有效地利用了哼唱语音的分段特性并克服了动态规划在长路径搜索时可能丢失全局最优路径的缺点。在含5 223首M ID I的数据库上同等条件下该算法正确率分别比线性伸缩、动态规划及递归匹配方法提高10.5%、6.0%和2.8%。该算法具有更高的准确率

会议

识别精确匹配线性伸缩动态规划匹配算法全局最优路径同等条件句子层次规划算法准确率正确率数据库匹配分复杂度语音切割歌曲分段递归

基于韵律语段的语音情感识别方法研究

语音情感识别领域提取情感特征时,普遍采用"不同情感类别,相同时长基准"的做法,忽略了人耳敏感的韵律段长会依情感不同而有所差异的现象。本文首先通过情感识别实验确定各类情感的最佳识别段长,作为人耳敏感韵律段长。并构造了基于韵律段特征的多重Elman网络模型,以期对不同情感基于特定敏感韵律段长进行识别和对多分类器识别结果进行有效融合,实现了对人耳情感辨识规律的模拟。结果表明,使用敏感韵律段特征的系统识别

会议

韵律语语音情感识别同情感有效融合网络模型实验确定情感特征多分类器辨识规律识别率系统模拟基准构造定长

离散分数余弦变换在话音隐秘通信中的应用

随着军事、安全等方面要求的日益增长，语音信息隐藏技术成为了语音信号处理和信息安全领域的热点和难点，并得到了迅猛发展。本文将分数余弦变换应用到语音信息隐藏中，通过分析得

会议

维语语音韵律的方言差异

本研究从透视乌鲁木齐维语与和田维语的韵律差异的角度来展示维语韵律的一些特点。在听感上，维族人很容易判断这两种维语方言，除了音段特征的不同外，韵律差异是区别的关键。但对

会议

维语语音韵律乌鲁木齐韵律特征韵律单元语音停顿声学分析和田感性认识方法探究音质维族透视切分方言

基于VP树结构的多层匹配算法在哼唱识别中的应用

哼唱识别是音频检索的一个重要应用，其难点是音频歌曲数据的非结构性以及搜索速度和准确率平衡的问题。本文提出了新的数据库构造方法，将音频歌曲集用手工标注方法提取主旋律并

会议

Over-sampling basis expansion model aided channel estimation for OFDM systems with ICI

The rapid variation of channel can induce the intercarrier interference in orthogonal frequency-division multiplexing (OFDM) systems. Intercarrier interference

期刊

estimatoraidedmultiplexingmultipathdifficultysymbolresolvefadingdiagonal

段长在汉语识别系统后处理阶段的应用

与本文相关的学术论文