口语对话系统中关键词识别的研究

来源 :清华大学 | 被引量 : 0次 | 上传用户：jiangjunaiai

【摘要】

：

近年来，口语对话系统的应用越来越广泛，其中语音识别算法直接影响到整个系统的性能，但在某种程度上现有语音识别算法并不能满足需要。为了提高口语对话系统中语音识别的性能，本文

【作者】

：

严斌峰

【机构】

：

清华大学

【出处】

：

清华大学

【发表日期】

：

2004年期

【关键词】

：

口语对话系统参数共享语音确认关键词识别语音识别

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来，口语对话系统的应用越来越广泛，其中语音识别算法直接影响到整个系统的性能，但在某种程度上现有语音识别算法并不能满足需要。为了提高口语对话系统中语音识别的性能，本文对语音识别中的关键词识别方法进行了研究，内容主要包括如下几点： 1.声学模型参数共享的研究：为了解决训练数据的稀疏问题和加快关键词检出的搜索速度，本文对声学模型的参数共享策略进行了分析，提出了改进的合并分级聚类算法，并将其应用于模型状态级别的参数共享。语音识别器采用参数共享后，识别过程的时空消耗大大缩减，同时识别正确率仅有较小的损失。 2.关键词检出搜索策略的研究：针对关键词词表规模扩大后，关键词检出性能不佳的现实，本文采用了当前主题指导的关键词检出的搜索策略：利用当前主题及其对应的活跃词表生成识别有限自动机，指导关键词的检出。主题指导下的活跃词表规模减小，关键词检出算法的识别性能有了很大的提高，基本满足口语对话系统的需要。 3.语音确认方法的研究：本文对用于语音确认的各种置信特征进行了分析和比较，选择传统的基于垃圾模型的分段后验概率统计值和本文提出的线性预测编码二次识别结果作为置信特征；设计支持向量机分类器联合多种置信特征给出确认结果，取得了很好的确认效果。另外，本文对基于统计假设理论的似然比语音确认方法进行了改进，提出了一阶段的快速联合似然得分和似然比得分的连续语音识别确认方法，克服传统二阶段确认方法的待确认语音切分边界不准的缺点，提高了系统的效率和识别性能。 4.鲁棒语音识别方法的研究：为了提高关键词识别系统的鲁棒性，以克服训练和识别环境不一致导致的真实含噪环境下识别正确率过低问题，本文提出了基于邻接空间的后端贝叶斯预测识别方法。相对于传统的语音识别方法，该方法在保证干净语音测试集的识别率没有大的下降的前提下，对叠加高斯白噪声和有性别差异的测试集的识别率都获得了较大的提高。

其他文献

基于中文信息安全传输效率的研究与设计

随着Internet业务的增长，网络安全日益成为影响网络效能的重要问题。如何做好信息安全的同时又能提高传输效率，是备受业内关注的问题，已经成为信息安全领域的一个研究热点。　　

学位

信息安全加密压缩中文信息传输效率

以太网三层交换机启动模块及VDSL接入模块驱动程序的设计

嵌入式系统是以应用为中心的硬件设计和面向应用的产品开发为基础的专用计算机系统，广泛用于制造工业、过程控制、通信、仪器、仪表、汽车、船舶、航空、航天、军事装备、消费

学位

嵌入式系统VxWorks(一种嵌入式操作系统)三层交换机VDSL(甚高速数字用户线)BSP(板级支持包)

基于现代教育理论与技术的多媒体课件制作

本文通过分析社会背景、教学现状、教育理论与学习理论，特别是建构主义学习、教学理论，提出多媒体课件制作的必要性和重要性。系统的阐述了多媒体课件制作理论和技术，提出了多媒

学位

现代教育技术多媒体课件数据库制作模式

基于数据链路层数据捕获与信息过滤

随着网络技术的不断发展，特别是信息技术的发展，使社会进入了一个信息爆炸的时代，世界也由于Internet而变小，人们通过各种技术，如电子邮件、网络视频会议系统、网络传呼机等工具，使

学位

WinPcap数据捕获信息过滤网络安全

基于IGMP Snooping组播在校园网多媒体系统中的应用研究与设计

本文提出了基于IGMPSnooping的二层组播协议和VLAN相结合的技术，对数据链路层组播做了深入的研究，该技术有效地控制了交换式以太网中不断增长的多播流，从而实现数据链路层上实质

学位

IGMP组播数据链路层校园网多媒体系统组播协议视频编码

中间件在电子商务系统中的应用

中间件(middleware)是基础软件的一大类,属于可复用软件的范畴.BEA TUXEDO是构筑坚实的、易于管理的电子商务系统的成熟平台,使企业能够快速推出新的产品和服务,保持企业的竞

学位

交易中间件计算机软件电子商务

集成学习及其应用的研究

本文对集成学习的以下几个方面进行了深入研究，包括增强集成学习系统的可理解性、基于集成学习的归纳学习方法、集成学习在文本挖掘中的应用、集成学习在图像处理中的应用。创

学位

集成学习神经网络集成规则抽取决策树数据挖掘

FY-3C卫星微波辐射资料同化应用研究

FY-3C卫星作为我国新一代极轨气象卫星业务卫星,搭载了新型微波温度计(MWTS Ⅱ)和新型微波湿度计(MWHS Ⅱ)具有高的探测精度,为数值预报系统提供了大量观测数据。为研究FY-3C

学位

卫星资料同化FY-3C卫星新型微波湿度计新型微波温度计WRF模式

泊松玻尔兹曼方程的有限元方法和并行模型关键技术研究

泊松-玻尔兹曼(Poisson-Boltzmann，PB)方程是描述离子溶液中的生物分子静电相互作用的隐式溶剂化模型。本文提出了基于高阶有限元方法(Finite Element Method，FEM)求解PB方程的

学位

有限元算法拟时间迭代法并行模型泊松玻尔兹曼方程

面向Internet的分布式海量文件存储系统研究

该文的目标是：面向“普及计算”模式,研制高性能的网络海量文件存储系统,以支持公众对文件的高效存取.我们的总体思路是：利用软件手段,采用一种具有高可扩展性的体系结构.将Int

学位

网络存储海量存储P2P路由算法分布式文件系统Cache

口语对话系统中关键词识别的研究

与本文相关的学术论文