口语对话系统中语音识别的研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:tigernone
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高口语对话系统中语音识别性能,本文从识别算法和语音确认两个主要方面出发,在关键词搜索性能、语境知识对关键词识别的指导及新语音确认特征诸方面进行了研究,提出如下方法、策略: 1.关键词动态确认。针对关键词的漏检错误大多数都与另一错误关键词的误警错误有关这一现象,提出关键词动态确认的概念。在搜索过程中引入虚拟OOV模型来对产生的关键词候选进行确认,及早地将不正确的关键词候选剪除,从而避免其对正确关键词候选的干扰影响。实验表明:在误警率相同的条件下,误识率下降了约10%。 2.语境知识指导下的关键词识别策略。针对目前的各种语音识别方法在对话系统中性能不佳的现实,为改善对话系统的整体性能,提出对话语境知识指导下的关键词识别策略:利用对话管理器给出期待焦点信息,确定对应焦点下的活动词表、活动规则集,生成相应的识别自动机,并用其来指导关键词识别。实验表明:语境知识指导下的关键词识别算法具有很高的识别性能和鲁棒性,基本能够满足口语对话系统的需要。 3.上下文相关语音确认策略。通过分析识别结果中互相干扰现象的发生,发现待确认结果前后序词的确认度会对待确认词本身的确认度有一定的指示作用,提出上下文相关语音确认策略:引入上下文知识来指导语音确认,改善语音确认的性能。利用待确认词与其前后序词的确认特征组成待确认词的上下文相关确认特征,体现出识别结果中的前后序词对当前待确认词的影响。实验表明:该算法的拒识性能明显好于传统语音确认算法。
其他文献
最近两三年,P2P(Peerto Peer)又成为因特网上的一个热点.相比当前因特网上主流应用模式Client/Server或者Client/Service而言,P2P具有自己鲜明的特点和优势.在P2P网络中,任何
该文主要从以下三个方面入手研究企业知识集成系统:(1)本体论表示、建立方法、评估方法.尽管普遍认为本体论对知识共享和重用的实现具有重要的作用,但在本体论的研究中仍然存
心理健康是人类健康的重要组成部分,实施心理健康援助有利于维护人类的心理健康水平。在开展心理健康援助时,能否实现心理健康问题的早期识别与干预是决定心理健康援助效果的关
随着Internet技术的发展和互联网的普及,应用程序的数据存储规模和数据的访问量越来越大,对数据存储系统的可用性要求越来越高,而访问延时要求越来越短。这些数据大多是非关系型
随着大规模分布式软件系统的广泛应用,原有应用系统必须有效地集成到统一的企业级应用环境中,实现业务和数据的共享.应用软件系统集成的主要问题是用于集成处理的业务流程通
地理信息系统(GIS)被用来收集和表现那些描述地理世界物理和逻辑属性的信息.地理信息系统应用领域的复杂性、数据类型的多样性(包括空间数据和他们之间的复杂关系)、在最终产
信息技术为企业的发展提供了新的机遇,如何利用信息技术实现信息化,提高管理水平,增强企业的综合竞争能力,是摆在我们面前的一个重要课题。 企业信息化与企业管理之间是一种互
北京同步辐射装置(Beijing Synchrotron Radiation Facility, BSRF)上的X射线衍射实验站是一个共享开放的实验平台,广泛应用于材料科学、纳米材料科学、催化能源和生物学等领
随着IT产业的飞速发展,各行业对于数据存储的需求正在不断增长.网络存储技术的适时推出,将互联网技术与存储技术有机的结合起来,解决了传统存储技术所固有的缺点.该文重点研
本文主要研究了基于新型机器学习方法的人脸识别技术,内容涉及人脸检测与人脸识别。本文将机器学习领域最新的研究进展,如选择性集成学习和非线性流形学习等应用于人脸识别,做出