语音识别中的置信度研究与应用

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:freezinghk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要研究在不同的语音识别应用场合中,在不同语法约束条件下,置信度的一般计算方法和相关具体应用。本文将置信度计算归结为纯声学和带语言两个部分,对这两部分置信度的一般方法进行了分析,给出了统一的置信度计算方法,并在该计算框架下,分别研究在弱语法、统计语法和强语法约束条件下,置信度的具体计算方法和应用效果。论文工作的主要内容和创新点如下:   (1)归结出语音识别中置信度计算的一般方法,将置信度分为纯声学和带语言两个部分,并给出各自的一般计算方法,使得在不同语法约束条件下的置信度计算得以在统一的框架下进行研究。   (2)以电话关键词检测系统为例,研究在弱语法约束条件下的置信度算法,在基于在线垃圾模型的声学置信度基础上,引入基于MCE准则的声学置信度优化方法,并利用局部语法信息提升置信度性能,使关键词检测系统的等错误率相对降低了13.8%。   (3)以大词汇量连续语音识别系统为例,研究在统计语法条件下的置信度算法,将基于词图后验概率的置信度计算方法归结为语言置信度的计算,并指出该方法与基于在线垃圾模型的置信度在引入竞争路径提高性能方面的一致性。在2004年度“863”连续语音测试集下,置信度的等错误率达到22.7%。   (4)以电话关键槽检测系统为例,研究在强语法条件下的置信度算法,主要说明槽语法的动态扩展技术对压缩搜索空间,降低搜索错误方面的应用,并给出利用置信度信息降低前垃圾词对关键槽检测系统影响的方法。通过这两种改进方法,系统的槽识别率从47.1%提高到了65.2%。
其他文献
本论文首先回顾了传统的个人身份认证技术,然后针对脱机签名的计算机自动鉴别问题进行了一些探索和研究,所完成的工作主要包括以下几个方面: 1)分析了脱机签名鉴别问题的主要
无线传感器网络是由大量传感器节点通过网络多跳方式自组织而成的无线网络系统。在传统无线传感器网络中,汇聚点或Sink周围的节点往往因承担过多数据转发任务而过早耗尽自身能
本文针对基本粒子群算法易陷入局部极小点、搜索精度不高等缺点,利用遗传算法的原理,在粒子群算法中引入了选择、杂交和变异算子,结合局部版粒子群算法的思想,提出了一种基于遗传
扩散磁共振成像是一种无创检测大脑白质纤维结构的成像技术。它可以通过探测组织中水分子的扩散情况来推测神经微观组织信息,刻画脑白质纤维形态学信息,从而获取脑结构连接信息
OPC (OLE for Process Control)是在微软的协助下,由世界上领先的跨国自动化公司和软硬件供应商合作开发的一套工业标准。OPC的设计目的是利用微软的COM(Component Object Mod
生产调度是现代集成制造系统(CIMS)环境下生产的核心内容,因此无论是生产调度理论的研究,还是应用系统的开发都受到了学术界和企业界的关注。生产调度问题通常是多约束、多目标
研究乙炔加氢反应器的直接非线性控制问题。由乙炔反应器的机理模型推导出反应器的连续和离散模型通式,在simulink环境下分别建立连续和离散仿真模型,通过仿真实验分析反应器的
本文以石化丙烯腈生产工艺的丙烯腈收率的软测量问题为实际应用背景,对微粒群优化算法及其在软测量建模中的应用进行了研究。对于测量丙烯腈收率这样的复杂系统的神经网络预测
由于2-D系统在过程控制、空气干燥、电力传输线、水蒸气加热以及图像处理等领域具有广泛的应用,近年来受到了广泛的关注。稳定性与控制器设计是研究2-D系统的两个最基本问题,目
本文主要讨论基于Word文档的文本数字水印技术。首先提出了一种中文文本的数字水印,该算法依据二次余数理论自适应的嵌入水印信息,在中文文本中实现了字移编码,使水印信息近似随