基于音素模型的语音关键词检出系统中确认技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:dqylovezf1314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关键词检出是从连续语音中检测并确认给定的若干个特定词。它是连续语音识别的一个重要分支,有着广阔的应用前景,已成为近年来颇受重视的一个研究方向。传统的关键词检出系统一般基于离线垃圾模型,垃圾模型的设计和训练的难度较大,且依赖于具体的关键词表,难以应用到实际系统中。基于音素模型的语音关键词检出系统,不需要设计和训练垃圾模型,关键词表可以随实际应用变化,识别速度快,能基本满足实际应用的需要。关键词确认在关键词检出系统中至关重要,它可以在不降低检出率的同时,减少系统的误警率,提高系统的性能。  置信度原理是关键词确认的理论基础。基于音素模型的关键词确认要求确认方法不依赖于具体的关键词表,确认速度快。基于模型本身和识别过程信息的置信度能够满足这种需求,如:特征临界区域百分比方法、基于状态长度规一化声学置信度方法、基于在线垃圾得分方法等。本文提出的基于动态排位信息的关键词确认方法也是这种类型,确认性能要优于已有的基于音素模型关键词检出系统确认方法。  由于基于单一置信度的关键词确认方法设置拒识门限比较困难,而且确认性能难以达到实际应用的要求,因此考虑将多个置信度联合进行关键词确认。支持向量机是统计学习理论发展的产物,基于VC维理论和结构风险最小化原理,对于有限样本情况有良好的性能,所以,本文采用支持向量机作为多置信度结合的工具。这样,在保证高检出率的前提下,系统的误警率有了大幅度的下降,检出性能得到了进一步的提高。
其他文献
图像识别在军事国防以及民用领域的作用日益显著。近些年,从遥感和航拍图像中实现目标的自动识别取得了长足的发展,但目前仍没有一种可以普遍适用的方法。这其中的困难不仅体现
传统工业控制通常以工控机为硬件平台来构建监控系统,这种模式的监控系统存在成本高、体积大、安装及后期维护复杂等缺点。随着微处理器运算、处理能力日益强大,同时随着嵌入式
信息技术的快速发展为网络教学提供了广阔的前景。网络教学作为一种新的教学方法,改变了传统教学方式,提高了教学效果及学生参与教学活动的积极性。与传统的教学模式相比,网络教
在自然语言理解领域,词义消歧(Word Sense Disambiguation-WSD)是基础研究课题,也是重点和难点之一。作者在统计的框架下,多方面地考察词义消歧问题,得到了一些较好的结论,并在此
文件同步分为三个阶段。一是更新检测阶段,检测和发现文件的变化。二是同步决策阶段,决定如何进行文件同步,获得文件同步的具体步骤。三是同步实施阶段,进行具体的数据传输,完成文
面向奥运新闻机器翻译的中文分词研究与实现随着信息时代的到来,“信息爆炸”成为信息处理领域的瓶颈问题,不同语种之间大量的信息交流更加大了问题的严重性。不同语言之间的翻
通信网络的信道是一个开放性信道,它在赋予用户通信自由的同时也给通信网络带来一些不安全性因素。伴随着VoIP的广泛使用,它在给用户带来廉价、方便、功能丰富的语音通信功能的
随着P2P计算模式的兴起和Internet端系统计算能力的迅速增强,原先被忽视的终端用户设备成为一种宝贵的资源。如何充分利用这些终端用户设备,在动态的P2P网络环境中对海量数据进
Internet搜索已经成为Web上最重要的应用之一,人们经常需要到Google、Baidu等搜索引擎去查找想要的信息,对于科研人员更是如此。为了开展研究,他们需要到网上查找相关的文献信息
声纹识别,也称说话人识别,它是通过对说话人的语音信号进行分析,而对说话人进行确认(Verification)或鉴别(Identification)的一种技术,已经在安全支付、声纹解锁、公安刑侦等许多