交互式语音应答系统中关键词识别的研究及实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:netease
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要目的是研究适合于交互式语音应答系统的关键词识别技术.研究内容主要包括:1.基于连续隐马尔可夫模型(CHMM)框架下关键词识别声学模型的建立.要想设计一个好的关键词识别器,声学层的设计包括特征参数的选择、声学基元选择、模型训练以及词表外词模型选择等,都对系统最终的检出正确率有着重要的影响.本文对声学模型的建立进行了详细的探讨,并在大量实验的基础上找出了适合本文所描述系统的参数组合,实现了一个基于CHMM框架的小词表非特定人关键词识别器.2.研究了关键词识别的系统架构.关键词识别分两个主要阶段:关键词检出和关键词确认.本文提出了基于支持向量机(SVM)的关键词确认策略,充分利用检出阶段的解码信息构建起对假想命中的接受和拒识之川的判决分界面,从而避免了一般关键词确认方法中固定阈值的设置问题,从实验结果来看,取得了比较好的效果.3.结合构建的关键词识别器,实现了一个面向特定领域的交互式语音应答仿真系统,从测试情况来看取得了很不错的效果,也从实际应用中再一次证明了本文探讨的关键词识别技术的有效性.
其他文献
本文对视频编码中的关键技术-熵编码技术进行了研究,针对高清晰度视频提出基于复合上下文的熵编码器,并进一步研究了算术编码器CABAC,提出新的8*8DCT系数的算术编码方法.目前
本文在对声音信号采集、特征提取以及场景分类技术等理论全面分析的基础上,提出了一系列新的时域特征提取方法如帧内平均峰值能量、帧内峰值能量方差、带通过零率等和各维特
本文首先分析了一些已有的自动评价方法,如孤立点测试法、BLEU/NIST方法、GTM方法以及智能度方法等,通过实验验证了他们在英汉翻译评价应用中的可行性,并针对汉语语言的特殊
本文对语音保密通信中必须经历的数模、模数转换过程进行了研究.文中讨论了音频信号在数模、模数转换过程中受到的影响,其中主要包括信道噪声、量化误差、时域漂移、幅值差异
随着现代工业技术的不断发展,机械设备运行周期越来越长,速度也不断变快,人民对于其安全性的要求也不断提高,为此,一种能够实时地检测出机械设备健康状况的方法就显得十分有必要。
目前,以SMP服务器作为结点的机群系统被普遍采用。由于单个结点上多个CPU的使用,机群对结点间的通信带宽提出更高的要求。虽然目前的高性能通信网络得到迅速的发展,但因受物
本文主要研究了设计模式组合技术及其使用,提出了采用UML及其扩展机制表示的用于支持设计模式组合方法的三个模型:模式级模型、带接口的模式级模型和细化的模式级模型,
随着人们对地理信息需求的不断增长和网络技术的飞速发展,GIS技术与网络技术相互融和形成了网格GIS技术。虽然目前网格GIS技术已越来越多地应用于各个领域,但国内农业灌区领
关联规则挖掘首要解决的是效率与伸缩性问题。由于数据挖掘任务所面对的数据集通常是由数以百万计的记录所构成的大型数据库或数据仓库,因此如何提高从大型数据库中挖掘关联
本文从以下几个方面进行了研究:1.汉英双语句对短语结构对齐的研究。利用词对齐、句法分析的结果进行短语结构对齐。研究了两种不同的结构对齐方法:第一种方法只对