语音关键词检测若干问题研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:xiaotaowang33
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着语音识别技术的日益成熟和多媒体数据的爆炸式增长,语音检索技术越来越得到人们的重视,也正在得到越来越广泛的应用。语音检索一直面临两大难题:语音识别错误问题和集外词问题,这两个问题严重影响语音检索的准确率和召回率。本文针对这两个问题从索引结构、查询扩展、语义分析等角度展开,来改进语音关键词检测的性能。主要工作和创新包括以下几个方面:1.研究了基于混淆网络的两层索引检索结构的生成和应用将词混淆网络转换成音节的混淆网络,构建one-best和音节混淆网络的两层索引结构。实验表明使用one-best和音节的混淆网络两层索引在精确率下降不多的情况下,能有效提高检索的召回率,词混淆网络转换而来的音节混淆网络将各个词之间的语义约束性引入,同时音节提升了同音词间的兼容性,检索时one-best索引的信息可以用来更好的提高了检测性能。2.研究了基于混淆矩阵的查询扩展算法将利用one-best结果和词混淆网络训练的混淆矩阵应用于输入端进行查询扩展,并引入常用音节串模型,实验表明,在之前索引的基础上,引入音节串模型的查询扩展,不仅能够将识别结果完全错误的信息进行一定比例的召回,而且检索精度相对普通的查询扩展有所提升。3.提出了基于语言模型和词激活力检索排序算法在两层索引的基础上,将语言模型和表示长距离信息的词激活力模型引入来对检索结果进行过滤排序,滤除虚警信息,实验表明语言模型和词激活力这些语义信息的引入能很好的对检索结果进行约束和过滤,提升检索结果的性能。
其他文献
台湾家白蚁是一种重要的木食性白蚁,能利用其消化系统中复杂的纤维素酶催化系统高效降解木质纤维素多糖类物质。β-葡萄糖苷酶(BG)是这个多酶系统中的一类重要的纤维素酶,且是
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
近年来,随着网络技术的快速发展,信息隐藏技术作为信息安全重要课题成为各国研究者所关注和研究的热点。其原理是利用载体中存在的冗余信息来隐藏秘密对象,以实现保密通信或者实
血液中的葡萄糖和胰岛素透过血管壁进入组织器官是维持人体葡萄糖稳态的重要步骤,若葡萄糖和胰岛素滞留在血管内无法到达组织发挥功能,则将导致机体的高血糖、胰岛素抵抗以及
随着互联网的广泛普及,越来越多的用户利用电脑、智能手机等终端设备浏览网络,获取信息,找到所求。对作为网络入口的运营商来说,如何对登陆用户进行快速有效的鉴别、授权和计
石油产品的开口闪点是石油产品在储运中最为重要的安全性指标。随着我国对外开放的高速发展和石油贸易的迅猛增加,我国现有的闪点测试仪在速度、精度及标准等方面已经远远不能
本文针对军用无线通信系统的要求,对通信系统进行了深入研究。 本文选择移动自组织网络(MANET)作为研究对象,主要研究内容为支持QoS的MANET媒体控制协议、路由协议。 通
为满足人们日益增长的带宽需求,新兴的宽带接入方法EPON应运而生,实现EPON的综合业务接入的光网络终端设备显得十分重要。本课题主要是光网络终端设备的硬件和软件的设计,实现宽
学位
脂联素是由脂肪组织特异表达的细胞因子,分泌后进入血液循环,调节体内能量代谢.脂联素球状区在体内独立存在,成脂联素功能相似.虽然由脂肪组织特异表达,但是当动物脂肪过度沉