知识引导的段模型解码及其关键词检测研究

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:bechametop
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声学模型,是语音识别领域的核心研究方向之一。段模型放宽了隐马尔科夫模型(Hidden Markov Model,HMM)模型在给定状态时语音观测矢量相互独立的假设,获得更精确的声学模型。然而,基于随机段模型的大词汇量连续语音识别系统,虽然有更优于HMM系统的识别性能,却难以达到较快的识别速度,成为制约其应用的关键问题。本文针对段模型解码算法及其语音识别系统和关键词检测系统,进行的主要工作有:   ·实现了基于声韵母预分类的段模型提速算法。该方法是语音知识在解码中的初步应用。首先,对语音信号所属声韵母类别作出快速判断,实现了语音段上相应声学模型解码空间的压缩,从而有效地提高了解码速度。在不影响识别正确率的同时,识别系统的识别时间减少了51.8%。   ·完成了语音中声带不振动界标点的检测和定位,并将其作为搜索过程启发点,引入段模型解码算法中。声带不振动界标点检测算法,能够检测出语音信号中声带停止或开始自由振动的时间点。实验表明,汉语中87.4%的塞音及98.9%的擦音能够通过声带不振动语音段的检测工作从语音中分离出来。   ·在对语音中发音稳定段的分析和检测的基础上,实现了可变步长的段模型解码方法。发音稳定段,是指与发音动作平稳时段对应的语音信号段。在声学模型解码过程中,跳过起点或终点落在发音稳定段中的待解码语音段,从而提高了解码速度。在识别系统中,识别时间缩短了23.4%,同时声韵母识别错误率相对降低了2.3%;在关键词检测系统中,声韵母网络的构建时间缩短了32.5%,同时关键词漏检率相对降低了15.4%,虚警率相对下降了15.7%。   ·实现了采用语音预分类及特定区域校验的关键词检测系统。首先,关键词预检测方法快选出语音中可能包含关键词的语音段;随后段模型在这些语音段上计算其对应关键词的置信度得分,得到关键词检测结果。
其他文献
随着电力电子技术的发展,DC-AC逆变器在航空、航天、航海等国防领域和电力系统、交通运输、邮电通信、工业控制等民用领域得到广泛的应用。为了研制更高性能的DC-AC逆变器,人
切换非线性系统是一类重要的混杂系统,具有重要的理论研究价值和广泛的工程背景。由于切换系统中连续动态和离散切换信号之间的相互作用,使得系统的动态行为十分复杂,大量的分析
近年来随着计算机技术的发展和后PC时代来临,嵌入式技术已经成为工业生产和科研实验中不可或缺的重要组成部分。另一方面,数据采集则是信号与信息处理的关键,在军工和民用中得到
随着我国经济发展,机械制造业越来越成为我国经济发展的支柱产业。而数控机床是机械制造业的核心,故数控机床的研制进行得如火如荼。但是,我国研制的数控机床仍然存在不少的
自主/遥控水下机器人是近年来出现的一种新型水下机器人,其自带能源,通过微光缆与水面支持系统相连接,既具有自治水下机器人大范围自主航行的能力,又具有遥控水下机器人定点操作
在过去数十年,由于其广泛应用,例如优化,不动点计算和其他方面,神经网络已经受到相当的关注。众所皆知,时滞现象在神经网络中经常出现,不仅影响传递的速度,还易引起不稳定和震荡。因
PET瓶胚温度控制系统作为饮料瓶吹灌旋一体机的一个重要组成部分,设计的好坏直接决定了吹瓶的质量。饮料吹灌旋一体机是集吹瓶、灌装和旋盖于一体的饮料瓶生产机组设备,相对
本文主要研究了几何主动轮廓模型,和多特征集协作学习在图像分割中的应用。工作主要从以下几个方面进行:从定制矢量流的角度,讨论了集成多线索的信息到矢量场中,以用于驱动GAC模
传统的随机系统控制主要是控制随机系统输出的均值和方差等统计特性。近几年来,随机系统控制出现一个新的分支,即随机分布控制。这类系统的主要特点是其输出为系统变量的概率密
在复杂网络的研究中,当前不同领域的学者关注的热点是揭示节点数众多、连接结构复杂的实际网络的整体特性,特别是网络拓扑结构与网络动力学行为之间的关系、结构与功能的形成机