论文部分内容阅读
关键词识别是语音识别的一个重要研究领域,具有广阔的应用空间与巨大的应用价值。本文对关键词识别技术的发展现状与主要技术进行了研究,并针对语音命令控制与音频文档内容检索两个应用领域设计实现了具体的应用系统。本文的研究重点为关键词识别系统的实现与算法比较,以及实际应用系统的设计方法与关键技术分析。主要的工作如下:1.基于Filler模型的关键词检测技术及应用本文研究并实现了基于Filler(填充)模型的关键词检出模块,对语音确认方法中的似然比特征的不同计算方法进行了对比,并结合动态垃圾得分特征进一步研究置信度评估的效果。实验表明,通过对竞争词的细化选择可以有效地提高关键词确认的效果,并且将似然比特征与动态垃圾得分特征进行联合还可以使性能进一步提升。针对语音命令控制应用,本文设计实现了基于Filler模型的语音引导系统,达到了较好的性能。通过工程实践,重点研究并解决了以下几个关键问题:关键词识别技术投入到实际应用中所需进行的识别速度和精度的调整、如何增强系统对非标准普通话的鲁棒性、如何通过工程的方法降低系统误警率。2.基于音节混淆网络的语音文档检索技术及应用本文研究了国内外对于语音检索课题的研究现状,调研了2006年的STD评测,实现了基于音节混淆网络的关键词检测引擎,并将其作为识别核心应用于实验室自主设计实现的广播音频内容检索系统中,通过对音频文档的索引机制的研究,建立了适合快速查询的反向索引与检索策略。