论文部分内容阅读
近年来,关键词检测技术在口语语音和电话语音领域取得了显著的发展,但针对流媒体语音关键词检测的有关文献却很少见,基于这个目的,提出一套针对流媒体关键词检测的系统方案。系统利用WMFSDK从流媒体中提取出解码的语音数据。为了区分集外词和关键词,利用了在线垃圾模型拒绝集外词并且得到多个关键词候选。在关键词确认阶段,把解码过程中得到的基于MAP的词置信度和N—best特征作为特征向量,设计了支持向量机(SVM)分类器。通过实验对SVM方法和传统的Fisher方法进行了比较,研究表明前者的应用效果整体优于后者。