论文部分内容阅读
本文实现了一个电视台媒体资产管理中的关键词语音标引系统。系统以连续混合高斯隐马尔可夫模型为基础,采用分层构筑维特比算法进行训练和识别。为实现标引的实时性,采用实时计算的方法,录音和识别同时进行。为了减少计算量,并没有将状态持续时间分布引入Viterbi译码,而是将其作为后处理部分。对于汉语数字识别的一些易混词,采用声调作为辅助判决。以此做了一个体育赛事的词库,经测试表明,关键词标引首选识别率达到93.5%,前五选识别率达到98%。