论文部分内容阅读
随着多媒体技术的不断革新和广播电视事业的快速发展,电视广播数据成指数倍增长,给电视广播媒资管理以及监播带来了巨大的挑战。为了管理快速增长的监播内容,建立完善的监测系统实现自动化监播的迫切性日益增加。音频在电视广播领域具有广泛的通用性,因此利用音频匹配检索进行内容监播是主流方案,面向内容的音频匹配技术成为广播监测研究的重点,具有重大的应用价值。本文根据广播电台广告监播的实际需求,对现有音频检索算法中的音频指纹技术和匹配检索技术进行学习研究并改进,设计并实现了一套电台广告监播系统。该系统能快速、正确地实现对电台播出的音频流进行广告音频的监播、统计并反馈给客户。具体的工作内容以及研究创新如下:1.电台广播在播放时需要采用调音器对播出的音频进行EQ处理进行润色,同时广播中音频很容易遭受噪声干扰和时间拉伸攻击导致播出音频失真。现有的指纹提取算法在鲁棒性和准确性两方面不能很好地均衡,因此本文采用基于MCLT改进的语谱图,通过动态阈值来确定峰值点对建立音频指纹,提高音频指纹的抗噪性和对EQ处理的抵抗力。利用音频指纹,采用适当哈希函数构建指纹哈希,提高指纹哈希对时间拉伸攻击的抵抗力。实验结果表明,该算法与现有方法相比,具有很强的抗噪性和鲁棒性,尤其对于时间拉伸攻击具有很强的鲁棒性。2.传统的广告监播方法是采用模板匹配的方法,该方法能够准确的确定广告音频的起始结束时间。但由于广播音频流一般长达24小时,广告音频才10s左右。传统的模板匹配的方法来确定时间效率及其低下。本文结合指纹哈希采用二次过滤匹配,采用了一种基于哈希冲撞点统计的音频匹配方法,通过冲撞的哈希点的时间信息,利用最小二乘法线性拟合出待检音频与目标音频的时间对应关系,完成音频查找及时长分析。实验表明该方法能够快速、准确地确定目标音频的时间位置信息,满足实际监播需求。3.结合改进的音频检索算法和实际功能需求设计并实现了电台广告监播系统。系统利用改进的音频指纹提取算法以及音频匹配的方法完成广告音频的查找检索。该系统主要包括音频比对分析系统和广告业务流程系统,能够实现电台广告监播全自动化。同时该系统能够方便地迁移至其他电台节目等音频的监播业务。