基于原子模式的新音频事件检测

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:bohaiyifan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的快速发展和手持录音设备的普及,人们可获取的音频数据呈爆炸式增长。为了有效管理、利用海量音频数据,对音频事件检测技术的研究成为一大热点。目前的音频检测算法主要针对预先定义的音频类型,而对新音频事件发现的研究相对欠缺。本文定义的新音频事件是指在未知的音频流中,人们可能感兴趣的一类音频事件,其数量在某一段时间内大于其他类音频事件。由于新音频事件的类型只有在将其检测出来之后才可得知,故新音频事件发现属于无监督学习的范畴。本文主要对传统的矢量量化方法进行改进,提出了一种基于原子模式的新音频事件发现方法,并通过实验验证其性能:1、在码本训练阶段,用多维正态分布表示码字,结合模糊聚类思想,使一个样本在码本训练划分时,可依概率隶属于多个码字,实现了“软分类”,减少了量化误差;2、在码字搜索阶段,考虑目标音频事件的准平稳特性,提出了一种基于动态规划的编码方法。该方法对每一段音频的编码进行平滑,能减少冲击杂音等背景噪音的影响,提高系统在复杂的音频环境中的稳定性。3、在码字索引阶段,将包含样本数目较多的码字作为“高频码字”,统计每一段音频中隶属于高频码字的帧数的比例,并以此为依据实现对新音频事件的筛选。4、设计并实现了一个新音频事件检测系统。实验表明,当目标音频类型占比达20%以上,或者目标音频时长是次大类音频的3倍以上时,系统普遍可实现新音频发现的目标。对目标音频样本的抽取也取得了良好的效果。综上所述,本文方法在对待处理音频集无先验知识的情况下,提供了一种发现新音频事件的解决方案,弥补了该场景下研究工作的欠缺。
其他文献
采用常压化学气相淀积(APCVD)工艺在1000~1400℃温度范围内的(100)Si衬底上进行了β-SiC薄膜的异质外延生长.实验结果表明,随着淀积温度的升高,外延层由多晶硅向β-SiC单晶转变,结晶情况变好;但同时单晶生长速率
本院自 2001年 1月~ 2002年 8月对经阴道分娩并施行会阴切开缝合术的产妇使用盐酸利多卡因胶浆进行局部麻醉止痛,取得了满意效果,现将临床疗效观察报告如下.
为促进江苏省林业的可持续发展,2015年按照江苏省林业局统一部署,南京市高淳区开展了第九次森林资源连续清查工作,来摸清林木覆盖率的变化情况。对此,介绍此次调查的情况,分
知识产权制度对于企业技术创新具有巨大的推动作用,现代企业要充分利用知识产权制度激发企业技术创新,必须了解和掌握知识产权法律,建立完善的知识产权制度,确立相应的知识产
随着我们幼儿园入园率的不断提高,社会对幼儿教师的需求量不断增加,但幼儿教师的职业化程度不能很好的满足人们对此职业的要求,社会上对于幼儿教师越来越高的专业化要求使得
<正>中国大唐集团有限公司培训学院通过认真组织学习习近平总书记在全国组织工作会议上的重要讲话、中办《关于进一步激励广大干部新时代新担当新作为的意见》(以下简称《意
超燃冲压发动机是发展高超声速技术的核心,以其为动力装置的各类高超声速飞行器对于国防安全和航天运输都有重要意义。本文分析了超燃冲压发动机对热防护材料的要求,综述了C/
目的:探讨应用改良Kessler法治疗开放性跟腱断裂的临床效果。方法:对32例开放性跟腱断裂患者采用常规清创缝合和改良Kessler法吻合肌腱。结果:全部32例患者伤口愈合,功能恢复
教师的人格魅力是在教学活动中影响和改变学生的心理及行为的素质与能力。本文从多个方面、多个角度分析教师人格魅力对学生学习热情的影响,探讨教师个人魅力的养成,为教师更
针对成庄矿5310大采高工作面开采受陷落柱影响的问题,对陷落柱进行了详细的勘探,明确了陷落柱的位置、范围,制定详细的探放水技术措施,对陷落柱进行超前探放水,并制定了过陷