安全监控领域音频事件检测研究

被引量 : 7次 | 上传用户:loveni978
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的安全监控是基于视频图像的,而且大部分主要用于事后查看,近年来,音频监控也得到了许多研究。音频监控因其良好的实时性以及对视频监控的辅助,具有重要的研究和实用价值。音频监控通过音频事件检测来进行,而监控领域的音频事件检测研究还存在一些难点,比如事件类别的特征空间复杂,难以找到有效的音频特征,比如由于音频事件发生时间的随机性,不同事件在时间上可能重叠在一起,比如训练数据可能不平衡等问题。本文针对安全监控下的四种音频事件做检测,包括脚步声、玻璃破碎声、开关门声和语音。鉴于特征提取在模式识别系统中的重要作用,本文针对特征空间过于复杂这个问题,做了一些工作,主要包括以下三个方面:1.搭建和优化基于SVM的音频事件检测系统本文采用支持向量机作为分类器,然后搭建MFCC特征的基线音频事件检测系统。搭建好最初的系统之后,采用两种平滑算法来改善系统性能,效果不理想。自己设计了一种简单的平滑方法,减少了大量的输出事件碎片,总的准确率和召回率分别由35.0%和82.7%提升到51.8%和86.1%。后来进一步发现类别之间的准确率、召回率差别很大,经分析发现问题在于训练数据不平衡,针对这个问题,做了随机欠采样的试验,并最终确定后续实验训练样本欠采样的比率。2.调研分析了大量音频特征,提出幅度区间比率特征在调研和分析了大量音频特征的基础上,总结设计特征的方法和思路。受子带能量比特征的启发,提出幅度区间比率特征,以及使用这些比率值套用信息熵的计算公式算出一个熵值作为特征。之后对新提出的特征做了实验,并对比与MFCC特征的效果,发现单独使用新特征效果不理想,但是结合MFCC和新特征能够提升系统准确率,说明新特征具有一定的效果。3.研究了PCA和LDA特征变换算法,并对LDA算法做出了改进应用PCA和LDA特征变换算法,将原始高维特征映射到低维空间中,使得在新空间中能够更好地分辨各个类别,实验结果显示LDA相对于PCA,效果更好,并且特征维数也能降得更低。之后针对LDA类间距离的衡量可能存在的问题,修正类间散度矩阵的计算公式,具体使用了三种不同计算方法。实验结果显示改进LDA算法的准确率、召回率都获得了一定的提升,错误比率AED-ER也同时降低了一些。
其他文献
目的以施万细胞作为周围神经模型,比较富血小板纤维蛋白(PRF)与浓缩生长因子(CGF)对其的影响。方法随机选取18~55岁身体健康志愿者10人,无菌条件下采集静脉血10 m L,制备PRF
抗战胜利后,享誉国际的美国五星上将乔治·卡特利特·马歇尔,被杜鲁门总统派往中国,和平调处战后的中国内战。最初,他以客观、公允的姿态,奔走于交战中的国共双方,从而得到中
<正> 苦酒汤出自《伤寒论》312条:“少阴病,咽中伤,生疮,不能语言,声不出者,苦酒汤主之”。笔者用此方治扁桃体炎、咽炎有类似症状者,收效甚好,特别是屡用抗菌素无效者,其效
目前,大学生企业实习"零报酬"现象普遍,已严重地制约着实习生的实习生活,延缓大学生优质人力资源的形成步伐。为此,只有从社会就业形势、企业成本行为、法律政策依据、实习生
<正>近年来,我市组工干部教育培训工作坚持以邓小平理论和“三个代表”重要思想为指导,认真贯彻落实科学发展观,紧紧围绕加强党
电价改革是电力体制改的重要部分,作为主要经济杠杆的电价,在构建电力市场,优化电力资源配置,调节各方利益上发挥了关键作用。本文主要分析了我国电价历史问题,新形势下电价
对于半挂牵引车,整车悬架系统主要包括底盘悬架系统和驾驶室悬置系统,是车辆的主要减振系统。车辆行驶过程中受到路面不平度激励对车辆的冲击和振动,当车辆随机振动频率与人
小学是英语学习的初级阶段,学生没学过字母、音标,无法按发音规律记忆和巩固单词,这样会大大影响学生的学习兴趣和对知识的进一步巩固。所以小学英语教学应当从学生的学习兴趣、
汽车产业作为"工业中的工业",在国民经济发展中起着至关重要的作用。中国汽车产业国际竞争力的强弱,影响着中国汽车产业的成败。当前,在中美德日韩等汽车大国中,汽车产业国际
农村公路是国民经济发展的一项重要交通基础设施。近年来,我国农村公路建设速度日新月异,但已建成的农村公路的养护管理存在诸多问题。大量的农村公路建成后,公路养护没有跟