高性能的音频场景识别方法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:whywhatyou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从单个自然事件到整体声场,声音包含各种有助于人类理解周围环境的信息。近年来,已经提出了几种自动分析这些信息的新颖方法,并且出现了一些新的应用。音频场景识别通过分析音频来提取其所处的环境信息,认识音频内容的本质,能够改善人类的生活,更好地为人类社会提供服务。除此音频场景识别涉及的一些关键技术如信号处理、数据挖掘及决策对于分析非线性非平稳信号、智能多媒体信息处理与检索、促进信息科学与数学学科之间的交叉融合、推动人工智能为代表的新技术的发展具有重要意义。音频场景识别在音视频描述与检索、机器导航、语音降噪、场景建模、军事刑侦情报获取和监控等领域存在着较广泛的应用。本文以音频场景识别的高性能为目标,主要完成了如下工作:(1)分析音频场景识别的原理。从模式识别的基本理论出发,对音频场景识别进行了详细地分析,为音频场景识别提供了理论依据。基于音频场景识别的通用模型,提出将加入特征选择算法的音频场景识别改进模型,以更高效地对音频场景建模。(2)研究音频场景特征获取方法。提取一系列的音频场景信号特征,并针对现有特征选择算法存在的计算复杂度高和性能低问题,提出了改进的特征选择的优化框架,基于该框架提出基于改进特征评价标准和混洗蛙跳算法的特征选择算法,用于获取音频信号特征的最优的特征子集,提高音频场景特征的有效性。(3)研究精确分类器评价准则。针对多分类问题,提出基于混淆矩阵的分类器的综合评价准则,并将其用于评估复杂的音频场景识别系统性能,以验证论文提出方法的有效性和优势性。(4)提出将GMM与CNN进行模型融合的分类方法,用于提高系统的分类性能。(5)系统设计及实现。基于GMM和CNN搭建音频识别系统,实验结果表明,本论文实现的音频场景识别系统可以快速准确地对音频场景进行分类,具有准确率高、成本低、操作简单等优点,具有研究参考价值。
其他文献
多层陶瓷电容器(MLCCs)体现了电子元器件小型化、复合化、低成本、高可靠性的发展趋势.BME(BaseMetal Electrode)技术的发展促进了Ni内电极MLCCs的生产和应用.为了适应贱金属
传统的小麦生产以获取籽粒产量为目标.随着小麦品种的改良和栽培技术的改进,中国小麦生产得到了长足的发展,现已成为世界小麦(谷粒)产量最高的国家.相伴而生的问题则是小麦(
目的探讨肺栓塞误漏诊的原因,以提高对肺栓塞鉴别诊断能力。方法选取2014年1月至2018年4月有症状,但入院时没有诊断或疑似诊断为肺栓塞,而最后诊断确定肺栓塞的病历,分析误漏
2004年雅典奥运会上,我国运动员罗雪娟在女子100米蛙泳项目上拔得头筹,为我国女子蛙泳项目拉开了新的序章。但随着齐晖夺得2006年短池游泳世界锦标赛女子200米蛙泳金牌后,蛙泳项目的发展屡受挫折。直到史婧琳在2014年仁川亚运会女子100米蛙泳决赛中夺冠,并且破赛会纪录。尽管如此,中国在国际赛场中女子蛙泳项目依旧式微,因此研究史婧琳的技、战术特征,探寻这一项目我国顶尖运动员的制胜规律,分析出史婧
风暴潮在世界自然灾害中位居首位,在人员死亡和破坏方面甚至超过地震。风暴潮灾害在我国也是最严重的海洋灾害,在西北太平洋沿岸国家中,登陆和影响我国沿海的台风频数最高,我
为了揭示我国无居民海岛自身特征蕴含的对开发顺序的客观要求,文章基于海岛自然属性和社会属性的分析,从地理学、生态学、环境学和国土安全学的角度阐述无居民海岛开发的影响
综述了碳/碳复合材料等温CVI制备工艺的最新研究进展,重点介绍了致密化过程和热解碳的形成机理,并展望了今后的发展趋势.
橄榄石型LiFePO4正极材料具有原料来源丰富、无毒、环境友好、理论容量较高、热稳定性和循环性能好等特点,有望成为新一代锂离子电池正极材料.介绍了LiFePO4正极材料的结构、
目的 探讨miRNA(miR)-31对宫颈鳞癌siHa细胞系侵袭性的影响及其可能存在的作用靶点。方法 采用逆转录聚合酶链反应(RT-PCR)及Western印迹对比宫颈鳞癌组织、正常宫颈组织及siHa细
自1980年开始,利用从法国引进的长灯笼形甜椒胞质雄性不育系"LANES"为不育源,通过回交转育方法,于1984年选育出羊角形辣椒胞质雄性不育系"21A"、灯笼形甜椒胞质雄性不育系"8A