音频事件检测技术研究与应用

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:lyt0821
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
音频事件检测技术是音频内容分析与处理最主要的任务之一,目标是判断音频段中所发生的事件种类并标注音频事件的起止时间,其算法性能的优劣对后续音频处理与分析相关任务具有重要的影响。该技术涉及了机器学习与模式识别等相关领域知识,并在现实中存在广泛的应用领域,如安防监控、智能家居以及多媒体检索等。音频事件检测技术存在以多种标注格式进行学习的形式,本文以深度学习技术为基本理论,针对基于序列标注格式的检测算法进行了深入研究并提出相关改进方法,构造相应数据集以对算法的性能进行分析。本文的主要工作和创新点包括:(1).对基于序列标注的音频事件检测算法,提出了一种序列标注格式以及损失函数,使其能够利用音频段中准确的事件序列信息,并引入复合状态的概念清晰地对序列信息进行数学描述。然后在CTC(Connectionist Temporal Localization)算法基础上进行改进,使其能够利用所提出的复合状态以及损失函数对模型进行训练。(2).收集并构建了一个具有多种音频事件类型以及充足有效时长的音频数据集,并提供准确的强标注文件。通过混音等音频处理算法生成多个具有不同统计特性的数据集,然后利用生成的数据分析数据统计特性对各算法性能的影响。为了验证提出算法的有效性,本文在三个公开的数据集TUT Sound Events Synthetic 2016、TUT Sound Events 2016 Develoment以及TUT Sound Events 2017上分别进行了对比试验,通过实验可以验证相较于原有的基于序列标注的音频事件检测算法,本文所提出的算法具有更优异的性能以及稳定性。
其他文献
随着5G时代的逐步到来,互联网行业正酝酿着一轮新的爆发。与此同时,承载人们表达愿望的微博社交平台也发展迅猛。用户在微博平台上留下了丰富的个人信息和海量的个人动态,并且这些数据都是用户的自发行为,具有极高的可信度和多样性。通过对用户产生的这些多样性数据进行收集、整合、分析,可以做到尽可能全面、准确地描绘用户画像。本文主要从微博平台中收集用户数据,分析和挖掘用户特征,构建一个较为完整的用户画像。针对常
随着移动互联网技术近些年来的飞速发展,用户的数据业务类型愈来愈多,由互联网产生的业务数据流量正在呈指数级增长,业务对终端处理器的计算能力和存储能力都提出了更高的要求以满足用户需求。为了解决这一瓶颈,移动边缘计算(Mobile Edge Computing,MEC)的概念被提出,移动边缘计算通过下沉云中心的存储和计算能力至网络边缘,在靠近无线接入网和核心网之间部署边缘计算服务,为用户业务数据提供计算
最近,通过利用定义集,很多几重量线性码被广泛的构造和研究。这些线性码在秘密共享、认证码和强正则图上都有应用。文章第一部分,推广了王秋燕所构造的线性码,获得了很多新的
计算机动画作为计算机图形学的一个重要研究方向,在各个领域的应用越来越广泛。随着计算机硬件和图形学算法的发展,计算机动画不断向着高质量和高效率的方向进步。户外场景的
随着世界经济的发展及贸易全球化,海上运输方式已经占全球贸易运输的80%以上。由船舶压载水引发的物种入侵已成为大家关注的热点。船舶压载水即在船舶航行过程中,为了控制其纵倾、横倾、吃水及稳定在压载舱装入的水及悬浮物。对于船舶压载水中微生物的研究是港口入侵生态和船舶压载水管理和控制的研究热点。本文通过选取停靠于上海洋山港的三条典型航线(中国——美洲航线、中国——欧洲航线、中国——澳洲航线)的32艘船舶进
计算机视觉在人类生活中应用广泛。但是,计算机处理一张图片时,往往会对整张图片以同样的算法进行处理,耗费大量的时间。显著性检测让计算机先检测出人类感兴趣区域,然后只对这些区域进行后续算法处理,节省了大量的计算量。但是面对复杂场景时,现有的针对2D、3D图像的显著性检测算法并不能取得准确的检测结果。光场图像的多模态信息(包括颜色、深度和聚焦信息),可以帮助算法在复杂场景识别显著性物体。但是现有的光场显
本翻译报告选取的源文本为《清朝和中国的传统文化》,出版于2015年。该书作者为莱斯大学历史系教授理查德·史密斯,他在历史和全球视野中阐释了清朝文化,展示了这个时代的中国人如何看待世界,他们的人生观和价值观如何在物质文化和社会习俗等方面得以展现。本文以第一章节《明朝遗史》英译汉文本为蓝本,让读者了解外国人眼中的中国明朝发展史。事实上,译者的翻译是一个文化回归的过程。针对这类历史文本的翻译,本文总结了
目的肝细胞癌(hepatocellular carcinoma,HCC)作为一种高发病率、高致死率的全球性恶性肿瘤,其进展速度快、转移率高、复发率高、不易早期诊断,导致肝细胞癌病人治疗后5年生
十九大报告中对我国政府部门进行行政管理体制改革提出了明确要求。现阶段,我国处于结构转型升级不断加快,和谐社会建设不断推进的重要节点;同时,还处于改革开放不断深化,经
2013年,我国《公司法》进行了第二次重大的修改,公司资本认缴制开始实施。这一举措虽给公司设立带来了极大的便利,激发了市场活力,但债权人的利益保护问题却被忽视。在公司无法偿还到期债务之时,出于对债权人利益的考虑,股东出资义务加速到期制度引发了学界与实务界的热议。由于法律对此并无明确具体的规定,加之相关理论研究的不成熟,学界对该制度存在较大的分歧,同案不同判的情况亦越来越多地出现在司法实践中。为保护