面向声音事件的特征提取与识别方法研究

来源 :电子科技大学 | 被引量 : 3次 | 上传用户:xmg11860
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由特定物理事件引起的声波可以称为声音事件。对声音事件的特征提取和识别,可以帮助我们确定声音事件的类型,获取环境信息,从而指导生产和生活。声音事件识别过程分为特征提取和分类识别两个部分,现在主流的特征提取方法以传统语音特征为主,对声音事件的特征提取缺乏针对性。此外,由于声音事件受环境因素影响大,传统的分类器或分类算法难以对复杂的声音事件进行特征挖掘,在分类问题中表现一般。基于神经网络的分类模型效果较好,然而对训练样本的数量要求很高,难以在有限的数据集支撑下获得良好的识别效果。为此,本文在对声音特征提取与分类器设计的研究基础上,提出将样本扩增和数据增强方法同时应用到声音事件识别中,为声音事件分类识别研究提供一种新的方法。本文选取生活环境中常见的动物的声音、自然声景和水声、人类的非语音声、室内或家庭声音、户外或城市噪音等5大类50小类非语音声音事件为主要研究对象,使用音频录音文件作为声音数据集。本文在声音事件识别基本原理的基础上,设计了基于谐波分量和冲激分量分解的多种特征组合的特征表示方法,样本扩增和数据增强方法,以及基于残差神经网络的声音事件识别总体方案。首先对单通道音频文件进行谐波分量和冲激分量分解,将音频样本分解为两部分;在此基础上设计了组合特征提取方法,该方法对声音样本分别提取对数梅尔谱图、梅尔倒谱系数、色谱图、过零率,引入时域一阶和二阶差分得到特征组合。这种特征组合一方面符合人耳的非线性听觉特性,另一方面实现了频域和时域特征的结合,提高了特征刻画的全面程度。设计了音频样本扩增方法、基于线性混合与随机裁剪的数据增强方法,在SGD优化器超参数调优方面进行了一些分析。本文将数据集按照80%和20%的比例分割为训练集和验证集,经过5折交叉验证,在验证集上对50类声音事件分类获得了88.3%的准确率,超过了人工分类81.3%的准确率,说明本文所提方法对于声音事件具有良好的分类识别效果。
其他文献
利用DSP高速、内存较大的特点,对振弦传感器输出信号进行过采样处理,以提高信噪比。提出了将Quinn和Rife-Jane算法结合起来对经过FFT变换后的信号进行精确频率计算。实验证明频率测量误差不大于1%,同时具有较强的抗干扰性。
研究了冻融循环-氯盐侵蚀和弯拉荷载-冻融循环-氯盐侵蚀作用下混凝土的劣化行为,分析了氯盐侵蚀和冻融损伤的相互影响,以及弯拉荷载对混凝土抗冻性能的影响.结果表明:冻融循环
目的:利用体外共培养实验,观察结肠癌细胞SW480中上皮特异性转录因子Ese-3表达水平的改变对树突状细胞(dendritic cell,DC)分化成熟的影响。方法:利用慢病毒系统获得过表达Ese-3的
刘勰《文心雕龙》的创作论是全书的精华。《神思》篇是创作论的总纲。在这一总纲中 ,刘勰对作家艺术家创作活动的艺术想象问题 ,进行了深刻的论述 :一、“思理为妙 ,神与物游
警察信任是政治信任的重要组成部分,探究警察信任的影响因素具有现实意义。基于中国公民意识调查数据,采用复杂抽样下的序次logistic回归分析,可以发现:在控制了社会治安问题
根据我国燃具设计规定的设计工况(大气压力为101325P_a,燃气温度为0℃,燃气额定压力为P_d),本文通过大量运算与测试分析了燃具使用地点的大气压力和燃气温度对其设计额定热负
目的:树突状细胞是重要的抗原提呈细胞,通过处理和提呈抗原,从而启动T细胞反应,在固有免疫和适应性免疫中发挥关键作用。在树突状细胞发挥作用的过程中,其内质网(Endoplasmic
1958年,在河南洛宁县张鼎延别墅遗址出土了《琅华馆帖》原石。《琅华馆帖》是汇集王铎、张鼎延等人书法作品的一部刻帖,镌刻精细,所刻诸体形神兼备,原石保存完好。帖石材质为汉白玉,刻工为北方著名工匠张翱。《琅华馆帖》的底本来自于王铎、张鼎延来往信札、诗文奉和。此外,帖中还收录了王铎好友张缙彦与张鼎延儿子张琯、张璿的诗文。《琅华馆帖》的内容具有多方面的价值,其中一些诗作,文学、史料价值相得益彰,以诗记史
目的:研究TNFR1和PDC-E2在胶质瘤组织中的表达情况,分析TNFR1和PDC-E2异常表达与胶质瘤发生发展的关系。方法:采用Western blot技术检测9例不同级别胶质瘤新鲜组织中TNFR1和PDC
目的:探讨术前多模态磁共振弥散张量成像(diffusion tensor imaging,DTI)脑功能定位技术在脑胶质瘤手术中的应用价值。方法:选择2016年1月至2017年3月在我院接受手术治疗的25