一种基于双路径深度卷积网络的声场景分类方法研究

来源 :电子器件 | 被引量 : 0次 | 上传用户:soaringroc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声场景分类,就是训练计算机通过声音中所包含的信息将声音正确的划分到其所属的场景中,其在物联网设备、智能助听器、自动驾驶等领域有着广泛的应用。根据声学特征谱图的特点和深度学习中的卷积神经网络理论,提出了一种基于卷积神经网络的声场景分类方法。首先提取音频的对数Mel谱图及其一阶二阶差分谱图,并在通道维度上进行拼接,随后利用中值滤波器对融合谱图进行分层,得到2个融合谱图分量。然后搭建了双路径深度卷积神经网络分别对每个谱图分量进行建模,并在系统输出前将2个路径获得的特征图进行融合,最后通过全连接层进行分类。并在T
其他文献
吸入麻醉药通常用于麻醉维持,但也可用于麻醉诱导,特别是在小儿。中枢神经系统中的不同离子通道包括GABA、甘氨酸和NMDA受体)对吸入麻醉药是敏感的,可能发挥相同作用。因此吸入
非胰岛素依赖性糖尿病(NIDDM)更常见,发病率约为IDDM的10倍。对遗传背景和迁移入群的发病研究表明该病由遗传和后天因素共同作用而致。NIDDM是以胰岛素抵抗为特点。  1病理
妊娠可使隐性糖尿病显性化,使既往无糖尿病的孕妇发生GDM,使原有糖尿病病人的病情加重。妊娠合并糖尿病对母儿的影响及影响程度取决于糖尿病的病情及血糖控制水平。凡病情较重
目的:研究DWl对急性脑梗死的诊断价值,及对急性与非急性脑梗塞鉴别诊断价值。方法收集2013年3月至2013年11月在我院行1.5T常规MR检查,并行FLAIR及DWI检查的36例临床可疑脑梗死患
目的:探讨肥胖症患者的临床治疗方法。方法回顾性分析我院从2011年6月~2012年6月期间收治的56例该病患者的临床资料进行总结分析。结果56例患者经积极治疗后体重均明显下降,身体
探讨主动脉瓣狭窄患者的介入治疗手术的方法和手术步骤。回顾性分析我院从2011年1月~2012年1月期间收治的28例该病患者的临床资料进行阐述。介入治疗心脏病科学的发展之快,经皮
设备的智能化状态评估和预测维修是构建智慧能源的核心要素之一。以转子动力学、现代信号处理和人工智能技术为基础,开发了基于历史大数据挖掘和人工智能算法的矿井旋转机械
1946年俄罗斯的Demikhov 医生进行了心肺联合移植的动物实验,开创了心肺移植的新纪元。1968年,C o o l e y 完成了首例人心肺联合移植术。20世纪80年代初期心肺联合移植呈发展
为了使13.56 MHz射频识别天线适合于智能钥匙柜应用中,对13.56 MHz PCB天线的工作原理、作用机理进行了简单的介绍,然后对应用于智能钥匙柜的13.56 MHz平面螺旋电感天线进行了理论分析计算、CST三维电磁场仿真、匹配电路仿真,最后通过矢量网络分析仪对设计的13.56 MHz射频天线进行测试,测试结果表明设计的13.56 MHz天线达到了设计的要求,能够用于智能钥匙柜识别天线中。
目的:探讨子宫内膜癌患者的放射治疗效果。方法对8例子宫内膜癌患者进行放射治疗临床病理资料进行回顾性分析。结果5例患者经过手术后放疗后,达到了治愈效果2例没有手术的患者