【摘 要】
:
计算机听觉场景分析旨在解决计算机如何像人类一样通过声音来感知周围环境的问题。音频场景分类是它的一个子问题,其主要目的是设计一个可以正确判断出一段新的音频信号所处场景种类的系统。随着人工智能技术的迅猛发展,音频场景分类技术开始在智能监控、自动驾驶、可穿戴智能设备等很多行业得到应用,成为目前学术研究的热点之一。针对音频场景分类问题现存解决方案中忽视多域特征和网络隐藏层信息的问题,本文提出了多域融合注意
论文部分内容阅读
计算机听觉场景分析旨在解决计算机如何像人类一样通过声音来感知周围环境的问题。音频场景分类是它的一个子问题,其主要目的是设计一个可以正确判断出一段新的音频信号所处场景种类的系统。随着人工智能技术的迅猛发展,音频场景分类技术开始在智能监控、自动驾驶、可穿戴智能设备等很多行业得到应用,成为目前学术研究的热点之一。针对音频场景分类问题现存解决方案中忽视多域特征和网络隐藏层信息的问题,本文提出了多域融合注意力机制算法和基于深度监督的多层特征融合网络,从而解决了网络模型对通用特征信息提取不充分的问题,提高了分类的准确率。本文的主要工作及创新点如下:(1)提出了一种多域融合注意力机制算法。音频数据存在有效数据区间起始点变化不定,多场景音频混杂等问题,则单纯利用前馈神经网络进行特征抽取很难获得高性能的通用特征。因此,本文引入了注意力机制来实现网络的自适应学习与特征抽取。此外,针对以往研究者只关注单域特征提取的问题,本文提出了 一种融合时域和空域特征的多域融合注意力机制算法。实验结果表明,算法的性能在三个评价指标上均优于常用的深度学习算法,AUC达到96.8%。(2)提出了一种基于深度监督的多层特征融合网络。由于浅层网络中丰富的局部特征信息和深层网络中充足的全局描述都对网络的分类效果影响较大。因此,本文联合浅层与深层特征,利用深度监督方法同时学习音频信息的局部与全局表示,并且对这些特征信息进行了有效融合。该网络在Audio Set数据集上进行了充分的实验,结果表明其系统性能优于Google基线模型,AUC达到97%。
其他文献
目的:探究无创高频振荡通气(nHFOV)与经鼻间歇正压通气(NIPPV)治疗新生儿呼吸窘迫综合征(NRDS)的临床价值.方法:选取2019年8月-2021年2月惠州市第三人民医院收治的NRDS患儿60例.简单随机分为对照组(n=30)和观察组(n=30).对照组给予NIPPV治疗,观察组给予nHFOV治疗.比较两组患儿治疗前后的动脉血气指标、机械通气时间、总用氧时间、全量喂养时间、住院时间及并发症.结果:治疗后,两组患儿的PaO2/FiO2、PaO2均明显升高,PaCO2均明显下降,且观察组PaCO2明显
目的:观察并对比浮针与电针在神经根型颈椎病治疗中的效果,并评估其安全性.方法:选取本院2017年9月-2020年11月的65例神经根型颈椎病患者作为研究对象.按照随机分组的方式将其分为对照组(32例,给予电针治疗)与观察组(33例,给予浮针治疗),观察两组患者的治疗效果、疼痛程度、生活质量,并记录两组不良反应发生例数.结果:观察组总有效率(96.97%)高于对照组的81.25%(P<0.05);观察组治疗后与治疗后2周的VAS评分、NPQ评分均低于对照组(P0.05).结论:与电针相比,浮针治疗神经根型颈
无线传感器网络(Wireless sensor network,WSN)是由部署在监测区域中的节点自组织形成的网络系统,是物联网的重要支撑技术。应急安全导航是无线传感器网络的新兴应用,可在发生紧急事故时导引现场的移动机器人等智能体安全到达目标点,在大型智能无人仓储系统中具有广阔的应用前景。针对传统应急导航算法存在动态适应性差、导航效率不高等不足的问题,本文致力于研究一种基于无线传感器网络的移动智能
随着新时代国家法制体系的不断完善,依托日新月异的互联网技术,公安系统逐步启用网络平台进行笔录信息的管理。然而破获案件,还需要对笔录信息进一步挖掘。目前,依靠人工进行案件梳理的效率较低,且难以整合全部有效信息。实体关系抽取则能够实现人物间的关系抽取及涉案人物的属性抽取,进而构建涉案人物关系网,从而辅助公安系统破获案件。可见,实体关系抽取模块的开发具有重要意义。在调研实体关系抽取的研究现状并结合公安系
目的:探讨中药联合降阶梯疗法治疗婴幼儿喘息的临床效果.方法:选取2019年6月-2020年6月本院收治的150例喘息患儿,以随机数字表法均分为两组.对照组75例患儿接受降阶梯疗法治疗,试验组75例患儿接受中药联合降阶梯疗法治疗,比较两组患儿治疗效果及复发情况.结果:治疗前,两组患儿的临床表现积分比较,差异无统计学意义(P>0.05);治疗3、7 d后,试验组患儿临床表现积分均低于对照组,差异有统计学意义(P<0.05);试验组患儿治疗总有效率高于对照组,复发率低于对照组,差异有统计学意义(P<0.05).
目的:探讨不同剂量右美托咪定在晚期肝癌癌痛患者镇痛中的应用价值.方法:选取2018年1月-2020年6月中国人民解放军113医院治疗的晚期顽固性癌痛肝癌患者117例,按照随机数字表法分为三组,A组(舒芬太尼2.5μg/kg+右美托咪定1.5μg/kg)、B组(舒芬太尼2.5μg/kg+右美托咪定2.0μg/kg)、C组(舒芬太尼2.5μg/kg+右美托咪定2.5μg/kg),每组39例.三组均采用患者自控静脉镇痛治疗.观察治疗开始后的2、8、24、48及72 h患者的疼痛视觉模拟评分(VAS)、镇痛泵有效
目的:分析超早期小骨窗微创手术治疗高血压脑出血(HCH)患者的效果.方法:选择2020年3月-2021年3月本院收治的102例HCH患者,按随机数表分为对照组(51例)和研究组(51例).对照组实施大骨瓣开颅术,研究组实施超早期小骨窗微创手术,比较两组临床效果,治疗前后神经功能及日常生活能力,术后并发症.结果:研究组总有效率94.12%,高于对照组的78.43%(x2=5.299,P<0.05);研究组手术用时(32.36±9.65)min,血肿消退时间(5.17±1.25)d,住院时间(16.83±5.
目的:探讨雾化吸入方案联合穴位贴敷治疗小儿哮喘急性发作的效果及对肺功能的影响.方法:回顾性分析2019年10月-2021年3月阳江市人民医院收治的120例小儿哮喘急性发作患儿的临床资料,按照治疗方式将其分为对照组和观察组,每组60例.对照组采取沙丁胺醇溶液联合布地奈德混悬液雾化治疗,观察组在对照组的基础上加用穴位贴敷治疗.比较两组疗效、肺功能指标及症状消失时间.结果:治疗前,两组FEV1、PEF、FVC比较,差异均无统计学意义(P>0.05);治疗后,观察组FEV1、PEF、FVC均高于对照组,差异均有统
目的:探讨泮托拉唑对胃溃疡患者胃黏膜修复指标及胃肠激素的影响,以期为临床治疗提供参考依据.方法:选取2017年10月-2020年12月淄博市张店区妇幼保健院收治的100例胃溃疡患者,根据就诊先后顺序分为对照组和观察组,每组50例.对照组采用阿莫西林、克拉霉素和奥美拉唑治疗,观察组采用阿莫西林、克拉霉素及泮托拉唑治疗.比较两组疗效、不良反应发生情况;比较两组治疗前后的GAS、MTL、CCK水平及胃溃疡边缘黏膜的VEGF、EGF和COX-2水平.结果:观察组总有效率为94.00%,高于对照组的80.00%,差
目的:分析左甲状腺素钠片治疗亚临床甲状腺功能减退的效果及对血脂水平的影响.方法:选取2020年2月-2021年2月本院收治的78例亚临床甲状腺功能减退患者,按照随机数表法将其分成对照组和观察组,每组39例.对照组采用硒酵母片治疗,观察组采用左甲状腺素钠片治疗.比较两组疗效及治疗前后的血脂指标[总胆固醇(TC)、甘油三酯(TG)、低密度脂蛋白(LDL)、高密度脂蛋白胆固醇(HDL)]和血清促甲状腺激素(TSH)、血清游离三碘甲腺原氨酸(FT3)、游离甲状腺素(FT4)水平.结果:治疗前,两组HDL、TC、T