【摘 要】
:
目前大多数声音识别检测的研究都是基于强标签数据集的,但在真实环境的声音识别与检测任务中,音频标签不完整并且含有大量噪声,使得获取强标签音频数据比较困难,进而影响对声
【机 构】
:
西安电子科技大学电子工程学院,西安电子科技大学通信工程学院
【基金项目】
:
国家自然科学基金(51675425),陕西省重点研发计划(2018SF-365)
论文部分内容阅读
目前大多数声音识别检测的研究都是基于强标签数据集的,但在真实环境的声音识别与检测任务中,音频标签不完整并且含有大量噪声,使得获取强标签音频数据比较困难,进而影响对声音的准确识别与检测。为此,在卷积循环神经网络模型的基础上,提出了一种多尺度注意力融合机制。该机制使用注意力门控单元,在降低声音时频图特征中噪声影响的同时,能够更多地利用有效特征。同时,通过结合多个尺寸的卷积核进行特征融合,进一步提升对声音特征的有效提取。此外,采用一种结合帧检测结果的加权法对声音信号进行识别。最后,在弱标签环境下,从AudioS
其他文献
针对二维最大类间方差阈值法(2D-Otsu)抗噪性较弱、计算时间较长的问题,文中提出了一种基于随机权重及异步价值因子取值的人群搜索算法,并将其应用于2D-Otsu中对钢轨缺陷图像进行分割。该算法采用随机权重加快收敛速度,采用异步价值因子提高搜索能力,有利于全局收敛到最优值。根据测试函数分析,WFSOA算法能够快速收敛,寻优值结果精度高,收敛时间短,算法稳定性好。在钢轨缺陷图像分割中,将2D-Ots
将聚乙烯醇与明胶混合水溶液进行静电纺丝,制备了聚乙烯醇与明胶混合超细纤维及其电纺膜,研究了混合纺丝液的组成对纺丝液的粘度、表面张力和电导率的影响,观察了纤维的微观
于2010、2012、2013年在黑龙江省建三江、宝泉岭、五常、牡丹江、绥化和佳木斯这6个水稻主产区的23个县及农场,从空育131及其它13个水稻主栽品种上采集的感病穗颈节分离、获