基于字典学习的无监督机器异常声检测

来源 :复旦学报：自然科学版 | 被引量 : 0次 | 上传用户：hfj0219

【摘要】

：

机器异常声检测是识别目标机器发出的声音是正常声音还是异常声音的任务,在机器生产中十分重要.而真实工厂中,实际的异常声音很少发生并且高度多样化,所以很难收集到详尽的异常声.针对训练集异常数据少的问题,本文提出了基于字典学习算法的无监督机器异常声检测系统,并通过单类支持向量机寻找异常点,可以在仅有正常声音样本作为训练数据的条件下有效检测未知的异常声音.在音频特征选择方面,我们选择了16个机械领域经典的传统特征(如方差、峭度等),并将音频分帧处理,以获取更多的音频特征信息.与DCASE2020 Challeng

【作者】

：

姚瑶李圣辰邵曦

【机构】

：

南京邮电大学通信与信息工程学院,西交利物浦大学智能工程学院

【出处】

：

复旦学报：自然科学版

【发表日期】

：

2021年3期

【关键词】

：

字典学习异常检测单类支持向量机传统机器特征

【基金项目】

：

国家自然科学基金(61936005,61872199,61872424)。

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

ESTARFM算法在长江中下游平原地区的适用性研究

时空融合技术是目前解决单一遥感数据源难以同步获取高时空分辨率数据的有效途径。然而,如何设置参数使模型融合效果最佳,如何设置在植被监测中广泛应用的植被指数的融合步骤,进而获得最佳的植被指数时序数据,目前仍不明晰。本文以长江中下游平原地区的典型县域—南昌县为例,基于Landsat和MODIS多时相数据对当前主流时空融合模型—ESTARFM(Enhanced Spatial and Temporal A

期刊

时空融合技术ESTARFMLANDSATMODIS波段反射率NDVIEVI长江中下游平原

一种新型的特征平滑处理的民乐音符起始点检测算法

音符起始点是音乐特征信息中最基础的特征,也是高级音乐分析任务(如基频估计、节奏分析、节拍跟踪等)的前提.然而,目前大多数音符起始点检测算法的研究对象多以西洋乐(如钢琴、小提琴等)或人声为主,针对中国民乐的研究极为匮乏,其主要原因是缺少高质量的带标注的数据集.为此,本文采集了古筝的部分考级曲目的音频,并在专家指导下对音符起始点加以标注,率先构建了一个带标签的包含3529条记录的古筝音符起始点数据集.此外,由于传统的神经网络特征预处理方法无法凸显古筝音符的起始点特征,本文提出了一种新型的特征平滑处理方法ELE

期刊

起始点检测数据集古筝特征平滑处理

一类周期为pq2的r元序列线性复杂度研究

利用模pq的欧拉商定义了周期为pq2的r元序列,并确定了该序列线性复杂度的精确值.结果表明,新序列具有高的线性复杂度,可以抵抗Berlekamp Massey算法的攻击.

期刊

欧拉商广义分圆伪随机序列线性复杂度

深度学习网络用于贝多芬钢琴奏鸣曲创作时期分类的研究

把音频文件转化为自然语言序列后,使用mLSTM模型+softmax回归的深度学习网络对贝多芬钢琴奏鸣曲的创作时期进行分类,10折交叉验证的平均准确率可达到90%.这一工作说明创作于不同时期的贝多芬钢琴奏鸣曲的确呈现出不同的艺术特征,这一模型也可为其他的音乐分类问题提供新的思路.

期刊

深度学习自然语言处理音乐分类

突发自然灾害事件网络舆情传播特征及影响因素研究

随着网络技术的发展,网络舆情分析在应对突发事件中发挥的作用日益显著。自然灾害发生后,准确把握舆情信息传播特征并分析其影响因素有助于应急管理部门及时采取有效的应急救援措施。本文以台风"利奇马"为例,基于"新浪舆情通"系统搜集的相关微博、微信、论坛、网站等全网舆情数据,探究台风灾害全过程舆情信息的时空分布特征,开展灾害舆情信息影响因素相关性分析。研究表明:(1)相比于灰色EGM(1, 1)模型,ARI

期刊

利奇马台风灾害舆情时空分析微博应急救助

基于DEM的黄土高原地形纹理概念模型

黄土高原"千沟万壑"的地貌形态,在多尺度空间下表现出显著自相似性,具有"局部无规则,宏观有规律"的纹理特征。目前,黄土高原地形纹理的提取方法及应用已经得到初步发展,但依然缺乏在理论层面的框架体系。本文在已有学者研究成果的基础上,限定黄土高原为研究范围,明确提出黄土高原地形纹理的概念模型,即内涵、特征、分类及表达。将内涵进行扩展,除已有的宏观形态地形纹理外,提出黄土典型地貌单元(黄土塬、梁、峁等)特

期刊

黄土高原地形纹理概念模型DEM地形特征多尺度地表形态纹理基元地学信息图谱

音乐声的音色感知特征与情感的关联研究

本文主要研究音乐声的音色感知特征与情感的关联关系.首先通过多维尺度分析方法确定了一个5维的情感空间;然后针对72种音色的音阶素材和48种音色的旋律素材进行情感标注主观评价实验,得到音色素材的情感数据;按照演奏内容、时域特性以及乐器类型这3种因素进行分类,分别研究了音色感知特征和情感的相关关系;采用多维偏好分析方法和单因素方差分析方法,讨论了演奏内容、时域特性以及乐器类型这3种因素对音色感知特征与情感的影响;最后采用多元线性回归建立了一组音色感知特征与情感关系的数学模型.实验结果表明,音色感知特征是影响音乐

期刊

音色情感关联音色感知特征多维偏好分析多元线性回归

互补约束数学规划问题的二阶Mond-Weir型对偶理论

基于S-稳定性条件,建立了互补约束数学规划问题(MPCC)的二阶Mond-Weir型对偶模型.在二阶广义凸性假设下,证明了弱对偶定理,强对偶定理和严格逆对偶定理.给出了数值算例验证上

期刊

互补约束数学规划二阶广义凸函数Mond-Weir型对偶对偶定理

基于挤压和激励残差网络的歌声检测

本文提出一种基于挤压和激励残差网络的歌声检测算法,运用该算法,不需要对音乐信号进行复杂的特征工程处理,仅需对网络输入简单朴素的声学特征,便能通过多层次卷积以及挤压和激励操作,学习到更多的有效特征,从而达到比当前流行的检测算法更强的性能.算法中,残差结构使得网络可以轻松扩展深度,挤压和激励模块能对深度残差网络中学习到的多个特征进行自动融合,进而使得学习到的歌声特征整体更有效.为了验证算法的可行性和有效性,本文选择了2个公开的数据集进行实验,并以目前性能最好的歌声检测框架之一作为基线系统,实验结果证明了本算法

期刊

歌声检测音乐信息检索挤压和激励网络残差网络卷积神经网络

基于NPP/VIIRS与Landsat-8数据对城市建成区提取方法研究

城市建成区是行政区范围内具有基本完善的市政公用设施的非农业生产建设用地,它包括市区集中连片的部分以及分散在近郊区与城市有着密切联系的部分.针对利用不透水面指数和夜间灯光数据结合的方法提取城市建成区(Built-up area of urban extraction, BAUA)的结果在城市近郊工业区有缺失现象,以及市中心内部的大面积裸露土地和夜间灯光数据值较弱的地区存在大块空洞现象的问题,以201

期刊

城市建成区VIIRS数据不透水面指数地表温度形态学后处理

基于字典学习的无监督机器异常声检测

与本文相关的学术论文