基于字典学习的无监督机器异常声检测

来源 :复旦学报:自然科学版 | 被引量 : 0次 | 上传用户:hfj0219
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器异常声检测是识别目标机器发出的声音是正常声音还是异常声音的任务,在机器生产中十分重要.而真实工厂中,实际的异常声音很少发生并且高度多样化,所以很难收集到详尽的异常声.针对训练集异常数据少的问题,本文提出了基于字典学习算法的无监督机器异常声检测系统,并通过单类支持向量机寻找异常点,可以在仅有正常声音样本作为训练数据的条件下有效检测未知的异常声音.在音频特征选择方面,我们选择了16个机械领域经典的传统特征(如方差、峭度等),并将音频分帧处理,以获取更多的音频特征信息.与DCASE2020 Challeng
其他文献
时空融合技术是目前解决单一遥感数据源难以同步获取高时空分辨率数据的有效途径。然而,如何设置参数使模型融合效果最佳,如何设置在植被监测中广泛应用的植被指数的融合步骤,进而获得最佳的植被指数时序数据,目前仍不明晰。本文以长江中下游平原地区的典型县域—南昌县为例,基于Landsat和MODIS多时相数据对当前主流时空融合模型—ESTARFM(Enhanced Spatial and Temporal A
音符起始点是音乐特征信息中最基础的特征,也是高级音乐分析任务(如基频估计、节奏分析、节拍跟踪等)的前提.然而,目前大多数音符起始点检测算法的研究对象多以西洋乐(如钢琴、小提琴等)或人声为主,针对中国民乐的研究极为匮乏,其主要原因是缺少高质量的带标注的数据集.为此,本文采集了古筝的部分考级曲目的音频,并在专家指导下对音符起始点加以标注,率先构建了一个带标签的包含3529条记录的古筝音符起始点数据集.此外,由于传统的神经网络特征预处理方法无法凸显古筝音符的起始点特征,本文提出了一种新型的特征平滑处理方法ELE
利用模pq的欧拉商定义了周期为pq2的r元序列,并确定了该序列线性复杂度的精确值.结果表明,新序列具有高的线性复杂度,可以抵抗Berlekamp Massey算法的攻击.
把音频文件转化为自然语言序列后,使用mLSTM模型+softmax回归的深度学习网络对贝多芬钢琴奏鸣曲的创作时期进行分类,10折交叉验证的平均准确率可达到90%.这一工作说明创作于不同时期的贝多芬钢琴奏鸣曲的确呈现出不同的艺术特征,这一模型也可为其他的音乐分类问题提供新的思路.
随着网络技术的发展,网络舆情分析在应对突发事件中发挥的作用日益显著。自然灾害发生后,准确把握舆情信息传播特征并分析其影响因素有助于应急管理部门及时采取有效的应急救援措施。本文以台风"利奇马"为例,基于"新浪舆情通"系统搜集的相关微博、微信、论坛、网站等全网舆情数据,探究台风灾害全过程舆情信息的时空分布特征,开展灾害舆情信息影响因素相关性分析。研究表明:(1)相比于灰色EGM(1, 1)模型,ARI
黄土高原"千沟万壑"的地貌形态,在多尺度空间下表现出显著自相似性,具有"局部无规则,宏观有规律"的纹理特征。目前,黄土高原地形纹理的提取方法及应用已经得到初步发展,但依然缺乏在理论层面的框架体系。本文在已有学者研究成果的基础上,限定黄土高原为研究范围,明确提出黄土高原地形纹理的概念模型,即内涵、特征、分类及表达。将内涵进行扩展,除已有的宏观形态地形纹理外,提出黄土典型地貌单元(黄土塬、梁、峁等)特
本文主要研究音乐声的音色感知特征与情感的关联关系.首先通过多维尺度分析方法确定了一个5维的情感空间;然后针对72种音色的音阶素材和48种音色的旋律素材进行情感标注主观评价实验,得到音色素材的情感数据;按照演奏内容、时域特性以及乐器类型这3种因素进行分类,分别研究了音色感知特征和情感的相关关系;采用多维偏好分析方法和单因素方差分析方法,讨论了演奏内容、时域特性以及乐器类型这3种因素对音色感知特征与情感的影响;最后采用多元线性回归建立了一组音色感知特征与情感关系的数学模型.实验结果表明,音色感知特征是影响音乐
基于S-稳定性条件,建立了互补约束数学规划问题(MPCC)的二阶Mond-Weir型对偶模型.在二阶广义凸性假设下,证明了弱对偶定理,强对偶定理和严格逆对偶定理.给出了数值算例验证上
本文提出一种基于挤压和激励残差网络的歌声检测算法,运用该算法,不需要对音乐信号进行复杂的特征工程处理,仅需对网络输入简单朴素的声学特征,便能通过多层次卷积以及挤压和激励操作,学习到更多的有效特征,从而达到比当前流行的检测算法更强的性能.算法中,残差结构使得网络可以轻松扩展深度,挤压和激励模块能对深度残差网络中学习到的多个特征进行自动融合,进而使得学习到的歌声特征整体更有效.为了验证算法的可行性和有效性,本文选择了2个公开的数据集进行实验,并以目前性能最好的歌声检测框架之一作为基线系统,实验结果证明了本算法
城市建成区是行政区范围内具有基本完善的市政公用设施的非农业生产建设用地,它包括市区集中连片的部分以及分散在近郊区与城市有着密切联系的部分.针对利用不透水面指数和夜间灯光数据结合的方法提取城市建成区(Built-up area of urban extraction, BAUA)的结果在城市近郊工业区有缺失现象,以及市中心内部的大面积裸露土地和夜间灯光数据值较弱的地区存在大块空洞现象的问题,以201