基于主成分分析和深度自编码高斯混合模型的无监督异常数据检测方法研究

来源 :现代电子技术 | 被引量 : 0次 | 上传用户:p244150486
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在异常数据检测中,由于数据量过大和数据特征维度过高,往往会导致数据标定困难、数据冗余、算法效率降低等。针对以上问题,将主成分分析(PCA)特征选择算法与深度自编码高斯混合模型(DAGMM)相结合,提出一种新的无监督异常数据检测方法 PCA-DAGMM。该方法首先利用PCA特征选择算法对数据进行预处理,去除对分类效果增益较小的冗余数据,降低运算成本;然后将特征选择后的数据输入到DAGMM模型中进行训练。基于kddcup99数据集和CIC-IDS-2017数据集进行实验,并与多种特征选择算法进行对比,实验结果表明,PCA-DAGMM方法可以有效优化分类器性能,提高分类器训练效率,适用于解决网络流量异常检测问题,F1指数在kddcup99数据集和CIC-IDS-2017数据集上比DAGMM模型分别提高了4.37%和1.06%,训练时间减少了14.43%和8%。
其他文献
恶意应用是移动终端用户面临的最严重威胁之一。由于恶意应用的恶意性、传播性和隐蔽性,恶意应用的检测往往落后于它的出现。虽然目前已从应用行为分析、特征提取和动态执行等多方面对恶意软件进行研究,但缺乏对恶意应用作者系统的、全面的分析。本文从Android应用作者的角度对应用程序展开研究,解决应用作者识别和行为分析问题。为准确识别应用作者,提出一种二阶段方法A~3Ident,包括作者解耦和作者识别两个阶段
学位
武汉东湖风景名胜区是典型的城市型风景名胜区,为进一步提升景区的品质,将东湖打造为世界城中湖典范和世界级城市生态绿心,武汉相关部门结合《武汉东湖风景名胜区总体规划(2011—2025)》开展了东湖风景名胜区喻家山服务区详细规划的编制工作。文章以东湖风景名胜区喻家山服务区详细规划为例,在分析服务区现状的基础上,提出了“完善保护区划、加强生态保护,强化功能结构、提升空间环境品质,突出东湖水域特色、明确功
期刊
基于植被净初级生产力和覆盖度的植被生态质量指数构建方法,对长白山自然保护区2000—2021年植被生态质量变化情况进行评估分析。结果表明:长白山自然保护区是吉林省绿色程度较高、生态环境好的区域,植被覆盖度和年净初级生产力总体呈上升趋势;生态质量指数随着海拔的升高而降低,2000年以来,植被生态质量指数总体呈上升趋势;96.6%的区域植被生态质量在持续提升,特别是西南坡增幅显著,生态质量变差区域主要
期刊
现实生活中,交流过程不止有说话声,更是充斥着各种各样的噪声干扰着沟通质量。因此,如何更好地抑制噪声对沟通的影响性,是一个急需解决的问题。语音增强是为更好的解决噪声对交互影响而出现的技术,主要目标是增强混合语音中的目标语音,从而在一定程度上使得增强后语音更易于理解。传统的语音增强只能较好的应对平稳噪声,对于非平稳噪声效果往往不太理想,最近深度学习的崛起在很大程度上解决了对非平稳噪声的抑制。由于频域处
学位
目标检测一直是计算机视觉领域比较典型的研究问题,在实际生活和工业场景中也得到了越来越广泛的应用。但是,由于目标检测中存在一些问题对于其性能提升造成了阻碍,比如:多尺度目标特别是小目标、目标之间相互遮挡、复杂环境的噪音干扰。因此,针对以上问题,本文从复杂场景及小目标两个方面着手进行了研究。论文的主要工作如下:1、针对多尺度目标检测任务存在小目标检测准确率不高,召回率较低的问题,提出了一个基于双通道注
学位
随着机器学习和深度神经网络两个领域的迅速发展以及智能设备的普及,人脸识别和分析技术正在经历前所未有的发展。目前,人脸识别和分析精度已经超过人眼。此外,人脸表情识别(Facial Expression Recognition,FER)作为人脸识别和分析技术中的一个重要组成部分也已经达到了前所未有的精确的效果,但对于复杂环境下的人脸表情图像(有遮挡、低分辨率、有额外噪声),想要达到同样的精确的识别结果
学位
为了提升石油烃污染土壤的修复效率,考察了不同表面活性剂(吐温-80 (Tw-80)、曲拉通X 100 (TX 100)、十二烷基硫酸钠(SDS)、十二烷基苯磺酸钠(SDBS))对过硫酸钠氧化土壤中石油烃的强化效果,并分析了表面活性剂SDS强化修复效果较优的原因。土壤中石油烃的去除率遵循如下趋势:SDS>SDBS>TX 100>Tw-80。SDS强化修复效果较优可能与其在土壤中吸附量较小对石油烃的增
期刊
通过眼球捕捉的视觉信息是人脑认知世界、感知周围、捕捉外界信息的重要途径之一,随着眼动跟踪设备的不断完善,使用眼动数据分析人脑认知的方式越来越受到研究人员的关注。然而目前对眼动数据的研究主要是从“自底向上”的角度分析,缺乏对“自顶向下”因素的讨论与定量化分析计算。本文主要从“自顶向下”的角度对多目标跟踪过程中的凝视控制进行分析,探究了人脑完成多目标跟踪任务中进行的注意力分配过程,并研究了条件熵与凝视
学位
在21世纪的今天,人工智能蓬勃发展,而神经网络模型技术的逐渐成熟在其中起到了关键性的作用。神经网络模型作为一种特征提取器在多个研究领域都展现出了强大的性能。这主要是因为它对复杂函数有着强大的拟合能力,并且参数越多拟合能力越强。因此网络结构被设计的越来越深、越来越宽。然而,模型的训练和测试不仅要占用非常多的存储空间,还对设备的硬件有较高的要求。这给神经网络模型在边缘端设备上的部署造成了非常大的障碍。
学位
本论文探讨了基于虚拟现实技术的急救护理教学模式及其效果评估。首先介绍了虚拟现实技术在护理教学中的应用,指出传统教学模式存在的问题。随后详细讨论了基于虚拟现实技术的急救护理教学模式的设计原则和构建要素,并结合实际案例进行说明。接着介绍了急救护理教学模式的实践应用过程和步骤,并提出了虚拟现实技术在急救护理教学中的应用效果评估方法。通过实验设计和数据收集,对教学模式的效果进行评估和结果分析。最后进行讨论
会议