非平衡类的异常检测研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:bingyuziqi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
异常检测可视为非平衡分类问题,因此可借助解决该问题的方法来实现异常检测。近年来,对非平衡分类问题的研究在模式识别领域受到了广泛关注,并已取得了显著进展,相关成果已用于垃圾邮件过滤、网络入侵检测、文本检索等各个领域。支持向量机(SVM)作为一种性能优异的分类器,已在众多模式识别问题中获得了印象深刻的效果,并也可用于非平衡分类问题。但由于其本身对非平衡类的脆弱性,直接用它难以奏效。非平衡支持向量机(ASVM)则相对有效地克服了这一不足。其有效性归因于它融合了单类支持向量机对非平衡类的鲁棒性和SVM大间隔的优势,即同时使类间间隔和单类间隔最大化。但这一有效性也部分掩盖了ASVM的不足,即忽视了每类数据内在结构的利用。受到结构化SVM(SSVM)的启发,我们发展出了结构化非平衡支持向量机(StASVM)。它不仅保留了ASVM的优点,同时通过在ASVM目标函数中嵌入类内结构信息,达到了结合更多先验知识,提升分类性能的目的。实验验证了StASVM确实具有比ASVM更优的分类性能。尽管ASVM和StASVM在非平衡分类问题上获得了相对好的分类性能,但其时间效率较低。增量算法能有效地提高时间效率,但高效地解决非平衡分类问题的增量算法仍相对缺乏。我们从降低类间不平衡率出发,将一种简单的增量学习算法拓展应用于当前的类不平衡问题上,并在部分UCI数据集上取得了满意的实验效果。进一步通过结合主动学习策略,我们提出了基于主动学习的增量型非平衡支持向量机(IASVM),其在保证与ASVM相当分类效果的前提下,大大减少了算法的训练时间。
其他文献
在目前医学及生命科学研究中,基因芯片被广泛用来进行各种生物实验。其中寻找差异基因在芯片实验中是最基本的实验目的,它在基因诊断、药物筛选等方面有着重要作用。由于芯片
虚拟化技术是一种在工业界以及学术界快速成长的技术。虚拟化技术包括软件虚拟化以及硬件虚拟化技术。其给计算资源的共享与管理带来很多的便利之处。虚拟化技术作为”云计算
随着计算机科学的不断发展,计算机软件的应用范围日趋广泛,规模迅速扩大,复杂性不断增加,人们对其可靠性的要求也越来越高。软件可靠性模型研究作为软件可靠性估测的核心问题
随着互联网技术特别是以淘宝和亚马逊等为代表的电子商务的飞速发展,互联网中的数据呈现爆炸性增长,信息过载问题显得越来越严重。帮助我们从海量数据中筛选出有意义数据的信
本体是一种重要的知识表示形式,它是共享概念模型的明确的形式化规范说明,并在语义Web、知识工程、软件工程、生物医学信息学和社会化网络等领域中得到广泛应用。然而,本体创建
虚拟内窥镜是计算机技术在医学领域的典型应用,它利用医学影像作为原始的数据,结合虚拟现实技术、计算机图形学、图像处理、科学计算可视化来模拟传统光学内窥镜,是一种非侵
在需要知识共享的语义网中,本体是解决语义层次上的信息共享和重用的基础。本体编辑器作为对领域知识建模的必要工具,能帮助领域专家完成对本体的创建、解析、存储和重用等工
随着信息产业的急速发展,迎来了大数据的时代。网络中数据量的剧增给已经成熟的网络结构提出了巨大的挑战。云计算是依托成熟的虚拟化技术,从网格计算、分布式计算和协同计算
现在的社会是高速发展的社会,日益发展的科技,伴随着越来越多的信息流通,大数据便是这个时代的产物。大数据的价值并不在“大”,而在于“有用”,数据中的价值含量、挖掘成本
无线传感器网络(Wireless Sensor Network,WSN)是嵌入式技术、无线通信技术、传感器技术等多种技术的融合,它是一种由多传感器节点通过自组织形成的监控网络。随着其技术的不