语义属性数据聚类/分类算法及其在异常检测中的应用研究

来源 :江南大学 | 被引量 : 5次 | 上传用户:lhm0510
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的发展、应用程度的不断提高,重要信息系统的安全越来越受到严重威胁,各种网络安全事件越发不可避免,日益严重的网络安全危机甚至已经成为危及国家安全的关键因素。对入侵与攻击行为的检测与防范,保障计算机系统、网络系统和整个信息基础设施的安全已经成为一项刻不容缓的重要课题。虽然面向小规模网络的异常检测技术相对比较多,但随着网络带宽、网络规模的不断增长,复杂网络行为表现出了许多新的特性,深刻认识网络业务数据中潜在的规律和特殊性,是不断改进、提高异常检测方法性能的前提和基础,是进一步提高入侵检测系统的信任度、甚至实现大规模网络异常检测的关键所在。基于这样的认识,论文研究分析了网络连接数据和异常检测样本数据的特点,对数据集提出了一些新见解,认识到了网络数据中的一些新规律,以这些新发现和认识为出发点进行一系列有关异常检测算法的研究、探索,更加明确了本文的研究内容和意义。着重研究了以下三方面的问题,主要工作和创新成果一并概括如下:⑴深入地分析和研究了网络数据/异常检测样本集(KDD Cup 1999)中的新规律和新特点,如存在着大量的语义属性数据;样本记录是异构的;数据样本的分布不平衡;数据样本集由大量的同质异构样本组成;入侵数据相对于正常网络数据是离群数据等。通过对语义数据、异构数据相异性度量测度的研究,研究提出了新的度量方法;研究提出了数据集中聚类线索的挖掘方法,从样本组成和维组成两个角度挖掘样本的结构信息,分别提出了语义数据的量子聚类算法、离群聚类算法和结构熵聚类算法,并向异构数据集进行了扩展。进一步进行了基于相应聚类算法的异常检测研究,检测方法效果好。⑵量子力学是一门研究微观粒子在能量场中分布的科学,对波函数、量子势能、薛定锷方程以及能量场决定粒子分布的这一量子机制进行了分析研究,指出了这一机制与数据挖掘中的聚类机制的相似性,从而给出了量子聚类(Quantum Clustering,QC)算法的量子理论依据;通过用量子力学中的波函数推导FCM(Fuzzy c-Means)算法中的模糊相似系数,给出了一个FCM算法的量子理论解释;提出了量子聚类算法中调节参数的一种估算方法,大大地缩短了量子聚类算法的训练时间;针对网络数据中存在大量语义属性的特点,提出了一种语义属性数据的模糊量子聚类算法;并进一步研究提出了基于量子理论的异常检测方法。⑶语义属性数据的内积计算是一个公认的难点问题。通过对核方法和支撑向量机中核函数的分析,提出了一种语义属性数据内积计算的核方法,并扩展到异构数据的内积计算,有效的扩展了支撑向量机的应用范围,并实现了在异常检测领域中的应用,取得了良好的效果。
其他文献
究竟何时才能迎来新的行业机遇期?业内专家认为,光通信企业还需静待时机出现。近日,备受业界关注的中国移动2020—2021年普通光缆产品集采中标结果公布,此次中标候选人为长飞
"互联网+"智慧环保将互联网创新成果与生态环境保护进行深度融合,在推动生态环境领域技术进步的同时,对全面提高生态环境保护综合决策、监管和公共服务水平,加快环境管理方式和工作方式转变具有重要意义。本文从"互联网+"智慧环保的发展需求出发,梳理了生态环境信息采集、传输、管理和决策方面的技术现状并凝练发展面临的问题,针对性提出了"互联网+"智慧环保总体架构,具体阐述了精准治气、系统治水、生态监管、资源交
随着信息技术的不断发展,互联网在人们生活中扮演着越来越重要的角色。而随之而来的各种网络安全事件严重成胁着互联网的应用和发展。因此,以安全为目的的网络监控在维护网络正
2011年8月我校培训处承担了吉林地区社区药学专业人员的岗位培训工作,社区药学专业岗位培训包括理论培训和技能培训两方面,如何做好社区药学专业岗位的技能培训及考核,提高专业
目的探讨膝关节半月板损伤术前、术后如何护理。方法通过对膝关节结构的了解,术后常见并发症的预防,制定术后常规护理方法,针对患者的心理压力及紧张情绪采取心理疏导,加强对
常温液态金属及其衍生材料是近年来异军突起的新兴功能物质,该领域取得了一系列突破性发现,催生出诸多全新的材料创制与应用,被视为人类利用金属的第二次革命。本文扼要介绍
近年来基于Gnutella协议的非结构化对等技术得到极大的普及应用,越来越多的用户享用这种技术带来的资源共享的便捷和灵活。但恶意用户节点却利用该技术的特性随意对路由转发的