基于滑动窗口的不确定数据流聚类算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:randygu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据流聚类是数据挖掘领域的一个重要研究方向,其研究成果已被应用于诸多领域。然而传统数据流聚类算法不适应于不确定数据流,而且在聚类过程中不能对数据流中近期的数据进行详细的分析。这给数据流聚类研究带来新的挑战和难题。本文对基于滑动窗口的不确定数据流聚类算法进行了研究,给出了一种滑动窗口下的指数直方图中桶的过期时间点选择策略,基于一种局部离群点检测方法,给出了一种离群点处理机制。本文的主要工作概括如下:1.概述了数据流挖掘技术、不确定数据流的产生原因及描述方式,介绍了不确定数据流聚类的研究方向以及相关算法。阐述了离群点数据检测的必要性。2.分析了现有基于滑动窗口的数据流聚类算法的局限性,给出了一种滑动窗口下的指数直方图中桶的过期时间点选择策略,同时给出了滑动窗口下面向不确定数据流的聚类算法ESWUStream,实验表明该算法可以取得较高的聚类质量。3.详细分析了离群点数据对聚类结果的影响,引入一种局部离群点检测方法,给出了一种基于缓冲区的离群点处理机制。仿真结果表明这种机制可以有效地降低离群点数据对聚类的影响。
其他文献
随着因特网的飞速发展,网络通信成为人们交流的主要方式之一。因此,网络信息安全问题受到越来越多的关注。数字签名作为确保网络信息安全的核心技术之一,在理论研究和现实生活中
DTN(delay tolerant networks)网络涵盖了传感器网络、Ad-hoc网络和车载网络等,在军事、民用等方面具有广阔的应用前景。在一些特殊场景,例如部署在敌方控制区的军事自组织网络
随着大型分布式系统的不断发展,人们越来越关注系统的可靠性。例如中国研制的天河一号系统、航空火车等分布式控制交通系统以及基于MPI的FT-MPI系统等。分布式系统不仅关系到
随着数字化技术的普及和互联网技术的飞速发展,数字媒体越来越深入到人们的生活和工作当中。矢量数字地图作为一种数字图像产品,因其占用空间小、放大不失真、数据精度高等特点
随着移动设备与无线网络技术发展,延迟容忍网络(DTN)[1]被研究者广泛关注。由于端到端网络无法持续连通,因此传统无线路由已经不适用于DTN环境。移动智能终端规模的逐渐扩大和
生物特征识别技术是基于人的生理或行为特征进行身份识别的技术。步态识别是一种新兴的生物特征识别技术,它根据人走路的姿势识别人的身份。与指纹、人脸、虹膜等生物特征相
随着嵌入式系统的不断发展,嵌入式控制系统也趋向于复杂化,针对嵌入式控制软件的逆向分析也变得越来越重要。通过汇编代码逆向分析,可以分析整个软件代码的架构、理解代码的功能
无线传感网络作为物联网的数据信息感知层,由大量传感器节点组成,节点能量受限和网络生存时间短是WSN的重要特征。为了提高无线传感网络的能量使用效率,并保存能量,设计能耗均衡
随着无线网络技术的快速发展和手持电子设备的日新月异,某些环境下传统的基于端到端的完整路径的通讯模式显然已经不再适用。一种新的网络体系应运而生。延迟容忍网络(delay to
车辆跟踪是智能交通系统(ITS,Intelligent Transportation System)中的重要技术,在图像的运动目标跟踪与识别中经常遇到车辆遮挡的问题,该问题是动态图像处理过程比较难以解决的