基于密度的不确定数据流聚类算法的研究与实现

被引量 : 0次 | 上传用户:clin_789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着网络和作用于网络设备的迅速发展及应用,使大量不确定数据流进入人们的商业应用和学术研究中。例如无线传感器网络WSN(Wireless Sensor Networks)、射频识别RFID(Radio Frequency Identification)等技术的快速发展使大量不确定流数据应运而生。针对不确定数据流环境的聚类分析有着十分重要的应用前景,已经成为当前的研究热点。然而已有的面向静态数据或确定数据流的聚类分析算法已不能满足当前需求。因此开展不确定数据流聚类算法的研究势在必行。在不确定数据流中,数据的不确定性给聚类算法在利用数据信息问题上提出了极大的挑战,首先,简单的计算期望距离将无法得到高质量的聚类结果;其次,现有的数据流聚类算法大多使用标界窗口或类似标界窗口,往往只简单删除最久未更新的簇,因此无法高效处理演化数据流以及分析近期数据的聚类细节;最后,基于划分的流数据聚类算法大多只能形成球形簇,无法针对不同数据分布情况形成任意形状的簇。基于此,本文对不确定数据流环境下基于密度的聚类算法展开研究。首先,本文提出不确定度的概念以衡量不确定数据的分布信息,并通过改进面向确定数据的聚类算法DENCLUE,使其可以处理附带不确定度的不确定数据,以尽量降低数据的不确定性对聚类结果产生的影响。其次,提出在滑动窗口下的基于密度的不确定数据流聚类算法USDENCLUE,并通过聚类特征指数直方图技术实现其快速的删减功能,使其在分析特定时间窗口的聚类细节的同时可以高效的处理噪音数据、演化数据流以及生成任意形状的簇以提高聚类质量。最后,采用真实数据集以及人工合成数据集并与著名的Clustream聚类算法进行比较,实验结果表明USDENCLUE聚类算法在处理不确定数据流时具有良好的聚类效果,并且可以有效的处理噪音数据及演化数据流。
其他文献
近年来,随着信息技术的不断的发展,信息安全已成为信息系统设计中一个非常重要的问题。访问控制作为信息安全体系的一部分,同时也是国际化标准组织定义的五项标准安全服务之一,随
本文选取西余大学医学院、哈佛大学医学院、加州大学旧金山分校医学院、约翰·霍普金斯大学医学院和伊利诺伊大学芝加哥校区医学院这五所具有代表性的医学院校就医学整合课课
快递"最后一公里"作为配送服务链的末端,一直是快递服务的一个瓶颈,快递企业与消费者作为物流配送服务的源头提供者与最终使用者,以两者为中心的商业模式是快递企业抢占"最后
方差互换本质上是种期合,它将段时间内资产价格所实现的方差与某事先定的方差进行互换.当合到期时,如果资产价格所实现的方差大于事先定的方差,那么方差互换的买方将会取得正
体验经济时代,客户需求的个性化决定了客户体验需求的独特性,在此背景下,企业提供的产品和服务需要更加符合顾客体验需求,才能获得可持续的核心竞争能力。随着社会的发展,消费者的
在我国,人民法院受理的行政不作为案件呈上升趋势,但对其危害尚未引起足够的重视。理论界对行政不作为的认识并不统一,现行法律规范对行政不作为诉讼救济的规定也不完善。具
开窗行为是人们利用最普遍也是最方便的一种调节室内通风状况的方式,通风不仅可以改善室内热湿环境状况和空气品质,还可以在一定程度上减少建筑能耗。因此,研究建筑内部人员开窗
本文以重庆市公路运输系统为研究对象,运用公路运输经济学、系统工程学、统计学、管理学等相关理论作为理论基础,针对公路运输系统运行效率进行研究。文中首先采用聚类分析法
近年来随着交通事业发展需要,作为高速公路咽喉工程的连续钢构桥得到了快速的发展。大跨度曲线连续刚构桥能更好的突破地物、地形的限制,尽可能地缩短道路展线长度或避开岩溶
干扰素β(IFNβ)具有抗病毒、抗肿瘤、抗增殖和免疫调节作用。临床上主要用于乙型肝炎、丙型肝炎、多发性硬化症以及多种肿瘤的治疗。但是体内半衰期较短限制其应用,所以有必要