面向不确定进化数据流聚类算法研究

被引量 : 0次 | 上传用户:a3470114
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
不确定数据流聚类作为数据流挖掘的一个主要研究方向,其研究成果已应用于网络监测、金融服务等诸多领域。然而,由于不确定性描述的引入,使得传统的数据流聚类算法不能对不确定数据流进行有效地聚类,这给不确定数据流的聚类带来了新的困难和挑战。本文对不确定进化数据流聚类算法进行了研究,给出了一种在线微簇维护策略,基于投影聚类的思想,给出了高维空间中不确定数据流聚类算法。本文的主要工作概括如下:1.概述了数据流挖掘的研究现状,分析了不确定性对传统聚类结果的影响,介绍了数据流挖掘的窗口处理模型,归纳了数据流聚类的基础算法。2.分析了UMicro算法在线聚类过程中,基于界标窗口模型的微簇维护存在的缺陷,给出了一种基于滑动窗口模型的微簇维护策略,同时给出了低维空间中不确定数据流聚类算法——USCluster算法。仿真实验明了USCluster算法比UMicro算法具有更高的聚类准确性和时间效率。3.针对高维空间中不确定数据流的聚类问题,基于投影聚类的思想,给出了高维空间下的不确定数据流聚类算法——HPUSCluster算法。仿真实验证明了在高维空间中,HPUSCluster算法比USCluster算法具有更高的聚类准确性和时间效率。
其他文献
目的应用Meta分析方法比较钬激光碎石术(Holmium laser lithotripsy, HL)与气压弹道碎石术(Pneumatic lithotripsy, PL)两种碎石术在微创经皮肾镜碎石术(Minimally invasive
针对高Mach数超燃冲压发动机实验能力空缺问题,基于航天十一院新建的FD-21高能脉冲风洞,进行了Ma=8超燃飞行条件的模拟能力设计与调试,获得了总焓2.9 MJ/kg、总压11.01 MPa实
云计算出现被誉为IT产业第四次革命,使计算机相关的产业模式、程序应用环境及用户服务模式等都产生了全新的变化,由于云计算分布式系统本身具有优良的计算性能和强大的可扩展
中国是个农业大国,可以说,解决好“三农”问题是中国发展和建设的关键,建设生态文明是当前解决中国“三农”问题的重要举措,而大力推进社会主义新农村生态文明建设,就成为我
近年来,Internet网络互联技术和移动通信技术的高速发展带动了以IP技术为核心的移动互联网的发展。移动IPv6技术以其出色的移动性支持成为移动互联网首选组网协议。然而,移动网
当前,合作学习已成为深受师生们欢迎的教学方式之一,在基础教育课堂中发挥着独特的作用。教师希望通过开展各种形式的小组合作学习,让学生学会沟通、互助、分享和生存。然而,
手机信息服务与旅游结合产生了手机旅游信息服务。本文介绍了国外手机旅游信息服务发展状况,按照供应商和信息内容对旅游信息服务进行了分类,总结了旅游信息服务的特征及对旅
<正>20世纪90年代,语法教学开始被淡化,然而与之形成鲜明对比的是,20世纪前期多数人主张强化。国文时期习惯称之为"文法",国语时期多称之为"国语文法"。本文不对语法教学本身
<正>随着新媒体技术的普及,微电影已经成为微时代最热门的关键词之一。虽然当前对微电影的定义,还没最终明确化,但至少已经有了几个"微"点共识:"微时"、"微媒"以及"微众",分
目的探讨住院2型糖尿病(T2DM)合并甲状腺结节患病情况以及临床特点,研究高胰岛素血症、胰岛素抵抗、胰岛素样生长因子-1(IGF-1,Insulin Like GrowthFactor-1)以及二甲双胍对T2DM甲