高维数据流的自适应子空间聚类算法

来源 :计算机科学与探索 | 被引量 : 0次 | 上传用户:gcj820305
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高维数据流聚类是数据挖掘领域中的研究热点。由于数据流具有数据量大、快速变化、高维性等特点,许多聚类算法不能取得较好的聚类质量。提出了高维数据流的自适应子空间聚类算法SAStream。该算法改进了HPStream中的微簇结构并定义了候选簇,只在相应的子空间内计算新来数据点到候选簇质心的距离,减少了聚类时被检查微簇的数目,将形成的微簇存储在金字塔时间框架中,使用时间衰减函数删除过期的微簇;当数据流量大时,根据监测的系统资源使用情况自动调整界限半径和簇选择因子,从而调节聚类的粒度。实验结果表明,该算法具有良好的
其他文献
Petri网的分解技术是复杂网系统分析的一种重要手段,基于变迁指标的分解方法将系统分解为一组T-网。通过获得分解子网的结构性质以及子网与原网间的性质保持关系,得到了判定
电子商务是利用计算机网络技术和远程通信技术,实现电子数字化和网络化商务运行的过程。信息技术的发展,促进了数据挖掘技术的研究与应用,随着现代电子商务的拓展和运行,作为一种
在挖掘量化关联规则的过程中,由于对量化值的划分,将产生语义损失。为避免这种情况,提出基于无损语义的算法MPSQAR来处理量化关联规则的挖掘。主要工作包括:(1)提出规泛化量化值的
自从20世纪70年代初推行计划生育政策以来,我国在人口控制方面已经取得了举世瞩目的伟大成就,人口开始进入在一定制约条件下的低增长时期。我国是世界人口大国,为了保证国民经济
本文主要针对峰山应急水源在水质分析取样时,就代表性及实践操作性方面进行了多种取样方法的分析比较,并就雨季启动峰山应急水源加密检测频次进行了阐述分析。
人类的视觉注意机制是人类大脑感知事物的最直接的功能。提出了一种基于视皮层视觉机制的生物激励注意模型。利用HMAX(hierarchical maximization)模型的四层机制中的C1细胞单元图,构造独立成分分析(independent component analysis,ICA)滤波器组,进一步利用对尺度、平移等均具有不变性的C2细胞特征,以及香农熵理论,共同构造用于视觉显著性区域检测的测
传统《选》学与现代《选》学的区别主要在于研究模式。传统《选》学以文献研究为唯一模式,现代《选》学融文献研究与文学研究为一体而以文学研究为主要标尺。此一标尺,既为区别20世纪《选》学流派的唯一尺度,并为区分20世纪《选》学研究分期的唯一标准。20世纪《选》学流派约略可分为高步瀛代表的传统派,黄侃与屈守元代表的转型派及骆鸿凯代表的现代派。20世纪《选》学研究可分为20世纪初至1949年的开创期,1949年至1977年的间歇期,1978年至1999年的发展期。开创期融传统格调与现代精神为一体,融文献研究与文学
R-Tree及其变种的多维索引结构在数据的操作过程中通过对空间的分隔和不断调整将整个空间划分为大小不等的子空间以容纳足够的空间对象,这种方法能有效地实现多维空间对象的索
针对Web信息可信度问题,提出了一种为Deep Web数据记录计算可信度的有效方法C-Rank。该方法为每一条记录构造一个S—R可信度网络,包含两种类型顶点及三种类型边。首先基于可信