空间聚类挖掘算法研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:shashuang0126
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
空间聚类是空间数据挖掘中的一个重要的研究方向.空间数据聚类是要在一个较大的空间数据集中,根据距离的度量标识出簇,使得在同一个簇的对象尽可能相近,而不同簇间的对象彼此不相似.空间数据聚类在地理信息系统、遥感、医学图象处理、环境研究等领域有广泛的应用.最近关于聚类的研究主要都是针对算法的效率,而对聚类来说,更重要的是聚类结果的正确性,即聚类结果要保证质量和具有实用性.虽然目前已经提出了许多聚类算法,但对于在动态数据库中进行增量聚类的研究却很少,而在数据仓库等环境中运用增量聚类是比较合适的.该文针对具有代表性的密度聚类算法DBSCAN的不足,进一步考虑了对象的空间属性,提出了改进的聚类算法,改进算法能得到更好的聚类结果.并提出了在动态数据库中,基于密度聚类方法进行批量增量聚类挖掘的算法.首先,针对密度聚类算法DBSCAN对簇边界对象处理的不足,进一步考虑了对象的空间属性,在聚类时考虑对象方向关系的基础上提出了构成簇的边界对象的新定义,而在已有的空间聚类算法中都没有应用到对象的方向关系.新的定义更好地描述了簇边界对象的特征.并给出了符合提出定义的空间聚类算法,改进算法能在相同的时间和空间复杂度的条件下取得更有效的聚类结果,改进算法也消除了DBSCAN对数据输入顺序的敏感性.其次,基于密度聚类的概念,对增量聚类中动态数据库插入和删除对象的几种情况作了详细分析,并提出了有效的批量增量聚类算法.算法着重于根据基于密度聚类的方法的特性,以批量处理的模式提高增量聚类挖掘的效率.在已聚类数据集中,当有新对象插入或有对象要删除时,批量增量聚类算法能有效地更新原来挖掘出来的模式.最后,对提出的两个算法就时间复杂度和聚类结果的质量两方面进行了分析,并在模拟数据上进行了实验.实验表明,提出的改进聚类算法和批量增量聚类算法是正确和有效的.
其他文献
近年来,在保险,金融,随机网络理论,自然生活中重尾分布被用来做数据的模型,成为较热的研究课题.若事件尾部发生概率大于正态分布尾部发生概率,则称该类事件服从重尾分布,在重尾分布
随着计算机网络以及基于网络的分布式计算的发展,对于Agent系统的研究,已成为人工智能领域中一个新的研究热点.基于Agent的技术被认为是软件领域中的一次重大突破.该文提出了
设G是无向简单连通图,A和B是G的两个不相交的顶点子集,定义[A,B]为一个端点在A中,另一个端点在B中的边所成的集合.S=[X,Y]称为G的边割,其中X(∈)V(G),Y=V(G)X.设k是正整数,若G-S的每
在新课改下,倡导“体育与健康”,这不但体现出高中体育的学科定位,也适应了社会发展需求.近几年,高中生健康问题是现代社会的一个关注焦点,健康教育也是教学改革的一个热点问
本文研究的对象是M(φ)上的2n+1次多重线性恒等式.我们基于U.Leron的结果,利用G.de.B.Robinson的对称群的表示理论及Olsson和Regev在[10]中的有关结论,并引用本人在[12]中的
幼儿园领域的教学,大致接触到语言、社会、健康、科学和艺术这五个方面的内容,这些内容对幼儿日后的生活习惯、认识能力、个性展现、待人接物等方面,都有着较为深远的影响.
Tychonoff乘积、逆极限与σ-积是一般拓扑学中三类重要的乘积性质。自上世纪80年代末以来,国际著名拓扑学者G.Gruenhage,K.Chiba,Y.Yajima,H.Tanaka等对以仿紧为代表的用覆盖刻
环R上的有限生成模的结构和分类是模论的中心问题之一,当R为主理想整环时(以下用P表示),有限生成模的结构与分类问题已经解决,本文利用矩阵的方法对这些结果重新进行讨论.本
本文对指纹冲击线的识别与应用进行了研究。文章指出,冲击线(手指的褶皱纹)多的指纹,用常规图像处理方法,提取的特征准确率低,易于造成指纹匹配的误识与拒识。本文针对这类指纹,综
到目前为止,用有限差分对空间进行离散时,主要应用的是一阶或二阶的增量未知元方法(见[7][1]).三阶、四阶增量未知元分别在[2]、[1]中有所介绍.增量未知元的构造(参见[5])可