基于信息熵的空间对象群聚类算法研究

来源 :南京师范大学 | 被引量 : 0次 | 上传用户:lyyzk09
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类是数据挖掘的基本任务之一,其目的为把相似性大的对象聚集为一簇,把相似性小的对象分离开来,从而发现潜在的、有意义的知识。空间聚类是空间数据挖掘的重要内容,是指在一个较大的多维数据集中根据距离的度量找出簇或稠密区域,在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。空间聚类分析是一项非常有意义的数据挖掘任务,在国内外得到了广泛的关注,并被应用到诸多的领域中。现有的空间聚类算法都侧重于对点对象或单一对象进行聚类分析,而没有考虑具有包含、相邻等空间拓扑关系构成的空间对象群的综合特性分析。本文研究了基于空间关系的空间对象群聚类问题,取得的成果如下:1.在综合分析空间数据特征的前提下,首先给出了空间对象群的相关定义,空间对象群就是基于空间关系将空间数据集划分成的若干个对象组;然后通过引入空间数据的预处理算法,明确阐述了空间对象群的构造过程;在此基础上,最后针对空间对象群的聚类问题进行了深入的分析,这为后续的空间对象群聚类算法的提出奠定了基础。2.提出了基于信息熵的空间对象群聚类算法ESOGC,把空间对象群包含的对象看作空间对象群的属性,采用蚁群聚类算法,根据空间对象群主题对象邻域范围内信息熵的变化实现空间对象群的聚类。对算法ESOGC进行测试,实验结果表明算法ESOGC对基于空间关系的空间对象群聚类分析是有效的。3.提出了基于相似性计算的空间对象群聚类算法NSOGC,使用信息熵定义了空间对象群之间的相似性。并将该相似性计算方法与传统空间聚类算法相结合,得到一种新的空间对象群聚类算法NSOGC。对NSOGC进行了测试,实验结果表明NSOGC对于空间对象群的聚类是有效的,提高了空间对象群聚类的效率。
其他文献
随着互联网信息量的爆炸式增长,当今的时代已经成为了信息的时代,信息检索技术也在逐步趋向成熟,信息检索工具搜索引擎也层出不穷。但是用搜索引擎检索信息并不总是让用户满
无线传感器网络(Wireless Sensor Networks,WSN)是由时空上独立的低耗能传感器组件所组成,它们能够准确感知温度、湿度以及压力等各种物理和环境指标,并且通过对收集到的指标
随着云计算和互联网技术的蓬勃发展,软件以服务形式供用户使用受到人们的青睐。云计算环境中集成了海量的各种各样的服务,用户可以根据实际需求购买所需的服务。海量服务中又
叶脉是植物分类的重要特征之一,植物叶片图像叶脉分割是叶脉识别的前提,而叶脉分割大多数都是对灰度图像进行处理,由于叶片图像采集过程易受光照影响而出现阴影、光照过强的
无线传感器网络将人类和物理世界互联,极大地方便了人们的生产生活。数据收集作为无线传感器网络中的基本问题,直接影响到网络性能和服务质量。由于传感器网络中采集的数据大
配电自动化是提高供电可靠性和供电质量的主要环节,在当前供配电领域具有重要的研究意义。馈线自动化是配电自动化的重要内容之一,馈线终端单元FTU是馈线自动化的基本控制单
随着人们对果蔬营养保鲜要求的提高,对冷库及制冷设备控制水平的要求也不断提高。自动控制技术经历了几十年的发展与完善,在工业控制领域中得到了广泛的应用。将自动控制技术
软件工程的一个重要领域是程序理解,随着软件规模越来越大,对源程序的理解成了一个较难的问题,在这个问题的需求下,程序切片技术应运而生。程序切片技术是一种程序分解技术,
骨发育成熟度(骨龄)指标在预防医学、临床医学、法医学和体育科学等领域有着广泛的应用。传统的骨龄评分是由专家根据标准模板对待测X光片进行评分,分值的主观性较强,不利于
图像边缘包含了图像的重要信息,是图像的最基本特征。边缘检测是图像处理中的一个经典问题,边缘检测直接影响到智能视觉系统其他阶段工作,特别是模式识别的结果。因为实际图