距离邻近与自然邻近典型聚类方法比较

来源 :昆明理工大学 | 被引量 : 4次 | 上传用户:leunggz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
空间聚类(spatial clustering)是空间数据挖掘和知识发现(SDMKD, Spatial Data Mining and Knowledge Discovery)领域中一个极其重要的研究方向,以数学建模提取空间特征模式为前提,采用指定的相似性测度来计算空间实体之间的邻近程度,进而解译与评估空间实体分布的聚集性。针对复杂空间目标几何形体的直接聚类,是空间聚类区别于传统聚类分析的标志。然而空间实体形状的多样性和位置的随机性,使得几何要素之间的相似性难以定义和计算,导致空间聚类分析的应用较为局限。目前,多数商业空间数据库系统所支持的聚类分析算法是采用欧氏距离(Euclidean)、曼哈坦距离(Manhattan)、马氏距离(Mahalanobis)等作为聚类统计量,既缺乏点、线、面等复杂形状的正确表达,也难以计算要素之间的邻近程度,最终导致算法难以自适应地发现任意形状的簇类,特别是在处理有障碍物约束的聚类时,传统基于距离邻近的聚类算法就无法实施。结合实验分析,造成以上缺陷的根本原因来自距离度量的局限,主要表现在以下两方面:(1)基础理论方面,距离邻近的计算模型与人类的空间认知习惯有明显的差距,理想化的距离定义难以描述实际空间的复杂分布;(2)实际应用方面,距离邻近计算模型忽略了实际应用所依托的客观环境,缺乏空间障碍物的识别与处理的能力,降低了聚类结果的准确性和可解释性,进而限制了实际应用。基于Voronoi图所定义的自然邻近(natural adjacency)空间关系能够有效地克服距离邻近的不足,为空间数据聚类提供了一种有效的度量途径。本文以实现二维空间几何数据聚类为目标,首先采用距离邻近测度,基于改进的树ART2神经网络,实现了空间带状分布数据点的聚类;然后进一步考虑到空间数据的复杂几何属性和障碍物阻隔,引入自然邻近测度,借助Voronoi多边形的直接邻近表达和优化面积阈值计算,提出自然邻近空间聚类算法(SCBNA, Spatial Clustering Base on Natural Adjacency);最终结合实际应用,对距离邻近和自然邻近的聚类方法进行了比较。同时,为了有效地提取Voronoi邻近关系,文中提出了基于栅格数据的变速Voronoi图构建算法和基于矢量数据的全要素Voronoi图生成方法,并对算法的复杂度和收敛性进行了分析。论文的主要内容及成果分述为以下三点:(1)经典ART2神经网络采用向量的相位信息作为相似性测度以实施聚类,具有伸缩性好、结构相对简单、识别能力强等特点。但其作用于二维空间数据,不仅存在模式漂移和向量幅度信息缺失的问题,而且网络不能自适应地以不同粒度划分空间,难以适应不规则形态分布的空间数据聚类。本文提出了树ART2(TART2, Tree-ART2)网络模型,通过长期记忆模式(LTM, Long Time Memory)的调整和向量幅度信息的学习,该网络保持了带空间欧氏距离约束的旧模式记忆,并引入树结构优化,降低了警戒参数设置的主观要求和模式交混现象的发生。对比实验结果表明,更适用于带状分布的空间数据聚类,具有较高的可塑性和自适应性,是一种典型的距离邻近聚类方法。(2)结合实际考虑,河流、湖泊、公园、铁路等障碍物的存在破坏了空间的连续性,以距离邻近的聚类方法不能准确表达空间障碍物的复杂几何形体,且难以正确定义离散待聚类实体的空间邻近关系。本文引入自然邻近计算方法,以两个相离空间目标是否共享Voronoi边来判断邻近关系,提出了一种带障碍物约束的聚类方法——SCBNA,通过构建全要素Voronoi图,采用自然邻近测度准确表达空间实体间的相对位置,优化分析面积阈值以划分数据归属,算法无需自定义参数,能够发现任意形态且密度渐变的簇,可以精确识别带障碍物约束的空间集群目标,提升了聚类的准确性和自适应性。(3)以考查生长源的生长过程为出发点,通过置换权重常数为权重函数,使生长速度描述为权重距离的时间导数形式,提出一种新的Voronoi图-变速Voronoi图,其核心思想是顾及数字高程模型的高程变化并以形态学膨胀操作为基础,用高程的变化建立权重函数及依据时间消耗的膨胀过程收敛。在表达势力范围及Voronoi邻近关系计算方面,变速Voronoi图具有更佳的实际应用价值与意义。
其他文献
通过分析高速动车组启动过程和主要设备参数,设计启动电路、启动方法和便携式应急启动设备,解决高速动车组在运用过程中由于蓄电池亏电不能启动问题,提高高速动车组蓄电池亏电问
文章在对中高职旅游类专业课程衔接现状和存在问题分析的基础上,从课程培养目标、教学目标、课程内容设计、课程评价体系等方面探讨中高职旅游类专业《餐饮服务与管理》一体
目的:观察槐耳颗粒(金克)对乳腺癌患者术后免疫功能的调节作用.方法:50例乳腺癌改良根治术患者,随机分为金克组和对照组,金克组在术后第2~5天开始服用金克20 g,3/d,30 d为1疗程,对
以珍珠岩与蛭石的7种比例和蛭石颗粒大小的5种组合进行了金盏菊育苗试验,结果表明:珍珠岩与蛭石的比例对基质和金盏菊的生长影响较大,并且以珍珠岩与蛭石的比例0.3:0.7,0.5:0.5和0.7:0.3为
实施资金集中管理,能有效提高企业集团的资金效率与效益、增强战略控制力、凝聚核心竞争力。在国内大型企业集团整体上市大势所趋的格局下,如何协调监管机构政策,推进上市公
目的:对比血瘀证组和对照组巴马小型猪眼底视网膜血管血氧饱和度,探讨血瘀证候模型小型猪眼底视网膜血管血氧饱和度的改变。方法:12只小型猪,随机分为血瘀证组6只和对照组6只
社会冲突论是指社会主体之间由于需要、利益、价值观念的差别和对立而引起的相互反对的社会互动行为。本文通过对中山市崖口村村民对旅游开发的认知和态度进行深度调研访谈,
太阳能热发电通常以水工质吸热作为第1代,以熔盐吸热作为第2代,以空气、超临界二氧化碳或固体粒子作为介质的布雷登循环系统称为第3代太阳能热发电系统。通过采用空气或陶瓷
蜡染是一种以蜡防染印花法,又称为“蜡防”、“蜡缬”,是中国历史悠久的传统印染工艺之一。贵州传统蜡染具有独特的艺术特色和文化价值,承载着少数民族迁徙历史、图腾文化及集体审美表达。在国家大力倡导传统工艺振兴和文化创意产业发展的大背景下,本人毕业创作《翱》系列作品从贵州传统蜡染文化中汲取灵感,提炼丰富的鸟纹进行重构设计,运用传统蜡染工艺技术的优点和特色,在材料和工艺上进行了多元化的创新试验,将蜡染与现代
目的:探讨槐耳颗粒对化疗患者生活质量及免疫功能的影响。方法:78例肿瘤患者随机分为两组,治疗组39例在常规化疗的基础上加用槐耳颗粒口服,对照组39例进行常规化疗,观察两组治