面向空间数据复杂性特征的聚类分析方法研究

被引量 : 0次 | 上传用户:baofeifly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据获取技术的快速发展,数据呈现出多样化、海量化的发展趋势。针对空间信息的空间数据被大量收集,成为探索空间领域知识的根本途径和重要依据,迫切需要面向空间数据的空间数据挖掘技术来发现其中隐含的有用知识。作为空间数据挖掘的重要分支,空间聚类以其较强的实用性和高效性,成为相关领域的研究热点。本文在深入研究空间数据挖掘、空间聚类知识和现有方法的基础上,面向空间数据体现出的复杂性特征中的海量特征、高维特征、带障碍约束特征以及多尺度特征,研究高效的空间数据聚类分析方法。针对空间数据的海量特征,运用善于进行大规模数据聚类分析的经典K-Means算法进行聚类分析,对于其存在的k值预设及初始聚类中心随机选取导致算法准确率、效率不高的问题,利用空间数据的特点,提出一种基于最优划分的K-Means初始聚类中心选取方法,提高了海量空间数据的条件下K-Means算法进行聚类分析的运算效率和算法准确率;针对空间数据的高维特征,提出一种高效的基于模糊扩展的高维空间数据子空间聚类算法,该算法基于模糊集对确定聚类边界起决定作用的稀疏单元网格进行模糊扩展,考虑相邻网格内样本点的相关性,改善了高维数据子空间聚类不平滑、边界不明确、易产生无意义过度聚类的问题,高效进行高维空间数据的聚类分析;针对空间数据多障碍约束的特征,提出一种基于网格的带障碍约束空间数据分级聚类算法,算法继承了基于网格聚类算法的优点,能够处理任意形状的障碍物并产生任意形状的簇,同时,算法采用分级策略对考察数据集进行障碍条件下聚类分析,降低了计算样本点间障碍距离产生的算法时空复杂度,提高了障碍约束条件下空间数据聚类分析的效率;针对空间数据的多尺度特征,提出一种基于等密度线的空间数据多尺度聚类分析方法,该多尺度空间聚类算法借鉴等高线思想,利用考察样本集等密度线的天然尺度性进行尺度条件下的空间数据聚类分析。本论文面向空间数据的海量特征、高维特征、带障碍约束特征以及多尺度特征分别进行了空间聚类分析方法的研究,并通过仿真实验分别证明了方法的可行性、有效性和高效性。
其他文献
本文在国内外逃避税问题较为突出的背景下,带着高额的管理层激励究竟会不会导致公司所得税逃避行为的恶化这样一个疑问,在分析国内外相关研究的基础上,通过委托代理理论建立
光纤通信以其巨大的带宽资源和良好的通信质量成为骨干网的必然选择。宽带需求对骨干通信提出了更高的要求,表现为信息量大、通信距离长、系统可靠性好。在光传输系统中,随着
<正>近年来,在省委、省政府的正确领导下,广东财政工作坚持以科学发展观为统领,坚持"生财有道、聚财有方、理财有规、用财有效"和集中财力办大事的理财原则,遵循"预则立"的工
随着我国市场经济的稳步发展、资本市场的逐渐繁荣以及各类社会主体参与市场交易行为的日趋活跃,越来越复杂的交易行为使会计信息对投资决策的影响作用越来越显著,会计信息产
中国新诗的形式焦虑促进了诗学对诗式问题的思考,五四时代的自由精神确立了自由体诗式的合法性,而新格律诗派的诗式理论则从艺术的本质上重新建立起了人们对诗的格律的信心。
本文从进出境水生动物病害检疫的概念、必要性与重要性、与之相关的法律法规和管理办法,进出境水生动物病害检疫的对象和程序,进出境水产品中致病微生物的快速检测方法,进出
本文首次采用反应性加工技术和溶液法以NaBH4、NaH、Na为改性剂M1,马来酸酐、肉桂醛作为改性剂M2,将不饱和侧基和极性基团同时连接到丁基橡胶大分子主链上,制备得到了一种快
本文的撰写是基于实际应用型课题——某汽车厂家车身涂装车间信息化改进项目的研究。由于原有的RFID系统受多种因素的影响,在工作过程中系统运行不稳定,综合考虑实际情况,本
市场经济体制下公共投资的作用主要是弥补市场失灵,有效配置资源,同时是政府进行宏观调控的重要手段。在理论界关于公共投资的研究越来越多,大部分研究认为公共投资对经济增长具
研究目的调查农村地区妇幼保健和生殖健康服务中存在的社会性别问题,探讨社会性别平等意识对农村妇幼保健工作的影响,从社会性别角度提出有效改善农村妇幼保健服务利用的有效