论文部分内容阅读
随着空间数据获取技术的快速发展,空间数据量急剧增加。在这些数据中包含了大量的潜在的有价值的信息,如何有效地管理,利用数据库中的数据,以及怎样才能发现其中潜在的知识,就摆在了我们面前。数据库应用的规模、范围不断的扩大。空间数据在人们发现知识和改造自然的过程中具有越来越重要的作用,空间数据挖掘的发展已经成为当今国际上的热点。空间数据挖掘的目的是从大量的、复杂的空间数据集中挖掘出潜在的、有用的知识,为预警提供服务。由于海量的数据已远远超过了人脑所能够分析的能力;为了充分地利用空间数据库中的资源,在大量的数据中获取有价值的信息,而提出了空间数据挖掘技术。空间数据挖掘技术可以帮助人们理解空间数据,便于对空间数据之间的内在关系加以分析和利用。聚类分析在数据挖掘领域中得到了广泛的应用,对空间数据的聚类是其中的一个重要研究方向。
空间数据挖掘,也称空间知识发现,从空间数据库中抽取没有清楚表现出来的隐含的知识和空间关系,并发现其中有用的特征和模式的理论、方法和技术。它是KDD技术在空间数据库方面应用的延伸。空间数据挖掘技术的应用,一方面可使GIS查洵和分析技术提高到发现知识的新阶段,另一方面从中发现的知识可构成知识库用于建立智能化的GIS系统。
由于加入了WTO,并加速融入经济全球化,必然对产品、服务的质量和企业的要求会越来越高。为了保证产品的质量,避免食品事故的发生,难免政府部门会对企业的产品的质量进行监督和管理。认证认可作为国际通行的技术性贸易措施手段之一,政府部门必然要求对不合格产品企业和分布地区加强预警和监管,必然要对大量复杂的数据信息进行分析和处理,从中挖掘出真正有价值的数据信息。通过对这些有用数据趋势的分析,对将来可能发生的事件提出预警。
本文首先以国家加强“认证认可制度”建设为背景,从具有海量特征的数据中提取出隐藏在数据之中的有用信息,为有关部门的管理者和决策者提供综合分析、趋势发展预测和决策预警等功能系统。其次对空间数据挖掘的一些基本的概念与原理以及一些基本算法的进行研究。特别是本文主要研究聚类分析,对聚类分析中一些算法要求、分类以及主要的算法的进行了描述。在本文中深入详细地对基于密度的聚类算法DBSCAN(Density-Based Spatial Clustering of Application with Noise)算法进行了研究,为数据挖掘策略和数据挖掘技术在系统中的应用提供必要的一些技术支持。然后对基于数据挖掘的系统的设计进行了较深入的研究,建立了认证认可系统的基本框架,并对认证认可系统的功能模块深入详细的描述。