论文部分内容阅读
数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、事先不为人知的、但又是潜在有用的信息和知识的过程。数据挖掘技术是面向应用的。它不仅是面向特定数据库的简单检索查询调用,而且要对这些数据进行微观、中观乃至宏观的统计、分析、综合和推理,以指导实际问题的求解,企图发现事件间的相互关联,甚至利用已有的数据对未来的活动进行预测。 人工智能的研究历来是计算机理论及应用研究的前沿之一,但是知识获取的瓶颈,一直束缚着人工智能研究人员的研究进程,而基于范例推理系统(CBR)恰能较好地解决这个问题,目前已广泛应用于各种问题求解,有着十分良好的应用前景。然而,CBR系统自身的构建也需要大量的知识获取工作。能否通过数据挖掘技术获得隐含的知识,从而进一步降低CBR系统对领域专家的依赖性呢?本文将重点探讨和研究如何将数据挖掘技术应用于CBR中。 地理信息系统(GIS)是60年代发展起来的一种集数据采集、存储、管理、分析于一体,并能够描述地球表面信息(包括大气层在内)以及空间、地理分布相关数据的空间信息系统。随着计算机技术的迅速发展和社会需求的不断增加,GIS技术逐渐走向成熟,应用领域不断扩大。人们对GIS的要求已经不再局限于简单的图层显示和自动制图,人们期望从中获得更多的知识,因而提出了将数据挖掘、智能决策引入GIS中。本文将重点探讨和研究如何将数据挖掘技术应用于GIS中。 本文共分六章。第一章对数据挖掘技术、范例推理和地理信息系统进行了综述,说明了本文的立题依据和意义,提出了本文的研究方向和重点。 第二章介绍了数据挖掘的一些基本概念,对数据挖掘的主要技术----离群分析、聚类以及分类技术作了深入的研究和探讨,并在此基础上详细地给出了本文后继章节中所涉及到的主要数据挖掘算法。 第三章介绍了CBR的一些基本概念、基本原理以及CBR系统的特点,并在此基础上对CBR中的关键技术作了深入的研究和探讨。 第四章研究了数据挖掘技术在CBR中的应用。首先研究和探讨了CBR中数据挖掘的主要技术和方法,之后针对不同的应用需求,提出了两个范例库构造算法和一个范例库维护算法,分别将数据挖掘中的主要技术----关联分析、离群分析、聚类和分类技术应用于其中,并给出了实验实例,实验结果证明了算法能够有效地提高CBR系统中知识获取的自动化程度和系统的性能。 第五章研究了数据挖掘技术在GIS中的应用。首先介绍了地理信息系统的一些基本概念,之后研究了空间数据分析的基本技术,提出了GIS中基于专家系统 安徽大学硕上学位论文 摘 要 与范例推理技术的空间数据挖掘体系结构,最后开发了一个实际应用的地理信息 系统,并将数据挖掘技术应用于该地理信息系统之中。 第六章是全文的总结和研究工作的展望。