论文部分内容阅读
随着计算机技术的发展,数据库得到了广泛应用.在数据库中积累了大量可用的数据,但是数据库管理系统却没有提供有效的工具和方法来分析和利用这些数据,如何充分利用这些数据,进行决策支持成为当今需要深入研究的课题.数据库的知识发现或数据挖掘随之出现,成为有效利用数据,进行数据分析的有力武器.聚类分析是数据挖掘的重要组成部分,应用范围非常广泛,其常规应用包括:模式识别、空间数据分析、图像处理、经济学(尤其是市场研究方面)、www文档分类等等,因而成为各界研究的对象.本文首先阐述了数据挖掘技术,是本文的研究背景和基石;接着讨论了聚类分析技术,是本文研究的核心和关键;最后在以上两部分基础之上开展应用研究,是本文理论结合实际、多种技术和知识综合应用的体现.由此本文通过对以上各部分的研究,提供了一个实用的、有效的数据挖掘中聚类分析技术应用的参考模型,可供准备开展数据挖掘项目的广大企业用户参考使用,这也正是本文研究的创新和目的所在.本文分为五章,内容结构如下:第1章绪论介绍了本文的研究背景,所做的主要工作和本文的内容结构.第2章数据挖掘技术概述详细介绍了数据挖掘理论和技术,包括:数据挖掘和数据库知识发现定义,数据挖掘起源,数据挖掘处理过程模型,数据挖掘技术,数据挖掘分类,数据挖掘与相关学科的区别与联系,数据挖掘研究现状及存在的问题.第3章聚类分析技术概述详细介绍了聚类分析技术,包括:聚类分析综述,聚类分析中常用的两种数据结构,聚类分析中常用的几种数据类型,聚类分析中的常用方法.第4章聚类分析应用研究在以上两章的基础上,结合一个具体的数据挖掘任务实例,研究了数据挖掘应用的解决方案,包括:数据挖掘技术应用方案研究,聚类分析应用实例,实例系统的技术重点与难点及不足,实例系统的使用介绍.第5章结束语总结全文,给出本文研究中存在的问题和今后研究工作的方向.