论文部分内容阅读
随着数据库技术和社会经济的发展,一些企业的数据库里存储了海量的数据,但是面对这些数据,现有的OLTP数据处理系统并不能有效的处理它们,数据挖掘的出现正是应对了这一需求,就是从大量的数据中抽取出潜在的、不为人知的有用信息、模式和趋势,来为人们的决策提供依据,同时,由于它对海量数据中潜在模式的发掘,数据挖掘对于生物学、天文学等科学研究也起到了相当大的作用。
由于数据挖掘是一个比较新的概念,它又是伴随社会的需求而产生的,因此对数据挖掘的理论以及它的应用进行研究就不仅有重要的理论意义,而且还有重要的现实意义。本文以数据挖掘的基本理论为基础,结合情报学的相关知识,对数据挖掘的产生、概念、技术基础、方法、算法、语言以及应用进行了系统的研究和探索,并在此基础上提出了数据挖掘系统开发的基本思路并以此建立了一个银行卡分析系统。
全文共分四章:
第一章:概述。对数据挖掘技术的产生历史予以分析,并对紧密关联的数据仓库、联机分析处理技术进行了分析研究,阐述了它们三者的联系以及区别。
第二章:数据挖掘技术研究。这是本文的主体部分,对数据挖掘的支持技术、体系结构、数据挖掘系统的分类以及数据挖掘的对象作了介绍;本部分还对数据挖掘的技术原理,包括计算机科学的人工智能、机器学习、神经网络、信息检索做了深入的研究,同时对数据挖掘的数学理论来源以及统计学来源做了一定的分析;最后本章对数据挖掘的模式模型、方法算法、语言等核心技术进行了研究,并给出了实施数据挖掘的一般步骤。
第三章:一个银行卡分析系统的实施。应用现有的数据挖掘工具开发了一个银行卡的数据挖掘分析系统,首先阐述了该设计该系统的背景以及系统结构,然后分析了该系统的功能模块。
第四章:数据挖掘前沿研究及银行卡分析系统的完善。对第三章建立的系统的功能进行了完善,并提出了现有数据挖掘工具中不存在可用模型的情况下自定义开发模型的一般步骤;本部分还对数据挖掘的前沿研究做了一定的阐述。
本文的研究对于发展日新月异的数据挖掘研究来说,显然是不够的,还有很多值得深入研究的地方。