基于数据库的数据挖掘研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:wgy_2003_9
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库技术和社会经济的发展,一些企业的数据库里存储了海量的数据,但是面对这些数据,现有的OLTP数据处理系统并不能有效的处理它们,数据挖掘的出现正是应对了这一需求,就是从大量的数据中抽取出潜在的、不为人知的有用信息、模式和趋势,来为人们的决策提供依据,同时,由于它对海量数据中潜在模式的发掘,数据挖掘对于生物学、天文学等科学研究也起到了相当大的作用。 由于数据挖掘是一个比较新的概念,它又是伴随社会的需求而产生的,因此对数据挖掘的理论以及它的应用进行研究就不仅有重要的理论意义,而且还有重要的现实意义。本文以数据挖掘的基本理论为基础,结合情报学的相关知识,对数据挖掘的产生、概念、技术基础、方法、算法、语言以及应用进行了系统的研究和探索,并在此基础上提出了数据挖掘系统开发的基本思路并以此建立了一个银行卡分析系统。 全文共分四章: 第一章:概述。对数据挖掘技术的产生历史予以分析,并对紧密关联的数据仓库、联机分析处理技术进行了分析研究,阐述了它们三者的联系以及区别。 第二章:数据挖掘技术研究。这是本文的主体部分,对数据挖掘的支持技术、体系结构、数据挖掘系统的分类以及数据挖掘的对象作了介绍;本部分还对数据挖掘的技术原理,包括计算机科学的人工智能、机器学习、神经网络、信息检索做了深入的研究,同时对数据挖掘的数学理论来源以及统计学来源做了一定的分析;最后本章对数据挖掘的模式模型、方法算法、语言等核心技术进行了研究,并给出了实施数据挖掘的一般步骤。 第三章:一个银行卡分析系统的实施。应用现有的数据挖掘工具开发了一个银行卡的数据挖掘分析系统,首先阐述了该设计该系统的背景以及系统结构,然后分析了该系统的功能模块。 第四章:数据挖掘前沿研究及银行卡分析系统的完善。对第三章建立的系统的功能进行了完善,并提出了现有数据挖掘工具中不存在可用模型的情况下自定义开发模型的一般步骤;本部分还对数据挖掘的前沿研究做了一定的阐述。 本文的研究对于发展日新月异的数据挖掘研究来说,显然是不够的,还有很多值得深入研究的地方。
其他文献
在介绍并评价当前主要检索行为实验方法的基础上,引入美国Marvin Zelen教授的Zelen设计,综合已有检索行为实验方法的优缺点给出应用于网络用户信息检索行为实验的改进Zelen实
中文微博信息是具有特别保存价值的原生数字资源,其长期获取面临风险,保存机构必须采取措施保障其可以得到长期利用。目前中文微博信息保存相关的研究、实践缺失,亟待引起研究人
针对大学图书馆网络环境下学位论文提交与发布系统软件的选型问题,介绍已通过CALIS认证的四套学位论文提交与发布系统,并从论文提交、论文审核与编目、文档标准化制作、论文
知识管理是以信息科学、认知科学和管理科学为基础,并在知识经济的背景下产生的一种新型管理思想。目前知识管理已经成为很多学科的研究热点,同时也引起了图书情报学界的广泛重
概述开放课件资源的起源、特征,深入分析其对e-Learning的支撑作用;结合图书馆的发展现状与功能特征,阐明图书馆开展e-Learning服务的可行性,并从收集、整合、组织开放课件资
21世纪的今天,人类社会在经历了农业经济时代和工业经济时代之后,逐步迎来了一个崭新的时代——知识经济时代。这个全新的时代具有不同以往的鲜明特征。同时在这个时代中,企业面
随着语料库技术的不断发展以及语料库管理系统的广泛应用,语料库中存储的数据量急剧增大。但目前大多数语料库系统所能做到的只是对语料库中已有的语料进行存取,人们通过这些
指出情报概念“竞争知识”之说的不足,建立了一个情报发生、传递的模型,根据大众情报观,结合情报与非情报的典型事件进行论证。归纳出情报“传递—保密”的对立统一典型特征;
中国加入WTO后,中国的物流行业将向国际全面开放,这将使物流行业成为竞争最为激烈的行业之一,成为拉动国民经济的新增长点.方兴未艾的物流热正在全国兴起,也逐渐成为科研领域
第25期图书情报工作岗位培训班rn由中国图书馆学会专业图书馆分会举办的“图书情报工作岗位培训班”自1981年创办以来,每年一期,每期历时6个月,已有26年的历程.该班是北京地