论文部分内容阅读
计算机与信息技术的的飞速发展,使人们能以更快、更廉价的方式获取和存储数据,这就使得数据与信息数量以指数速度增长。1993年全球数据存储量约为2000TB,2000年就增加到了300万TB。而且还在以惊人的速度增长。过量的数据被人们称为信息爆炸,带来的挑战是:一方面规模庞大、纷繁复杂的数据体系让使用者漫无头绪、无从下手;另一方面在这些大量数据的背后却隐藏着很多具有决策意义的有价值的信息。那么,如何发现这些有用的知识,使之为管理决策和经营战略发展服务?计算机科学给出的最新回答是:数据挖掘(Data Mining)。本文的主题是数据挖掘在外贸业务分析决策系统中的应用研究。论文首先就数据挖掘的重要环境-数据仓库及相关的联机分析处理(OLAP)技术进行了分析,并重点对数据挖掘的概念、算法、使用的技术、实际的挖掘过程、数据挖掘的体系结构进行了论述;在此基础上,根据经贸委制定的CTPI指标体系建立了外贸业务分析决策系统框架;进一步,利用OLAP分析所建的数据仓库中的数据、指标分析计算出的指标值以及中国统计年鉴网站的相关数据建立了专用的数据挖掘仓库,从各个角度对其进行数据挖掘,建立了多个挖掘模型,为经贸委科学决策提供依据。论文还就数据挖掘在系统应用中遇到的一些问题提出了自己的看法和解决方案,同时,为充分利用已有的模型结果,提高挖掘模型的维护效率,分别对关联规则模型和预测类挖掘模型提出了一种快速更新的方法和思路。