论文部分内容阅读
随着中国加入世贸组织,外贸进出口交易日趋频繁,同时,随着计算机信息管理技术的普及,每天都会产生数量巨大的交易数据,这些数据中潜在蕴含着巨大的有价值信息,传统的报表功能和统计分析工具已经不能满足同益增长的用户需求,企业需要更为智能化的决策系统,通过科学的方法找出蕴含在数据中的价值,商业智能技术应运而生,其中数据挖掘是最为重要的实现手段之一。数据挖掘是从海量数据中提取有用的、新颖的知识的处理过程,主要用于在企业的数据库中找到和提取相关的模式或知识,为企业优化管理和业务提供决策支持。根据数据挖掘技术的这个特点,并针对传统的信息管理系统在决策支持方面存在的不足,本文提出把数据挖掘应用到外贸进出口行业的竞争情报系统中以提高企业管理的决策支持功能。本论文具体工作如下:
1.针对外贸进出口行业中如何合理配置资源的问题,引入关联规则和序列模式方法,并针对关联规则中Apriori算法I/O开销过大、效率较低等问题,提出了经过改进的算法AIMP,在降低系统时间、空间复杂度等方面具有良好效果。经过在J2EE挖掘平台上的验证,证实改进算法是行之有效的。
2.针对外贸进出口行业中信用评价、趋势分析等问题,引入数据挖掘中决策树分类方法来加以解决。在分析了ID3等分类算法的基础之上,提出了解决实际问题的方案并在挖掘试验平台上实现。
3.针对外贸进出口行业竞争情报系统的特殊性,设计了适用于贸易数据挖掘的整体系统架构。系统为Browser/Server三层架构分布式应用系统,相比传统的Client/Server两层结构的数据挖掘系统,在可扩展性、可用性等多方面具有明显优势。该系统可作为外贸企业竞争情报系统中信息获取的可靠来源。
4.基于J2EE平台,设计开发了数据挖掘系统,并将改进后的挖掘算法在该平台上实现。系统采用IBM Rational Software Architecture 6.0进行系统UML建模,实验数据为2001至2004年度中国对美洲各国进出口贸易数据。