论文部分内容阅读
信息化的浪潮在世界各地,各行各业掀起,信息化的层次也在不断演进,从MRPⅡ、ERP到CRM,从数据仓库(Data Warehouse)、到数据挖掘(Data Mining),每一次变革都极大地推动着企业信息化的升级和企业管理水平的提高。随着信息技术的与时俱进,企业信息化的热点也随之转变,据赛迪顾问在2005年中国数据管理技术应用年会上发布的《2004-2005中国数据管理技术应用软件市场研究年度报告》报告显示,商业智能作为整体数据管理技术已经在应用软件市场中成为发展最快的一个领域,其在中国市场销售额的增长率已超过40%,占到总体数据管理技术应用软件市场的44.36%。很明显,又一个信息化热点商业智能在我国已经悄然兴起。但是,据市场反映,在这一领域我们与国外仍有着不小的差距。本文正是基于这一历史背景进行立题研究。本文围绕商业智能这一课题,对多维分析技术、数据挖掘这两大商业智能的核心支撑技术进行了深入细致的研究与分析,并在对microsoft analysis、pentaho、openi等已有商业智能产品和市场详细调研的基础上实现了一个智能多维分析平台。本文所做的主要工作、技术难点与创新处如下:1.大量查阅了商业智能的相关资料,追溯了商业智能兴起的原因及其发展过程,认真学习了商业智能的体系结构、架构过程及应用实施的知识,深入领会了商业智能的概念及其核心支撑技术。2.深入细致的学习了多维分析技术的概念、特点以及多维分析系统的体系结构,并研究了数据的切片、切块、下钻、上卷以及转轴操作,并对开源多维分析服务器Modrian的数据流程、体系结构、多维数据库的元数据格式以及将Modrian做为二次开发的类库进行了详细的分析与研究,而且也从应用的角度对作为Modrian的前端展现开源组件jpivot的类库、常用标签组件做了深入的学习,并在此基础上对Jpivot和及其所依赖的Wcf组件进行了全部汉化工作。3.认真学习了数据挖掘的相关知识,分析了数据挖掘的算法以及如何进行数据挖掘,并在此基础上对开源软件Weka的数据输入、分类、聚类、关联、元学习方案以及属性、实例过滤算法进行了分析,并就如何利用Weka做二次开发进行了深入细致的研究。4.在深入学习Struts开发框架,分析模型-视图-控制器(Model-View-Controller,MVC)设计模式,Struts的类库结构及Tag库以及输入验证及错误处理机制的基础上,充分利用Struts的优点,扬长避短,不仅大大提高了生产效率,而且明晰了系统结构,为系统进一步扩展提供了良好的前提条件。5.基于上述原理和已有的研究成果,设计并实现了智能多维分析平台,该平台具有的特点与创新如下:1)本系统采用了B/S结构,系统的所有用户可以通过Internet远程使用本系统,不受时间和地点的限制,而且系统基于web的操作方式,对于有着庞大的互联网用户数量的中国市场来说更加具有竞争力。2)与基于Mondrian和Jpivot开发的开源商业智能系统pentaho和openi相比,本系统的核心功能均提供了向导式的操作方式,而且增加了创建Mondrian多维数据集的功能,进一步降低了对系统对用户的要求。3)基于开源软件构建商业软件,大大降低了开发成本,为进一步提升产品的竞争力,提供了一种有效的商业软件产品开发模式。4)完全基于xml的数据存储,使得系统脱离了具体的数据库平台,提高了软件的独立性及软件的访问速度,有效的降低了软件的实施成本。5) Xml、Xsd、Dtd、Xsl、Css以及Taglib技术的引入,不仅增强了系统的个性化,而且一定程度上降低了界面显示与控制逻辑的耦合性,为美工和程序员并行开发系统奠定了基础。6)可定制的系统界面以及属性文件的应用,从一定程度上满足了用户的个性化需求,而且对软件的国际化有着良好的支持,使得系统在不修改代码的情况下就可提供多语言版本。7) Weka持续快速的发展以及对分布式处理的支持,使得系统在数据挖掘应用扩展及挖掘性能方面有着良好的支持。目前,本系统已经在北京市商业银行、西门子(中国)A&D集团、营口市商业银行等多家单位投入使用,效果良好。作者在校期间,参与的研发项目及所发表的文章见附录。