论文部分内容阅读
当前,很多企业应用数据挖掘技术,将其业务数据转化为有用的信息帮助决策,从而在市场竞争中获得优势地位。然而,企业开发自己的数据挖掘应用系统,要么采用市场上现有的商业智能解决方案及产品,要么自行编写数据挖掘算法,前者需要昂贵的费用,后者需要开发人员对企业业务和数据挖掘技术同样精通,这从开发成本和开发周期上来说,都不是最好的方案。如果把软件构件技术应用到数据挖掘领域中,将数据挖掘各个独立的业务模块以构件的形式加以实现,并利用构件库技术有效的组织、管理和检索构件,能大大的提高数据挖掘模块的复用效率和质量,缩短数据挖掘应用系统的开发周期和降低开发成本,满足市场对数据挖掘任务动态多变的需求,推动数据挖掘技术的更广泛应用。
软件复用是在软件开发中避免重复劳动的解决方案,它被视为解决软件危机,提高软件生产效率和质量的现实可行的途径。软件构件技术作为支持复用的核心技术,越来越得到广泛的重视。为了充分利用可复用构件,完成大量构件的生产、分类、检索、组装和维护工作,构件库的作用十分重要。
首先,本文讨论了数据挖掘模型的数学定义,并以此为基础,设计和实现了数据挖掘算法模型和构件模型。构件模型是构件设计的标准规范,而构件是数据挖掘构件库的基本元件,每个构件代表了数据挖据任务的一个流程,并实现了某一数据挖掘功能。
接着,本文设计了数据挖掘构件库系统的分类检索策略。构件的分类检索技术是构件库系统的核心技术,它直接影响到构件的复用效果。通过多种分类检索策略相结合,使得构件复用者可以快速准确的检索到所需要的构件。
最后,本文设计和实现了数据挖掘构件库管理系统。构件库管理系统是建立在操作系统支持的基础上,对构件库进行统一的管理和控制,提供各种构件库管理功能,保证构件库数据的一致性和完整性。管理系统基于浏览器/服务器(B/S)模式,设计为四层结构,分别为用户浏览层,接入服务层,逻辑实现层和数据层。其中逻辑实现层是系统的核心模块,负责处理系统的全部业务逻辑,它由构件管理、用户管理、构件权限管理、反馈信息管理和安全性管理等五个子模块共同组成。