论文部分内容阅读
数据挖掘技术的产生和发展为人们从海量的数据信息中发现有用的知识提供了一条有效的途径,数据挖掘系统则架起了数据挖掘技术与数据挖掘应用之间的一座桥梁,数据挖掘系统的研究和开发将有利于推动数据挖掘应用的进一步推广。实践和经验表明,数据挖掘的标准化工作将有助于改进不同的数据挖掘系统和功能间的互操作性,促进数据挖掘系统在企业和社会中的使用和推广。
数据挖掘的工业过程标准CrossIndustryStandardProcessforDataMining(CRISP-DM)是一种为行业内所广泛接受的数据挖掘过程标准模型,本文通过对数据挖掘的工业标准过程CRISP-DM的研究,提出了一种遵循CRISP-DM标准的数据挖掘系统框架并对框架中各个层次的功能进行了定义。JavaDataMining(JDM)API规范是由SUN的JCP组织推出的一种基于Java平台的开发数据挖掘软件的接口标准,通过遵循该标准开发的数据挖掘产品之间可以实现功能模块的共享性和互操作性。通过对JavaDataMiningAPI标准的研究,对提出的数据挖掘系统框架进行了进一步的细化,设计出了一种基于JDMAPI标准的数据挖掘系统体系结构,对体系结构中的功能模块的划分和各自的功能进行了详细的定义,并对数据挖掘系统实现中的一些关键技术问题进行了分析归纳。
元数据在数据挖掘系统中具有非常重要的管理和配置作用,元数据管理是数据挖掘系统设计和实现中的一个重要的组成部分。本文对数据挖掘系统体系结构中元数据管理模块进行了进一步的详细分析与设计,分析了元数据管理中存在的问题,通过定义一种中立的元数据操作和元数据内容描述格式,实现了元数据的操作处理与元数据的物理存储机制和元数据展示的相互分离,提供了一种灵活的和可扩展的元数据管理子系统体系结构。通过对现有的元数据物理存储机制的分析,选用了关系型数据库作为元数据管理子系统原型的物理存储机制,对原型系统中的实现技术进行了详细的分析与设计并初步实现了一个元数据管理子系统的原型系统。通过原型系统的实现验证了元数据管理子系统体系结构和功能模块设计的可行性,为进一步实现数据挖掘系统奠定了良好的基础。