数据挖掘系统框架及其元数据管理的研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:yangyahui00
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘技术的产生和发展为人们从海量的数据信息中发现有用的知识提供了一条有效的途径,数据挖掘系统则架起了数据挖掘技术与数据挖掘应用之间的一座桥梁,数据挖掘系统的研究和开发将有利于推动数据挖掘应用的进一步推广。实践和经验表明,数据挖掘的标准化工作将有助于改进不同的数据挖掘系统和功能间的互操作性,促进数据挖掘系统在企业和社会中的使用和推广。 数据挖掘的工业过程标准CrossIndustryStandardProcessforDataMining(CRISP-DM)是一种为行业内所广泛接受的数据挖掘过程标准模型,本文通过对数据挖掘的工业标准过程CRISP-DM的研究,提出了一种遵循CRISP-DM标准的数据挖掘系统框架并对框架中各个层次的功能进行了定义。JavaDataMining(JDM)API规范是由SUN的JCP组织推出的一种基于Java平台的开发数据挖掘软件的接口标准,通过遵循该标准开发的数据挖掘产品之间可以实现功能模块的共享性和互操作性。通过对JavaDataMiningAPI标准的研究,对提出的数据挖掘系统框架进行了进一步的细化,设计出了一种基于JDMAPI标准的数据挖掘系统体系结构,对体系结构中的功能模块的划分和各自的功能进行了详细的定义,并对数据挖掘系统实现中的一些关键技术问题进行了分析归纳。 元数据在数据挖掘系统中具有非常重要的管理和配置作用,元数据管理是数据挖掘系统设计和实现中的一个重要的组成部分。本文对数据挖掘系统体系结构中元数据管理模块进行了进一步的详细分析与设计,分析了元数据管理中存在的问题,通过定义一种中立的元数据操作和元数据内容描述格式,实现了元数据的操作处理与元数据的物理存储机制和元数据展示的相互分离,提供了一种灵活的和可扩展的元数据管理子系统体系结构。通过对现有的元数据物理存储机制的分析,选用了关系型数据库作为元数据管理子系统原型的物理存储机制,对原型系统中的实现技术进行了详细的分析与设计并初步实现了一个元数据管理子系统的原型系统。通过原型系统的实现验证了元数据管理子系统体系结构和功能模块设计的可行性,为进一步实现数据挖掘系统奠定了良好的基础。
其他文献
MU-MIMO(Multiuser Multiple input Multiple output)技术是当前及正在演进的无线访问标准,如LTE,LTE-A,WIMAX和WLAN中的关键技术。Multiple User-MIMO系统在同一时间及频率范围
随着互联网的迅猛发展,流媒体服务已经成为Internet上相当重要的一种业务,而且发展迅速。流媒体具有数据量大,持续时间长,实时性要求高的特点。当并发用户数量很大时,一般的单播服
空间数据是地理信息系统的基础,整个地理信息系统都是围绕空间数据的采集、加工、存储、管理、分析和表现展开的。随着Internet网络的飞速发展和普及,万维网地理信息系统(WebGI
随着USB接口技术的发展,USB设备越来越多地走近我们的日常生活和科研工作中,给人们带来了很多方便。USB接口技术有很广泛的发展前途,研制出能用于经纬仪上的USB设备也是有必
随着Internet的发展,基于网络的应用系统越来越多,现代社会对网络的依赖日益增强,同时网络的安全也面临着巨大的挑战。面对威胁,众多安全机构研发了许多安全产品,但攻击者的
感知和识别复杂环境中人的行为是普适计算研究的热点之一,随着微型低功耗传感器的发展,传感器开始融入人类生活的各个方面,基于传感器的行为识别已经成为目前研究的热点。本
近年来,随着信息系统的广泛使用,系统安全问题受到用户越来越多的关注。访问控制作为解决安全问题的关键技术之一,在理论研究不断深化的基础上,有关的应用研究也得到了极大的
在经济快速发展的今天,人们对成本和效率有了更高的要求。为了打破平台对用户的束缚,充分利用已有的成果,节省重新开发的费用,平台迁移或软件重用已经变得越来越重要。 因而,源
本文给出了基于GIS平台构建的城市排水管网信息系统。包括系统的体系结构、主要数据结构、功能等的设计和实现,特别是对普通GIS平台所缺少的排水专业方面的扩展功能,如水力计算
数据库系统作为当前多数企业和部门的信息载体,担负着存储和对数据信息的访问控制任务。一方面要求数据库系统能提供对数据信息的安全存取服务,即向授权用户提供可靠的消息/数