数据挖掘构件库系统的知识库研究与实现

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:sz_yaoli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今的社会处于信息爆炸的时代,企业数据仓库中数据的数量日益庞大。数据挖掘应用能够从数据中抽取潜在的有价值的知识,提供更丰富的数据支持,帮助企业领导在业务管理和发展方面做出正确的判断。基于可复用构件的开发,能够节省开发的成本并提高软件质量。因此通过建立数据挖掘构件库,能够很好地解决数据挖掘应用开发过程中软件重用的问题。然而实际的使用中,普通的用户往往存在专业背景知识不足的问题,无法像专业人才那样运用数据挖掘构件,使得数据挖掘应用难于得到推广。 本文在讨论构件库的现状和已有的构件检索方法的基础上,参考国际数据挖掘标准流程CRISP-DM,在数据挖掘构件库系统中加入知识库,建立了规则库、方案库以及构件检索词库,以导航的方式,为用户提供构件推荐。首先,系统根据数据挖掘流程和输入数据的统计分析结果匹配对应的规则,推理得到数据挖掘构件方案,供用户选取;然后,系统根据用户所选择的方案,提供给用户具体的数据挖掘构件下载;最后,用户可以将下载后的构件在数据挖掘工具的设计面板中连接成完整的数据挖掘工程。整个系统将数据挖掘(DM)工具和数据挖掘构件库整合起来,从而扩充了DM工具的功能,使其可以灵活地复用构件库中的构件,同时也使构件库可以更好地利用DM工具作为构件组装的平台,方便构件的复用,提高了数据挖掘构件的复用水平,降低了数据挖掘技术的使用门槛,有利于数据挖掘的推广。本文还讨论了知识库的相关理论,包括知识库定义,知识表示方法,产生式系统以及Rete网络。最后设计实现了一个跨平台、多用户式的数据挖掘构件库系统,实现了其中的知识库系统,并且定义了规则库中规则的格式,其灵活的表示方法为增加新的规则以及方案的扩展提供了便利。 本文研究工作的主要创新点如下: 1、建立支持数据挖掘构件库的知识库,以知识表示数据挖掘构件,构建了一个可灵活修改的的规则库,一个基于CRISP-DM数据挖掘流程的方案库,并且构建了一个构件检索词库。 2、利用知识库系统中的推理引擎以及规则库,设计了针对数据挖掘构件的推荐策略,实现了知识库对数据挖掘应用开发流程的控制。 3、以导航的方式检索构件,结合数据挖掘开发流程模型,对流程模型进行细分,由此推导得到方案,供用户下载相应的构件。通过增加与用户的交互过程,提高了检索构件的搜全率。 4、通过知识库将DM工具和数据挖掘构件库系统紧密的联系起来,成为一个能够进行构件管理、构件组装以及支持构件复用的数据挖掘开发环境。
其他文献
工作流技术,作为一种有效控制、协调复杂活动执行和信息集成的手段,是实现企业业务管理自动化的一项先进技术和有效途径。但是,当企业组织越是依赖工作流技术来管理日常工作
我国物流信息化建设过程中存在着盲目性,由于缺乏统一规划与管理,导致信息孤岛现象严重,使已有物流设施不能充分发挥作用。当前我国正积极推动RFID(无线射频识别技术)在物流
随着企业IT系统建设与发展,很多企业IT系统的建设已经完成了从无到有,再到完善的过程。而随着众多业务系统的建设的完成与系统的规划,EAI系统的建设逐渐成为企业在IT建设中的
身份识别系统广泛的应用于安全性较高的场所,如机场,银行,机房等地。传统的识别技术有密码锁,IC卡等。目前逐渐兴起并发展的生物识别算法,如人脸识别,指纹识别,虹膜识别,掌纹
工作流技术起源于20世纪80年代,随着当前网络技术的发展和行业信息化的不断深入,工作流技术也在迅速发展。工作流管理系统与传统信息系统的区别在于,传统的信息管理系统是面
在智能家居系统中,通过远程移动终端对家庭设备进行监控是非常重要的一项功能,用户远程监控家庭设备的过程本质上就是用户移动终端和家庭数字设备之间的数据交互过程。本文所
物联网基于互联网、电信网等信息承载体,通过对物理世界和信息空间的互连和整合,给人们提供智能服务。如何将互联网和无线传感器网络更高效快捷地互连,并如何在此基础上提高
随着通信技术的飞速发展,人们对获取信息的方式也在不断的变化,从最初的报刊,杂志,然后到Internet,现在正越来越向更加方便,更加轻巧的手机等智能客户端转化。但是如何能够快
随着人们对移动信息服务需求的日益增长,基于IEEE 802.11的无线局域网技术被广泛采用。在网络应用的功能越来越丰富的同时,用户对网络性能的要求也越来越高,其中一个非常迫切
随着信息化的快速发展,越来越多的关键信息需要转化为数字化的形式并存储在可管理的介质中,网络对于存储和管理信息的能力产生了新的需求。而当前主流的存储技术NAS、SAN等各