基于插件架构的数据挖掘系统平台研究与设计

被引量 : 11次 | 上传用户:gc_xyz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于数据挖掘所带来的显著的经济效益,而受到了学术界和产业界的广泛关注。目前,已经有很多数据挖掘系统得到开发和应用,大都是针对数据挖掘和数据分析领域专家的,其集成的算法功能和数目固定,而且存在功能组件可扩展性较差等问题,制约了数据挖掘系统的推广应用。因此,研究具有较强的可扩展的数据挖掘系统及其集成技术,对提高数据挖掘系统的应用价值具有十分重要的理论意义和实用价值。基于插件架构的系统具有支持可扩展性的重要特性,引入插件架构方法到数据挖掘系统构建领域,将能够较好的满足该领域对扩展性方面的需求。本文基于插件架构的思想,对当前数据挖掘系统领域中既有的成果进行了较为全面的分析和总结,从数据挖掘过程模型入手,着重分析了数据挖掘系统领域需求中的主要特征,提出了基于插件的数据挖掘系统,并从横向和纵向对系统该架构的功能扩展进行了详细的分析。结合面向对象思想与设计模式,在插件架构设计模型的基础上对基于该架构模型的数据挖掘系统进行了体系结构设计,描述了该系统的工作机制,并对其核心功能包、数据对象模型、插件算法配置、数据与算法对接等主要的功能组件进行了设计。通过引入抽象工厂设计模式,解决各个组件的可扩展性机制,设计了适合多数据源的处理以及多挖掘算法集成的适配框架。针对该框架中插件算法的封装、加载和管理等关键问题,提出了相应的解决方法。在完成系统主要功能组件的分析与设计的基础上,对课题提出的基于插件架构的数据挖掘系统平台进行了原型系统实现。该原型系统展现了基本界面结构和主要功能,通过一个实际的数据集的测试,验证了本课题提出的模型和方法,初步达到理论研究与实际应用结合之目的。
其他文献
在这件论文中我企图研究的是中国古代和现代社会中男人和女人的地位。因为家庭是社会的基层组织,通过研究家庭和婚姻能够了解古代和现代的社会关系差别,以一个家庭举例说明,
金荞麦是我国南方广泛应用的一种民间中草药,块根入药,具有很高的药用价值和营养价值。目前对金荞麦的研究报道主要集中在其组织栽培、化学成分、营养价值、根部药用价值以及
弥散性血管内凝血(DIC)是一类由多种病因引起的、以小血管内广泛微血栓形成及继发性出血为特征的临床综合征。其病情凶险,病死率高,目前尚无统一的治疗方案。目的:成功建立家
在电力行业旋转机械设备运行过程中,转子的振动问题会造成故障。而转子不平衡是旋转机械的常见故障之一。对旋转机械转子进行动平衡测试与校正是确保旋转机械安全稳定运行的
电网电能损失率(简称线损率)是供电企业一项综合性的经济技术指标,也是供电企业三大经济指标之一,它反映了一个电力网的规划设计、生产技术和运行管理水平。在电力网线损构成
天津滨海新区成立10余年来,经济发展迅速,滨海新区的建设已经纳入全国总体发展战略,滨海新区迎来了新的历史性机遇!作为国家综合配套改革先行试验区的滨海新区,它的开发和建
随着中国入世,企业的经济竞争范围早已扩展到全球,组织内员工的压力问题也不再是国外的独特产物,无论是员工个体还是整个组织都已意识到工作压力对员工本身的危害,进而对组织
HP6机器人由日本Motoman公司研发,可通过NX100控制柜和NX100-PP示教编程器进行在线示教编程,实现搬运和焊接等功能,在汽车制造业得到广泛应用。但离线编程功能方面,其专用Mot
自动爬升暖棚由支撑系统、保温防护系统、爬升系统组成。支撑系统采用槽钢、木工字梁等,解决与结构相连问题;保温防护系统采用保温岩棉,解决保温和防护问题;爬升系统采用液压
本文应用自制的固液分离装置,对味精厂提取车间的结晶母液及废液中谷氨酸进行分离处理,探讨了工艺过程中的有关因素。研究结果表明,本工艺优于传统的滑槽工艺。