基于J2EE架构的数据挖掘平台中关联规则算法的实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:wuxirl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是近年来发展起来的新技术,通过数据挖掘,人们可以将知识发现的研究成果应用于实际数据处理中,为科学决策提供支持.目前数据挖掘逐渐发展成为一个多学科领域,涉及到多方面的技术,特别是和计算智能方法的结合越来越紧密.本文首先介绍了数据挖掘的基本概念、内容、功能、常用技术及未来的发展方向.接着介绍了关联分析的基本概念、分类及经典的Apriori<[1]>算法思想.关联规则算法是数据挖掘中的核心技术之一,在整个数据挖掘过程中有着非常重要的作用.接着,本文从工程角度出发,设计并实现了一个基于分布式结构的数据挖掘系统.本文从系统的体系结构、功能设计、模块划分、实现技术等方面进行了详细的分析和讨论.该系统在J2EE框架下,支持EJB技术标准,为数据分析员提供了一个基于c/s模式的数据挖掘平台.实验小组采用了组件化的思想,设计了这个数据挖掘系统平台,提供给数据挖掘技术的研究者一个研究用的实验平台,只要遵循我们的数据模型接口和挖掘模型接口,新的数据挖掘算法可以很容易地集成到系统中来.同时,我们的平台又是一个具有实际应用价值、可以与数据挖掘应用紧密结合的、便于升级和移植的挖掘系统框架.将数据挖掘系统实现技术与最新的EJB标准结合起来,采用组件技术设计,使得系统具有良好的开放性和可扩展性.系统基于J2EE技术设计,可以大大减少系统开发的工作量同时具有良好的健壮性.然后,提出了一种基于约束项的关联关系的挖掘新算法AprioriTID,此算法主要是改进原来的算法没有基础项集的选择这一缺点,对整个挖掘的基础项集进行有针对性的筛选.本文从这个算法的产生原由、流程、实现过程、实现的意义以及需要改进的地方等多个方面进行描述.对于这个算法我用EJB进行封装,并发布到Jboss服务器上,实现了整个算法分布式调度.这个算法还有很多的不足,我从理论和实际的应用方面对其进行改进.最后,本文总结了课题的主要研究工作.
其他文献
网格是一种新兴的基于Internet的分布式并行处理框架。它能跨多个管理域组织或企业进行资源发现、资源管理、信息交换和资源共享。网格资源管理系统是网格计算的重要组成部分
“储层地质统计分析系统GASOR”是一个基于单机运行的、用于油气储层随机建模的大型应用系统。为了适应石油行业的需求,GASOR系统的工作平台不但要从单机转向Internet,而且还要
网格是一个集成的计算机和资源环境,网格技术是随着网络技术的发展和应用而逐渐兴起的一个研究热点。在网格环境中,所有的单机系统或机群系统都可以作为一个节点,以提供和消
本文针对长城铝业公司的具体情况,分析了原有压力容器监控系统的不足,并在.Net框架下结合使用了OLAP、数据仓库等技术,实现了一个压力容器综合分析系统。系统能够多角度分析
虚拟专用网技术VPN 是近年来一项发展迅速、引人瞩目的网络新技术。所谓虚拟专用网是指以建立私有、快捷、安全的网络为目的,以连接广泛的公共网络为传输媒介,以加密认证为主
信息化水平日益成为衡量一个国家现代化建设和综合国力的最重要标志之一,知识管理也随之成为企事业单位构建现代信息系统的热点,为了迎接知识经济时代的挑战,我国正在加快实施国
Web是一个巨大的、广泛分布的全球化信息仓库,它提供了新闻、财经、广告、商务、文化、教育等多方面的信息服务。如何有效地帮助用户从Web上发现他们感兴趣的资源,已经成为一个
伴随着自然语言处理技术的蓬勃发展和英语教学方式的多元化需求,计算机技术与英语教学的结合越来越密切,教学辅助软件如雨后春笋般层出不穷。由于语言体系的差异,英语和汉语
本文首先回顾了网络管理技术的发展历程,介绍课题相关的研究概况,对SNMP网络管理的相关内容做了阐述,引入移动代理技术,对其概念、原理、特点和标准化等进行了详细介绍,并考察分析
互联网络的普遍应用使得人们希望能够以一种更加灵活的方式接入到Internet 中去,而不受时空的限制。传统IP 技术不能满足这种需求,而移动IP 技术正是适应这种需求而产生的。