论文部分内容阅读
21世纪,随着信息社会的不断发展和互联网的逐渐普及,人们面对日益增加的信息量,迫切需要有效的工具来分析和处理所需要的数据。随着20世纪80年代神经网络的发展和KDD(数据库中的知识发现)的逐步推广,数据挖掘技术应运而生。数据挖掘是为了发现数据中事先未知的规则和联系而对大量数据进行选择、探索、分析和建模的过程,其目的在于帮助人们找到潜在的具有应用价值的挖掘结果。神经网络以模拟人脑神经元的数学模型为基础,并以此建立自适应的动态系统,具有适应能力强、并行速度快的特点。在数据挖掘领域,神经网络常用于分类(如感知机、BP、RBF网络)、聚类(如SOM、RBF网络)和统计预测(如RBF网络);神经网络尤其适合于处理描述性和预测性的数据挖掘。遗传算法作为一种模拟生物自然选择和遗传机制的随机搜索方法,具有隐含的并行性和全局搜索性,并且易于和其他模型相结合。Java强大的面向对象和网络编程特性以及方便的跨平台性,使得目前许多公司和组织用其进行基于Web的软件开发。而作为Java企业级开发平台的工业标准J2EE,更是为广大Java开发人员提供了一套完整而强大的中间平台。MVC(Model-View-Controller)设计思想由Trygve Reenskaug提出,现已成为一种广泛应用于J2EE开发领域的设计模式。本文从理论和开发两方面进行相应的结构组织。理论部分,首先介绍了数据挖掘的概念以及神经网络在数据挖掘中的应用。按照数据挖掘的相关技术,本文详细介绍了处理分类问题的两层感知机、BP神经网络、RBF径向基函数网络以及用于无监督聚类问题的SOM自组织神经网络;对每种网络,还通过实际的用例给予了更为直观的功能描述;然后介绍了遗传算法的相关知识,本文重点分析了如何利用遗传算法优化BP神经网络的结构以及初始的连接权值;并用一个实验说明了遗传算法在优化BP神经网络中的优良表现。在挖掘平台的开发部分,本文首先介绍了在线数据挖掘项目MinerOnWeb;然后着眼于软件工程的需求分析、设计以及开发流程,详细介绍了在J2EE架构下基于神经网络方法的数据挖掘平台的设计方案和开发步骤。按照实际的开发需求,将挖掘平台划分成数据源的获取、神经网络挖掘模型的训练、神经网络挖掘模型的保存以及挖掘模型的应用四个部分;然后对每个部分进行了详细的介绍。挖掘平台的开发紧紧围绕两层感知机、BP神经网络、RBF径向基函数网络以及SOM自组织神经网络的数据挖掘应用而展开。本文同时还展示了这四种神经网络在挖掘平台上的实际应用效果。