基于数据仓库的分类分析研究

来源 :青岛大学 | 被引量 : 0次 | 上传用户:ullige000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文主要研究决策树和神经网络模型.该课题是在课题组前期完成的HDC(highway Decision Center)数据仓库平台的基础上进行的,在对CART决策树进行了深入研究分析的基础上,针对存在的问题对数学模型、算法等进行了若干改进,最终独立开发了基于数据仓库平台的适合大数据量CART分类器.为了提高决策树的执行效率,该文还实现了建树和修剪阶段的合并.另外,该文对基于RBF网络的分类器进行了深入研究.基函数的中心选取问题是RBF网络应用的关键因素,该文采用最近邻学习算法确定基函数的中心,针对RBF网络通常所采用的随机选取半径往往导致网络训练速度慢等问题,提出了基于样本统计的中心选取方法.最后将此方法用于银行信用卡信用度预测上,预测结果表明了该方法的有效性.该论文的组织结构为:第一章为诸论,介绍了研究背景和分类分析研究领域国内外的研究动态,阐述了该文的主要研究内容;第二章详细叙述了CART分类器的原理,给出了建树与修剪阶段合并的算法;第三章描述了RBF神经网络分类器,给出了基于样本统计的网络中心选取方法;第四章讲述了CART分类器的设计与实现;第五章对该课题的研究工作进行了总结分析了今后所要进行的工作以及进一步研究的课题.
其他文献
基于动态联盟的敏捷供应链是企业21世纪参与国际竞争的重要技术手段。参照国外敏捷供应链管理的先进思想、研究成果和产品,研究并建立符合国内企业、行业实际情况的敏捷供应链
该文论述了面向对象的高炉炉喉十字温度预报及布料指导子系统的设计和实现问题.针对炉前操作人员对十字温度预报的新需求,提出了采用基于TD算法的时序神经网络来完成对十字温
利用计算机视觉技术,实现身份证号码的自动识别和录入将大大提高身份证管理的效率。目前身份证号码的识别系统是以扫描仪来获取身份证图像,但扫描仪不利于长时间实时获取图像。
分布式系统是充分利用现有计算机资源的一个很好的解决方案。而要让分布式系统获得良好的负载平衡、高通信性能、高可用性等特性,进程迁移功能是不可或缺的。 分布式操作系
为了高额利润,许多公司正在大量地使用网上的廉价信息。这导致公司的数据量日趋增大。因此,从巨量的数据集中快速地找出感兴趣的模式已成为一个紧迫的任务。数据挖掘为解决这一
决策支持系统、数据挖掘技术目前已得到了广泛的应用,作为这两者的信息来源数据仓库和数据集市技术也得到了相应的发展。数据仓库和数据集市的重要性在于它为决策支持系统和数
目前计算机软件的规模越来越大,复杂度也不断提高,软件错误造成的后果也就越来越严重,软件的质量和可靠性已引起人们的高度重视。在现代软件工程中,软件开发的各个阶段,都应进行相
该文主要是从这两方面问题着手,从网络形态上和预测模型结构做出相应的改进,以期望提高预测的准确率.对于网络形态,考虑使用递归神经元网络作为预测模型的主体,通过对递归神
该论文首先对Linux的进程结构、进程调度等问题进行了分析.并附带说明了Windows 2000的相关内容.接着该论文对Linux操作系统的进程间通信机制进行了全面深入的论述.包括信号,
随着许多新兴的计算模式的广泛应用(移动计算、对等计算、网格计算等),当前的网络安全系统呈现出新的问题:首先,这些计算模式中网络是自组织的、不依赖网络拓扑结构的;其次,