数据挖掘理论与方法若干问题研究

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:douzixia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘就是从大量的数据集中抽取和精炼新的模式或知识的过程,目前已经成为一个重要的研究课题.该文以提高数据挖掘的效率为目的,以微机机群为平台,以油田地质数据库为背景开展研究工作,主要包括以下六个方面的内容.1.提出了两种处理缺损数据的方法.一种是基于Bayesian网络的缺损数据处理方法;另一种是基于数据库先验知识的缺损数据处理方法,它充分利用数据库的冗余信息来推断缺损数据.2.提出了两种聚类新算法.一种是进化聚类学习方法,蚁群算法是解决离散优化问题的一种重要算法,该文首次将其应用到聚类学习中,提出了一种基于蚁群算法的进化聚类学习方法,取得了很好的效果;另一种是基于代表点的聚类方法,对于一些非球形分布的数据集,用普通的方法聚类的效果不理想,利用该方法可以首先根据领域知识选取一些代表点,然后再进行聚类学习,实验效果较好.3.提出了两种关联规则挖掘算法.一种是基于概念格的关联规则挖掘方法,将概念格的方法应用到关联规则挖掘中来,首先建立概念格的Hasse图,然后利用Hasse图的节点进行关联规则挖掘;另一种是基于微机机群平台的挖掘关联规则的并行方法,我们发现矩阵中的上三角矩阵具有良好的性质,将该性质运用到关联规则的挖掘中来可以大大提高挖掘效率.4.提出了一种基于超图理论的离群数据挖掘方法.算法首先建立了超图模型,然后利用超图的分割算法寻找频繁超边,根据超边上权重的大小来检测离群点.5.提出了离群数据再挖掘的概念和算法.离群数据一般可以分为三种情况:一是错误,二是正常的偏离,三是含有一定信息量的数据.其中第三种情况的数据是我们感兴趣的.该文提出了在离群数据集中进行再挖掘的概念,并给出了一种基于频繁属性子空间的再挖掘算法.6.提出了一种基于Multi-Agent理论的智能数据挖掘体系结构.仅仅从改进算法和提高硬件速度的角度来提高数据挖掘的效率,已经远远不能适应数据量日益增长的需要,因此需要新的理念来指导数据挖掘.
其他文献
本文主要介绍了军用远程多媒体协作系统的安全管理中心及加密算法的软件实现。该系统由几家研究所和大学共同研制,实现对军用网络上的远程登录与访问的控制以及保密通信。
该论文设计了一个分布式的高速数字系统,对电力系统参数进行采集,通过合理的故障诊断判据,判断电力故障类型,连同故障发生时间、电力系统参数的录波数据一并上传到中央控制器
该文先对图像融合做了简要的概述,介绍图像融合的历史、现状和发展;在第2章,着重讲述了小波变换的理论及其在图像处理中的应用.在该文的中间,作者用大量篇幅介绍了图像融合技
锅炉燃烧控制系统建模及仿真研究摘要工业锅炉是我国最主要的能源消耗设备,对其燃烧系统进行控制具有其极重要的经济意义。但是由于锅炉的燃烧系统是一个多变量强耦合的非线性
学位
红外成像制导是当前制导领域研究的热点,而红外图像信息处理又是其中的关键技术.该文围绕着设计和实现面向红外图像信息处理的嵌入式系统软件展开研究.该文在分析了红外成像
该文主要研究了高性能数字式交流伺服技术在实际交流位置伺服系统中的应用.文中设计的高性能数字式交流位置伺服系统采用松下MINAS系列交流伺服电机及其驱动器组成电流环和速
全文分为两个部分,第一部分对于有线控制网络的实时介质访问控制和差错控制进行研究,第二部分将研究扩展到无线控制网络领域,重点在于无线实时介质访问控制和相关硬件实现.全
过程控制是高校自动化学科的一门重要课程,学生在课堂上学习了理论知识后,需要在实践中进行消化理解和创新。显然,去工厂参观实习可以帮助学生了解工业过程,但不能培养他们的实际
提出了一种新颖的面向故障投诉推理的配电网模型,即将配电网看作图,将可开断配电设备和用户区看作图的节点,将配电线路看作图的边,提出了配电网分层的概念,并讨论了分层算法.提出