数据仓库与数据挖掘若干理论研究及在CIPS中的应用

来源 :同济大学电子与信息工程学院 同济大学 | 被引量 : 0次 | 上传用户:akiro
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的不断推广应用,大量的先进制造企业采用了计算机及相应 的信息技术进行管理和运营,收集、存贮了海量的生产经营记录,但同时,大 量的信息也带来了真假信息难以识别,很难提取出企业真正需要的知识的问题, 企业普遍面临数据爆炸却有效的信息和知识相对短缺的状态,因此,如何对数 据进行有针对性的开采,发掘出有价值的信息和知识,形成企业的know-how, 指导企业的技术决策和经营决策,对于企业的发展,将发挥出举足轻重的作用。 数据仓库和数据挖掘就是解决上述问题的关键技术之一。本文以某流程企业为 背景,对数据仓库和数据挖掘若干理论进行研究并针对企业的实际情况顺利地 实施,为企业生产经营活动的协调与整体优化和设备的正常运行、故障预警提 供了丰富的决策依据,主要内容如下。 无论实施数据仓库还是数据挖掘,都要首先进行数据预处理。针对流程企 业数据源中存在的质量问题,提出了数据清洗的ETL的具体框架,采用不同算 法和技术对数据进行了有效的清洗、转换和装载,为数据仓库提供了可靠的数 据来源,在此基础上,分别采用DWER模型分析了具有复杂维结构和聚集的生 产计划和实际费用的数据仓库,星链ER模型(StarChainER)分析具有链式事实主 题的副产品库存和销售的数据仓库。最终建立起来以生产费用、油气生产、干 气和副产品库存和销售为主题的数据仓库。 根据流程企业中参数点的重要性不同和用连续数据表示的特点,分别研究 加权关联规则理论和模糊关联规则理论及在流程企业中的应用,针对数据的不 同特点,采用不同的模糊隶属函数处理了连续数据;然后把加权和模糊结合起 来,提出了两种新的方法实现了模糊加权关联规则:把项集的模糊数综合为权 值的方法和Fuzzy WedApriori算法,并在流程企业中有效应用。 鉴于实时数据库中数据点有时间戳的优势,在现有的研究基础上,从两个 角度发展了时间序列模式发现,首先采用两种算法:TimeSeq- Apriori算法和 TimeSeq PrefixSpan算法分析了具有时间间隔的时间序列分析;然后提出了时间 序列拓扑的思想,并根据时序数据库构造了FTP-图,采用FFP-图连接、候选TP 图剪枝和采用哈希树的候选TP-图计数方法,编制了FrequentTimePattem Graph 算法有效地挖掘出频繁模式图的时间序列,为企业设备运行时决策过程提供了 理论依据。 采用加权聚类方法对关键设备的大量历史数据进行分析,建立了设备正常 情况的聚类模型,提出了紧密(离核)指数、离群指数和综合指数的计算方法, 实现了对设备有效的实时监控。蚁群算法是一种比较先进的模拟进化算法,采 用蚁群算法改进了聚类分析。并根据蚁群算法中的pij(t)综合考虑了簇团内数据 点个数和到簇团内中心点距离的特点,创造性提出一种新的离群数据挖掘的方 法,得到较好的效果。 关键词:数据仓库,数据挖掘,ETL框架,概念模型,模糊加权关联规则,时间序列分析,时间序列拓扑,加权聚类分析,蚁群算法,离群数据挖掘,CIPS
其他文献
研制一套铝熔液恒流量自动浇注控制系统,实现精确的流量控制,是解决工艺参数对铝电磁快速连续铸轧理论研究的不利影响的关键环节。论文针对自动浇注控制系统设计中的流量模型
本文的研究工作从工程应用的角度出发,围绕着自主式移动机器人的视觉系统这个主题展开,研究涉及了摄像机标定技术(包括立体标定技术),标定后镜头畸变校正技术,立体视觉下的立
本文以人脸识别为目标,围绕着提高人脸识别的性能及其鲁棒性。主要研究了基于Gabor滤波和流形学习理论的人脸识别算法,主要完成的工作如下:(1)探讨了人脸识别技术的研究现状及其
移动Agent作为一种分布式计算技术,具有移动和自治等性质,在实践中得到日益广泛的应用。然而,由于Agent可以在不同的主机平台之间移动导致了一些新的安全问题。其中最为棘手的是
学位
人造水晶在压电技术、光学技术以及宝石装饰等方面有着广泛的应用和巨大的市场。随着技术的进步和人民生活水平的提高,人们对人造水晶的品质要求也越来越高。温度是决定水晶品
本文采用F2812设计并实现了直流伺服力矩电机数字控制系统,文中详细介绍了整个系统的软件硬件设计与实现方法。通过实验结果检验,位置的伺服精度达到了±0.018°,并对系统
并网逆变器是当前新能源研究领域的热点,三相四桥臂并网具有转换效率高、输出电能质量好以及带不平衡负载能力强,受到世界各国研究结构的广泛关注。三相四桥臂并网逆变器的优良
骨龄评分主要是对儿童青少年的骨发育进行分期、评分而得出骨发育年龄的方法,具有明确的量化概念,使得计算骨龄的精确度大大提高,目前已得到愈来愈广泛的应用,如在预测小儿成
随着科学技术的迅猛发展,对于设备和被控系统的安全性、可靠性和有效性的要求越来越高,有关复杂系统故障诊断技术的研究愈来愈受到重视,已成为国际自动控制界的热点研究方向
针对河南物华玻璃有限公司的实际需要,我们设计开发了一种新的玻璃配料微机控制系统。它采用上下位机的结构模式,以PC机作为上位机,PLC作为下位机。论文主要内容包括系统总体设