数据挖掘方法及其在电力系统故障诊断中的应用研究

被引量 : 0次 | 上传用户:lostlovestefan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是一个多学科领域,从多个学科中汲取营养。这些学科包括数据库技术、人工智能、机器学习、神经网络、统计学、模式识别、知识库系统等。它自从问世以来,引起了国际国内计算机领域、人工智能等领域的研究热潮,在各行各业的应用研究也正在兴起。 现有的数据挖掘方法都是挖掘事务数据库DB中的项ID之间的关联关系,所挖掘出来的信息反映的只是项ID之间的联系,但不能反映它们之间的量化关系,在电力系统的应用中这种量化关系是普遍存在的,它对于决策系统起着非常重要的作用。本文为此提出了一种关于多频项集量化挖掘的概念及算法,利用故障项ID的明细数据,能挖掘出各项ID之间的量化比例关系,来反映项集内部元素的频数对其它项集的影响和关系,如事务性数据库中每条事务同时包含项集的类别及其数量,重点考察那些“量化比例相差悬殊的关联项集”是否真正关联?或许它们之间根本就没有关联,而是一种巧合,这样可以解释电力系统中的一些偶然现象。 当数据库记录动态增加时,现有的数据挖掘方法面临重复多次扫描数据库,这样就会浪费计算机的系统资源。本文为此提出了一种针对大型数据库、关于多频项集、动态增量式的挖掘新算法,利用前次的挖掘结果和新增故障项ID的明细数据,只需对增加部分进行挖掘,挖掘完毕后,另外对原始数据库部分补加一次扫描,克服了其它算法对原始数据库重复扫描多遍、搜索空间过大、搜索时间长、算法效率低等缺点,是对计算机系统资源的充分优化。 针对有候选项集的关联规则的挖掘,本文提出了一种双字段互连式数据挖掘新算法,该算法只需在求1—项候选项集和2—项候选项集时,扫描原始数据库DB各1次,在求更高层次的频繁项集时,就不需要扫描原始数据库,而只需扫描上一层次的候选频繁闭项集,这样大大缩小了搜索范围,提高了算法执行效率,节约了系统资源。 针对无候选项集的关联规则的挖掘,本文将FP—T挖掘算法引入基于“树”的多层关联规则的挖掘,并将FP—T挖掘算法进行改进,通过构造一种具有特殊节点链指针的索引表,利用多概念层之间的父子关系,来实现多层频繁项集的并发数据挖掘,可挖掘出不同概念层之间的关联规则,从而可大大减少重复扫描数据库的次数,挖掘出更多的关联信息。 电力系统中的属性参数值特别多,如果都参与运算和挖掘,会影响系统程
其他文献
针对我国国有高科技企业员工持股计划改革(制)的研究缺乏统一逻辑框架这一缺陷,本文结合国有企业改革的实质、员工持股计划的基本功能、激励的内在机制、高科技企业的生产属
类风湿关节炎(Rheumatoid arthritis,RA)是一种以关节慢性炎症为主要表现的自身免疫病。其发病机制目前仍不十分清楚,目前认为细胞凋亡机制障碍是自身免疫性疾病发病原因之一
目的:探索重症高血压脑干出血的立体定向治疗。方法:采用CT导向立体定向枕部旁正中横窦下入路血肿排空治疗脑干出血13 例,男8 例,女5 例;年龄28~69 岁,平均47.6岁;中脑4 例,桥
以十六烷基三甲基溴化铵(CTAB)为乳化剂,丙烯酸(AA)为助乳化剂,甲基丙烯酸甲酯为油相,配合适量的水,构建反相(W/O)微乳液,研究了该微乳液体系的相行为。利用该微乳液体系,通
党的十八以来,党的建设和国家的发展面临着新形势和新任务。以习近平为代表的新一届中共领导人,逐渐形成了一套具有鲜明特点的权力监督思想,赋予了权力监督思想全新的时代内
本论文以国家自然科学基金项目“智能运输系统项目社会经济影响测度模型与方法”为依托,结合长春市绕城高速公路现状,对于高速公路实施匝道控制系统开展了研究,深入的探讨了
目的:观察载脂蛋白E基因敲除(ApoEKO)对小鼠行为学特征、血脂、软脑膜微循环及脑组织病理形态学的影响。方法:取11、15~20、29~41周龄的ApoEKO小鼠,按周龄随机分层分为青年模型
行业协会作为第五种经济治理机制,在经济治理中发挥愈来愈重要的作用。当前,行业协会是我国社会经济发展亟需的一种非政府组织,得到了社会广泛关注。但我国行业协会总体素质
薪酬是社会成员取得收入的一种方式,属于收入分配的重要内容,也是最敏感、最复杂的经济问题和社会问题,甚至是一个政治问题,公务员的薪酬分配更是如此。因此,如何建立起适应