基于聚类集成的工业数据智能划分方法的研究与应用

来源 :济南大学 | 被引量 : 0次 | 上传用户:easy69
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
工业是产生大数据的重要源头,工业数据的分析有助于提高信息化和工业化的融合水平,实现数据智能分析,同时工业数据的处理也面临着诸多挑战。本文进行分析的工业数据是排污设备运行过程中的主要用电数据,包含数据集结构不规律、数据密度分布不均匀以及存在噪声点的问题。根据需求要采用人工智能的分析方法,通过对这些用电数据进行分析实现设备运行状态的划分,然而这些是无标签数据,无法进行分类,因此选择将其作为一个聚类任务进行实现。在对工业数据进行分析时大多会采用单一的聚类算法,但是每个算法的性能不同,针对的数据结构和密度分布也不同,并不能保证获得的数据划分结果是高质量的。为了有效的解决以上问题,在本文中设计了基于密度的选择性聚类集成方法,以实现数据集更为高效的分析划分。其中主要包含了以下的研究创新:首先在生成聚类成员阶段,使用DBSCAN、DPC以及OPTICS三种基于密度的弱聚类算法对数据集进行初始分析,经过多次参数预处理,得到质量较好的初步基聚类结果,以实现对任意结构、任意分布密度的数据集进行有效的划分;对于生成的协关联矩阵,为去除部分数据点对之间的相似度来排除噪声对划分结果的负面影响,通过设定阈值将频率较低的元素值进行多级删除得到多个重构矩阵,同时还根据路径问题设定了基于鲁棒性的极大极小相似度,通过分析数据点对之间路径中数据点的权重,更加准确的分析数据点对之间的相似度;此外,根据集群内数据点之间的紧密性以及集群之间的分离性,设计了基于鲁棒性的内部有效性指标,将使用凝聚式层次聚类方法对多个重构矩阵分析得到的多个划分结果进行分析选择,选择内部有效性指标值最小的成员划分结果作为最终的数据分析结果。本文以大气污染工况用电监控系统(PEMS)中的工业排污设备运行状态的分析判定为应用背景进行研究。在工业的生产发展过程中会产生很多污染物,并且根据规定需要通过排污设备进行治理,而对排污状况是否达标进行监控是十分重要的。本文提出并设计了基于鲁棒性的排污设备运行状况监测系统应用,应用内容主要由数据初始分析、数据结果一致性融合划分、最终结果标签的输出等几部分组成。基于聚类集成的思想,通过对数据集初始分析处理、将基聚类结果进行一致性融合以及通过基于鲁棒性的内部有效性指标选择最终输出结果等方法,由此得到质量更好的、准确性更高的数据划分结果。本文通过在多个数据集进行实验测试,并且与多个聚类集成方法进行效果的评估对比,证明了本文方法的先进性和有效性。通过将研究方法与工业数据集成到排污设备运行状况监测系统的应用中,能够让用户看到可视化的数据分析的结果标签,实现工业排污设备运行状态的有效监控,及时对工业的排污进行管控调整以实现排污达标。
其他文献
当前我国流动人口数量急剧增多、流动规模不断扩大,其中流动女性占总流动人口的半壁江山,因此,对流动女性的相关问题进行研究具有重要意义。流动女性的就业问题及就业质量水平是关系着该群体在流入地生存和发展的关键因素。自2013年以来,我国生育政策不断调整,从单独二孩政策到全面二孩政策再到如今的三孩生育政策,生育政策的放开承载着国家对提高生育率的殷切希望。然而,对于流动女性而言,她们在流入地处于“女性”和“
学位
在“互联网+”浪潮背景下,互联网与餐饮相结合,诞生了以通信技术和互联网平台为基础的外卖平台,激发了传统餐饮行业的生机活力,并催生了一种新兴职业群体——外卖骑手,成为了社会发展不可或缺的一部分。然而,外卖骑手的劳动过程存在着“数字”压力。开展对外卖骑手“数字”压力的研究,对于丰富网络社会学视角下平台经济从业者的相关研究,促进外卖行业健康发展,具有重要的理论意义和现实价值。本文基于劳动过程理论视角,通
学位
二次元文化作为一种典型的网络亚文化逐渐兴起于网络,对社会经济和文化产生了不容忽视的影响,喜爱二次元文化的青年御宅族群体规模也逐渐庞大。本文即以青年御宅族群体为主要研究对象,从社会学理论视角,对青年御宅族群体的网络互动生成、互动行为及其互动情感做出详细探讨与研究。通过线上参与式观察与深度访谈,选取哔哩哔哩网站与半次元文化社区两个典型的御宅族群体的交互平台,进入相关创作与交流空间,对其中御宅族群体的网
学位
窃电问题是制约我国电网发展的主要困境,是窃电者以不缴或少缴电费为目的,非法占用电能的行为。不仅会损害供电公司利益,影响电网运行稳定,甚至还会危害公众安全。尤其是农村地区,由于用电用户相对分散,这给工作人员防窃电管理也提出更高的要求。在此背景下,供电公司有必要加强引进先进的负荷控制系统,利用信息化、数字化和网络化管理手段实现智能化、自动化的防窃电管理。为此,从窃电方法、电能计量原理出发,以提高地区电
学位
铝是地壳上含量最为丰富的元素之一,在加里东晚期-海西早期的地壳运动过程中,贵州省所在的地区出现了大陆裂谷盆地,随后所衍生出的黔中协海盆、凯里海湾和渝南-黔北半封闭泻湖海湾地区得益于湿热的地理环境,在早古生代-晚古生代时期各类岩石的风化剥蚀使得铝得到了富集,并在如今的贵州省形成了资源丰富的铝土矿。中新生代时期的印支燕山-喜山运动导致了贵州地区的大陆裂谷盆地转变为山间盆地,铝土矿无法再形成,但当前贵州
期刊
慈善组织是慈善事业发展的活力源泉,是衡量一个国家和地区慈善事业发展水平的重要指标。就大陆而言,近年来慈善组织发展的环境日渐宽松,政府也不断扶持慈善组织的发展,尤其是《慈善法》颁布后,慈善组织的准入门槛不断降低,给民间慈善组织的发展提供了发展的机会。在县域社会中,民间慈善组织既有量的增加,也有质的提高,特别是在募捐方面也有很多创意,形成了一套完整有效的募捐策略,也取得较好的效果。本文以A县的S微公益
学位
随着经济发展和现代化水平的提高,越来越多的女性选择进入劳动力市场和男性共同分担家庭中的经济压力,两性之间在公共领域的界限被打破。然而在家庭领域,性别界限依然存在,两性家务劳动承担不均导致家庭矛盾,影响婚姻质量。基于中国家庭追踪调查2018年的数据,本研究在综合社会交换和工作—家庭角色冲突等理论知识的基础上,通过对相关文献资料进行梳理,阐释家务劳动承担、婚姻质量、工作满意度的概念内涵。以城市青年为研
学位
随着城市化进程的快速发展,农村地区传统家庭结构不断发生嬗变,老年人在家庭中所发挥的角色功能不断淡化,正处于家庭价值创造及负担挤压的边缘。同时,随着农村老年人年龄的不断增长,其身体机能逐渐衰老,劳动能力逐渐弱化。在村落公共社交圈中,他们处于“沉默”和“隐形”的参与边缘;与城市老年人相比,农村老年人缺乏健全的社会保障支持,养老保障各方面也有所欠缺。因此,农村老年人的孤独感与价值剥夺感与日俱增,形成了心
学位
随着物联网、云计算、大数据的发展,最优化问题出现在生产实践、科学研究和社会活动的众多领域中。最常见的解决方法是利用目标函数的导数通过多次迭代来求解问题。然而随着问题变得越来越复杂,很多现实问题趋向于黑盒问题的特征,在面对此类问题时传统的数学优化方法由于过于依赖问题的数学特性而失败。因此,如何智能化解决最优化问题成为人工智能领域发展的一大重要难题。启发式算法是进化计算涉及到最优化问题的一个子域,它把
学位
目前,随着互联网的发展以及技术的创新,个体之间相互联系、相互影响不断加强,形成了规模庞大的动态网络,这些动态网络可以被抽象为动态图。为了对动态网络进行分析,就需要一种行之有效的方法,如社区演化分析方法。基于社区演化,可以有效预测社区未来变化,揭示社区发展的规律,从而有效推动社区的发展。为有效进行社区演化分析,需要对社区结构在不同时间快照的状态进行跟踪。但是目前已有的针对动态网络进行社区演化分析的研
学位