电力设备非结构化数据挖掘的应用研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:colossus198201
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国电网智能化、信息化的建设与发展,电网中的电力设备通过长期的运维、检修和试验,积累了大量的各种形式的电力数据。其中,相比于主要以数值形式存储的结构化数据而言,非结构化数据主要以文本、图像、音频、视频等形式存在,具有更广泛的应用场景和更高的价值密度,但由于不能被计算机直接识别和处理,其挖掘过程也存在更多的难点。为此,本文以电力设备的两类典型的非结构化数据——文本数据和图像数据为例,针对这两类数据在电力设备的缺陷评估、缺陷处理、状态识别等方面的挖掘应用进行研究,并取得如下成果:1.针对目前大量电力设备缺陷需要人工进行缺陷等级分类的情况,提出了基于卷积神经网络的电力设备缺陷记录文本自动分类方法。采用基于词向量的文本表示技术和基于卷积神经网络的文本分类技术构建分类模型,并针对电力设备文本数据的特点对模型结构进行适应性改进,提高了模型的分类准确率和效率,保证缺陷能被及时处理和上报;2.由于电力设备缺陷的复杂性和多变性,很多缺陷处理决策往往缺乏参考依据,针对这一问题提出了基于知识图谱技术的电力设备缺陷记录文本检索方法。基于电力设备缺陷知识图谱的自动构建和图搜索技术,实现了通过当前缺陷记录文本对相似历史缺陷记录文本的准确检索,从而可将历史缺陷的处理方式作为当前缺陷处理的有效参考,为知识和经验相对不足的缺陷处理人员提供缺陷处理的有效指导;3.针对电力设备巡检图像中各种电力部件的类别和位置识别问题,提出了基于改进Faster R-CNN模型的电力设备图像目标检测方法。以主变压器的巡检图像为例,考虑了主变压器各个部件的尺寸差异较大以及部件位置之间存在关联性的特点,对Faster R-CNN模型的结构进行了改进,有效提高了主变压器多部件类别和位置识别的准确率,为识别不同部件的缺陷和故障现象奠定了基础;4.为解决电力设备状态的自动识别算法效果受到图像训练样本限制的问题,提出了结合三维空间信息的电力设备图像数据扩充方法。以隔离开关的巡检图像为例,结合隔离开关三维形状的先验知识,采用透视投影变换、三维旋转变换等方法,扩充了不同拍摄角度下的隔离开关图像训练样本,相比于传统的图像数据扩充方法,对隔离开关位置和分合状态的识别效果有更显著的提升。
其他文献
目的研究大黄素对大鼠重症急性胰腺炎severeacutepancreatifis,SAP)合并心肌损伤的作用机制。方法32只sD大鼠随机分为假手术组(A组,8只),模型组(B组,8只),大黄素治疗组(C组,8只),大黄素加五
“撤扩并”后,区级机关不再存在,新组建的乡镇区域扩大,管理职权加强了。相应地,乡镇档案工作规模将扩大,任务也日趋繁重。一方面,乡镇档案门类、数量会不断增多;另一方面,乡
制造业是现代经济和工业发展的基石性产业,在建立一国核心产业比较优势、攀升全球价值链高端、强化国际竞争力等方面发挥关键性作用。自加入世界贸易组织以来,国内人口红利带来的低廉的劳动力成本使得中国在日益全球化的世界分工和贸易中打造了强大的竞争优势,中国日渐成为世界制造业贸易大国。但我国过去所采用的通过增加投资、劳动投入来增加产量的外延型经济增长方式对环境造成了大量压力,低成本的人力优势也随着人均生活水平
摘要:针对我校学生均多数为护理专业学生,其需要较强的实际动手能力,以及将来参与临床工作时应当实用、够用的特点,角色扮演法使学生既成为践行者也成为观察者,有助于其在教与学、学与做的知与行中牢固掌握知识,提高能力。  关键词:人体解剖学;角色扮演法;效果;问题  中图分类号:G642.0 文献标志码:B 文章编号:1674-9324(2016)42-0255-02   人体解剖学是一门形态科学
陈羽作为中唐时期的一位中小诗人,与韩愈、戴叔伦等重要诗人有过交往。与同时代的诗人一样,陈羽感受着那动荡不安的时代氛围,在诗中也较多反映自己惆怅迷惘的心理。就其诗歌
一、当前乡镇文书立卷中存在的问题 1.立卷不符合要求,主要表现为:文件材料收集不齐全,不完整,应归档文件的种类、数量、质量达不到规范要求,无分类方案,组卷方法不够科学,前
通过梳理以往的职业能力研究和相关的心理学理论基础,试图理清职业能力的内涵和结构,未来研究希望以计算机专业的职业能力为落脚点,确定计算机专业的职业能力的内涵和结构,量化计
目的探讨用鲎试剂检查醒脑静注射液细菌内毒素方法。方法根据《中国药典》2005年版Ⅱ部收载的细菌内毒素检查法的要求进行实验。结果醒脑静注射液经10倍稀释时不干扰鲎试剂与
5.12汶川地震诱发了大量崩塌滑坡体,为震后泥石流的爆发提供了丰富的松散固体物质,震后大多拦挡坝被淤满,防治效果不甚理想,其根本原因为对特殊的震后泥石流物源起动机理认识不深刻,工程设计所需的泥石流一次冲出量及动储量仍采用震前的常规计算方法,导致计算结果产生较大偏差。迄今为止,汶川地震已过去十年有余,震后泥石流以及雨季水流作用,使得沟道物源已逐渐成为了震后泥石流爆发的主要物源之一。“宽缓”型沟道因沟
随着互联网的快速发展,网络链路上数据传输速率不断提升,网络链路层对路由器数据报文分发速率的要求也越来越高。路由器数据报文分发的核心是模糊匹配算法,高效实现模糊匹配