电力变压器缺陷文本信息数据挖掘研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:auroragame_luoxl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着国民经济水平的日益提升,对于电力系统运行的安全性、稳定性、可靠性等提出了更高的要求。各类电力设备在工作过程中可能出现各种缺陷,如果无法及时发现和消除缺陷,将危及系统正常运行。其中,变压器作为输变电系统的关键环节,其健康稳定运行对电力供应至关重要。但是实际运行中的许多变压器,由于运行年限较长,会出现老化、漏油等缺陷,因而需要进行常规巡检。电力设备缺陷记录是由运维人员在巡检过程中对于出现缺陷情况的电力设备的记录和描述,充分挖掘电力设备缺陷记录中的信息,可以对电力设备缺陷进行准确的分类与统计,帮助运维人员定位缺陷部位、判断缺陷类型,并根据已有的缺陷记录参考可以实施的消缺方法,有利于设备缺陷的快速消除,提高电力系统运行的可靠性。同时为电力行业的智能辅助决策研究提供补充。随着电力大数据这一概念的提出和自然语言处理技术的进步,各类结构化数据逐渐得到充分的挖掘,但由于电力缺陷文本是由运维人员手工记录,属于非结构化信息,目前还并未得到充分的利用。对缺陷文本的分类统计工作往往由人工完成,受限于分类人员的知识和经验,分类往往具有主观性,且效率较低。采用智能文本分类方法对缺陷文本进行分类统计,提高了分类的效率,节省了人工出力,还能够提升缺陷分类的准确性。此外,在对缺陷进行分类定级和消缺处理后,将已有的缺陷记录存储进知识图谱数据库,在新增缺陷时,可以在知识图谱数据库中检索历史缺陷记录中的相似情景或同一缺陷部件,从而借鉴已有案例,参考曾经的处理方法做出消缺安排,有助于帮助经验不足的运维人员做出正确判断。同时,知识图谱数据库将知识中的关键信息抽取出来进行展示,可以直观展现某一部件的历史缺陷情况及消缺方法,对于电力工作人员学习和把握电力设备缺陷知识具有重要指导作用。此外,知识图谱数据库还可以对新增缺陷记录进行检错处理,筛出错误或表述不清的缺陷记录,输出规范化表达,有助于电力大数据的规范化管理。因此,本文以电力变压器缺陷文本为研究对象,采用自然语言处理方法对其进行预处理、文本分类和知识图谱实现,实现了缺陷记录的准确分类、可视化以及错误检索,具体工作及成果如下:1.针对电力变压器缺陷文本为非结构化数据这一问题,在分析大量缺陷文本的基础上,运用自然语言处理技术对其进行一系列处理。采用基于隐马尔科夫模型的jieba分词工具对其进行分词、去停用词操作,将大段非结构化文本转化为关键词的形式。然后采用分布式表示对关键词进行向量化处理,将词语训练为计算机可以理解的分布式词向量,并基于Python软件进行了实现。2.由于当前电力缺陷文本分类往往由人工完成,不仅浪费时间和精力,更容易受分类人员主观判断和经验的影响。因此本文构建了缺陷自动分类定级模型,能够准确提取缺陷描述文本全局特征和局部特征,根据文本描述对缺陷进行准确的分类定级。采用南方电网公司2808条电力变压器缺陷记录进行训练与测试,引入了评价指标对分类效果进行计算,证明了分类模型的有效性。3.当前缺陷记录以文字的形式记录在缺陷记录表中,文字记录无法直观的体现缺陷位置的结构情况、对应的缺陷情况以及消缺方法。本文基于Neo4j软件构建了电力变压器缺陷记录知识图谱,将变压器缺陷记录经知识抽取、知识融合、知识加工后,以图数据库的形式存储,既提取了变压器内部结构和部件之间的关联关系,又直观的表现出了各部件实体与缺陷情况之间的对应关系,在某一部件出现缺陷时,可以直接搜索到其数据库中已有的历史缺陷情况描述及对应消缺方法,进而充分挖掘历史信息,为检修人员提供参考。此外,考虑到缺陷记录由手工记录,可能会出现漏记或错记,本文提出了一种图搜索的缺陷记录检错方法,对缺陷实体缺失、缺陷情况缺失等多种错误情况进行过滤,并输出完整准确的规范化表达。
其他文献
分子对接是在药物发现过程中一种被广泛使用的计算方法。它通过计算机模拟的方式在受体蛋白质的结合位点中对类药小分子进行姿态定位、评分、排名,以选择出优先用于后续实验测试的化合物,这一过筛选过程将极大地提高后续实验的成功率从而减少时间和经济成本,因此计算机模拟分子对接在药物设计与研发流程中作用重大。在新药研发过程中,对某一特定受体可能需要在数十亿类药小分子中搜索较优的小分子及其与受体蛋白结合的姿态。因此
学位
开源代码平台为科研人员提供了分享和交流代码的环境,近几年,深度学习在自然语言处理、计算机视觉、生物计算等科研领域取得了很大成功,越来越多的深度学习模型和代码在开源平台分享。针对特定问题,研究人员有必要查找相关解决方案,将可复用代码进行对比和性能分析,但现有系统在代码检索和对比方面很少关注算法描述中的专业词汇、函数调用结构等技术特征。为此,本课题改进了基于通用文本的关键词抽取方法,更好地融入反映代码
学位
在现实世界的光照环境下,许多材质有着高频变化的外观光泽闪烁现象。这种现象的成因在于:物体表面上无数微观结构中的一部分形成了完美镜面反射或折射,将尖锐的强烈光源入射到这些微观结构位置上的光线所携带的能量较大比例地散射到观察位置,被人眼观察到。在高度真实感渲染领域里,高精细程度的表观细节材质模型对于提升场景的真实感起到至关重要的作用。传统的材质模型容易使画面变得“油腻”、单调或亮度不正确。而优秀的金属
学位
以群组形式组织和参与活动成为当前移动社交应用的流行趋势,推荐系统的关注点也从面向个体的“个性化”扩展到面向群组的“共识化”。群组成员偏好聚合大多采用预定义的固定策略,例如均值聚合、最小痛苦聚合、最大满意聚合等,这些策略很难捕捉到复杂而动态的群组决策过程,对于近期提出的神经网络模型,成员之间的相互影响及动态的决策过程很难形成输入并通过训练进行表征。而为群组做出推荐时,如何能捕捉到用户的行为序列模式和
学位
文字自诞生起就承载着传递信息的责任。随着互联网技术与移动技术的迅速发展,存储在计算机上的信息以指数级别爆炸增长。文本作为信息的载体也因此增长迅速。对于计算机而言,存储与利用自然场景中的信息是以红绿蓝为基础元素的图片。令计算机自动识别图片中的文本信息有着广泛的应用意义,如自动驾驶、票据识别、人机交互等。近几年来,效果最好的模型大都是基于视觉语义的模型,这类方法通常先使用一个特征提取器将二维的图片提取
学位
<正> 贵刊1991年第1期第52页刊登于克俊同志撰写的"头痛饮治疗多种头痛81例观察"一文,我读后用此方法(川芎40g,当归、白芷、防风各10g,蜈蚣1条。前4味水煎两次兑匀,蜈蚣研细末,分两次用煎剂冲眼,每日1剂,12日为1疗程)治疗血管神经性头痛10例,疗效满意,特向贵刊作以汇报。 10例患者中男3例,女7例,年龄15~35岁,头痛史最长5年,最短1周,多方就医,均诊断为血管神经性头痛。经本
期刊
图分类是图挖掘领域的重要研究方向之一,被广泛应用于许多实际领域。现实世界中的常见数据,如社交网络、城市交通网络、化学分子网络等,通常可以表示为图结构。基于图结构数据的分类任务在生活中有诸多应用,如判断化学分子结构的理化特征,将蛋白质分子结构用于新药发现等。因此,利用现有神经网络模型实现准确图分类具有重要意义。近年来,图神经网络在节点分类和链接预测等方面取得了很好的进展。在图中,除节点包含大量特征信
学位
以视频监控为基础搭建的感知系统和网络每天都会产生海量的视频数据,对视频内容的理解和分析在民生、安防、交通、娱乐等领域都具有重要的应用价值。在视频内容理解和分析研究中,基于自然语言的视频事件检索是重要的研究内容之一。基于自然语言的视频事件检索是指以自然语言语句作为查询条件,从视频中查找出与该语句相符的视频片段。由于涉及计算成本高昂的视频理解和文本理解,基于自然语言的视频事件检索不仅需要在不同的场景下
学位
近年来,随着网络技术的发展,监控系统在各行各业的应用越来越广泛,像通信,交通,安全等领域,天网系统更是走进了大街小巷。而随着公共安全意识的提高,监控摄像头大量用于公共安全领域,像地铁站,高铁站等场合,对于公共安全领域来说,理解视频中人的行为对于及时发现公共场景中可能发生的异常事件具有重要的意义。现如今,监控摄像头大量用于考试场合,像中考、高考等重要考试在考场中都会有监控摄像头辅助监考老师进行监考,
学位
使用投影仪将虚拟场景投影到真实鱼缸的后壁,可以构建一个融合虚拟海洋世界和真实鱼缸环境的混合现实(Mixed Reality,MR)鱼缸,研究表明,其有助于吸引孤独症谱系障碍(Autistic Spectrum Disorder,ASD)儿童的注意力,ASD儿童在此系统中可以比较好的集中注意力,与海洋世界和游动的虚拟海洋生物交互,进行认知课程的学习。其中,可以通过使海洋生物模仿并跟随真实鱼类运动以增
学位