变电站一次设备故障知识图谱构建方法研究

来源 :东北电力大学 | 被引量 : 0次 | 上传用户:jscumt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着特高压电网和新能源的快速发展,变电站一次设备故障处理任务要求工作人员具备更高的业务能力。但目前该任务主要依赖员工的知识储备和长期经验积累,需要反复记忆和查询大量文本形式的知识。由于缺乏高效精准的电力领域知识抽取、组织与管理技术,存在故障处置的精准性和规范性难以得到保证的问题。针对该问题,提出了变电站一次设备故障知识图谱构建方法。该方法以一次设备故障处理相关资料为研究对象,通过自然语言处理、深度学习等技术对故障语料中蕴含的实体及关系进行识别与抽取,进而构建变电站一次设备故障知识图谱。该图谱包含了一次设备拓扑关系、设备故障数据、故障处理方法等信息,通过对这些信息的整合和归纳,可为工程师提供全面准确的故障诊断和处理方案。该研究面向三个问题:(1)如何从非结构化的一次设备故障文本中提取专业词汇,并构建包含嵌入信息的领域词典?(2)如何从一次设备故障文本中自动准确地识别电力实体片段及类型,以将其作为知识图谱的节点?(3)如何对实体间的关系进行抽取,并构建变电站一次设备故障知识图谱?针对这三个问题,开展了以下三个研究内容:(1)对一次设备故障语料进行文本清洗后,利用N-Gram模型、信息熵和互信息对专业词汇进行挖掘,并利用词嵌入模型训练得到领域嵌入词典;(2)根据实体识别思想提出BERT-FLAT-CRF模型,通过结合领域嵌入词典信息和引入相对位置编码,实现对一次设备故障文本中实体及类型的识别。(3)在完成实体识别任务的基础上,提出基于BiLSTM-ATT的故障知识图谱构建方法,实现变电站一次设备故障知识图谱的构建。采用一次设备故障维修手册、故障排除问答等相关语料为实验数据,对整体研究方法进行有效性验证。在构建一次设备领域嵌入词典后,利用BERT-FLAT-CRF模型结合词典信息对实体进行识别,并开展对比实验。实验结果表明,该模型对于一次设备故障语料中的实体识别效果最优,精确率、召回率和F1值分别达到了86.2%、81.11%和83.58%。然后,利用BiLSTM-ATT模型对实体间关系进行抽取,并与其他三种模型进行对比实验。实验结果显示,该模型在一次设备领域语料的关系抽取任务中,各项指标均优于其他模型。因此,该模型能够自动准确地提取实体之间的关系,从而构建变电站一次设备故障知识图谱。
其他文献
<正>由中央和地方财政平衡关系说起1994年迄今,我国的财政管理体制一直以分税制冠名。在当下中国,每当提及现行财政管理体制,总能听到不少微词。不过,只要稍加过滤和分析,就会发现,由于观察问题的角度不同(也许是知识背景的差异所致),人们围绕问题所做出的原因归结多不得要领,很少击中要害。社会上流传甚广的关于“中央政府集中了60%的收入,地方政府却承担80%的职能”的说法,便是一个颇具代表性的例子。这就
期刊
细菌性奶牛乳房炎是由多种病原微生物感染引起奶牛乳房炎症的一种常见多发性疾病。感染后的病牛主要表现为乳房肿胀发热、泌乳量下降及乳汁败坏等症状。该病发病率高、流行范围广、治疗成本高且治疗难度大,给奶牛业造成了巨大的经济损失。该病通常采用青霉素、卡那霉素、红霉素、四环素、链霉素和磺胺类药物等抗生素进行治疗,特别在发病初期或者急性感染时,治疗效果较好。养殖户应采取以“预防为主,治疗为辅”的防控原则,及时对
期刊
为探究梯度结构对双组份纺粘水刺超细纤维非织造布透气性能的影响,采用三步法工艺制备了系列梯度结构双组份纺粘水刺超细纤维非织造布并测试其特征参数;利用Geodict软件建立了梯度结构双组份纺粘水刺超细纤维非织造布的三维纤维分布模型,分析了梯度结构对超细纤维非织造布的流速、流线和流场压力的影响,预测了其透气系数,结果分别为3544.07 mDarcy,2527.90 m Darcy,2320.68 m
期刊
随着我国工业化水平的不断提高,对诸如航空、航天、汽车、光学等领域的零部件精度有更高需求,进而对机床加工精度提出了更高的要求。因此,在精密加工领域,机床误差补偿成为了一项重要的研究方向,期望通过误差补偿经济有效地提高机床加工精度。而误差补偿实现的基础是建立一个高精度、强鲁棒性的误差预测模型。本文以三轴数控实验平台为研究对象,探究数控机床热误差产生的原因以及机床热变形的机理,对不同温度变化条件下的数控
学位
报纸
学位
肺炎克雷伯菌(Klebsiella pneumoniae,KP)是一种人畜共患病原菌,可引发人和动物的肺炎、败血症等疾病。该菌在人医上研究较多,而动物源报道相对较少。KP在奶牛群中主要引起奶牛乳房炎而给养殖业造成巨大经济损失。随着KP分离率的不断上升、毒性的增强以及耐药性的不断产生,对该菌进行致病性、分子流行性特征与溯源研究迫在眉睫。本研究拟通过对湖北地区5个牛场进行KP的流行病学调查、毒力特征、
学位
随着国家电网公司信息化建设的快速发展,公司通信设备数量不断增加,对于电力通信设备故障的处置难度也在不断提高。若能将积累的历史故障文本数据加以组织和利用,将电力通信设备当中发生的故障信息进行平台化整合,建立电力通信设备故障知识图谱,可以较好的解决电力通信设备故障的处置问题。因此,本文针对电力通信设备故障知识图谱构建的相关技术和电力通信设备故障智能诊断方法开展研究,主要研究内容如下:(1)针对电力通信
学位
程式语是以整体形式高频出现的、词语连续或不连续的多词单位,一般具有明确的意义和功能。研究程式语的识别和分类对于提高文本表达的规范性、语义挖掘的准确性、机器翻译的地道性以及智能问答的逻辑性等,都具有重要促进作用。然而,传统研究主要依靠语言学家人工地对程式语进行识别和分类,成本高、效率低。近年来,一些研究者开始提出基于统计机器学习的程式语自动识别和分类方法,但是这些方法也往往不能在效率及准确性之间取得
学位
随着身份认证需求的不断增加,虹膜识别系统逐渐应用于各种场景。虹膜分割作为虹膜识别的一个环节,其准确率直接影响识别系统的精度,其效率直接影响识别系统的性能。本文对虹膜分割中不同场景下的关键问题展开研究。针对不同问题提出相应的虹膜分割方法,主要研究内容如下:(1)面向多类型采集设备的虹膜分割:在办公地点众多的场景中,虹膜图像采集设备种类繁多,不同相机传感器拍摄的虹膜图像在分辨率、图像质量和灰度等级方面
学位