融合BERT、双向长短记忆网络和条件随机场的电力设备缺陷文本实体抽取

来源 :电网技术 | 被引量 : 0次 | 上传用户:napone
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能电网建设的全面展开,产生了大量的与设备缺陷相关的电力设备缺陷文本,蕴含着故障类型、故障原因及设备消缺方法等关键信息,是电力领域的研究热点。但缺陷文本存在着体量大、多源异构和内容杂乱冗余的问题,目前缺乏对其进行高效整合利用的方法。针对以上问题,该文基于BERT(bidirectional encoder representation from transformers)模型对命名实体抽取技术展开研究。一方面,增加了双向长短期记忆(bi-directional long short-term memory, Bi-LSTM)层进一步提取文本语义信息;另一方面,采用条件随机场(conditional random field,CRF)替换了BERT的输出层,克服了预测标签的局部最优问题。最后融合以上两种策略提出了改进BERT算法,即将BERT与双向长短记忆网络和条件随机场相结合,实现了缺陷文本的命名实体抽取。实验结果表明,改进BERT算法在7类实体上均取得了较高的F1值。与BERT相比,实体抽取的总体精确度和召回率分别提升了0.94%和0.95%。
其他文献
自党的十八大以来,我国不断加深对中华优秀传统文化的重视。习近平同志认为,中华优秀传统文化是我们最深厚的文化软实力,也是中国特色社会主义植根的文化沃土。可见对优秀的传统文化的传承不仅是如今社会发展的政策要求,更为中华复兴提供了不竭的动力。优秀的传统文化在众多音乐形式中扮演着极为重要的角色。随着时代的发展,融合了中华优秀诗词文化的艺术歌曲越来越受到人们的重视,并因此涌现出大量的艺术歌曲作品。本文通过对
常德市相关政府部分向来重视群众体育工作的开展,群众体育工作的开展离不开体育公共服务信息的传播与发散,因此对常德市体育公共服务信息的实证研究可以为政府部门提供实证数据的决策咨询,可以为后续体育信息化工作的开展提供理论支撑。本研究采用文献资料法、专家访谈法和问卷调查法对常德市体育公共服务信息的供给和需求进行分析。研究发现常德市体育公共服务信息的主要供给对象是学生以及体质内人士;供给内容主要体育运动锻炼
期刊
宅基地使用权流转,对促进农业的规模和集约经营,对农村现代化发展具有意义。改革开放后,我国形成了中国特色的宅基地使用权流转制度。寿县小甸镇地处江淮地区,在宅基地使用权流转中取得了较好的成绩,但农户宅基地使用权流转在新时代新形势下出现什么问题?这些问题该如何解决?这些问题是当前乡村建设、乡村振兴需要回答的问题。本文对寿县小甸镇宅基地使用权流转进行调查研究,在客观描述其现状的基础上,总结其现有经验、分析
中国人身险行业过去实现高增长的动力是什么?为回答这一问题,本文构建包含需求侧和供给侧两方面因素的面板向量自回归模型,重点考察经济发展水平、风险水平、风险认知和销售能力对我国人身保险消费的影响。结果表明,经济发展水平、风险水平和风险认知对人身保险消费具有长期促进作用,而销售能力对人身保险消费具有短期拉动作用。经过方差预测分解可知,我国人身保险消费具有明显的“供给侧主导”特征,也即我国的人身保险消费主
空中乘务员的服务意识决定着他们在工作当中为乘客所提供的服务行为和服务态度,更决定着航空公司的整体形象。因此,加强对空中乘务员服务意识的培养,不仅能够提升航空公司服务的质量,还能够为航空公司带来更大的经济效益。本文主要阐述了空中乘务员应当具备的几点服务意识,并针对性地提出了培养空中乘务员服务意识的几点策略。
期刊
2022年昆士兰临床指南发布了小于胎龄新生儿(SGA)临床指南,对其定义分类、生长与健康、评估与诊断、支持性护理、出院随访等方面进行了更新和修订。本文主要针对2022版指南更新内容进行解读,以更好地指导儿科临床医师进行小于胎龄新生儿管理,对降低5岁以下围儿死亡提供借鉴。
2020年初,新冠肺炎疫情肆虐全球。疫情之下,世界各国的经济活动、民众生活甚至政治安全都受到了前所未有的挑战。与2003年非典肺炎疫情时期相比,现阶段我国已经建立了更加完善的疫情信息公布机制,在重大突发事件发生时,疫情信息一直是备受投资者关注的内容。因此,疫情信息公布的股票市场反应是值得探讨的问题。基于上述背景,本文归纳和梳理了行为金融学中相关的理论,学习和研究了目前国内外相关领域的研究现状。在此
为有效预测河流水质变化趋势,持续改善水环境质量,充分利用水质序列的时序性与多元相关性信息,构建基于灰色关联-长短时记忆网络(GRA-LSTM)水质预测模型。选择长江南京段河流型水源地进行实例研究,结果表明滑动时间窗口(d)为2,最大训练次数(MaxEpochs)为220,隐含层神经元个数(numHiddenUnits)分别为80与100时,总磷与溶解氧预测效果最佳,并将预测结果与误差反向传播神经网
在共享经济快速发展过程中,网约平台用工模式呈现出不同于传统用工模式的新特点,网约工为代表的新业态劳动者合法权益难以有效保障的问题日益凸显,对我国现行劳动法律治理体系提出了新的时代挑战。基于网约工劳动权益保障的制度困境以及网约工类型呈现形态多样化、网约工与平台之间的法律关系复杂化、平台对网约工的控制与剥削更加隐蔽化的用工特点,“非标准劳动关系”理论不仅丰富和完善了传统劳动关系理论,而且为我国网约工权