基于集成学习的ICT系统故障文本多标签分类研究

来源 :华北电力大学(北京) | 被引量 : 0次 | 上传用户:Engineer7002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,信息化时代到来,电网数据体量呈爆发式增长,使得国网信息系统的负载压力不断增强。国网信息系统涉及范围广,层次复杂。而信息系统出现故障又是不可避免的,并且其带来的危害也是不可估量的。那么寻找对故障快速响应和及时处理的方法就是一项具有重要意义的工作。在人工智能技术蓬勃发展的时代,从海量数据中挖掘关键信息,可以使得信息系统故障研判技术更加智能化。国家电网ICT系统在日常工作中积累了大量的信息系统故障报修记录,这些记录大多数是非结构化的描述性的文本数据,很难利用自动化工具进行归类与分析。而且,通过观察发现,一项ICT系统故障的出现,通常有多个成因。针对ICT系统故障报告的特点,本文构建了基于集成学习算法的多标签文本分类模型,从而实现故障的辅助研判。首先从文本挖掘技术出发,抽取原因类别和故障问题描述形成多对一的因果关系。然后对中文文本进行分词,去停用词,向量化等操作。最后,采用将多标签分类算法二元关联(Binary Relevance)与集成学习算法梯度提升(Gradient Boosting)相结合的分类方法进行多标签文本分类。前者用于问题转化,将多标签问题转化为单标签问题;后者用于迭代训练,通过梯度提升提高准确率。实验表明,此方法比基于逻辑回归的二元关联算法、ML-kNN算法处理故障文本的分类效果更好。
其他文献
本研究采用调查研究和田间试验相结合的方法,以海南省菠萝主产区琼海、万宁的菠萝园为研究对象,开展了菠萝园土壤肥力调研,明确了菠萝园土壤酸化状况及营养现状。以此为基础研究了土壤改良剂硅钙钾镁肥不同施用量(0、450、900、1350、1800、2250 kg·hm-2)对土壤养分状况及台农17号菠萝养分累积、产量和品质的影响。主要结果如下:(1)调研结果表明,海南省菠萝主产区琼海和万宁的菠萝园土壤酸化
本文研究分数阶微分方程边值问题解的存在性.主要研究了三部分内容:其一,研究了一类具有非齐次边界条件的分数阶微分方程正解的存在性;二是研究了一类分数阶微分方程共振条件
《普通高中化学课程标准(2017年版)》中明确提出,高中化学课程应重视教学内容的结构化设计,提高学生对于化学的学习兴趣,促进学生学习方式的转变,培养学生的化学学科核心素养
针对当前生活污水中含有表面活性剂、秸秆和牲畜排泄物处理率不足以及生物能源需求迫切等问题,本研究在以牛粪和玉米秸秆为底物的混合发酵体系中添加不同浓度表面活性剂,研究其对混合发酵产气的影响,并采用修正后的Gompertz模型进行拟合,分析其产气潜力;在得到最优浓度之后,结合发酵过程中的产气特性、酸碱度、原料降解、酶活性及微生物特性,利用单因素方差、相关性分析等统计学手段,分析发酵过程中各指标的变化和相
维生素E(VitaminE)是一种对动植物都具有重要作用的脂溶性抗氧化剂,只能在光合生物如绿色植物和光合细菌中合成。维生素E是人和动物体中重要的营养元素,因此必须通过食物或其
现阶段,江苏省的经济增长方式仍然处于粗放型向集约型转变的状态,而其新型工业化建设过程中所面临的资源环境约束将日益趋紧,且不同地区所受的约束存在明显差异,江苏省产业发
气液两相流广泛存在于生活、工业中,其中运动界面是存在于气液两相流中重要的组成部分,气液两相流的运动,会带动界面不断运动,进而产生复杂的界面现象。捕捉到的界面的各种现象,不仅可以得到更多气液相互作用的内在机理,同时对生活和工业都有巨大的影响。如何处理两相流,进而得到相界面,主要有两种方法,一种是表面法—显示追踪法,另一种是体积法—隐式追踪法,或者是欧拉方法和拉格朗日方法。界面追踪方法中拉格朗日方法和
作为植物生长过程中不可或缺的元素,C、N、P元素的组成及分配一直是生态学研究的热点问题,研究涉及不同层次(个体、种群、群落)、不同功能群及其与环境条件之间的关系。但种
工业纯钛具有比强度高、质量轻、耐热性高以及优异的耐腐蚀性能等突出优点,使其成为优质轻型耐蚀结构材料和重要的生物医用材料。因此,如何获得具有高强度和良好塑性的钛材是
新时代基层治理承载着"党建整合"的顶层设计。苏州市凭借经济发达镇的综合改革,形成了"党建整合"+"社会整合"的"双重并轨"治理模式。这一模式依托党建整合,引领组织、联动、