基于自然语言处理的智能操作票技术的研究

来源 :中国电气工程学报 | 被引量 : 0次 | 上传用户:rwsonny
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:近年来,随着信息技术的发展,人工智能已经成为信息时代的一个热门话题。自然语言处理(NLP)是计算机科学、人工智能和语言学的一个研究领域,主要研究计算机和人类语言之间的相互作用。该领域产生了大量的人工智能研究成果和产品,是人工智能领域的一个热点。调度操作票的智能自动生成是一项既有技术又有经验的综合性工作。本文结合自然语言处理技术和机器學习方法,基于数学理论和中文信息的MMT模型,实现了操作票内容的智能提取和操作票的自动生成。结果表明,基于中文信息的多语言机器翻译模型是进一步解决当前句法分析问题、减少歧义、提高分析水平的一种参考方法。研究结果的意义在于语法规则可以被测试,句子的语法模型结构可以进一步加工为主体,建立实用工具和模型可以提供深入的理解自然语言,语法知识基础的扩展和深入研究法语句子的意义。
  关键字:人工智能;自然语言处理;操作票
  Abstract:Inrecentyears,withthedevelopmentofinformationtechnology,artificialintelligencehasbecomeahotresearchtopicintheinformationage.Naturallanguageprocessingisafieldofcomputerscience,artificialintelligenceandlinguisticsthatfocusesontheinteractionbetweencomputerandhumanlanguage.Inthisfield,alargenumberofresearchresultsandproductsofartificialintelligencehavebeenproduced,whichisaresearchhotspotinthefieldofartificialintelligenceatpresent.Usingthetheoryofalgebraiclinguisticstobuildtheexpertsystemofsyntacticanalyzer,theMMTmodelofChineseinformationisusedintheresearch.TheresearchresultsshowthattheMMTmodelbasedonChineseisareferencemethodtofurthersolvethecurrentsyntacticanalysisproblems,reducingambiguityandanalysislevel.Thesignificanceofitsresearchresultsliesinthatitcantestgrammarrules,establishsentencegrammarmodelstructurethroughdeepprocessingofcorpus,providepracticaltoolsandmodelsfordeepunderstandingofnaturallanguage,expansionofgrammarknowledgebase,andin-depthstudyofsentenceFrenchmeaning.
  Keywords:Artificialintelligence;naturallanguageprocessing;operationticket
  1引言
  电力生产过程中经常要进行电气操作。由于电力系统开关操作失误,严重的人身和设备事故时有发生。如何让自然语言处理技术与操作票结合,让操作员方便快捷的开出合规的操作票,就是电力行业一个急需解决的问题。
  语义维度是基于自然语言处理(NLP)的句子研究的出发点和重点,是指导句子研究的语义维度。从语义维度构建句子研究框架,从语义维度对句子类型进行分类,形成句子语义类型体系。本文的研究内容包括,一个完整的语法分析操作票信息,还有通过语料库的处理,提取规则,提取的语法规则和逻辑分析,最后还有基于代数理论实现语义和语篇结构分析,建立中文文本规则匹配工具,包括现代汉语语料库加工和探索汉语语法的实际模型理论方法和工具。基于构词的中文分词方法,分词用于操作票指令,然后,通过词性标注部分词性标注对分词结果进行标记。最后,根据操作票的语法规则,实现操作票动作、对象和状态的提取。该方法不仅消除了常规提取所需的大量人工配置工作,而且提高了效率。
  2实现方法
  1. 中文分词

  中文分词的结果是识别和提取的基础操作票的内容,中文分词的目标是提高操作票文本分词的准确性,特别是没有用的词语(没有加入单词列表的词),要把其彻底的剔除。
  在采用基于词表的分词算法时,如正向最大匹配法和n-最短路径法,最大的问题之一是没有加入词典的词的分词存在固有的缺陷。一般的解决方案是添加一个没有加入词典的词模块来处理没有加入词典的词的分割。在中文分词中,没有加入词典的词的分词错误严重影响了整个分词的查全率。基于构词的汉语分词算法将汉语分词转化为汉语单词序列标记,较好地解决了没有加入词典的词的处理问题。根据单词在单词中的位置,将单词的单词位类别分为四种:单字(S)、单词前缀(B)、单词中间(M)和单词结尾(E)。
  1. 句法分析

  句法分析是在给定的语法基础上,自动识别句子中所包含的句法单位及其相互之间的关系。语法分析工具利用语法符号语言将系统获取的中文文本转化为符号语言表达式。利用符号句和中文文本句构成二部图模型,构成符号句。推理机的工作包括两个方面:一是确定语言的语法体系,即在操作指令语言中正式定义句子的语法结构;另一方面,句法分析意味着一个句子的语法结构可以自动地从一个给定的语法系统中派生出来,并且可以分析一个句子中所包含的句法单位和这些句法单位之间的关系。基于语料库的句法分析,是基于语料库提供的数据资源来分析汉语或英语句子并生成报告的过程。句法分析包括句法功能分析和句法结构分析。语法知识库的设计采用冯志伟的中文信息MMT模型来构建一本语法词典。使用初级标准现代汉语语料库中各语言块的自动分析结果作为数据集。然后再对对语料库中的所有句子进行分析和统计分析。   本文构建了一个基于MMT中文信息模型的语法知识库规则词典。多分支结构用于描述语法规则。它是一个基于规则的自底向上的集成算法。多标记识别,如汉字的170个部分可分为12类。根据这个分类系统,可以在归一化的过程中进行分析。相同和不同的汉语构词理论和实证数据。作为汉字的标记,可分为语音标记、语义标记、、汉字分类标记等。利用汉语信息的MMT模型、多树语法词典和带有部分语音标记的分词词典对语料库文本进行自动分析。
  句法分析结果可分为两组:1)成功组。2)分析故障块集合。处理部分需要人工检查,根据系统给出的分析,添加足够的词典或语法规则,直到所有的句子、段落或章节自动分析。根据句法规则,我们用递归的方法替换句子,得到句子的句法结构。该系统将现代汉语的具体词汇转化为语法和短语符号,实现汉语句子复杂特征集的操作。运用符号学理论构建语法符号学句子。本文的核心和关键技术是语法符号和句子的递归分析的融合操作。
  1. 词性标注

  语音标注部分的输入为汉语分词后的操作票文本的输出,输出为相应的语音部分。语音部分标注基于HMM实现,中文分词结果对应于观测序列(一个词对应一个观测值,一个文本对应一个观测序列),语音序列部分对应于状态序列。以“合上#5机380V脱硫工作PC端电源6275开关”为例,观测序列为{合上,#5机,380V,脱硫工作,PC端电源,6257开关},其相应的状态序列是词性{动词、名词、名词、名词、名词、名词}的一部分。其状态空间模型是{s1、s2、s3、s4 ,s5,s6} = { v,n,n,n,n},n,n}},并观察空间{o1、o2……是所有单词的非重复集合。这样就对所有的操作指令进行标注。
  1. 模型训练

  该技术需要使用训练语料库对中文分词和词性标注两种模式进行训练,使用具有代表性的训练语料库有助于提高模型的效果。利用收集到的操作票指令数据组成的训练数据,训练基于HMM的汉语分词模型。按照规则的训练数据进行处理,为后一个词词位序列根据词性标注一节中描述的参数估计方法,遍历行语句,训练语料库统计获得第一个),每个词的频率连续的词语转换数,每个单词对应的词性,每个单词的次数归一化得到π初始状态矩阵,状态转移矩阵和状态观测矩阵。遍历每一行后训练语料库,使用相邻词的转换数量,和相应数量每个词性的出现次数获得的统计数据,然后就形成初始状态矩阵,状态转移矩阵和状态观测矩阵。最后训练出操作票指令专用的分词和词性模型。
  1. 内容提取

  结合中文分词的状态序列和部分词性标注,分析了操作票文本的语法语义模型,所有的操作票语句都可以抽象为“动作+设备+初始状态+最终状态”的形式。
  1. 智能生成

  建立事实和知识规则库,应用ES推理机制,推理形成实际操作票。该机制由数据库、知识库和推理机三部分组成。其中,电站和变电站的主要接线形式及相关设备存储在数据库中,与电气名称、事实陈述和推理过程中的中间结果有关。将电气操作的知识规则存储在知识库中,利用元规则系统对这些规则进行约束、补充、选择和控制。在推理机制中,利用MMT训练模型实现自动匹配和回溯的推理控制机制,在知识库中搜索与目标任务匹配的规则,最终解决问题。
  3关键技术点
  本文开发的操作票系统在保证系统可靠性的基础上,具有开放性、通用性、灵活性和实用性的基础上,综合分析国内外现有的操作票系统,结合实地调查收集用户需求,提出使用面向对象的、跨平台的编程技术相结合的理论专家系统,开发一套具有良好的开放性、通用性、灵活性和实用性的智能操作票专家系统的设计思想和设计一套全面和有效的解决方案。
  由于操作票的生成过程是一个需要大量知识和经验推理的過程,很难建立精确的数学模型,因此传统的数学分析方法显然不适合该系统。专家系统是一种弱解方法,适用于解决经验问题和逻辑问题。因此,本文从机器学习和自然语言处理的角度出发,机器可以学习理解操作票指令的相关内容,然后将理解结果训练成模型,提供操作票的内容提取和智能生成。
  4结论
  智能性:利用专家系统理论,建立自动开票模型和错误检查模型。本系统具有智能开票和纠错功能。系统还可以智能识别各种线路和设备的各种运行状态。
  通用性:本文根据总体思路设计了专家数据库。该系统通过提供用户友好的维护工具和增加专家数据库的知识,可以满足用户的开票要求。此外,还使用跨平台编程工具来开发具有跨平台执行能力的系统。
  可靠性:本系统根据电网实时运行参数,通过专家知识的推理,完成开票流程,操作票准确性高。同时,系统具有综合纠错能力,提供操作票预览功能,进一步保证了系统的可靠性。本系统具有用户权限管理功能,保证系统不越权操作。
  实用性:本系统采用时下流行的IONIC工具包开发用户界面,界面简洁美观;充分考虑用户的操作习惯等因素,设计操作简单方便。系统提供了大量的用户设置,提高了系统的可用性。
  该技术提高了效率,具有通用性,可直接应用于不同的变电站。此外,该技术具有机器学习方法的共同优势,通过对训练数据的整理,提高模型的效果,具有实用性和可靠性。
  参考文献

[1]宗成庆.中文信息处理研究现状分析[J].语言战略研究,2016,1(6):19-26.

[2]杨福义.基于双语平行语料库的术语自动抽取[J].中国科技术语,2018(2):13.

[3]冯志伟.自然语言计算机形式分析的理论与方法[M].合肥:中国科技大学出版社,2017:819-820.

[4]郑志恒.智能信息处理-汉语语料库加工技术[M].北京:科学技术出版社,2010:168.

[5]曹倩,赵一鸣.知识图谱的技术实现流程及相关应用[J].情报理论与实践,2015,38(12):13-18.

[6]邓莉琼,张贵新,郝向宁.基于知识图谱的图像语义分析技术及应用研究[J].计算机科学与应用,2018,8(9):1364-1371.

[7]李跃鹏,金翠,及俊川.基于Word2vec的关键词提取算法[J].科研信息化技术与应用,2015,6(4):54-59.

[8]Wang,Z.,Kuan,K.Ravaut,M.,etal.(2017)TrulyMulti-ModalYoutube-8MVideoClassificationwithVideo,Audio,andText.ComputerScience,arxivpreprintarxiv2017:1706.05461.

[9]邓莉琼,吴吉祥,张丽.从视频到语义:基于知识图谱的视频语义分析技术[J].计算机科学与应用,2019,9(8):1584-1590.

其他文献
摘要:近年来,我国经济不断发展,工业化发展进程加快,社会用电量飞速提升,电气自动化技术被广泛应用于发电厂中,不仅节省了大量的能源,还提升了火电机组的工作效率,使电厂原本的运作模式得到了创新发展,在市场竞争中获得了更大的优势,竞争力得到快速提升。随着现代社会自动化技术的不断完善发展,加强电气自动化技术在电厂中的创新应用成为一项重要的工作。基于此,本篇文章对自动化控制技术在电厂的综合应用进行研究,以供
期刊
摘要:随着国民经济的快速发展,城市电网规模在不断的扩大。不过,在满足城市经济发展需求的过程中,不仅要扩大电网的规模,还应该确保电网建设的技术工艺水平不断提升,保证配网工程的施工质量,这样才可以为广大人民群众提供安全可靠的优质电力服务。为此,本文就针对配网电缆线路工程施工的关键技术进行了一些探究,以供相关人士参考。  关键词:电网规模;关键技术;施工要点;技术工艺水平  引言  电力资源在社会发展中
期刊
摘要:配电网运维是电力运维系统中面向电力用户的最后一环,在电力运维系统中在为电力用户提供优质电能的同时,也为电力客户带来了良好的用电体验。所以,配电环节成为电力运维企业与客户的一个桥梁,影响着客户的最终用电体验,而且影响着客户对供电企业的评价。基于配网自动化一次设备运维管理做法,能提高供电企业服务质量,对于其研究具有重要意义。  关键词:配网自动化;一次设备;运维管理;管理方法  引言  基于配网
期刊
摘要:发电厂生产具有高耗能、高污染特征,在新形势下,如何才够使电厂锅炉使用过程中的污染减少,提高能源利用率成为需要克服的关键问题。同时,电厂锅炉应用在热能动力中实际作用日渐凸显,不断通过创新技术,将锅炉使用效率提高,将能耗减少,可使电厂获得更高的经济及社会效益。基于此,本篇新形势下电厂锅炉应用在热能动力的发展与创新进行研究,以供参考。  关键词:新形势;电厂锅炉;热能动力;发展与创新  引言  热
期刊
摘 要:我国现阶段的发电产业应用最多的是风力发电,主要的原因是清洁能源的推广普及,进一步的促进了我国的风能地区的风力发电厂的扩建。因此,就风电场电气设备中风力发电机的运行维护对策开展深度探究,结合实际风力发电机运行过程中出现的故障问题,针对性的提出多种有效管理维护方式,并结合当前存在的多种管理维护问题进行其完善以及调整,从本质的风力发电机的运行维护管理体系中提出建议点,从而最大化降低风力发电机故障
期刊
摘要:随着互联网的出现和发展,它对社会生活的各个方面产生了深远的影响,在很大程度上改善了人们的生活方式、工作效率及工作的方式。在互联网不断深入发展的推动下,人们对于互联网也不断提出了新的发展要求,为适应互联网的发展潮流,同时也为了满足人们对互联网发展日益提高的要求,各种功能各异的网站应运而生。网站的作用可以是为企业宣传,可以是产品营销,可以是知识传递等,以满足人们的多种需求。数据库是网站开发的核心
期刊
摘 要:某发电企业二期机组投产以来,汽泵组(哈尔滨汽轮机厂NGZ83.6/83.5/06型小汽机、上海电力修造总厂HPT300-340-6S/27A型汽泵)润滑油质频发超标,分析其原因,提出改进措施。实施改造后,二期机组四台汽泵组润滑油常年合格,效果显著。  关键词:汽泵组;润滑油;油质超标;原因;对策  0 引 言  某发电企业二期机组给水泵汽轮机为哈尔滨汽轮机厂NGZ83.6/83.5/06型
期刊
摘 要:海口磷业有限公司(原三环化工)于2015年10月成立,通过引进以色列化工的先进生产管理和工艺技术,生产工艺和装备逐年改造和新增,预计三环化工110KV变电站供电负荷将在2021年达到58MW,超过变电站50MW的供电容量。三环化工110KV变电站投产较早,目前3C110KV两台主变存在不平衡,负荷分布不均匀,为消除 2 台变压器不平衡,改进站内超负荷运行的安全隐患问题,确保供电能力、供电可
期刊
摘要:文章对火力发电机的常见故障及检修方法进行了系统的归纳和总结,对火力发电机的检修现状和检修管理方法进行了系统的描述。在我国,火力发电依然占据主导地位,希望相关工作者在日常的电厂发电机检修工作中负责、高效地解决火力发电机故障问题。  关键词:火电厂;发电机;故障;维修  引言:火力发电厂是通过燃烧将煤等燃料的化学能转化为电能,其主要设备有锅炉、汽轮机、发电机、凝汽器和回热加热器等。其中发电机是将
期刊
随着通信技术的成熟发展,以大宽带、大规模链接、超低时延的智能化升级,正在逐步颠覆传统产业。与此同时安全也成为当下所有行业关注的重点对象,在频繁的网络用户实现信息交换与资源共享的同时,计算机通信网络也必须是安全的。这意味着如果敏感信息被不法分子利用,那么事情就变得复杂了。  提到安全,很难不把注意力集中在恶意破坏、恶意更改、恶意泄露,但事实是,通过数据传输安全、上网行为安全、边界安全、移动接入安全的
期刊