论文部分内容阅读
摘要:目前电网调度数据类型多种多样,管理也相对困难,以构建电网本体知识库为基础,将电网设备、调度运行数据、电网专业术语进行统一知识建模,研究电网调度运行结构化与非结构化数据的存储、解析,及其数据间相互关联,归属及同义关系。根据电网本体推理规则找出本体之间潜在的关联关系。基于电网本体知识库、对结构化与非结构化采用倒排索引解析技术,最终研究电网调度数据的智能检索技术,在快速检索到相关数据的同时,找出数据间内在联系。
关键词:本体知识库;推理规则;非结构化
引言
随着国内电力系统的发展,特别是智能电网建设的全面开展,电网运行管理系统在各级调控中心的应用越发广泛。电网结构日益复杂、同时面临的问题也层出不穷,如电网数据量的飞速增长,而传统固化的业务查询方式难以响应灵活的数据查询需求。常出现一个急需的业务数据查询,因为系统有的查询不能支持,所以必须等待应用升级或功能完善,影响了决策的及时性,也严重束缚了业务人员对信息的主动查询的需求,影响了业务人员主动灵活分析数据获取价值信息的工作。
为了应对日益增长的电网业务数据分析需求,使电网系统的相关计算、分析、决策管理更加智能化。要求相关电网工作人员能够快速的获得所需的知识和信息,并能准确的分析出信息之间潜在的关系,系统急需研制一种更便捷、更准确、更智能的数据检索技术。这些都需要借助于人工智能、快速检索相关技术的研究与支持。
1概述
1.1调度本体知识库概念
知识是人类在实践中所积累的认识和经验的总和,是人类进行智能活动的基础。知识库不仅仅贮存知识,还包括知识处理方式。知识库形成一个知识域,知识域中除了事实、规则和概念之外还包含推理、归纳、演绎等知识处理方法,逻辑查询语言、语义查询优化和人机交互界面等。本体知识库包含有明确定义的事实、断言和通过规则推理表达的某些明显的关系。
本体(Ontology)这个术语来自于哲学,它是研究世界上的各种实体以及他们是怎么关联的科学。本体是一个可以共享的概念化范围,描述了某个领域及其相互关联的视图,本体是共享概念模型的明确的形式化规范说明。本体描述了给定领域的知识结构,内在关系。
智能电网的调度知识表达了各个调度数据间的内在联系,依据其建立的本体知识库作为描述调度领域数据含义及关系的基础。从理论上来讲,在电网调度领域中,本体对象可以使具体的电网设备、文档资料,也可以描述抽象的专业知识概念、定义。基于调度本体知识库对调度本体进行分析,研究问题的语义抽象处理,描述调度本体的及其内在关系,构建调度本体知识库,目的是为电网运行数据检索进行推理和知识积累。调度本体知识库包括知识本体定义、调度本体间的关系两部分,其中调度知识本体定义即调度领域分析方向和研究问题的抽象描述,是调度本体知识库的基础。调度知识本体的关系,用于描述本体间的关联关系。
调度本体知识库作用在于:①明确调度本体的定义,从而避免知识库中来自不同数据源的信息的语义异构;②实现知识本体推理。本体可以体现出类似人类思维的逻辑性。
1.2调度本体知识库构建
本文采集并抽取现阶段电网调度运行中存在的各类数据,包括结构化和非结构化数据,其中结构化数据包括电网设备、调度运行、管理流程;非结构化数据包括调度生产过程中生成的报告、公文、图像以及采集的视频录音等内容。结合电网调度概念和专业术语生成调度本体知识库。
2智能检索技术
本文研究的快速检索技术采用的是Lucene搜索引擎,Lucene是一个基于Java的全文检索工具包,提供扩展添加索引管理和全文检索功能,轻量级,性能較好。
2.1基于电网专业词库切词
基于Lucene搜索引擎采用IKAnalyzer对查询条件与非结构化文档的内容切词,IKAnalyzer特有的“正向迭代最细粒度切分算法“具有60万字/s的高速处理能力,而且对中文支持较好,支持用户词典扩展定义。
2.2结构化数据的查询
电网设备数据、调度运行数据及其统计分析数据主要以结构化方式进行存储,依赖于数据库,因此查询的重点是将电网本体与属性按照SQL92标准生成可以执行的SQL语句,包含数据库、模式、表、字段等属性。
2.3非结构化数据查询
针对电力调度领域非结构化数据搜索而言,现有做法是根据非结构化数据格式、类型采用各种解析器对各种不同类型的文档进行解析,通过Lucene生成索引。比如对于WORD文档,提供的WORD解析器会做一些预处理的工作,如过滤文档中的文档格式、样式等等。WORD解析器的输出的是文档文本内容,接着通过Lucene的分词器(IKAnalyzer)从读取出的文本内容中提取出索引项以及相关信息。
3电网本体知识库与检索应用
现阶段智能电网调度支持系统存在数据量庞大,类型多样,关联关系复杂的实际情况,这些都对系统的建设,人员技能的要求都提出更高的要求,因此使用基于电网调度本体知识库的智能检索技术对提升调度管理系统(OMS)的智能性,降低使用人员的技能门槛,具有深远的意义。
3.1智能检索技术在电网调度运行数据查询分析上的应用
调度数据种类多样,涵盖了现阶段电网调度运行中能够采集及统计得到的所有的数据,包括运行数据、统计数据。查询关键字通过本体知识库进行推理找到相应的本体及与其存在关系的本体,然后用结构化或非结构化检索技术对数据进行查询与展示。
3.2在电网调度管理上的提升,智能检索技术
在电网调度运行中的应用以电网事故分析为例。电网运行稳定、安全是调度运行管理重要的指标之一,因此调度人员要对电网故障、事故有提前的预判能力,提前做好事故预案、分析以及事故后总结的工作。但电网运行情况复杂,调度人员很难掌握所有的情况,因此需要一种便捷的手段查询所有的电网事故和历史情况分析,包括事故产生原因,事故后果、处理要点等。
通过分析历史电网事故、故障将事故按照原因进行分类,例如输入“气象灾害电网事故”,通过对“气象灾害”与“电网事故”两个本体的分析推理,找到有关联的一系列知识本体,“降水”、“雷击”……“线路跳闸”、“线路覆冰”等,这些作为进阶查询条件,在结构化数据与非结构化数据中进行进一步检索,如在结构化数据中根据“降水”的结构化数据属性找到气象数据,预警数据,对应的OMS中调度日志由降水导致的事故记录以及相应的处理流程。
结语
基于电网调度本体知识库的智能检索技术,将电网调度领域专业术语、运行管理数据进行知识梳理,维护调度本体以及关联关系形成专业电网调度本体知识库。通过调度本体知识库生成检索索引,对电网调度中的结构化、非结构化数据进行数据分析、检索,实现电网调度领域内数据的相关性分析,提高调度数据检索准确性、智能性。为调度中心所有工作人员提供了具备全局性、透明性和高效性的调度数据智能检索功能,提高系统的智能化水平,降低使用者的技能门槛。实现调度运行信息全景管理、调度精细化决策、运行数据智能分析、资源优化配置,提升调度驾驭电网能力、科学决策管理能力和灵活高效调控能力,为智能电网调度管理系统(OMS)深化应用提供技术支撑。
参考文献
[1]李春.基于本体的文本信息检索技术研究与实现[D].南京:南京航空航天大学,2009.
[2]徐瑞卿,周渝慧.电力系统应急管理探讨[A].第八届中国管理科学学术年会论文集[C],2006.
关键词:本体知识库;推理规则;非结构化
引言
随着国内电力系统的发展,特别是智能电网建设的全面开展,电网运行管理系统在各级调控中心的应用越发广泛。电网结构日益复杂、同时面临的问题也层出不穷,如电网数据量的飞速增长,而传统固化的业务查询方式难以响应灵活的数据查询需求。常出现一个急需的业务数据查询,因为系统有的查询不能支持,所以必须等待应用升级或功能完善,影响了决策的及时性,也严重束缚了业务人员对信息的主动查询的需求,影响了业务人员主动灵活分析数据获取价值信息的工作。
为了应对日益增长的电网业务数据分析需求,使电网系统的相关计算、分析、决策管理更加智能化。要求相关电网工作人员能够快速的获得所需的知识和信息,并能准确的分析出信息之间潜在的关系,系统急需研制一种更便捷、更准确、更智能的数据检索技术。这些都需要借助于人工智能、快速检索相关技术的研究与支持。
1概述
1.1调度本体知识库概念
知识是人类在实践中所积累的认识和经验的总和,是人类进行智能活动的基础。知识库不仅仅贮存知识,还包括知识处理方式。知识库形成一个知识域,知识域中除了事实、规则和概念之外还包含推理、归纳、演绎等知识处理方法,逻辑查询语言、语义查询优化和人机交互界面等。本体知识库包含有明确定义的事实、断言和通过规则推理表达的某些明显的关系。
本体(Ontology)这个术语来自于哲学,它是研究世界上的各种实体以及他们是怎么关联的科学。本体是一个可以共享的概念化范围,描述了某个领域及其相互关联的视图,本体是共享概念模型的明确的形式化规范说明。本体描述了给定领域的知识结构,内在关系。
智能电网的调度知识表达了各个调度数据间的内在联系,依据其建立的本体知识库作为描述调度领域数据含义及关系的基础。从理论上来讲,在电网调度领域中,本体对象可以使具体的电网设备、文档资料,也可以描述抽象的专业知识概念、定义。基于调度本体知识库对调度本体进行分析,研究问题的语义抽象处理,描述调度本体的及其内在关系,构建调度本体知识库,目的是为电网运行数据检索进行推理和知识积累。调度本体知识库包括知识本体定义、调度本体间的关系两部分,其中调度知识本体定义即调度领域分析方向和研究问题的抽象描述,是调度本体知识库的基础。调度知识本体的关系,用于描述本体间的关联关系。
调度本体知识库作用在于:①明确调度本体的定义,从而避免知识库中来自不同数据源的信息的语义异构;②实现知识本体推理。本体可以体现出类似人类思维的逻辑性。
1.2调度本体知识库构建
本文采集并抽取现阶段电网调度运行中存在的各类数据,包括结构化和非结构化数据,其中结构化数据包括电网设备、调度运行、管理流程;非结构化数据包括调度生产过程中生成的报告、公文、图像以及采集的视频录音等内容。结合电网调度概念和专业术语生成调度本体知识库。
2智能检索技术
本文研究的快速检索技术采用的是Lucene搜索引擎,Lucene是一个基于Java的全文检索工具包,提供扩展添加索引管理和全文检索功能,轻量级,性能較好。
2.1基于电网专业词库切词
基于Lucene搜索引擎采用IKAnalyzer对查询条件与非结构化文档的内容切词,IKAnalyzer特有的“正向迭代最细粒度切分算法“具有60万字/s的高速处理能力,而且对中文支持较好,支持用户词典扩展定义。
2.2结构化数据的查询
电网设备数据、调度运行数据及其统计分析数据主要以结构化方式进行存储,依赖于数据库,因此查询的重点是将电网本体与属性按照SQL92标准生成可以执行的SQL语句,包含数据库、模式、表、字段等属性。
2.3非结构化数据查询
针对电力调度领域非结构化数据搜索而言,现有做法是根据非结构化数据格式、类型采用各种解析器对各种不同类型的文档进行解析,通过Lucene生成索引。比如对于WORD文档,提供的WORD解析器会做一些预处理的工作,如过滤文档中的文档格式、样式等等。WORD解析器的输出的是文档文本内容,接着通过Lucene的分词器(IKAnalyzer)从读取出的文本内容中提取出索引项以及相关信息。
3电网本体知识库与检索应用
现阶段智能电网调度支持系统存在数据量庞大,类型多样,关联关系复杂的实际情况,这些都对系统的建设,人员技能的要求都提出更高的要求,因此使用基于电网调度本体知识库的智能检索技术对提升调度管理系统(OMS)的智能性,降低使用人员的技能门槛,具有深远的意义。
3.1智能检索技术在电网调度运行数据查询分析上的应用
调度数据种类多样,涵盖了现阶段电网调度运行中能够采集及统计得到的所有的数据,包括运行数据、统计数据。查询关键字通过本体知识库进行推理找到相应的本体及与其存在关系的本体,然后用结构化或非结构化检索技术对数据进行查询与展示。
3.2在电网调度管理上的提升,智能检索技术
在电网调度运行中的应用以电网事故分析为例。电网运行稳定、安全是调度运行管理重要的指标之一,因此调度人员要对电网故障、事故有提前的预判能力,提前做好事故预案、分析以及事故后总结的工作。但电网运行情况复杂,调度人员很难掌握所有的情况,因此需要一种便捷的手段查询所有的电网事故和历史情况分析,包括事故产生原因,事故后果、处理要点等。
通过分析历史电网事故、故障将事故按照原因进行分类,例如输入“气象灾害电网事故”,通过对“气象灾害”与“电网事故”两个本体的分析推理,找到有关联的一系列知识本体,“降水”、“雷击”……“线路跳闸”、“线路覆冰”等,这些作为进阶查询条件,在结构化数据与非结构化数据中进行进一步检索,如在结构化数据中根据“降水”的结构化数据属性找到气象数据,预警数据,对应的OMS中调度日志由降水导致的事故记录以及相应的处理流程。
结语
基于电网调度本体知识库的智能检索技术,将电网调度领域专业术语、运行管理数据进行知识梳理,维护调度本体以及关联关系形成专业电网调度本体知识库。通过调度本体知识库生成检索索引,对电网调度中的结构化、非结构化数据进行数据分析、检索,实现电网调度领域内数据的相关性分析,提高调度数据检索准确性、智能性。为调度中心所有工作人员提供了具备全局性、透明性和高效性的调度数据智能检索功能,提高系统的智能化水平,降低使用者的技能门槛。实现调度运行信息全景管理、调度精细化决策、运行数据智能分析、资源优化配置,提升调度驾驭电网能力、科学决策管理能力和灵活高效调控能力,为智能电网调度管理系统(OMS)深化应用提供技术支撑。
参考文献
[1]李春.基于本体的文本信息检索技术研究与实现[D].南京:南京航空航天大学,2009.
[2]徐瑞卿,周渝慧.电力系统应急管理探讨[A].第八届中国管理科学学术年会论文集[C],2006.