论文部分内容阅读
随着计算机技术的快速发展以及人工智能与多个领域的结合使用,人工智能相关技术在生产生活中所提供的便利也让人们认识到人工智能技术所拥有的各种潜力,其中知识图谱所涉及的各种技术随着近些年的发展也开始成为人们的研究热点。而在电力领域,电力调度是为了使各种类的电力生产工作有序进行,保证电网对内可以保证自身安全稳定运行、对外能够提供可靠供电所采用的一种有效的管理手段与管理方式。为了提高电力调度的工作效率,结合现在知识图谱技术的发展技术,设计并实现一个电力调度领域的知识抽取系统,让该系统作为后续电力调度领域知识图谱构建的前期工作之一,以保证后续知识图谱构建中的其余工作可以顺利进行。为了解决电力调度领域知识图谱中知识抽取的问题。目前电力调度领域没有相关的知识抽取技术可以直接使用,因此研究并参考知识抽取技术在其他领域的一些研究资料以及使用情况,然后结合本科题的实际情况,在电力调度领域中知识抽取系统设计和实现过程中使用到的一些技术。在数据预处理中,使用数据清洗方面的一些技术对数据中的重复值和噪声数据进行处理;在实体抽取部分,使用Transformer模型获取句子的positional embedding代替Word2Vec获取句子的词向量,使用BiGRU模型通过positional embedding得到句子的label序列,使用CRF对label序列进行运算之后通过原来的句子得到句子对应的实体和实体的属性;在关系抽取中使用Attention模型在BiGRU模型的结果label序列和实体抽取结果两个部分结合的情况下对实体与实体间的关系进行抽取;在数据存储部分使用Redis对数据进行存储并进行持久化。在模型的实现部分使用Python语言与TensorFlow相结合的编程技术;在模型的训练部分,在实体抽取部分使用了两种方式训练系统中的模型,这两种训练方式主要是对于Transformer模型、BiGRU模型和CRF模型三个模型的不同训练方式,第一种是Transformer模型不进行训练而使用Google训练好的模型,而只是将BiGRU和CRF模型一起训练;第二种是将三个模型一起训练;数据存储部分通过搭建Redis数据库存储系统,将数据存入Redis数据库,并且存储后对抽取的数据进行持久化存储,以保证数据在程序退出后可以继续被二次使用。在电力调度知识图谱中知识抽取系统的设计与实现的过程中,针对该领域知识抽取的特殊性和参考其他领域知识抽取的研究资料,将本课题所需求的相关功能进行实现并进行测试。本系统实体抽取的准确率达到70%,符合功能设计的预期目标;关系抽取的F1值达到接近70%,说明了关系抽取功能的可行性;数据存储的可行性保证了系统对数据存储功能的实现。通过对系统中各个模块的各个功能的实现,最后实现了本系统所需要的电力调度领域知识图谱中知识抽取的功能。为电力领域的知识图谱构建工作提供了一部分的前期工作,实现了电力领域中知识图谱构建初期的知识抽取的自动化抽取,降低了成本,提高了后续工作的效率。