水泥熟料生产领域知识图谱构建

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:crr0808
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
水泥工业的智能化对水泥生产尤其是水泥熟料生产至关重要,由此将水泥熟料生产领域的知识信息化,构建一个水泥熟料生产领域的知识图谱是一个亟待解决的问题。由于水泥熟料生产领域的知识量巨大且涉及范围很广,在广泛研究、项目积累以及与领域专家讨论基础上,构建术语库并搜集水泥熟料生产领域的数据。结合搜集的水泥熟料生产领域的数据,进行实体识别和实体关系抽取来提取数据中的知识信息,再将提取的知识构建成水泥熟料生产领域的知识图谱。本文的主要工作如下:
  (1)建立水泥熟料生产领域的术语库;将搜索关键词结合术语库生成新搜索关键词,从知网和水泥企业网站搜集数据,使搜索更有针对性,并给出了相应爬取算法;针对水泥熟料生产语料中词实体的边权值和词信息,通过改进TextRank算法实现从搜集的数据中提取新的术语,并将其加入到术语库中。
  (2)针对水泥熟料生产领域中实体的多粒度的问题,融合预训练语言模型等外部知识,提出了基于术语库和BERT-BiGRU-CRF的实体识别模型。在此基础上采用记忆网络组件来提取不同数据源语料的语义特征,提出了基于记忆网络的实体识别模型。本文模型与CRF、BiLSTM和BiLSTM-CRF模型进行对比实验,结果表明本文提出的实体识别模型在水泥熟料生产领域的实体识别任务中具有一定优越性。
  (3)针对数据中的段落,在水泥熟料生产的实体关系抽取任务中,首先使用依存句法进行关系抽取,提取水泥熟料生产三元组。为充分利用实体位置信息以及长序列信息,采用以实体为边界分割句子,用CNN分段池化并加入注意力机制来提取更大范围的特征,提出PCNN-Attention实体关系抽取模型。实验结果表明提出的模型优于CNN、PCNN、BiLSTM-Attention模型。
  (4)提出基于字符和语义向量的相似度的方法进行知识融合,并使用多层Transformer模型对抽取融合后的知识进行进一步挖掘以扩展知识三元组,最后将得到的知识三元组中的实体和实体关系连接起来以构建成水泥熟料生产领域知识图谱,利用Neo4j存储知识图谱,对其进行可视化展示,并提供了3种不同查询示例。
其他文献
分布式视频编码(Distributed Video Coding,简称DVC)有别于传统的视频编码方式,它将具有复杂运算的模块(如运动估计、运动补偿等)从编码端转移到解码端。因此,它可以应用于编码端的计算能力、存储空间和功耗资源都受限的场景。目前,大多数的DVC采用信道编码实现信源的编解码,如低密度奇偶校验码(Low-Density Parity-Check,简称LDPC)。然而,LDPC在视频中
在监控、目标识别等实际应用中,具有高分辨率的图像能够提供更多的有效信息。但在成像过程中会受到模糊、几何变形、降采样及各阶段噪声等因素的干扰,导致图像产生一定程度的退化从而降低图像的分辨率,严重影响计算机视觉系统中图像处理的最终结果。为了得到高分辨率的图像,本课题围绕基于生成对抗网络GAN的退化图像超分辨率重建方法展开研究和改进,主要工作内容如下:(1)在Bicubic降采样这类退化产生的低分辨率图
日益增多的机动车数量与驾驶人数使得道路驾驶环境变得愈加复杂,在一定程度上增加了交通事故发生的概率。大量分析研究表明,驾驶员人为因素是导致道路交通事故发生的重要原因,其主要包括疲劳驾驶和分心驾驶两类危险驾驶行为,因此针对这两类危险驾驶行为进行有效监测与实时预警变得愈发重要。当前针对驾驶员分心与疲劳驾驶行为监测方法存在以下问题,一是未能同时兼顾驾驶行为监测的准确度与实时性需求;二是未对分心、疲劳危险驾
学位
飞行员作为民航安全的“最后一道防线”,其不安全操纵行为直接影响飞行安全。快速存储记录器(QAR)作为飞机上一种无保护装置的飞行数据记录设备,能反映航行期内飞行员的操作行为。目前基于QAR超限事件的飞行安全管理方法,通过设定监控参数分析飞行员不安全操纵行为,常常难以发现触发超限事件的潜在人为因素,因此,通过对QAR数据进行关联分析,对于更全面挖掘飞行员不安全操纵行为,提高飞行安全水平,具有重要的理论
伴随芯片、传感器及网络通信等技术的迅速发展,智能设备的数量呈现爆发式增长,这些设备产生的大量数据也呈井喷式的增长。而大数据处理技术的不断成熟也使得这些大数据的潜在价值不断上升,将这些具有潜在价值的数据进行开放共享是一个必然的趋势。但数据共享往往会带来安全方面的隐患,因此,建立一个使共享双方信任的数据共享平台是十分重要的。为了降低用户访问内容时的延迟,内容分发过程往往在不同地域的节点或服务器之间进行
学位
随着智能手机或平板电脑等智能移动终端的普及和物联网(Io T)技术的迅速发展,传统云计算技术已经无法满足终端侧“低时延,大带宽”的云资源要求,欧洲电信标准协会(ETSI)提出多接入边缘计算(MEC),在移动网络边缘提供IT服务环境和计算能力,以减少网络操作和服务交付的时延。在多接入边缘计算环境中引入软件定义网络(SDN)技术,可以支持大量网络设备的访问,且方便网络设备的扩展,使得边缘网络的管理更灵
交通领域中的智能驾驶越发重要,对于减少交通事故,防止人员生命财产的损失具有重要意义。但是,传统的车辆智能行车系统存在着效率过慢,并且精度较低的问题。随着深度学习的落地,前方防碰撞预警系统(FCWS)可以在前方车辆距离过近时,及时发出警报,从而避免发生事故。前方防碰撞预警系统主要目的是实时检测前方车辆的距离,由两个重要的技术支撑:车辆检测与深度估计。车辆检测用于识别监测前方车辆,而深度估计负责计算与
学位
双边拍卖作为一种高效的资源分配机制,已经被股票市场、期货市场广泛使用,同时也被用于云计算等领域解决资源分配问题。当前一般存在多个双边拍卖市场相互竞争,市场通过制定高效的机制来提高分配效率吸引交易者进入市场交易。双边拍卖中市场定价策略对交易者的收益有着重要的影响,通过影响交易者的市场选择和报价策略从而影响市场竞争结果,所以市场定价策略在双边拍卖中有着较为重要的地位。又因为市场定价策略和交易策略相互影
学位
随着在线流媒体服务需求的飞速增长,如今视频流媒体平台变得越来越流行,用户对低延迟和高质量服务的需求越来越大。高度多样化的内容使得在边缘服务器缓存空间有限的情况下不可能将所有需要的内容都存储在边缘。因此,如何分配缓存资源来服务尽可能多的请求,同时进一步减少传递延迟和带宽使用量,并提高用户体验质量,成为亟待解决的问题。边缘服务器有限的覆盖范围、用户移动性和请求模式的高度不确定也给服务部署带来了新的挑战
近年来,物联网、云计算、边缘计算等技术发展迅速,越来越多的资源受限智能终端设备出现在人们的日常生活中,并被广泛应用在交通、能源、物流、医疗、智慧城市、娱乐和社交媒体等场景中。通过应用区块链技术,可以有效保障这些存在资源受限设备的场景中数据的安全性与隐私性。但区块链技术本身对资源有较大的需求,而资源受限设备上的计算、存储、带宽等资源并不丰富,难以负担区块链共识过程以及存储区块链账本所带来的开销,这就