油气勘探开发文档的语义分析及提取方法的研究与实现

来源 :中国石油大学(北京) | 被引量 : 0次 | 上传用户:xzhtqx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱技术的推广与应用,给相关领域带来了新的研究方向与挑战。目前油气勘探开发领域的知识图谱正处于起步阶段,需要大量该领域的知识提供支持,这些知识主要来源于油气勘探开发文档,然而还没有一套完善的方法和系统,能自动地从这些文档中提取知识。如何从非结构化的文档中大规模地自动提取知识已经成为研究油气勘探开发知识图谱的首要任务(知识主要指油气勘探开发领域的实体和关系)。为了准确地提取油气勘探开发领域的知识,本文从三个方面研究了油气勘探开发文档的语义分析及提取方法,分别是油气勘探开发文档的信息提取、油气勘探开发文档的命名实体识别以及油气勘探开发文档的实体关系提取。其中,在文档的信息提取部分设计了一种基于规则和SVM相结合的文档信息提取方法,并通过对比实验证明了该方法的效果;在文档的命名实体识别部分,针对油气勘探开发领域的特点,编制出合适的规则和词典去优化机器学习训练的命名实体识别模型,更好地提升了油气勘探开发领域命名实体识别的效果;在文档的实体关系提取部分,采用模式和远监督相结合的关系提取方法,有效地提取了大量的油气勘探开发领域的实体关系。通过对三部分研究的整合,提出并实现了油气勘探开发文档的语义分析及提取方法。实验表明,该方法能够较好地从油气勘探开发文档中自动提取大量的油气勘探开发知识。
其他文献
针对雷达试验数据处理系统中直观表现雷达探测态势的要求,在分析MapX功能特性的基础上,应用MapX组件技术在VC++环境下实现了雷达探测态势图绘制。结合态势图中真实地理信息下航迹
麻疯树,大戟科植物,多年生落叶灌木或小乔木,种子含油率高达40%~60%,可以提炼出不含硫,无污染,符合欧四标准的生物柴油。其副产物可生产生物药品(医药中间体)、肥料及农药等
工业领域中,减速器因其独特的优势在现代化机械工业中被广泛运用。本论文任务来源于校企合作产学研项目,企业研发生产的精密研磨机用蜗轮蜗杆减速器,因其性能的优劣会直接影响到研磨机以及硅片加工的质量,因此配合企业开发减速器综合性能测试台,用于检验减速器综合性能指标,保证减速器产品质量。蜗轮蜗杆减速器主要性能指标包含振动性能、传动效率、温升等,其中对减速器振动信号的研究,不仅可以进一步提升减速器整机性能,而
基于无线数据传输,SQL Server,ODBC技术,提出了构建C/S结构的数据采集系统的设计思想,并设计出中间表数据交换模型,解决数据通讯问题;实现了ODBC数据源的自动配置,给出了系统设计与实
本文介绍了一种确定岩体结构面连通率的方法,该方法首先在岩体结构面网络中搜索到结构面-完整岩石组合的最小抗剪力路径,然后在此最小抗剪力路径上计算结构面的连通率。在考虑结
针对多路视频信息综合显示的方法及其实现进行了研究,给出了组成框图、工作原理及其硬件实现方案,从而为多探测器的视频综合显示在火控系统中的应用提供了有效的技术基础。
本文建立了一维河流石油类污染物"解吸为主"的动态水质模型.模型方程中考虑了河流悬移质、推移质泥沙和底泥与石油类之间发生的吸附解吸的动态过程,以及河流弥散作用对石油类
持久性有机污染物在长期的积累下会对人类和生物带来危害,也会造成自然生态环境的破坏。当前,我国污染物主要以持久性有机污染物为主,实践工作中对于该类污染物的分解工作存
本文通过多年沥青路面施工经验,对沥青路面的水损害原因进行分析并提出防治方法,对已产生早期破坏的沥青路面采取有效处理措施。
已有的许多研究发现,身体活动或者状态能够影响各种认知过程,即使是简单的身体动作也能激起发散性思维的表现。画图是想象、知觉和身体动作等心理成分协作进行的一种活动,如果先行做出画图活动,其对后续的发散思维有何影响?本研究通过2个实验,探索画图能否促进发散思维表现,进而寻找画图活动中能够真正促进发散思维的有效成分。实验1考察画图能否促进后续发散思维任务的表现。本实验将被试分为3组:(1a)自由画图组;(