基于深度学习的知识抽取算法研究及安监领域的应用

来源 :东华大学 | 被引量 : 0次 | 上传用户:hqc12322967
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱是人工智能研究和智能信息服务基础核心技术,能够赋予智能体精准查询、深度理解与逻辑推理等能力。知识图谱由(实体,关系,实体)形式的结构化三元组为基本单位构成,从大规模的非结构化文本中抽取结构化的三元组知识来构建知识图谱,并融入实际自然语言任务是当前研究的热点问题。
  从文本中获取三元组知识的常用方法是先识别实体,然后再进行关系抽取。本论文重点研究了实体间关系抽取的方法,提出了基于注意力机制的改进算法。针对行业应用,给出了从领域文本数据提取领域知识模型,建立知识图谱的可行方案,并通过安监领域的应用实践说明了方法的有效性。
  本文的主要贡献包括以下3个方面:
  (1)提出了基于特征级注意力的关系抽取模型。现有的关系抽取模型通常将不同类型的输入特征对句子语义关系的贡献视为一致的,忽略了根据上下文的不同,不同特征对关系预测的贡献是不相等的。由此本文的工作包括:a.基于特征级注意力机制:使用注意力机制来计算不同类型的输入特征对实体间关系的贡献,为编码层提供更合理的输入表示。b.考虑不同的注意力函数:对比研究了不同注意力打分策略对关系抽取模型的影响,以便选择最优的注意力函数。c.对比不同粒度的基线模型:在实验中比较了其它如:句子级、实体对级、词级等不同粒度的7种基线模型,实验结果表明,本文提出的特征级模型在AUC、F1值两项重要评价指标上均提升了约1.5%.
  (2)提出了针对行业应用构建领域知识图谱的方案。建设细分行业的知识图谱,首先需要领域知识表示模式,传统方法依赖专家给出,代价大且主观性强。为了快速从大规模的非结构化领域文本提取知识表示模式,本文给出了一种半自动化的模式设计方法:使用主题抽取、聚类等自动化手段从部分文本中提取领域关键词以及语义聚集、包含关系,人工修正后重复此过程迭代完成了领域知识表示的模式设计。基于此方法本文在安监领域的法规文本上提取了知识表示模式,共7类实体、5种关系。图谱三元组抽取采用的是基于BERT语言模型的命名实体识别算法和本文提出的特征级注意力关系抽取算法,使用安监领域的法律条规文本建立了一个包含1,076条实例的安监知识图谱。为了提高中文实体识别的准确性,本文在中文标准评测数据集上对比了使用BERT替代编码层直接微调和继续使用编码层2种方案的实验效果差异,最后选择了直接微调的结构进行实现。
  (3)实现了安监知识图谱的问答应用。本文使用安监领域数据构建了<问题,答案>对数据集,训练了一个问答模型。处理问答任务时,先通过问答模型匹配答案,再用知识图谱中对答案进行可视化的展示。
其他文献
【摘要】“翻转课堂”是一种新型的教学模式,将其应用于高职思政课教学中,能够提高学生的学习积极性,提高课堂效率,改善教学效果。但它对教师的各方面的能力提出了更高的要求。  【关键词】翻转课堂 教学模式 高职思政课  【中图分类号】G641 【文献标识码】A 【文章编号】2095-3089(2016)03-0048-02  2011年开始,席卷全球的翻转课堂教学模式受到了国内教育界的广泛关注和研究,并
期刊
在复杂网络的研究领域里,社区发现是热门的研究方向,研究划分复杂网络的社区结构,对于分析网络中的结构、功能和演变具有非常重要的作用。复杂网络的社区,即是一些复杂网络中紧密相连的子网络,外部的网络连接相对稀疏。社区结构,存在于社交网络、生物网络、铁路网络与论文引用网络等网络中,能够反映出复杂网络里的动态特征和功能。对复杂网络进行社区结构的挖掘,可以应用于各种各样的领域中,比如说个性化推荐、蛋白质功能检测、交通网络规划与信息检索等。
  在社区发现领域中,近些年的发展中涌现出不少优秀的算法,解决了大部分的
人一生中大约有三分之一的时间处于睡眠状态,睡眠有助于缓解身体疲劳,恢复精力,与人体的健康息息相关。据研究表明,好的睡眠习惯有助于延长人类的寿命。但令人担忧的是,近年来随着社会快速发展,人们的睡眠质量呈梯度式下滑。造成这种现象有两个主要原因,一是因为工作、生活节奏的加快,让人们忽略了对于睡眠的关注,二是因为缺乏有效的睡眠分析帮助人们了解自身的睡眠状态。为了帮助人们更好地了解自身的睡眠状况,本文基于智能床垫采集的信号进行了睡眠分期研究;为了及时了解睡眠出现的变化趋势,本文在睡眠分期的基础上,进一步研究了睡眠时
【摘要】泰语学习者想要更好的提高泰语水平,首先必须培养良好的阅读习惯,解决泰语阅读中存在的词汇、句子、语篇问题, 熟练掌握阅读技巧,提高泰语阅读的速度和质量。该文目的是为了:对泰语阅读技能进行研究,发现泰语阅读的问题,找到解决的方法,不断提高阅读水平和泰语阅读技能。  【关键词】提高泰语阅读技能  【中图分类号】G643 【文献标识码】A 【文章编号】2095-3089(2016)03-0082-
期刊
【摘要】“慢阅读”是从文字中发现更多意义和乐趣的一种方式。在阅读教学中,教师要把握好课堂教学节奏,适时等待,给学生留足读、品、议、练的时间与空间,并进行有效评价,让学生思考有方向,有深度,有广度,真正体现语文的扎实、朴实和真实,让学生在慢阅读的境界中获取快乐。  【关键词】“慢”耕耘 阅读教学 等待  【中图分类号】G623.2 【文献标识码】A 【文章编号】2095-3089(2016)03-0
期刊
【Abstract】The previous researchers have done in great details of expertise teaching and the novice teacher. But few article have discussed how novice teacher can learn from the experienced one. The pu
期刊
【摘要】自新课改以来,素质教育得到了越来越高的重视,许多的教育工作者正在努力尝试着把教育的目标从应试教育逐渐转移到素质教育上,把教学的重点放在了对学生学习能力和实践应用能力的培养上。随着新课程标准的深入推进,教育工作者必学转变教学观念,思考和探索新的教学出路,才能推动我国教育事业的发展进程。通过对目前高中数学的教学现状分析来看,不论是教师的教学模式上还是学生的学习方法上都存在着诸多问题,教师和学生
期刊
【摘要】随着《基础教育课程改革纲要 (试行)》的深入开展,如今的课堂教学较以往发生了巨大的变化。这种变化不仅体现在教师的教育教学观念的转变,以及由此引发的教师教学行为的改变上,更重要的是课堂教学过程中学生学习方式的改变,带来的学生的学习生活及学习效率的全面提高。本文在对有效学习的理论进行探讨的基础上,对当前学生在化学课堂学习过程中存在的低效或无效行为,进行了深入细致的分析,并就改变这种状况,教师应
期刊
【摘要】几何直观是2011版义务教育数学课程标准提出的十个核心概念之一。小学生的思维特点决定了他们在理解抽象概念、进行逻辑思维时,需要借助几何直观。本文针对调查研究发现的问题,从教学的角度提出了培养小学生几何直观能力的策略:第一建立数与形的联系;第二借助图形描述问题;第三利用图形揭示数量关系,感悟数学思想。  【关键词】几何直观 图形  【中图分类号】G623.5 【文献标识码】A 【文章编号】2
期刊
k步可达查询与现实生活息息相关,是目前研究者的热点关注问题之一,能够应用于生产生活中方方面面,例如无线传感网络,生物信息网络,社会交际网络等等。k步可达查询可以看成可达查询+长度约束k值。相比于传统的可达查询,k步可达查询能够给信息查询者提供更多更有效的信息。k步可达查询用于在给定的有向无环图中回答两点之间是否存在长度不超过k的路径。然而,现有方法处理k步可达查询时,存在索引规模大或者查询效率低的问题。
  为了解决现有方法存在的问题,本文首先提出一种部分点构建双向最短路径索引的策略,其次基于该策略