基于Bert-wwm-ext与损失优化的多头选择中医知识联合抽取

来源 :燕山大学 | 被引量 : 0次 | 上传用户:gtfzwcb2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中医理论知识体系结构庞大,实体和实体间关系错综复杂,需采用合适的技术手段对该领域知识加以组织和存储,以便能灵活地运用到日常生活之中。相较于关系型数据库,知识图谱则更加适合中医理论知识的组织与存储。而准确高效的实体关系抽取则是构建高质量知识图谱的重要基础。本文以自建Co NER&RE-TCM语料库为基础,以形成高性能的多头选择联合抽取模型为目标,围绕多头选择模型中字向量语义表征能力弱、类别不均衡数据集适应能力弱等问题,开展理论与实验工作。首先,对中医非结构化及半结构化文本数据进行实体和实体间关系标注,构建用于实体关系抽取的中医领域标注语料库Co NER&RE-TCM,并分析库中实体关系特征,为中医领域实体关系联合抽取模型的研究工作奠定基础。其次,针对多头选择模型存在的文本语义表征及特征提取能力弱的问题,提出一种增强中文文本语义表征及特征提取能力的方法,并构建了相应模块。该模块中,以Bert-wwm-ext预训练模型作为嵌入层增强中文文本语义表征能力、以Bi GRU网络与残差网络作为混合编码层增强特征提取能力。再次,针对中医知识文本数据中关系类别不均衡的问题,提出基于损失优化的类别不均衡适应能力增强方法。该方法在关系分类层后采用自设阈值的方式,将有效关系类样本自动划分为充分可分类关系和未充分可分类关系,并在后续仅计算未充分可分类关系的损失,让模型更专注于未充分可分类关系的学习,以缓解因关系类别不均衡造成的关系抽取准召率低的问题。最后,在Ubuntu18.04操作系统下,通过Tensorflow框架构建基于Bert-wwm-ext与损失优化的多头选择中医知识联合抽取模型,在语料库Co NER&RE-TCM上开展实体关系联合抽取实验,并分析实验结果。
其他文献
四旋翼无人机是一种重量轻、造价低、机动性和隐蔽性好,且具有自主飞行功能的小型无人机,能够执行森林火灾监测、交通监管、大气探测、物品运载等飞行任务。尽管无人机具有众多优势,但是无论如何提高单架无人机的效率,单机本身的性能总是有限的。为了解决这一难题,多无人机编队技术应运而生。本文以四旋翼无人机的编队跟踪控制问题为研究对象,主要研究内容如下:首先,设计有限时间事件触发干扰观测器,在有限时间内实现对外界
十四五《建议》明确提出将“构建国家科研论文和科技信息高端交流平台”作为“强化国家战略科技力量”的任务之一。当前互联网已经成为Web文章形式的主要信息来源。尤其是Web论文页面,其中包含的学者信息和论文内容信息,更是为构建学术领域的知识图谱起到了关键作用。但是不同数据源页面结构不同,程序员需要为不同的页面编写特定的内容抽取代码,从而需要消耗大量时间。如何在Web数据抽取的时候减少人工的参与,研发基于
大概念作为学科中处于更高层次、居于中心地位和藏于更核心的概念,为人们认识事物和建构知识提供了一个认知框架或结构,它揭示了事实性知识背后的规律,从而使碎片化知识发生有机联系。通过寻找共性提炼数学大概念、实践参与建构数学大概念、打通联系运用数学大概念,帮助学生建立知识与知识的联系、知识与事物的联系、知识与行动的联系、知识与自我的联系,为后续更高层次的学习奠定基础。
随着互联网技术的飞速发展,再加上出租车等待位置不佳会导致司机接客效率低以及资源分配不合理等问题,传统出租车行业面临着网约车的极大竞争。同时,交通资源的合理规划也是促进城市发展的一项重要方面。针对上述情况,可以在复杂网络中结合空间数据查询技术来解决此类问题。因此,立足于社会实际问题,本文针对用户对于出租车的需求,计算出租车在不同需求情景下的最佳停靠位置,并结合路网的性质进行深入研究,将整个路网进行区
本文针对一种燃料电池和蓄电池混合供能的交直流混合供电系统,对燃料电池电压范围宽、响应速度慢的特点研究系统母线电压控制,并进一步研究最大化利用燃料电池的能量管理方案。首先,确定供电系统结构。固体氧化物燃料电池与锂电池均通过Buck/Boost电路接入直流母线,通过DC/AC逆变器为交流负载供电,形成交直流混合供电系统。建立由锂电池储能单元和逆变器构成的级联系统的平均模型,研究基于李雅普诺夫控制理论的
海洋模拟在主机游戏、灾害救援、影视特效、海洋勘测与虚拟仿真等各个方面起着极为重要的作用。为了可以实时地模拟大规模真实海洋场景下非可溶性固体的扩散情况,本文提出一种适用于不同复杂形态固体与海面交互实时仿真模拟的新方法。主要从三个方面进行研究,分别是海面的改进建模、海面与物体耦合扩散研究和海面整体呈现光学效果的模拟。首先,为在确保真实性的情况下可以更好的满足海洋模拟实时性要求,采用基于投影网格结合浸入
此文利用电子与声子、激子(e——ph+ex)联合超导机理模型,从超导系统的自能表达式出发,重新写出T=Tc时的强耦合超导Eliasberg能隙积分方程,并用三段常数实能隙模型:Re{Δ(ω)}=Δo,ω<ωo(声子截断频率);Δex,ωo<ω<ωex(激子频率);-Δ∞,ω>ωex;导出高Tc氧化物超导体YBa2Cu3O7-δ超导体的临界温度。电子与声子、激子耦合的有效谱型取α2(Ω)F(Ω)=1
自然场景的模拟一直是虚拟现实一个重要方面,在本次的实验研究中,将针对日常下雨现象来进行虚拟领域的仿真研究。对雨场景的虚拟仿真广泛应用于影视动画、网络游戏、虚拟漫游体验等不同方向,但是目前这一领域的研究还存在许多短板与不足。不单单是技术人员的技术水平问题,还面临着实验设备不够完善,仿真效果不甚理想等各方面的问题。同时在很多实验室的研究中往往研究比较片面,与实际相对比,从天空落下的雨滴与水面发生碰撞时
在许多工业领域以及医疗保健领域中,对于液体体积的监测是非常重要的问题之一。因为若已知液体高度能很快计算出液体体积,使得液体高度是监测液体体积的一个重要指标。然而,现有关于监测液体高度的技术主要依赖于专用传感器,比如电容式传感器和超声波传感器,这极大地限制了它们的通用性。无线射频识别(Radio Frequency Identification,RFID)技术的普及,为建立无线且无源的传感系统提供了
电动汽车发展日趋成熟,充电资源却未满足其日益增长的需求。基于区块链众包的实时导航在电动汽车充电时发挥重要的作用。如何在获取众包进行路径规划过程中激励矿工计算众包任务,直接影响路径规划的质量。因此,本文针对区块链的挖矿诚信问题,基于声誉和概率统计学提出一种激励方法,提高矿工的声誉,激励其保持诚信;针对路况信息众包的矿工选择问题,基于空间众包和逆向拍卖提出一种矿工激励策略,提高矿工选择的效率和路况众包