【摘 要】
:
近年来,心血管病成为我国疾病负担和居民死亡的首要病因。随着医疗服务的信息化管理和数字化发展,医疗领域积累了大量的自由文本。如何从这些数据中提炼信息,并加以管理及应用,是推进智慧医疗建设的关键问题。本文旨在从心血管临床诊疗文献中自动提炼出有效的辅助诊断信息构建心血管知识图谱,并应用于自动问答系统,为医患提供高效精准的心血管资讯服务。具体内容如下:(1)研究基于多头标注和负采样的非结构化知识抽取。针对
论文部分内容阅读
近年来,心血管病成为我国疾病负担和居民死亡的首要病因。随着医疗服务的信息化管理和数字化发展,医疗领域积累了大量的自由文本。如何从这些数据中提炼信息,并加以管理及应用,是推进智慧医疗建设的关键问题。本文旨在从心血管临床诊疗文献中自动提炼出有效的辅助诊断信息构建心血管知识图谱,并应用于自动问答系统,为医患提供高效精准的心血管资讯服务。具体内容如下:(1)研究基于多头标注和负采样的非结构化知识抽取。针对中文临床诊疗文献的关系重叠问题,采用多头标注策略,对主流模型TPLinker进行特征改进,并通过负采样与动态权重的方法处理负样本过多的问题。为了提高模型的泛化能力,解决标注语料匮乏问题,从同义扩展、参数共享两个方面对文本数据进行增强。所提方法在心血管临床诊疗文献数据集以及公开的数据集上F1指标(精确率和召回率的调和均值)分别提高了5.73%、2.12%。(2)研究多数据源知识抽取下的实体对齐问题并构建心血管知识图谱。针对多源异构导致的知识重叠、知识碎片化问题,提出基于检索和重排序的实体对齐方法。所提算法在自有数据集及公开数据集上F1指标分别为83.04%、80.52%。最后结合知识抽取、实体映射以及知识存储等模块构建心血管知识图谱。(3)研究基于语义解析的知识图谱问答方法。首先对医疗问答场景下的实体识别进行研究:改进Albert的嵌入层,以混合编码的方式融合字、词信息并利用字匹配的方式实现实体链接。所提方法在自有的问答数据集上F1指标为92.97%,比单纯基于字编码F1指标提高1.81%。接着基于Albert实现关系属性的匹配,并引入对抗训练机制提高模型的鲁棒泛化能力。该方法在自有数据集以及公开数据集上准确率分别提高3.50%、3.21%。最后通过实体识别、关系属性匹配等模块的组合完成自然问句的语义解析。基于上述研究,本文实现了心血管知识图谱的构建并将其应用于自动问答系统中。
其他文献
数控机床在加工复杂工件时存在大量的定位辅助行程,为了提高数控机床的工作效率,应尽可能减小数控机床在辅助行程的运行时间,因此需要对辅助行程以轨迹运行时间最小为目标进行轨迹优化。目前传统的数控机床辅助行程插补方法多采用直线圆弧的梯形和S型速度曲线插补,且其中加加速度、加速时间、最大速度等参数需要人为设定,这一方面不利于数控机床智能化的实现,另一方面不利于高速控制的实现。本文针对如何实现数控机床辅助行程
绿色建筑和节能环保是目前建筑行业主要发展方向。一方面,装配式混凝土结构在建造质量、绿色环保优点突出;另一方面,再生混凝土技术的发展和应用,不仅节约了天然骨料资源,而且减少了废混凝土对环境的污染,为建筑废料的回收利用带来了活力。基于此,本文在已有的研究基础之上提出了一种冷挤压套筒连接装配式再生混凝土梁柱节点,并对其进行抗震性能研究。本文研究内容及成果包括:(1)基于过往的文献资料参考以及试验目的进行
利用金属/分子筛双功能催化剂实现对脂肪酸的临氢异构,得到的长链异构烷烃具有低温流动性好和辛烷值高等特点。应用于燃料、润滑油等领域,可极大地改善燃料及润滑油的相关性能。但随着碳链长度的增加,对脂肪酸临氢异构得到无碳链损失的长链异构烷烃的选择性普遍较低,开发合适的双功能催化剂成为解决此难题的关键。本文选用ZSM-22作为催化剂母体,Co作为活性金属,研究Co/ZSM-22金属/分子筛双功能催化剂在硬脂
在电子商务的快速发展下,需求不确定性日益增加,准确的需求预测是企业降低需求不确定性、在激烈的市场竞争中取得优势、脱颖而出的关键。由于消费者的真实需求往往是不可得的,在现有的研究和实践中,需求通常使用实际销售近似。然而,在日常的研究中,几乎所有可以通过公开途径获得的销售数据集都是高度不完整的,这为研究者和企业的执行需求预测、经营分析等活动带来了极大的不便。本文在学者们的研究基础上,将矩阵分解模型、商
由于地方院校办学资源的有限性以及核工程与核技术专业的特殊性,校企合作共建核电虚拟仿真实验室是必然选择。基于校企合作的模式,本文主要从开发仿真平台、设计实验项目、组建教学管理队伍、制订教学管理体系四个方面探索了我校核电虚拟仿真实验室的建设和管理经验,并总结了实验室建设与运行成效,为其他同类高校虚拟仿真实验室建设提供参考。
汽车悬架作为汽车底盘的重要部分,悬架的设计不仅影响到汽车的驾驶性能,而且关系到汽车的驾驶安全。悬架控制臂在车辆进行越障时承受较大的载荷,可能由于强度设计不足而发生弯曲失效。同时,由于环保及经济性的要求,控制臂需要进行轻量化设计,本文基于强度工况对控制臂的优化设计进行了研究。首先,对控制臂进行线性强度分析。根据整车设计参数在Adams中建立了前麦弗逊悬架的多体动力学模型,按照一般强度工况的定义输入轮
现代制造业正在往自动化和智能化的方向发展,控制系统作为工业机器人的大脑,决定着机器人的性能。传统的机器人控制系统是封闭式的,存在移植性差、可扩展性差和开放程度不高等不足。同时,智能制造对机器人的自主性控制要求也越来越高,将视觉传感器引入机器人控制系统的需求显著增加。针对以上问题,本文根据模块化和分层化的设计思想,在课题组已有的一套总线式软件运动控制器的基础上研究和开发了一套通用型工业机器人控制系统
极端降雨天气下外绝缘雨闪严重影响超、特高压输变电工程稳定运行。电站内雨闪多发生于伞裙较密集、直径较大的绝缘子,其在极端降雨下的电气绝缘性能尚未被全面研究。本文以空心瓷绝缘子为试品开展了人工淋雨试验,研究了不同淋雨条件和伞裙结构参数等因素对淋雨特性及闪络特性的影响,并重点分析了水滴形变与闪络特性的关联关系。研究成果可为极端降雨地区绝缘子选型和设计以及防治雨闪提供技术参考。首先,本文在已有研究的基础上
医院建筑区别于其他民用建筑,有服务人群特殊、功能繁杂、医疗流程和工艺复杂等特征,而医院项目建设本身也有自身的特点,如:管理难度大、要求高、影响大、造价高、工程变更多等,由此导致医院建设项目前期造价风险性大、控制难度高且不易管理。为经济、合理地控制医院建设项目的造价,必须对前期阶段存在的风险性进行有效管理,为后续造价风险控制提供可靠依据,进而实现造价风险管理目标。为此,本文的研究内容主要包括以下几点
公路货物运输是我国综合运输体系中至关重要的一环,承担了货物短途运输、“门到门”运输的重要责任,在社会和经济发展中具有举足轻重的地位。随着交通基础设施的不断完善、公路货物运输的不断发展,我国各级交通主管部门愈发重视公路货物运输的统计分析工作,但实践中采用的公路货物运输统计分析方法仍停留在传统方法中,公路货物运输信息化、智能化统计分析仍有待深入发展。近年来,交通信息化发展已初现成效,交通数据的不断积累