基于医疗知识图谱的应用系统设计与实现

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:AliceXQ
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能技术的飞速发展以及知识图谱在垂直领域应用技术的成熟,知识图谱在医疗领域有着广阔的应用前景。医疗知识图谱可以帮助医生做决策、帮助大众了解疾病常识、帮助病人了解患病情况,知识图谱在医疗领域的价值不仅仅是一个医学知识库,更重要的是提供诸如医疗智能搜索等功能,是辅助诊疗的基础。随着医学信息化水平的提高以及大数据的发展,医疗领域积累了大量未被充分利用的数据,构建医疗知识图谱可以充分挖掘数据的潜在价值。本文研究了搭建医疗知识图谱的流程和方法,使用深度学习、图神经网络等技术进行医疗实体抽取;搭建基于医疗知识图谱的知识查询、知识图谱自动问答、在线医疗实体抽取平台。本论文的工作主要有以下几点:(1)研究了标签注意力机制,把注意力机制应用到序列标签中来学习标签信息的嵌入表示。针对传统的LSTM实体抽取模型只能对输入序列进行特征抽取而没有考虑标签特征,本文应用一种逐层改进的基于标签注意力机制的网络LAN(Hierarchically-Refined Label Attention Network),该模型使用LSTM对输入序列进行特征抽取,使用注意力机制学习标签特征,注意力机制能够捕获标签上下文之间依赖关系。在医疗NER任务中使用CCKS2018医疗实体识别竞赛数据集,通过实验证明BiLSTM-LAN模型的识别准确率高于BiLSTM-CRF模型,但是识别结果略差与下文研究的GGNN模型。(2)研究了图神经网络技术以及文本序列在图网络中的表示方法。针对中文命名实体识别存在着词语边界不确定、组成复杂的缺点,本文研究了图神经网络在实体识别模型中的应用,并应用基于词典的门控图神经网络(GGNN)构造中文医疗实体识别模型,使用GGNN网络学习图节点的隐状态嵌入表示,然后把学习到的隐状态输入到BiLSTM-CRF进行预测,使用相同的数据集经试验证明图神经网络模型的识别准确率比BiLSTM-LAN和BiLSTM-CRF更高。(3)研究了知识图谱的构建流程,包括知识表示、知识抽取、知识存储及知识可视化。根据通用领域知识图谱的搭建流程和方法,抽取医疗百科半结构化数据构建医疗知识图谱;研究知识图谱的可视化方法,利用 Django、JavaScript、Bootstrap、Echarts 组件构建基于知识图谱的实体查询、关系查询可视化展示web界面。此外研究了基于规则匹配的知识图谱自动问答,搭建自动问答模块和在线医疗实体识别模块。
其他文献
随着电力电子技术的高速发展,IGBT(Insulated Gate Bipolar Transistor)功率器件由于其高容量、高电压等级以及较低的功率损耗等优点逐渐成为电力电子变换器的核心部件。功率器件长期运行在严苛的工况下,不可避免将产生严重的老化以及可靠性问题。相关研究表示,功率器件的结温过高致失效的比例高达50%,其主要的失效形式之一为封装级失效,而焊料层被认为IGBT功率模块的封装结构中
冷凝传热作为一种重要能量传递方式被广泛应用于能源、化工和电子等众多工业领域中,随着现代工业水平的不断提升,高效的冷凝传热性能也逐渐成为关注的热点。针对特殊润湿性表面常用的化学法修饰具有高污染、热阻大和制备周期长的缺点,以及现有的不锈钢超疏水表面的冷凝传热性能再难以提升,本文采用无化学的激光选区微织构技术及恒温热处理工艺,在SUS304不锈钢表面获得超疏水-超亲水的楔形选区图案,研究增强不锈钢的冷凝
工业硅由于其丰富、无毒且较成熟的加工技术,在下游多晶硅、有机硅及硅合金行业占有至关重要的作用。其夹杂物微观结构与分布不仅直接决定杂质的湿法浸出效率,而且对下游有机硅单体合成的效率及品质起到决定性因素。此外,夹杂物微观结构对西门子法和硅烷法提纯多晶硅过程也具有一定影响。因此,研究硅中夹杂物微观结构与分布则尤为重要。本文针对硅中夹杂物微观结构与赋存状态,系统研究了电磁强化–湿法浸出技术强化杂质去除及对
开关电源以其效率高,体积小,功耗低等优点广泛应用于计算机系统、通信设备、军事装备等领域,在其工作过程中功率开关管的高频通断会引起很大的瞬变电压/电流,与电路中的寄生参数相作用产生电磁干扰。随着开关电源高频化、小型化、模块化的发展趋势,其EMI问题愈发严重,不仅影响自身正常工作,还会污染周围电磁环境。因此如何准确预测和有效抑制开关电源EMI,改善系统EMC性能是目前研究的重点和难点。本文以DC/DC
推荐系统对于在线商业系统是一种非常重要的工具,能够在用户没有明确目标的情况下帮助他们发现感兴趣的内容,提供个性化的推荐服务。推荐系统的核心是推荐算法,在众多算法中,
我国个人所得税自1980年开征,此后个人所得税的征管一直是我国税收工作的重点内容,2018年个人所得税改革后,个人所得税的征收模式由分类制向综合与分类相结合的模式转变。在新的个人所得税征收模式下,哈尔滨市个人所得税增加了必要的专项附加扣除,个人所得税在增加税收收入和实现社会公平方面发挥着重要的作用。然而,哈尔滨市个人所得税在征收管理方面还存着税收收入增长缓慢、基层征管力量薄弱、信息化征管不高、申报
随着云计算、大数据在全球范围内的广发应用,数据中心的数量和规模不断增长,其高能耗、高费用等问题日益突出。越来越多的数据中心运营商尝试利用风能或太阳能等可再生能源为其数据中心供电。然而,可再生能源具有间歇性和随机性,给数据中心的供电管理带来了诸多挑战。虚拟电厂能够整合大量的可控负荷、分布式电源以及储能等多种分布式能源,为数据中心的能量管理提供了有效的途径。本文在虚拟电厂环境下,基于随机规划,重点探讨
随着传统汽车造成的环境污染危机愈发严重,纯电动车和可再生能源受到人们越来越多的关注。相应地,质子交换膜燃料电池(PEMFC)由于较高的能量转换率(30%~60%),运行噪声小和环境友好的特点,并且凭借高能量密度的优势,在新能源汽车发展中有巨大的潜力。通过引入动力电池组可以弥补燃料电池电动汽车无法回收制动能量、启动速度慢和输出特性偏软的缺点。双动力源可以使燃料电池混合动力汽车发挥更好的动力性,但是如
随着我国经济社会的高速发展和城市化进程的推进,机动车的数量日益增加,随之带来的城市交通问题也日益凸显。诸如交通拥堵、交通事故和汽车尾气造成的环境污染等问题,对城市区域路网的通行效率和市政交通管理都造成了严重的影响,城市交通管理者们迫切需要寻找合理高效的交通管制方案解决这些问题。而在影响城市区域交叉口通行能力的众多因素中,交叉口信号灯优化控制是至关重要的因素之一,也是现代交通管理的主要内容。利用在线
进入21世纪以来,我国经济快速发展,环境污染、生产隐患、资源浪费等问题随之产生且日趋严重。社会公众高度关注企业履行社会责任。能源企业作为我国国民经济支柱性产业,它关