新冠疫情病例知识图谱的构建及补全

来源 :吉林大学 | 被引量 : 0次 | 上传用户:guoqing123456789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自2019年新冠疫情爆发以来,我国已在疫情防控方面采取了很多有效的措施。但目前疫情还没有结束,所以针对加强新冠疫情防控的研究还在进行中。由于新冠病毒传播途径多样、伪装性强,目前主要通过追踪病例的时空数据,找出密接人员,来进行疫情防控。近年来,知识图谱在很多领域都得到了广泛的应用,包括问答系统、搜索引擎、智能语音、推荐系统等。随着知识图谱的发展,本文考虑将知识图谱应用在疫情防控领域,根据病例轨迹信息,构建由新冠疫情病例和城市的POI数据组成的新冠疫情知识图谱,并对缺失感染事件进行补全,可以实现信息溯源、推断高风险地点、发现密接人员等。本文构建的新冠疫情知识图谱是时间知识图谱,与目前存在的大多数知识图谱不同,时间知识图谱是带有时间信息的知识图谱,并且时间知识图谱中的知识通常是暂时有效的。之所以将新冠疫情知识图谱构建为时间知识图谱,主要是因为在新冠疫情中,很多信息都是与时间相关联的,比如说接触病例的时间、访问过某个高风险地区的时间,这都决定着感染新冠病毒的概率。本文还将构建好的新冠疫情知识图谱进行了可视化处理,目的是使得信息可以更直观的体现出来。在构建新冠疫情知识图谱时,我们发现网络上公开发布的病例轨迹信息存在不完整性,这是由很多不可控因素导致的。数据的不完整会导致知识图谱中知识的缺失,会为后续使用新冠疫情知识图谱进行新冠防控研究带来困难。为了找出知识图谱中缺失的部分,需要对构建好的新冠疫情知识图谱进行补全。现有的知识图谱补全模型有很多,如基于知识表示的模型、基于路径推理的模型还有基于强化学习的模型等,但这些模型都是用于静态知识图谱补全工作的,静态知识图谱即没有时间信息的知识图谱。而本文的所构建的新冠疫情知识图谱是时间知识图谱,静态知识图谱尽管在关系推理和下游任务中广泛使用,但仍无法对仅暂时有效的知识和事实进行现实建模。并且,大多数现有的时间知识图谱补全模型扩展了静态知识图谱嵌入,它们没有充分利用时间知识图谱结构,因此缺乏考虑已经存在于查询的本地邻域中的时间相关事件,并且在推理的过程中缺乏可解释性。由此,本文中提出了一个新的用于新冠疫情知识图谱补全的模型:T-WGPR,该模型主要分为两个部分,一部分是编码器,一部分是解码器。在T-WGPR的编码器中,通过利用具有注意力机制的图卷积神经网络关注每个事件和查询时间戳之间的时间位移来编码新冠疫情知识图谱的查询特定子结构,然后通过在图上传播注意力的解码器来执行基于路径的推理。最后,本文使用了构建好的新冠疫情知识图谱对提出的知识图谱补全模型进行了实验,通过实验结果可以表明,本文提出的模型与现有的知识图谱补全模型相比在每个评估指标上平均提高10%左右。
其他文献
随着软件工程领域对APP(Application,应用程序)的研究越发深入,有关APP的UI(User Interface,用户界面)方面研究越发受到关注,如数据驱动的UI分析和生成,UI的自动化测试与错误检测,UI的设计搜索与布局推荐等。如何提高UI的用户友好程度,让用户更易使用,已经成为热门的研究问题。在APP的实际开发中,比较普遍的做法是通过借鉴其他优秀的作品吸取经验,进而提升自己的UI。参
学位
机场航站楼公共区存在较大的火灾危险性,并且公共区中各类可燃荷载的燃烧特点也不同。本研究通过对商铺货架、书店书架、值机普通座和商务桌椅开展全尺寸实体试验,并采用火灾模拟软件FDS进行全尺寸建模和数值模拟,分析荷载类型与燃烧过程和温度的相关性,对比实体试验与FDS模拟的燃烧过程、温度、HRR等参数的差异及原因,并通过SPSS技术分析差异的产生机理。研究结果表明,可燃物的HRR与O2/CO2释放率会降低
会议
近年来,我国资本市场中企业操纵利润等现象时有发生,使得社会各界对企业盈余质量尤为关注。盈余质量的高低不仅关系到外部使用者基于企业盈余的各种决策的正确性,还会影响资本市场的正常运转。内部控制作为确保盈余质量的核心制度安排,其目标之一就是保证企业财务报告及相关信息的真实完整。随着《企业内部控制基本规范》的出台,我国逐步形成了一套规范的内部控制体系,但迄今为止,关于内部控制对盈余质量影响的研究尚未得出一
学位
随着信息技术和硬件水平的不断发展革新,现代生物识别技术越来越多的步入人们的日常生活中。尤其是近几年,新型冠状病毒肺炎在全球爆发,人们出入重要公共场合需要进行准确的身份认证和登记,但是面对新冠病毒极强的传染性和致病率,需要保证身份认证过程中受众的人身安全。而虹膜识别技术作为生物识别的热门研究方向之一,由于其非接触采集,不易伪造,可靠性高等特点,无疑是最符合当下身份认证需求的研究方向之一。而在虹膜识别
学位
保护湿地资源是维持物种多样性、确保生态建设质量的关键。基于此,针对南漪湖入湖河口现状,首先从生态效益、社会效益和经济效益分析湿地生态修复的必要性,其次提出生态修复目标和措施,旨在供相关人员参考,加快宣州区南漪湖入湖河口湿地生态修复。
期刊
为掌握FDS软件系统在中国火灾仿真领域的实际使用状况,利用我国知网对2011~2021年度收录的2092篇杂志学术论文开展了文章计算分析,并利用Citespace软件,对作家群体分布、杂志文章分布、发文数量、发文机构、文章重要内容、关键字和科研前沿领域等相关重要方面,开展了知识图谱分析。
会议
目的:调查系统性红斑狼疮病人疾病感知情况,评估其疼痛程度,了解其生活质量现状,探讨疾病感知与疼痛对生活质量的影响。方法:于2021年8月—2021年12月采用疾病感知问卷简化版(BIPQ)、疼痛数字评分表(NRS)和生命质量调查量表(SF-12)对我院风湿免疫科住院的81例系统性红斑狼疮病人进行问卷调查,采用Pearson相关、多元线性回归分析疾病感知、疼痛对病人生活质量的影响,并分析不同特征病人
期刊
随着我国改革开放的不断深入,市场经济体制不断完善,房地产行业也随之蓬勃发展。目前,房地产行业不仅是我国国民经济的支柱产业,更是推动社会进步的重要力量。房地产行业属于资金密集型行业,负债投资经营是其基本发展模式,科学合理地安排债务融资规模与结构有利于其投资效率的提高,从长远来看更有利于该行业乃至国民经济的稳健发展。论文以珠江股份作为研究对象,以合理化其债务融资水平与结构、促进债务治理作用有效发挥进而
学位
生物信息学是当今生命科学和自然科学的前沿领域,其主要研究内容之一为开发或设计一系列相关工具,以更有效地获取、分析和管理各种生物数据,为相关科研人员提供便捷的数据信息渠道。近年来,随着该领域的快速发展,生物信息学领域的优秀工具不断涌现。与此同时,生物信息学细分领域众多,产生的相关工具种类繁杂,对学习和使用工具造成了一定难度。知识图谱可以帮助人们解决上述问题。谷歌率先提出知识图谱的相关概念,用以辅助数
学位
随着强化学习的不断发展,强化学习的性能获得了极大的提升,并在工业生活中得到了越来越广泛的应用。强化学习的基本行为模式是智能体和环境进行持续不间断的交互,从而得到来自环境的奖励反馈信息,并利用这些交互信息数据对算法模型进行训练优化。然而,目前的强化学习中仍然存在着诸多的问题,例如强化学习算法对经验数据的利用率低的问题。在多智能体系统中,任务的训练难度会随着智能体数量的增多而越来越困难,产生奖励稀疏的
学位