基于异构数据源的疾病知识图谱构建研究——以高血压为例

来源 :武汉大学 | 被引量 : 0次 | 上传用户:chenjiechn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,医疗健康领域的电子病历等知识资源呈现爆炸式增长,这些异构数据源蕴含着丰富的应用价值,但各知识源间的异构性给数据的组织和利用带来极大的挑战。人工智能领域的知识图谱技术具有强大的知识组织和管理能力,可以用于医疗健康领域大体量异构数据的处理。通过对医学知识图谱的构建目标进行分析,本研究提出了基于异构数据源的疾病知识图谱构建框架,为疾病知识图谱构建提供思路。论文以高血压为例,设计并构建了高血压知识图谱,采用专家咨询的方式,对高血压知识图谱的质量进行了评估。具体来说,本研究的主要工作包括以下四个方面:(1)系统归纳和梳理了知识图谱构建领域及知识融合领域的国内外研究现状,概括相关研究领域的不足之处,包括:数据源方面,相关研究多采用文献、百科等数据进行疾病知识图谱的构建,很少有研究以电子病历作为数据源;模式层设计方面,现有研究对于电子病历的分析研究不足,模式层的设计无法清晰明确地表达真实的电子病历中记录的复杂的疾病发生发展过程;异构数据融合方面,现有的知识融合研究多面向通用领域,少有研究面向医疗健康领域构建融合模型,且学者对于医疗健康领域内数据源“异构性”的解释有局限性,忽略了电子病历与其他数据源在语义复杂性方面存在的不同。(2)设计了面向医疗健康领域的异构数据融合模型,并以此为基础设计了基于异构数据源的疾病知识图谱构建框架。详细分析了电子病历的语义特征及医疗健康数据源的异构性,明确了知识图谱的构建目标,基于知识表示的五元组理论,针对现有研究的不足,聚焦于医疗健康领域数据源的异构问题及模式层设计不合理问题,设计出集五层次知识融合模型及子图融合模型为一体的面向医疗健康领域的异构数据融合模型,并以此为基础提出一套完整的基于异构数据源的疾病知识图谱构建框架。(3)构建了高血压知识图谱。为验证面向医疗健康领域的异构数据融合模型及基于异构数据源的疾病知识图谱构建框架的合理性,本研究采用实证研究的方法,以高血压为例,构建了高血压知识图谱。本研究将完整的高血压知识图谱构建过程划分为面向领域知识的子图构建及面向电子病历的子图构建两个子任务。首先,通过语义类型的设计、语义关系的设计及概念描述体系的构建为两个子图建立了模式层,其中,面向电子病历的知识图谱的模式层构建充分考虑了电子病历数据的语义复杂性,设计了相应的属性用以存储电子病历数据在时间、地域、人口维度上存在的复杂语义信息。然后,以结构化知识库Disease Ontology、教材、《中国高血压防治指南2018》、百科数据及电子病历等为数据源进行知识抽取,以五层次知识融合模型为理论指导对抽取得到的知识元素进行知识融合,完成两个子图数据层的构建。最后,以子图融合模型为理论指导,通过语义关系链接及知识元素复用实现面向两个子图间的融合。至此,完整的高血压知识图谱构建完成。(4)高血压知识图谱的可视化和质量评估。在Protégé中实现高血压知识图谱的存储和可视化,并对高血压知识图谱开展质量评估。质量评估邀请来自三种不同学科的六名专业人员及具有三种不同角色的六名用户对高血压知识图谱的各个维度进行打分。评估结果表明,本研究构建的高血压知识图谱虽在内容覆盖面及产业化应用方面还存在一定不足,但整体质量较高,获得了各位专家较高的评价,证明面向医疗健康领域的异构数据融合模型及基于异构数据源的疾病知识图谱构建框架是合理可行的。
其他文献
被称为“银色浪潮”的人口老龄化趋势是当前中国面临的一大挑战,与此同时互联网的快速普及和信息技术的迅猛发展是当今社会的另一面貌,为老年人群提供健康知识服务,是积极应对老龄化问题的重要举措,而对用户特征的研究是开展老年健康知识服务的基础工作和首要任务。本文选取两个国内最具有代表性的老年在线社区——银龄网和可爱老人网,综合利用在线社区中健康相关板块的多种用户数据开展用户特征研究。第一章绪论中,从老龄化社
学位
数字人文是数字图书馆建设达到一定规模后的必然发展方向。图书馆如何支撑数字人文研究关系到其在数字时代的生存和发展。随着一系列文化遗产数字化保护工作的开展,以图书馆为代表的公共文化服务机构积累了大量的数字人文图像资源。数字人文图像语义内容丰富,包含深刻的文化内涵、抽象的思想寓意和复杂的历史背景。当前,图书馆对数字人文图像资源的组织和利用存在检索方式单一、用户检索意图和检索表达的语义鸿沟、语义标引深度不
学位
我国商业银行在20世纪90年代末就已经面向对私客户建设个人客户关系管理系统,并利用数据仓库、商业智能等理念和技术,在电子渠道中重点加强了操作型客户关系管理系统的建设,在业务分析和管理中则实现以客户信息整合为基础的分析型客户关系管理功能。进入21世纪以来,随着移动互联网、大数据、云计算等技术不断成熟和全面应用,互联网金融企业通过业务和技术创新向传统银行发起了挑战,由此给银行造成的客户流失已充分显现,
学位
在线医疗咨询是医患诊疗的重要方式之一,尤其在新冠肺炎呈现全球爆发趋势的近期,为了降低普通患者院内感染的风险,在线医疗咨询成为了越来越重要的就医方式。由于这种线上医疗方式的信息传递渠道相较于线下医疗方式更为有限,因此在线医疗咨询非常依赖于医生的沟通,目前广泛推荐医生使用的一种沟通风格是“以患者为中心的沟通风格(Patient-centered communication,PCC)”。为了进一步优化网
学位
近年来,传统电商与直播流媒体相结合的电商直播模式得到迅猛发展。电商直播作为一种新型社交商务,具有区别于传统在线购物场景的高互动性、社交性和娱乐性等特点。电商直播情境下,主播能够更加直观、个性化地展示商品信息的内涵和外延。消费者通过替代体验获得更多的社会线索支持购买决策。电商直播改善了传统在线购物情境下的信息不对称现象,特别是对于风险较高的体验类产品,电商直播在一定程度上规避了产品不确定性带来的负面
学位
在数字经济时代,APP采集隐私信息已成常态,用户可向APP披露隐私信息来换取更优质的服务与个性化体验,企业可利用用户隐私信息挖掘数据价值,提高精准化、个性化、定制化服务质量,从而与其他竞争对手拉开差距。这本是一个双赢场面,然而,由于企业目前普遍采用过度采集策略,往往会出现企业过度收集用户数据和滥用用户数据的情况发生,更有甚者会出现隐私泄露现象,这不仅仅对企业自身造成极坏影响还会让用户承受隐私信息泄
学位
近年来,信息技术的快速发展,为在线社交、电子商务等互联网服务注入新的血液,将其发展带入新的层面。这些服务在给用户日常生活带来诸多便利的同时,也大量收集、使用了用户的个人信息。2018年初,蚂蚁金服、百度以及字节跳动等主流互联网服务提供商都因其对用户隐私获权等操作的不规范,陆续被国家工信部信息通信管理局约谈,要求整改。随后一年多的时间内,国家陆续出台实施了《信息安全技术个人信息安全规范》、《网络安全
学位
随着中国人口老龄化、重大疾病年轻化和慢性病的加剧,人们的医疗健康需求迅速增长。传统的医疗服务模式面临着地域结构失调、需求结构失调和医患关系紧张等一系列问题,难以应对快速增长的医疗保健需求。在线医疗社区作为“互联网+”健康医疗模式的新形态,利用网络优势充分整合国内优质医疗资源,打破时间和空间限制,为患者及其家属提供了更加全面的服务和支持。伴随移动互联网和社交媒体的快速发展,在线医疗社区也从门户网站、
学位
随着移动终端智能化和互联网技术信息化的迅速发展,创新性的科学技术(如人脸识别、虹膜识别技术)开始成为移动支付领域重要的发展支撑,如何借助新兴的技术手段优化支付方式并提升支付过程中身份识别的效率,开始成为移动支付领域面临的重要议题。本研究聚焦于消费者刷脸支付创新抗拒行为,从信息隐私的视角出发,探究三种维度下消费者刷脸支付创新抗拒行为的形成机理。通过客观数据爬取方法获得大量语料数据,运用扎根分析法对资
学位
学术图书作为传播学术研究成果、传承学术思想的基本载体,承载着推进科学繁荣发展不可替代的使命。学术图书影响力评价对促进学术成果交流传播、学科规划发展具有重要意义。鉴于学术图书结构和内容的特殊性、以及受众的多样性,使得利用同行评议法或引文分析法对其影响力进行评价存在片面性等固有缺陷。特别是在社交媒体环境下,随着大数据技术的兴起、数字出版的流行、开放获取的普及,学术交流和知识创新的诸多方面深受影响,学术
学位