基于概念共现与引用的潜在共病关系发现研究

来源 :北京协和医学院 | 被引量 : 0次 | 上传用户:SONGZHIQIANGAAAA
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
共病是指两种疾病共同存在的状态,与日益增加的不良健康结果相关。共病的早期筛查与预警有助于完善临床诊疗思维,改善患者的预后。许多领域的共病研究处于起步阶段,疾病间的关联关系尚存在很大的不确定性。大量的疾病知识蕴藏在生物医学文献中,如何从海量的文献中有效地挖掘共病关系、预测潜在的共病组合是本研究主要探讨的问题。针对共病研究的必要性以及现有共病挖掘方法的局限性,本研究以糖尿病领域为例,从语义共现和引用行为两个视角出发,以SAO语义模型和引文全文本为基础,结合BP神经网络模型预测潜在的共病关系。首先,分别基于共现关系和引用关系构建共病网络。根据生物医学领域文献的特点,利用SemRep和MetaMap工具,抽取论文中的疾病概念。分别构造基于共现的共病对和基于引用的共病对,由此构建3个共病网络——共现关联网络、引用关联网络和二者取并集后的融合网络。通过网络基本特征指标、微观指标和链路预测指标对共病网络进行评价和比较,发现融合网络能够更好地描述糖尿病领域的共病现象。选用融合网络预测潜在的共病关系,利用链路预测算法计算融合网络的14个网络结构特征,包括基于局部信息的相似性指标、基于路径的相似性指标和基于随机游走的相似性指标。通过构建包含一个输入层、一个隐含层和一个输出层的BP(Back Propagation)神经网络模型,将网络特征进行整合,预测潜在的共病组合。预测模型的精确率为99.97%、召回率为84.40%、准确率为95.08%、F1分数为93.83%。预测结果中包含三种类型的节点关系:学术界已知的糖尿病共病关系、潜在的糖尿病共病关系和已知的糖尿病共病间的潜在共病关系。重点对糖尿病共病疾病间的潜在共病关系进行分析,发现在最新的文献中报导了这些疾病对存在关联的可能,但尚未明晰其中的关联机制,是未来值得探索的研究领域。模型的预测效能较好,预测得到的潜在共病关系基本符合相关文献的描述,能够证明本研究提出方法的有效性和可行性,达到了预期的实验结果。
其他文献
目的探究Ⅱ-Ⅲ期结直肠癌根治术后局部复发的危险因素及生存预后分析,根据危险因素构建列线图(nomogram)复发预测模型及生存预测模型并对其验证。同时探究Ⅱ-Ⅲ期结直肠癌局部复发后不同治疗方式治疗对患者生存时间(Overall Survival,OS)的影响,以指导临床医生对局部复发结直肠癌患者进行个体化评估和治疗。方法1、回顾性分析2009年1月至2019年12月在国家癌症中心/中国医学科学院肿
学位
背景:缺少关于中国急诊非瓣膜性心房颤动患者的肌酐清除率(CrCl)与不良临床结局之间的关系的真实世界数据。方法:对一项对前瞻性、观察性、多中心的房颤注册研究的数据进行事后分析。该注册研究纳入了 2008年11月至2011年10月在中国20家医院急诊就诊的非瓣膜性房颤患者并随访12个月。选择其中有CrCl数据的863名房颤患者纳入分析,将患者分为 CrCl≥80、50≤CrCl<80、30≤CrCl
学位
背景与目的阿尔兹海默病(Alzheimer’s disease,AD)是一种起病隐匿的进行性神经退行性疾病,目前病因尚不清楚,其临床特点是全面性痴呆。β淀粉样蛋白(β-amyloid,Aβ)斑块是AD的典型病理特征之一,在淀粉样蛋白级联假说中扮演重要角色。既往研究表明,Aβ斑块的沉积能够促进神经纤维缠结(Neurofibrillary tangles,NFT)和神经炎斑块(Neuritic pla
学位
目的:上皮样血管内皮细胞瘤(Epithelioid hemangioendotheliom;EHE)是一种较为罕见的血管源性恶性肿瘤,肿瘤细胞呈上皮样细胞索伴有大量粘液性透明样间质,可局部累及皮下软组织、骨组织器官和内脏器官。由于上皮样血管内皮细胞瘤发病率较低,目前国内外大多数上皮样血管内皮细胞瘤的实验研究少之又少,基本是以个案形式报道,关于上皮样血管内皮细胞瘤的分子发生机制、临床病理学特征及预后
学位
背景随着对肿瘤发生发展机制研究的进展,乳腺癌作为一种全身性疾病的观点已经被广泛接受。既往观点认为乳腺癌是一种免疫原性较低的实体肿瘤[1],但是随着对肿瘤发生、发展的分子及基因表达层面的进一步研究,部分高肿瘤突变负荷的乳腺癌亚型(如HER-2过表达型、三阴性)被证实具有较明显的免疫原性。肿瘤浸润淋巴细胞作为免疫微环境的主要组成成分,也被证实与乳腺癌患者病理亚型有一定相关关系,部分淋巴细胞亚群的变化有
学位
目的:评价心血管磁共振(cardiovascular magnetic resonance,CMR)压缩感知实时(compressed sensing real-time,CSRT)电影成像的图像质量,以及在正常窦性心律患者中与多次屏气常规分段电影序列结合辛普森(simpson)容积计算方法相比,采用单平面面积长度方法测量左心室容积及收缩功能的可行性。方法:本研究前瞻性连续纳入36例各类心脏疾病患
学位
第一部分 原发性高血压患者免疫微环境特征的研究背景:原发性高血压是一种轻度慢性炎症性疾病,然而,临床高血压的外周免疫状况仍缺乏全面的描述。我们希望通过对高血压患者外周血免疫细胞状态的研究,来阐明高血压独特的免疫微环境,期待为高血压的诊断和治疗提供帮助。方法:使用飞行时间质谱流式(CyTOF)技术对原发性高血压患者组(EH,n=5)和健康对照组(HC,n=5)的外周血单个核细胞(PBMC)进行检测。
学位
乳腺癌是世界上女性发病率和死亡率最高的恶性肿瘤,在中国也是女性最常见的肿瘤。乳腺癌的远端器官转移对预后有显著影响,是乳腺癌患者死亡的主要原因。乳腺癌常见的转移器官包括骨、肺、肝、脑等。不同的肿瘤细胞优先定植转移到特定的靶器官,其成功转移取决于靶器官特异性微环境与肿瘤细胞的相互作用,但具体转移机制尚未明确。乳腺癌转移模型是筛选乳腺癌转移相关基因、研究转移嗜器官性和探究肿瘤转移分子机制的重要研究工具,
学位
科学和技术创新是一个国家兴旺发达的不竭动力,是许多企业生存和发展的生命线。科学和技术创新的基础在于技术本身所存在的机会,识别这些技术机会的能力是国家和企业科技创新利益的核心。大数据时代,科技和产业生命周期进一步缩短,技术革命更快推动。为了获得领域内的竞争优势,相关组织和机构越来越重视使用更加高效的方法来自动化监控、处理和识别高速变化、增长的领域的技术机会。但技术机会是隐藏在论文、专利、研究报告等多
学位
随着互联网的发展,学术成果分享和传播的途径更加多样,知识流动的方式也发生了改变。学术论文作为常见的学术成果类型,除了被其他成果引用,也越来越多地被社交网络提及。替代计量学可以测度学术成果的社会影响力,追踪的学术交流行为已经由传统的文献引用发展为各种新形式,可以作为科技评价的新维度。替代计量指标具有及时性、综合性和社会化的特点。通过梳理学者学术成果影响力评价、替代计量学以及情感分析的研究现状,发现目
学位