CM-Predict:一种基于共表达网络的癌症转移分类框架

来源 :吉林大学 | 被引量 : 0次 | 上传用户:luoxuefubai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
转移是癌症研究中一个长期存在的问题,阐述癌症的转移机制对于癌症的临床诊断以及晚期癌症患者的治疗具有十分重要的意义。作为癌症发展中最为致命的一个过程,大约有90%的患者死于癌症的转移阶段,并且常常表现出对某些器官的偏好性,大脑、骨头、肝脏和肺部是四种最常见的转移器官。差异表达基因并不具有保守性和特异性,很难从系统层面解释复杂的癌症机理,缺乏对系统级特性的整体看法。得益于基因测序技术的进步以及网络建模技术的发展,基于网络生物学的分析方法已经被广泛应用于癌症的各项科学研究中。对基因共表达网络的研究与应用使得我们从系统层面加深了对癌症的理解,也为我们研究癌症向特定器官转移的机制提供了新的启发。为了探究癌症的转移机制,我们提出了一种可以对癌症的转移器官进行预测的方法CM-Predict。利用同类型癌症样本基因共表达具有一致性的特点,我们搭建了一个利用参考网络和扰动网络进行特征提取的框架,并利用提取的特征对癌症转移样本进行分类。该方法的原理是对于一个特定的基因共表达网络,增加一个“同类别”的样本不应显著改变网络的共表达水平;相反,加入一个其他类别的样本则会对原网络产生较大扰动,从而改变网络的结构。作为比较,我们将CMPredict和其他分类方法进行了对比,对于癌症转移分类任务,CM-Predict在BLCA、ESCA和LIHC数据集中的性能明显优于其余对比方法,在BLCA、ESCA和LIHC数据集中的预测准确率分别可以达到0.986、0.964和0.933,具有较高的准确性,而且模型具有较高的召回率和F1-score。在三个数据集上的结果表明,该方法取得了最好的效果,这使得CM-Predict成为预测肿瘤转移的一个有效方法。其次,我们在CM-Predict获得特征基因对的基础上,提出了一种统计评价方法,用以对模型所筛选的特征基因对进行富集分析,得到具有统计学和生物学意义的路径。富集分析的目标集为CM-Predict所得到的特征基因对,在enrich GO富集分析的基础上,统计特征基因对和enrich GO所富集的通路信息,利用超几何分布加fisher检验的方法获取具有统计学意义的生物路径。该方法可以有效地对三种癌症中每个转移器官的特征基因对进行通路富集分析,结果表明该方法可以捕捉癌症原发癌向不同器官转移的关键生物过程,为阐述癌症的转移机制提供了新的手段。
其他文献
随着地球资源紧缺、人类社会节能环保要求,和消费者对多样化、个性化以及定制化产品的需求逐渐增加,绿色制造和柔性制造系统成为制造系统未来发展方向。机器人装配线系统结合机器人和混流装配线的优势,是高度柔性化的制造系统。本文研究考虑能源消耗的第II类机器人混流装配线平衡与排序问题(RMALBSPII):界定工业机器人生产环节的不同状态及状态之间的转换关系,量化不同状态下的机器人能源消耗,为构造理论模型提供
学位
紫丁香蘑(Lepista nuda)属于伞菌目、口蘑科、香蘑属,又名紫晶蘑、裸口蘑,是一种药食两用菌,主要分布在我国的云南、黑龙江、甘肃等地区。紫丁香蘑具有特殊的香气,富含丰富的维生素、蛋白质、矿物元素等营养物质,具有良好的生物活性。本文针对紫丁香蘑多糖开展研究,优化了紫丁香蘑多糖的提取工艺,分离纯化粗多糖得到三种纯化多糖,并对紫丁香蘑多糖的结构进行解析,通过细胞实验评价其生物活性,主要研究结果如
学位
绿茶未经发酵,保留了许多天然的营养成分与风味物质。其中,茶多酚(Tea polyphenols,TP)作为绿茶中的典型代表,是形成茶叶色香味及其功效的主要成分,也是茶叶中对人体健康有益的主要营养成分。儿茶素作为茶多酚的主体成分,在抗氧化、抗肿瘤、抗辐射等生物活性方面有着突出的表现,受到国内外学者的广泛关注。然而,由于茶多酚本身的抗氧化性极强,其在被提取加工制备的过程中难免会降解损失,这给茶多酚的高
学位
艾滋病自上世纪80年代出现以来,是全球重大的公共卫生问题。HIV感染者会经历多个感染阶段,从几年到几十年不等。有效的疫苗能够遏制艾滋病大流行,因此结合国内外关于艾滋病模型分析的研究成果,本文旨在探索当疫苗效力有限时,多感染状态的模型分析。传统的模型分析通常考虑了艾滋病的三个感染阶段,即I1,I2和AIDS期,其中,未接种疫苗的易感个体及接种疫苗但疫苗保护效力减退甚至失效的易感个体,可因感染进入到I
学位
本研究以洋县黑米为原料,以L.plantarum 115(LP)、L.bulgaricus 134(LB)、L.paracasei 37(LPC)、L.rhamnosus GG(LGG)、L.casei MGB(LC)和L.acidophilus 14(LA)六株乳杆菌为发酵菌种,首先研究了乳杆菌在未糊化与糊化黑米中的发酵特性、稳定性和产淀粉酶特性,然后研究了乳杆菌发酵对黑米体外抗氧化活性与多酚的
学位
桑葚和甘蔗糖蜜都含有丰富的多酚类物质,是其具有生物活性的原因之一。本论文以桑葚和甘蔗糖蜜为原料制得桑葚游离多酚(MFP)和甘蔗糖蜜多酚(SMP),对其总酚含量、总黄酮含量、多酚组成及含量、单独及联合抗氧化活性效果进行分析;此外,通过构建体外消化模型,阐明MFP、SMP及两者复配物MP-1和MP-2在口腔-胃-小肠消化系统中的消化特点,并通过体外酵解模型进一步研究多酚与肠道微生物的相互作用,主要结论
学位
自新冠肺炎疫情爆发以来,如何快速诊断人群是否感染该病毒成为全球卫生领域的一大难题。除世界卫生组织官方推荐的病毒核酸检测外,在我国卫健委发布的《新型冠状病毒肺炎》诊疗方案(试行第九版)中明确指出医学影像对新冠肺炎的临床分型有重要意义,是区分新冠肺炎轻型(无需住院)与普通型的金标准。鉴于能进行医学影像诊断的放射医学人才十分有限,难以完成繁巨的临床任务,利用机器学习中的深度神经网络对新冠肺炎的医学影像进
学位
我国作为板栗原产国,产量常年位居世界第一,但由于缺乏深加工产业及现有加工产品附加值低等问题严重制约了我国板栗产业链的发展,这主要与对板栗加工性质和营养功能的研究不够深入有关。而淀粉作为板栗的主成分,其存在加工后消化率升高及易回生等问题在一定程度上限制了高品质营养健康板栗食品的开发。因此,从协同调控板栗淀粉消化性能及回生性能的视角,在提高其营养功能的同时赋予其优良的加工品质,是突破板栗制品创制瓶颈的
学位
随着深度视觉网络在如自动驾驶、医疗诊断等风险敏感应用中的普及,网络的安全性逐渐成为学术界和工业界的研究重点。在此背景下,用于安全漏洞检测的对抗攻击技术应运而生。对抗攻击通过生成相似于原始图片的对抗样本的方式,暴露网络的安全漏洞,从而为基于漏洞弥补的防御策略研发提供样本支持。然而,现有攻击方法在实际部署网络中的应用仍存在局限性。一方面,大多数攻击方法将分类网络当作目标攻击模型,难以推广至结构更为复杂
学位
车辆自适应巡航控制(Adaptive cruise control,ACC)系统是车辆高级辅助驾驶系统的重要组成部分,能够减轻驾驶员负担,提高驾驶安全性,对于燃油经济性也有一定的改善作用。随着无线通信、物联网、人工智能等先进技术的应用,车辆智能化和网联化程度不断加深,在行驶过程中能够获取多层次、多尺度的交通网联信息。在智能网联的背景下,基于ACC基础的预测巡航控制(Predictive cruis
学位