融合癌症多组学数据和PPI网络的功能模块发现方法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:sam_rao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
癌症是一类严重威胁人类健康的疾病,其致病机制复杂而且难以治愈,研究表明癌症的发生发展是多种因素综合作用的结果。高通量测序技术的发展,使得多组学数据越来越丰富,如何利用多组学数据获取疾病相关致病信息是当前热门研究领域。作为一种重要的表观遗传机制,DNA(Deoxyribonucleic Acid)甲基化的异常往往会影响基因表达水平,从而诱导癌症的发生。蛋白质作为基因表达的产物,不能单独发挥其生物学作用,它需要与其他分子相互作用才能完成某些复杂的生理功能。蛋白质-蛋白质相互作用PPI(Protein-Protein Interaction)网络是一种在生物活动中起重要作用的生物分子关系网络,尽管大多数蛋白质的序列顺序已知,但是它们的分子功能仍然无法很好解释。针对PPI网络功能模块的研究有助于理解生物机制,随着计算机技术的不断进步,越来越多的研究人员借助于机器学习和数据挖掘相关算法处理PPI网络数据,目的是找出癌症相关的致病基因功能模块并进一步了解其致病机理。本文从全基因组水平上研究了多种癌症的DNA甲基化和基因表达关联模式,并将同时具有差异表达和差异甲基化的基因映射至PPI网络,使用一种重叠功能模块发现方法,获得癌症相关的致病基因功能模块。论文取得的主要创新性成果如下:1.本文针对PPI网络数据存在的系统误差和由于生物实验问题导致的数据不完备等问题,将PPI网络数据和多组学数据进行融合,使得多种信息形成互补,有利于挖掘深层的模式。首先,处理基因表达数据和DNA甲基化数据,使用一种基于?值的差异性分析方法,获得同时存在异常甲基化和异常表达的基因;然后将所得基因融合PPI网络用于后序分析。上述方法使得构建的网络具有一定的先验信息,有效的弥补PPI网络的不完备特性。2.本文提出了一种基于DKNMF(Diffusion Kernel and Non-negative Matrix Factorization)的重叠功能模块发现方法。首先,对本文构建的网络利用扩散核函数计算特征矩阵,该矩阵不仅表示相连节点之间有关联,还能表示出非直接相连节点之间的关联。然后,以该特征矩阵为输入,利用非负矩阵分解方法进行多次迭代计算,依据模块度获得最优划分个数,并进一步得到基因的隶属度矩阵。最后,从模块间重叠度和模块密度出发筛选出连接紧密的功能模块。和其他功能模块发现方法的对比结果表明,本文所提出的方法具有更好的性能。3.本文在多个癌症数据集上进行了实验。对每种癌症的基因表达数据和DNA甲基化数据进行分析,并将其融合到PPI网络,获得与每种癌症相关的功能模块和致病基因。实验分析表明,本文实验所得功能模块内部连接紧密,模块之间连接稀疏,并且部分模块间存在重叠结构。生物学角度的分析表明,对所得功能模块进行富集分析的结果均具有良好的生物解释,且富集产生的信号通路大多与癌症相关。实验结果表明,本文提出的方法不依赖于数据集,具有良好的可扩展性,可以广泛应用于其他领域研究。综上,本文提出的基于DKNMF的重叠功能模块发现方法能够从全基因组层面获得癌症相关基因功能模块,有助于复杂疾病的研究,并为癌症的诊断、治疗及预后提供了理论依据。
其他文献
开展课外经典文学作品阅读,不但有利于学生开阔视野,陶冶情操,享受读书的快乐,同时又是提高学生语文能力的重要途径。本文遵循了小学生的心理特点及阅读规律,指出了当前部分
在幼儿科学活动中,我们应奏响"生活化的乐章",沟通生活与科学活动联系,使幼儿体会科学就在身边,感受科学的趣味与价值,让幼儿对科学产生亲切感,这有益于幼儿发展、理解、探索
本文以存在内部控制缺陷的财务重述上市公司为样本,在区分对发现能力和动机选择的影响将主要内控缺陷披露影响因素进行归类的基础上,通过构建总体Probit实证模型和分阶段模型
对木犀草素在单纯水溶液介质中的电化学行为作了研究。结果表明:在pH4.0的B-R缓冲溶液作底液的条件下,得到峰形对称的木犀草素的可逆氧化还原峰。循环伏安法(CV)试验结果表明
我国多年来一直采用的传统的以标底为主要判据的招标方法,存在操作方法与运作机制上的缺陷,是产生工程腐败的制度漏洞之一。本文通过相关的应用经济学理论,价值、成本和价格
目的探讨继续囊胚培养筛选非优质胚胎中具有发育潜能胚胎的可行性。方法收集生殖中心142例IVF/ICSI治疗周期中受精后第3天(D3)移植、冷冻保存后剩余的538枚非优质胚胎继续囊
过我国改革开放三十多年来的高速发展,汽车整车行业以及汽车零部件行业正处在转型迭代的关键时期,原有单纯依靠燃油为动力源的汽车正受到来自依靠电池为动力源的汽车以及燃油+电池混合动力源的汽车的联合挑战。我国汽车整车行业以及汽车零部件行业正进入“电动化、智能化、网联化、共享化”-新四化时代。整个汽车产业链的上游、中游、下游众多企业都面临着诸多潜的不确定性,但与此同时众多企业在营和发展中存在着许多策略优化的
为了比较6种植物生长促进剂在赣北植棉区棉花上分期叶面喷施对棉花生长、产量、品质和增效的影响。通过在赣北育苗移栽植棉模式下,利用萘乙酸、赤霉素、细胞分裂素、芸苔素、
目的1.构建二乙基亚硝胺(Diethylnitrosamine,DEN)诱导小鼠肝纤维化-肝细胞癌(Hepatocellular carcinoma,HCC)动态模型,模拟肝纤维化-肝细胞癌发生发展过程。2.观察丹酚酸B(Salvia
目的评价热感糖浆治疗普通感冒(风热证)的临床疗效及安全性。方法本研究采用随机、双盲、安慰剂对照、多中心的设计方法,随机分为3组。A组78例(小剂量组)口服热感糖浆+热感糖