基于多维基因组数据的癌症关键模块识别算法研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:wb_0622
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
癌症是在众多因素共同作用下发生的复杂疾病,会严重危害人类的健康。由于癌症的复杂性,从单一类型的数据中识别出的关键模块通常无法用于全面探究癌症的致病机理。随着测序技术的发展,涌现了大规模的多维基因组数据,这为研究人员对癌症的探究提供了新的视角。整合分析癌症的多维基因组数据,继而识别包含不同层次的生物分子信息的关键模块将有助于探索癌症发生发展的潜在机理,最终能为癌症的早期筛查和临床治疗提供理论依据。在联合非负矩阵分解(JNMF)算法理论的基础上,本文分别提出了稀疏正交正则化联合非负矩阵分解(SOJNMF)算法和网络正则化约束的稀疏正交正则化联合非负矩阵分解(NSOJNMF)算法用于癌症的多维基因组数据中识别了癌症的关键模块。分析结果表明,这两种算法有效地解决了JNMF算法和一些同类算法在实践应用中存在的问题。本文的工作如下:(1)为了保证分解后矩阵的稀疏性以及减少各个模块之间的冗余度,在JNMF算法框架的基础上,本文将L1范数应用于系数矩阵的同时引入正交正则化来约束系数矩阵,提出了SOJNMF算法,并将其应用于肝癌的多维基因组数据,最终识别了238个关键的mRNA-miRNA-甲基化模块。性能比较的结果表明,SOJNMF算法能明显降低识别的238个关键模块之间特征的重叠率,且AUC值要高于JNMF算法和SJNMF算法。功能富集分析结果表明,这238个模块中的大部分都有生物学意义。此外,这些模块的富集分析结果中富集最多的GO生物学过程和KEGG通路均与肝癌的发生发展密切相关。置换检验的结果表明,238个模块中59.6%的模块内部不同数据类型的特征在统计学意义上显著相关。这些结果表明SOJNMF算法能有效识别与肝癌相关的关键mRNA-miRNA-甲基化模块,有助于在多维基因组数据的层面上研究与肝癌相关的生物学途径的调控机理,对肝癌的临床研究和早期诊断具有参考意义。(2)为了识别miRNA、mRNA和lncRNA之间的关系,本文提出了NSOJNMF算法来识别与癌症相关的ceRNA共模块,以帮助了解癌症内RNA的表达模式和潜在分子机制。该方法以网络正则化的方式整合了RNA数据之间的相互作用关系,同时通过稀疏约束和正交正则化约束有效防止多重共线性,最终产生良好的模块化稀疏解。将NSOJNMF算法应用于肝癌数据集和和结肠癌数据集,分别识别出了200个肝癌的关键模块和210个结肠癌的关键模块。对这些模块的富集分析结果表明,90%以上的模块与癌症的发生发展密切相关。此外,由ceRNA共模块构建的ceRNA网络不仅准确地挖掘了三种RNA分子的已知相关性,而且还进一步发现了它们潜在的生物学关联,这可能有助于探究多种RNA之间的竞争关系及肿瘤发展的分子机制。这表明NSOJNMF算法可有效识别ceRNA模块,能够为未来验证基因组学数据中多种RNA之间的竞争关系影响肿瘤的发展这一观点提供理论支持和基础。
其他文献
正渗透(FO)技术作为一种新型的膜处理技术,在膜两侧溶液渗透压差的驱动下自发进行,具有更低的能耗和膜污染趋势,在水处理领域显示出巨大的应用潜力。但是,长期运行条件下的膜污染问题导致运行效率低,是阻碍FO技术广泛应用的关键。有机污染物易沉积并吸附到膜表面,是导致膜性能下降的主要原因。膜材料对膜污染的产生和发展具有决定性作用。由经典界面聚合法制备的聚酰胺复合正渗透(TFC-FO)膜是目前主流的膜类型。
学位
许多物理问题的控制方程都是微分方程,例如,人口问题、混合问题和落体问题均是以微分形式观察到的基本物理现象.对这些重要的物理问题引起的微分方程进行系统性研究时,任何显式解的发现对于研究其动力学行为都起着关键性作用.对非线性微分方程进行对称分析、精确解和守恒律的研究能够辅助对复杂物理现象的科学解释和工程应用.本文以李对称分析为主要的求解思想,结合符号计算软件Maple,研究以下三类非线性偏微分方程模型
学位
范德华材料是指同一层的分子中的原子在平面内以化学键相连,层与层之间的分子中的原子以微弱的范德华力相互作用的材料,根据其物理性质,可以将范德华材料分为两类:1.各向同性材料,如:石墨烯和过渡金属硫化物;2.各向异性材料,如:α相Mo O3(α-Mo O3)和六方氮化硼。近年来,范德华材料因其具有较小的短沟道效应、缺陷干扰相对较少、低损耗等优异的光学特性成为目前的研究热点。本论文基于传输矩阵法(Tra
学位
凭借高灵敏度、多参数、强穿透能力、水分敏感等特性,微波测湿技术在环境湿度传感和物料水分测定领域体现出了独特优势。然而,微波器件与湿敏材料的协同工作机制、微波信号与被测物料的复合建模、面向微波湿度传感与水分测定的频段调控与结构设计等关键科学与技术问题仍有待研究。本文围绕微波检测模块的传感机理和微波测湿技术的微扰模型展开深入研究,设计了两种微波检测结构,即耦合型微带谐振器和插槽型贴片天线,分别用于环境
学位
本文在分析文旅融合研究进展的基础上,从景观基因视角,运用系统分析、层次分析和熵权法等研究方法,从文化资源的旅游开发度、旅游活动的文化传承度、文旅发展的耦合协调度3个维度,构建了传统村落文化景观基因传承与旅游发展融合度的指标体系和综合评价函数。据此,对首批侗族传统村落进行评价。结果表明:(1)传统村落文化景观基因传承与旅游发展融合过程可分为“分散融合”、“融合调整”和“全面融合”3个阶段;(2)总体
期刊
碳点(CDs)作为碳基纳米材料的重要成员,具有高化学稳定性和光吸收率、低毒性和快速光致电子转移等特点。近三年来,CDs在促进作物生长,提高作物产量和品质等纳米农业领域中展现出新的应用潜力,CDs纳米农业成为研究热点之一。然而,CDs结构与其生物有效性的关系还不清晰,而且CDs在农业生态系统中的诸多调控机制还不明确。因此,本论文系统探究了掺氮碳点(N-CDs)与CDs在调控玉米光合作用方面的差异性,
学位
近几十年,分数阶微积分的研究不再只是侧重于纯数学理论的工作,而是开始扩展到许多科学与工程领域。作为其中一个重要分支,分数阶神经网络的同步性问题逐渐成为了研究热点。由于网络通信的实际环境条件,在对工程问题建立模型时,不得不考虑众多对网络通信带来不利影响的因素的存在性,因此设计合适的控制机制保证网络处于非理想状态时还可以达到同步性是值得思考的问题。本文主要对受到器械零件老化等引起的参数不确定问题,不可
学位
基于核心素养的学业质量标准是《义务教育道德与法治课程标准(2022年版)》的重大创新成果。准确理解学业质量标准必须从它的生成方式、内容结构、陈述结构等方面全面把握。学业质量标准是新课标的核心内容,是教学评的基本依据或参考,要发挥它的这一功能,必须对学业质量标准在实际应用中涉及的理论问题和操作方式进行深入思考。新课标以理论研究为基础,创造性地以学科任务导向型测评框架为实施学业质量标准的基本工具。
期刊
自2004年Science上提出“微塑料(Microplastics,MPs)”概念以来,微塑料作为一种新型污染物受到了广泛关注。大量研究表明微塑料会经过生物或非生物的作用进一步分解为粒径更小、性质更为活跃的纳米塑料(Nanoplastics,NPs)。纳米塑料的尺寸效应,可能使其具有独特的环境化学行为和生物有效性。进入环境中的纳米塑料,理化特性及其环境行为容易受到环境组分(如矿物质、有机质)和生
学位
近几年来,数学物理反问题由于其广泛的应用背景而受到了国内外学者的密切关注.其中矩型区域上的各类反问题已经有了很好的发展,而某些特殊的对称区域上相关反问题的研究成果还相对较少.故本文考虑球型区域上的反源问题和反向问题.这两类问题都是不适定的,传统方法得到的解常常会严重偏离真实解,因而需要利用正则化方法来获得可接受的近似解.本文的内容主要由以下几章构成.第一章主要介绍了研究背景和意义,以及国内外研究现
学位