基于多元数据融合的癌症亚型驱动基因识别算法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:mzl521fnn1314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
乳腺癌是女性中最常见的恶性肿瘤之一,同时是一种异质性疾病。癌症亚型特异性驱动基因的识别对乳腺癌的诊断、预后和治疗具有重要意义。随着下一代测序技术的快速发展,一些大规模的基因组学项目提供了多种癌症类型的大量的多组学数据,其中包括转录组学、基因组学和蛋白质组学等,为全面展开对乳腺癌的分子驱动机制的研究创造了一个前所未有的机会。如何通过整合分析多种类型的组学数据,从突变数据中识别出驱动基因是探索癌症进展的一大挑战。目前还没有稳健的模型能够从这些高异质、强相关的数据中挖掘出乳腺癌亚型相关的驱动基因与驱动通路。因此本论文基于多元数据融合来对驱动基因进行识别研究,从分子亚型来探索与患者预后相关的分子机制。本文的主要工作包括以下两点:(1)提出了一种基于模块网络的数据整合方法来识别亚型特异性驱动基因。首先针对高异质性乳腺癌数据在亚型之间进行差异表达分析,选出差异表达显著的基因数据子集,基于频率方法选出亚型候选调控基因;然后对每一种亚型,利用聚类方法构建初始模块,然后通过模块网络学习建立异质性网络,通过回归树模型建立起不同组学数据之间的调控机制,从而得到最终的模块和亚型驱动基因。最后为了验证驱动基因的特异性,本文利用基因表达数据基于十层交叉验证来分类样本,并通过拓扑通路分析和功能性分析来验证其生物意义。实验结果表明该方法是切实可行的,提出的整合方法能够识别出潜在的驱动基因,并且该方法相比于其他方法识别出的驱动基因能够较好的对癌症进行区分亚型。(2)提出了一种基于通路网络的驱动通路与驱动基因识别方法。通过整合拷贝数突变数据、基因相互作用网络数据和同源信息数据来识别出亚型的驱动突变。首先基于基因在所有通路中出现的频率和通路网络中基因的度来计算基因的初始权重;然后针对通路网络相互作用图,利用拷贝数突变和同源信息对通路网络中的点和边计算得分;进而计算整个通路网络的得分,通过排序选择出重要的驱动突变通路,同时选择出驱动通路中重要的驱动基因。为了验证选出的驱动基因的特异性,同样进行了亚型分类验证。针对选择的驱动通路和驱动基因进行通路活性分析和富集分析,并结合临床数据对通路进行生存分析。实验结果表明该方法的有效性,对于乳腺癌亚型的治疗具有参考价值,对了解乳腺癌的致病机制具有重要意义。
其他文献
消费级数码相机大都使用单个表面覆盖彩色滤波阵列的CCD芯片来获得彩色图像。原始图像在每个像素点处都只有红色、绿色、蓝色三基色中的一种颜色像素值。为得到完整的彩色图
当检察机关作为民事公益诉讼的起诉人时,其在民事公益诉讼中应享有处分权。虽然在《民事诉讼法》、《关于检察公益诉讼案件适用法律若干问题的解释》、《最高人民法院关于审
正则化路径(regularization path)方法是统计机器学习中一种有效的参数选择方法,该方法可以得出正则化参数所有的可能取值以及对应优化问题的解,在l1范数最小化(l1-norm minimization)和支持向量机(Support Vector Machine,SVM)的参数选择中发挥着重要作用。正则化路径方法主要利用了活动集(active set)方法追踪KKT(Karush-Ku
算法文化从古至今,积厚流光。我国古代数学中蕴藏着丰富的算法内容和思想。如今,从体现着算法知识内容的“算法初步”章节变成专门学习模块进入高中数学必修课程起,“算法初
直线运动平台是用来搬运或定位一个负载的执行机构。其是一种全新的实现运动与精确定位的机械结构,其实现了模块化设计,功能综合化。将之前的导向、传动系统、驱动系统等整合
三十多年来,国内外对中国中学生书面语体的多维度多特征研究仍是空白。本文基于Biber(1988)多维度多特征分析法,以LOCNESS(Louvain Corpus of Native English Essays)中的英
目前的频谱分配基本上是采用授权的固定分配模式,由于智能交通的快速发展对道路安全通告以及车内娱乐等车联网业务提出了更高的要求,已有的固定频谱分配方式已不能满足车辆用
目的:本研究利用不同条件培养大熊猫源石膏样小孢子菌,毛发穿孔试验及药敏试验探究该菌的部分生物学特性。对大熊猫源石膏样小孢子菌胞外蛋白酶提取、鉴定及致病性研究,以探
随着新课程改革的不断推进,培养学生的核心素养成为教学目标之一。我们以高中教学为视角,把力学部分作为主要研究对象,提出基于教学最优化的力学教学方案,并进行了教学实践,
假设p是一个奇素数,Fp是特征为p的素域.令O2+(Fp)是Fp上的2次加型正交群,并且令H是O2+(Fp)的Sylow p-子群.我们考虑O2+(Fp)在多项式环Fp[3V]上的保次Fp作用.本文找到p2+6个向量不变