基于RNA-seq数据的CCA基因共表达网络的构建和分析

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:ylfxg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因共表达网络是生物网络的一种,由基因作为结点,基因间的相互关系作为边。它可以用于寻找基因模块和hub-gene从而发现新的致癌基因、癌症亚型等。现有的大多数构建方法使用基因表达谱数据计算基因之间的关系,然而随着第二代测序技术的发展,人们可以得到比基因表达谱更细粒度的数据:基因所包含的外显子的表达值,也就是RNA-seq数据。这就要求我们使用新的方法构建基因共表达网络,典型相关分析CCA就是其中一种。CCA方法将一个基因看为多个外显子组成的向量而不是一维数值,构建的网络更为精确。在CCA算法的基础上,本文增加了数据预处理部分并对基因共表达网络的分析方法提出了改进。数据预处理部分使用了多种方法在不同维度对数据进行了归一化,并且使用T检验、Wilcoxon秩和检验和K-S检验筛选出normal组和tumor组之间表达显著的外显子,减少计算量并提高数据质量。在共表达网络的分析中,将基因共表达网络用于寻找显著pathway:使用normal组和tumor组的共表达网络计算pathway之间的共性分类相关关系CPCC,该值越小说明pathway越显著。为了证明分析方法的有效性,使用乳腺癌RNA-seq数据构建基因共表达网络,对top20pathway的显著性进行论证。在这20个pathway中,有12个pathway可以找出与乳腺癌相关联的文献,对这些pathway包含的基因进行层次聚类,结果显示normal样本和tumor样本被分的很开。此外,这些pathway的CPCC在随机CPCC的正态分布中的概率值均小于0.2。这些结果都显示我们的方法是有效的。最后我们构建了网站,实现了CCA构建的基因共表达网络及CPCC分析结果的在线显示。用户可以选择相关癌症和pathway,网站会展示出normal组和tumor组数据的共表达网络和分析结果。
其他文献
橡胶类材料是一类具有很多优越特性的高分子材料。在工程领域中,其承受弹性大变形的力学特性是其他材料不可替代的。橡胶材料在人们的日常生活及冶金、汽车、机电、建筑、石
公信力是政府的影响力与号召力。它是政府行政能力的客观结果,体现了政府工作的权威性、民主程度、服务程度和法治建设程度。清楚认识政府角色定位、强化政府信用行为、巩固
目的研制酮洛芬醇质体凝胶,并对其质量进行初步考察。方法采用注入法制备酮洛芬醇质体,通过正交实验优选较佳处方和工艺;采用研和法制备醇质体凝胶,HPLC测定其中主药的含量,
针对某电厂1000MW机组引风机轴承温度高的现象及原因进行分析,通过对引风机轴承检查,提出了轴承油脂选型、检修工序工艺及质量监督管理等防范措施,希望能够确保风机安全可靠
发展混合动力军用车辆对加速军队现代化建设具有重要的意义。作为混合动力军用车辆的重要组成部分,驱动电机直接为车辆提供动力,对整车的技术性能起着决定性的作用。随着军队
水利工程建设事关国计民生,而水利工程材料的产品质量对工程建设有重大意义。采用传统的普通液压万能试验机对建材样品进行加荷试验,由于试验过程均为人工操作,机械化程度低,
目的对地锦草的提取工艺进行研究。方法采用正交试验法,以槲皮素的含量为考察指标进行试验。结果用地锦草重量10倍量的体积分数为75%的乙醇作为提取溶剂,提取2 h,共提取3次为
针对北京市水资源短缺,水环境、水生态恶化等问题,为充分合理的进一步挖掘本地水资源的供水潜力,结合本人参与的“数字永定河”-官厅分中心信息化建设工作,从信息化和水资源
介绍了电动汽车关键技术发展状况,分别从电动汽车用驱动电机、动力电池及电池管理系统、电机控制及能量回收系统等方面进行了概述,并对电动汽车技术发展趋势进行了展望。在政
作为微流体系统的核心部件、驱动源,专家学者对微泵开展了大量的研究,实现了众多应用。针对传统微泵结构复杂、制备困难等不足,本文提出了一种新型的基于激光冲击波力学效应