肿瘤纯度在差异基因表达和肿瘤亚型聚类中的作用研究

来源 :上海师范大学 | 被引量 : 2次 | 上传用户:qqww1234cc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
肿瘤与正常细胞的差异基因表达分析、肿瘤的亚型识别都对癌症的早期诊断和临床治疗具有非常重要的意义。然而,临床上获得的肿瘤组织往往包含一定数量的其它细胞,如正常细胞、免疫细胞、基质细胞、血管细胞等。其中,正常细胞的混入会对差异基因表达分析和肿瘤亚型分类产生不利影响。因此,建立合适的统计模型修正肿瘤纯度信息对差异基因表达分析、肿瘤聚类的影响是亟待解决的工作。本论文针对以上两个问题展开系统研究。首先,我们研究了肿瘤纯度信息对差异表达基因分析的影响。通过模拟分析发现,肿瘤纯度与基因表达量差异之间的关系是乘性而非原来认为的线性关系。忽略肿瘤纯度,或者将肿瘤纯度作为协变量加入回归模型都会使得差异表达基因分析的结果出现偏差。为了解决这个问题,我们提出了一种广义的最小二乘模型和Wald方法来检验每个基因在肿瘤和正常细胞之间的差异性。通过对TCGA肿瘤数据的分析表明,无论是在差异表达基因个数、肿瘤间统计量一致性等指标上还是在对应癌症类型功能关联性上,该方法都优于传统的t-test和limma。其次,我们研究了肿瘤纯度信息对肿瘤样本进行无监督聚类的影响。通过对TCGA乳腺癌450K甲基化芯片数据聚类结果分析发现,利用传统的k-means和NMF进行聚类,肿瘤纯度将会使得聚类结果出现偏差,具有相类似纯度的肿瘤样本极易聚在同一类,并且肿瘤纯度较低的样本极容易聚错。基于此,我们针对DNA甲基化芯片数据,提出了一个基于模型的聚类算法。我们将肿瘤样本在每一个位点的甲基化水平假设成了一个高斯混合分布,利用EM算法进行参数估计和肿瘤样本聚类。数据模拟分析表明,相比较于k-means,我们的算法具有更高的精度。通过对TCGA的23种癌症的分析发现,我们的方法得到了相对于k-means和NMF的偏差较小的聚类结果。
其他文献
目的探讨泌尿外科腔内钬激光手术的护理要点及手术注意事项,以总结切实有效的手术配合方法,更好的为患者服务。方法回顾2010年1月~2011年12月186例行腔内钬激光手术患者在术前
目的:研究腔内钬激光手术在泌尿外科的护理程序及注意事项。方法:将一年来实施的170例泌尿外科腔内钬激光手术病人的护理程序及注意事项进行总结。结果:170例病人在运用腔内
在市场竞争激烈的社会,面对困境,民营企业不能随波逐流,坐等破产倒闭,而应通过改善营运资金管理,设法增加现金流入,尽快走出困境。本文针对民营企业应收账款增多,现金收入减
本文结合科学和中医的定义,依据现代科学划界的标准,从科学哲学的相关内容出发分析讨论中医的科学性和对中医的正确认识。
随着人民生活质量的提高及饮食结构的改变,我国直肠癌发病率和病死率逐年增加。直肠癌是发生在直肠的肿瘤,是常见的消化道恶性肿瘤,其病因尚不明确,主要与饮食及生活习惯、既
本文从构建主义原真性原理出发,通过对南丹白裤瑶非物质文化遗产旅游发展现状的研究,分析了白裤瑶旅游发展中存在的问题,并针对存在的问题,从非物质文化遗产的旅游开发与文化
固定资产是企业的主要资产,管理好固定资产是企业资产管理的一项重要工作。新会计准则对固定资产的核算有较大的变化,本文着重从新会计准则下固定资产的后续支出和减值准备的
自20世纪80年代改革开放以来,社区制取代单位制,全面推进社区建设需要进一步完善社区功能,来适应社区居民多样化的服务需求。城市生活的快节奏使居民没有时间和精力经营家庭
目的:探讨钬激光治疗泌尿系统腔内疾病护理的重要性。方法:对2001年至今,使用钬激光通过不同专科腔镜,对泌尿系统腔内多种病变组织进行汽化切除、结石碎石护理6 915例进行分
新课程标准要求我们在英语教学中要积极开发教学配套资源,教学要有灵活性、开放性和拓展性、能让学生在轻松的环境中优化学习方法,本文旨在论述英文歌曲在英语教学中的应用的