基于高通量数据筛选癌相关生物标记的可重复性研究

被引量 : 1次 | 上传用户:kkfhvk1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因芯片等高通量检测技术对癌症等复杂疾病的研究产生了巨大影响。根据基因表达谱与蛋白质相互作用等高通量数据,采用数据挖掘技术寻找癌症的生物标记对了解疾病机制、预测疾病风险有重要的意义。然而,对同一种癌症的研究,由不同的实验室得到的疾病标记通常很不一致。这引起了人们对这些疾病标记的临床应用和高通量技术的可靠性的质疑。本论文从三个方面对基于高通量技术筛选癌症生物标记的可重复性进行了探讨:1.疾病标记的低重复性通常被归因于实验设计缺陷、实验误差和统计分析的缺陷。但是,这些来自不同样本的疾病标记的不一致很可能反映了生物学变异和癌症的异质性。以乳腺癌转移为例,我们发现虽然不同数据得到的枢纽蛋白标记的重复性很低,但是这些枢纽蛋白显著地共享互作邻居并和这些互作邻居具有一致的共表达改变,而且不同数据获得枢纽蛋白标记共享的互作邻居倾向于候选癌基因,并影响一些乳腺癌转移相关的通路。因此,在不同病人中,不同枢纽蛋白标记可能通过与共享的互作邻居发生共表达改变而影响相同的功能。2.在癌细胞中差异甲基化的基因作为生物标记也被广泛用于癌症的诊断,同时异常的甲基化被认为是基因在癌症中发生表达改变的重要因素。我们分析了7种癌症的甲基化数据,我们发现在移除批次效应后,由研究同一疾病的不同数据得到的甲基化标记高度一致,证明了利用甲基化芯片识别差异甲基化基因(生物标志)的可重复性。结合表达谱数据,我们发现基因的高甲基化和表达下调显著相关,而低甲基化只和表达上调微弱相关。我们的结果显示,在不同癌症中的低甲基化基因都影响“角质化”,“趋化性”,“免疫反应”等和慢性炎症相关的功能,提示慢性炎症可能是诱发癌症全局性低甲基化的因素。3.由于癌症的遗传异质性及各种分子改变在个体间存在很大的生物学变异,寻找少数几个可重复的的疾病标记可能需要数千个样本。考虑到基因的表达行为不是孤立的,并且表达相关的基因倾向于功能相似,我们进一步提出了一种结合Gene Ontology(GO)基因功能分类知识体系筛选疾病特征功能模块并进行疾病识别的方法。我们没有选择少量的差异表达基因,而是用每个GO节点中注释的所有基因来构建分类器。通过分析7套癌症数据,我们发现每种癌症中都有大范围的功能模块发生了基因表达的改变,这些模块有很强的疾病识别能力,其中7个功能模块能够有效识别多种癌症的疾病样本,提示在不同癌症的发生与发展过程中存在着共同的基因表达改变机制。因此,功能模块可以作为疾病的标记可以取代难以重复发现的单个基因,用于研究癌症的核心机制和建立更稳定的诊断分类器。
其他文献
<正>一、引言如何实现车险规模与效益的协调发展,逐步提高车险业务的盈利能力,保证车险业务可持续发展,已成为当今保险业的焦点问题。笔者认为,就保险公司而言,加强核保精细
随着人类进入21世纪,我国的旅游饭店业发展的宏观环境、市场环境和服务对象都发生了新的变化。服务业地位的提升,为旅游业和旅游饭店业发展创造了良好的社会环境,饭店业作为
以甘肃省农村居民消费为研究对象,初步测算了甘肃省城乡居民恩格尔系数;比较、分析了城乡居民恩格尔系数变化特征;同时,根据此变化特征,将甘肃省农村居民消费结构发展变化过
检察宣传是检察工作的重要组成部分,是弘扬主旋律、树立检察形象、提高检察工作公信力的重要窗口,是凝心聚力、促进检察工作科学发展的重要措施,是增加检察工作透明度,赢得党
情境教学并非放弃传统教学或网络平台教学,三者可以相辅相成,合而为一。传统教学如果做到讲练结合,简洁明快,则可收到事半功倍之效;网络教学,如能做到师生互动,生动活泼,则可
视频包装是动态图像的主要应用场景之一,在以信息传达为目的的动态图像设计中,叙事设计是能否完整、准确和迅速传达信息的关键。动态图像将主题的阐发沿时间轴展开,如果将事
分析了网络化对军队思想政治教育的影响,并就如何利用网络,拓展思想政治教育,提出了应对对策。
随着全球工业化和城市化的迅速发展,城市排污河道的污染状况日益严重,采用原位植物修复技术进行治理既简单经济,又环保美观,且可操作性强,前景十分广阔。为了给今后河道修复
IC产业正面临着市场全球化、竞争日益激烈的环境,面对的挑战无处不在。IC设计公司必须根据自身所处的发展阶段,科学、正确地评价与选择合适的供应商,完善内部资源管理系统,寻
利用人工投加菌对土壤中农药残留进行生物降解与修复的试验,分别探讨了外加菌在土壤中降解性能、在土壤中移动与存活时间、菌剂用量和最佳修复条件等。结果表明,本试验用的DL