基于SNP arrays和NGS数据的肿瘤异质性建模分析方法

被引量 : 0次 | 上传用户:lovecat_fish
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着肿瘤研究的深入,人们逐渐认识到个体肿瘤存在一种典型的性质——异质性。肿瘤异质性是指同一肿瘤组织中存在不同类型的亚克隆细胞,它们在分化程度、侵袭转移能力以及对药物的反应等诸多方面存在差异。当前,高通量、大规模的测序技术使得从基因组水平上揭示肿瘤的本质成为可能。如何对测序所产生的海量数据进行有效地建模分析,是肿瘤基因组学亟待解决的问题。由于肿瘤样品的纯度问题、亚克隆细胞基因组复杂的变异方式以及高通量测序信号本身的噪声特性,构建合适的异质性肿瘤数据的统计模型依然具有挑战性。在这一背景下,本文提出了两种异质性肿瘤统计分析方法,分别以单核苷酸多态性微阵列(SNP arrays)和下一代测序(NGS)数据为基础,围绕亚克隆细胞的识别以及肿瘤基因拷贝数变异的鉴定进行了深入分析和研究。主要内容安排如下:1)详细地介绍了SNP arrays技术提供的两个基因信号Log R ratio (LRR)和Ballele frequency (BAF)对应不同的拷贝数变异时的信号值的变化。分析了一些实际肿瘤样品中的非理想因素,包括正常细胞污染、肿瘤细胞非整倍性、GC含量对基因信号带来的偏移,重点讨论从基因信号的二维分布图中怎样发现肿瘤异质性。2)借助正常成对基因组数据和已注解的SNP位点将NGS技术的全基因组读数信息经过提取和转换,得到和SNP arrays技术具有类似意义的LRR和BAF信号,同时也提出两个平台上信号在分布、信噪比及数据量上存在差异。3)提出了异质性肿瘤SNP arrays数据的分析方法(CHASE)。该算法采用隐马尔科夫模型(HMM)建立可观察的基因信号和对应隐藏的基因型之间的关系,同时考虑了多种非理想因素。该方法的创新点在于建立了两种肿瘤亚克隆同时存在的情况,采用了牛顿迭代算法来估测亚克隆细胞的比例。对于多组模拟肿瘤数据集和两个真实的乳腺癌数据的分析结果显示,该方法对检测异质性肿瘤中亚克隆细胞的比例以及克隆变异和亚克隆变异都具有较高的准确性。4)提出了针对正常-肿瘤成对NGS数据的异质性和基因型检测方法(SAPPH)。该方法采用增强的循环二进制分割算法(CBS)将基因组分成基因片段,通过过滤出高可靠性基因片段、聚类局部肿瘤基因比例和贝叶斯信息准则(BIC)模型选择的策略,有效地避免了信号截断的影响、降低了分析的时间复杂度。模拟实验表明该算法可以有效地检测出样品中多种亚克隆细胞比例和基因组拷贝数变异。本文的研究对异质性肿瘤SNP arrays和NGS数据的分析提供了有效的生物信息学工具,并对寻找癌症驱动基因、研究癌症基因组的演化历史和个性化治疗带来了很大帮助。
其他文献
2011年,国家草原生态补助奖励政策在全国8个主要草原牧区全面启动。内蒙古自治区积极落实国家政策,根据草原生态现状和自然资源的承载能力,科学制订了补奖标准、补奖区域、补
数学核心素养简单地说就是"学会数学思考"。引导学生深度探究是发展核心素养的关键。
桂馥在训诂中绝不仅仅是堆积材料,他不仅重视对文字字形的分析,也已然充分认识到读音的重要作用,从声音的角度探讨词的本义问题。在他的代表性著作里,经常可见以"某某声相近""语
本文把研究生党支部建设问题置于当前“以改革创新精神全面推进党的建设新的伟大工程”背景下进行探讨,指出新形势下高校研究生党支部建设存在的主要问题,以支部设置、队伍建设
目的评价多排螺旋CT(MSCT)薄层重组和高分辨率CT(HRCT)靶扫对肺微小结节(<10 mm)的显示效果和辐射剂量。方法回顾性分析100例微小肺结节MSCT薄层重组和HRCT靶扫的CT表现,包括
<正>本发明提供一种分散性佳的轮胎用二氧化硅补强剂的制备方法,包括:向热水中加入水玻璃,得底水,控制底水的pH值为6.8~7.2,然后向底水中以并流方式加入水玻璃、浓硫酸、氢氧
本文介绍了一种低杂散、低相噪、高集成度的频率源的研制。该频率源采用Hittite公司的鉴相器HMC830LP6G,通过锁相产生1GHz信号,杂散抑制≥70d Bc、相噪达到-116d Bc/Hz@1k Hz
随着经济和社会的发展,人们越来越重视林业发展中生态需求的满足,加快发展生态公益林已成为经济社会发展的必然要求。随着集体林权制度的主体改革任务的基本完成,全面推进生
随着我国民众生活水平不断提高,“社区服务”逐渐成为人们关注、国家重视的课题。而在社区服务逐步发展的过程中,“社工服务”起到了很大的推进作用。而传统社工服务工作中的
江苏粮食产量连续多年位居全国前列,为国家粮食安全做出了重要的贡献,近年来,随着江苏经济的加速发展,粮食生产已逐渐改变,粮食生产的集约化、规模化程度越来越高。文章分析