面向多核平台的拷贝数变异检测方法及并行算法研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:xionglongyan0817
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对肿瘤样本测序数据所做的基因拷贝数变异(Copy Number Variation,CNV)检测是研究癌症相关基因变异的重要手段。下一代测序技术(the Next Generation Sequencing)的迅速发展产生的海量测序数据,一方面推动了基因拷贝数变异检测算法的发展,另一方面带来了数据处理与存储等计算问题的挑战。本文利用读段深度法的检测CNVs的原理,构建了一套以贝叶斯信息准则(Bayesian information criterion,BIC)为理论依据的CNVs检测流程,针对该流程在CNVs检测过程时产生的区域断点位置检测不精确的问题,本文在序列统计阶段提出了一种基于序列数目等量的初始窗口划分策略。这种初始窗口划分策略根据要分析的测序数据动态地确定了尺寸可变的初始窗口,改善了一般窗口划分机制中断点位置预测敏感度低、不精确的问题,从而提升了CNVs的检测能力。本文在基于BIC的CNVs检测流程的基础上,为解决大规模测序数据的使用而导致的CNVs检测耗时长这一问题,提出了一种新的面向多核平台的基因拷贝数变异检测的并行算法。我们在深入解析分割算法的基础上,对算法进行了并行化可行性分析,通过将计算过程划分为多个计算BIC值和BIC差异值的计算任务在多核平台上完成实现。测试的结果表明,本文提出的优化算法能够有效的提升拷贝数变异检测的性能,在8核CPU平台上能够获得相对串行程序6.74倍的加速比。本文针对当前CNVs检测中的肿瘤样本DNA测序数据来源于肿瘤组织中肿瘤细胞与基质细胞的混合体这一问题,分析了通过检测肿瘤组织样本中肿瘤细胞纯度?、确定基因组倍数性?,最终实现基因组上绝对拷贝数变异的估算的理论依据,并将该内容与前两个内容一起构成了完整的绝对拷贝数变异检测流程。通过分析由肿瘤组织样本中肿瘤细胞纯度?、基因组倍数性?以及发生变异的各区间绝对拷贝数iq之间的关系建立的最小目标函数问题,我们改进了求解最小目标函数的算法,并对改进后的搜索算法进行了并行优化,实验结果表明,本文对求解最小目标函数的改进和优化有效地将检测流程应用在多核平台上,很大程度上提升了绝对拷贝数变异的检测的能力。
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
在日常生活中,数学无处不在,小到摊贩买菜,大到畅游题海,都需要数学的帮衬。因此,数学和人们的生活可谓是息息相关,然而在现今的学习生活中,由于教学手段枯燥死板,造成学生对数学产生
目的:探讨医学生睡眠问题的潜在类别并分析其影响因素,为改善医学生睡眠提供科学依据.方法:使用匹兹堡睡眠质量指数(PSQI)对某医学院校在校生睡眠状况进行调查,运用Mplus软件
为对明代中后期女袄的形制与结构作进一步解读,以出土和传世的明代中后期女袄作为实物来源,结合墓葬简报与地方志等书籍资料进行分析研究,发现其形制与结构上的变化主要体现
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
模式是通俗小说叙事的典型特征。一方面,传统文论以此极力排斥通俗小说,认为它缺乏艺术性,另一方面,模式化的通俗小说创作欣欣向荣。其实仔细观照通俗小说的模式,可以发现通俗小说
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
<正>引言汉语国际教育体系是一个综合系统,涵盖了教育教学、科学研究、人才培养、师资培训、语言测试、教材出版等多个领域。当前,汉语国际教育事业日益呈现多元化发展态势: