基于二代测序数据的癌症驱动通路识别方法

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户:libra163
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着高通量测序技术的发展,研究人员已经能够在全基因组范围内解决生物学以及生物医学中各种各样的问题,在此过程中也得到了海量的生物学数据。这些技术包括微阵列技术(例如基因表达,拷贝数变异,全基因组关联研究以及甲基化测序技术),第二代测序技术(例如RNA-seq,全外显子组测序以及全基因组测序技术)以及ChIP-Seq等技术。分析由这些技术所产生的数据常常能够发现一些值得注意的基因,这对于后续的生物学解释和验证具有很深远的意义。癌症通常是由基因突变的积累而引发的。最近,第二代测序技术的发展产生了大量的癌症基因组数据,这些数据帮助科研人员研究出识别癌症发展过程中的一些重要基因突变的算法,然而,这些算法不能解决基因畸变的异质性问题。因此,众多学者从研究癌症驱动基因转而研究导致癌症的驱动通路。为了识别癌症驱动通路,必须发展出相应的生物信息学算法。在本论文中,基于第二代测序数据,重点围绕着识别癌症驱动通路的算法进行研究,提出了有效的驱动通路识别算法,并且将算法的关键流程进行了详细阐述,同时与传统算法的结果进行了比较。本文的研究工作总结如下:第一,提出了一种改进算法来解决―最大权重子矩阵‖问题,该问题是基于癌症驱动通路的两种性质——覆盖性和排斥性——来识别驱动突变通路。这种最优化启发式改进算法称为模拟退火遗传算法(SAGA)。特别的,将基因表达数据融合到该算法中,使该算法运行结果更符合生物学意义,并且取得了令人满意的结果。第二,基于基因之间相互作用网络,基因变异将会通过改变或者移除某个点或者改变点的连接情况引起相互作用网络结构的变化,从而改变网络中基因表达的生物化学性质,导致癌症发生。根据此生物学现象,提出了DriverFinder算法,将正常样本和癌症样本的基因表达数据联合分析识别基因表达的离群值,同时,基因过长而引起的随机突变可以基于拟合广义加性模型进行滤除。通过使用DriverFinder算法,识别出具有生物学意义的癌症驱动突变基因,将这些基因进行生物学通路富集分析,从而识别出癌症驱动通路。通过大量的实验比较结果证明了该算法是有效的。本文最后分析了当前识别癌症驱动通路研究中存在的一些问题和今后的研究中需要做的工作。
其他文献
背景:HER-2属于膜酪氨酸激酶,是表皮生长因子受体家族的成员,当HER-2基因被激活,可导致细胞增生活跃和阻碍细胞的凋亡,这为肿瘤在乳腺癌中的发展提供主要的驱动力。MicroRNAs
对TDCS系统与铁路安全行车的关系进行介绍,根据日常维护中发现的网络问题进行分析,查找原因,并提出了相关解决方案,以确保TDCS系统稳定可靠运行。
作为行政事业单位的重要组成部分,内控管理不仅能够预防行政事业单位的风险,而且能够保证行政事业单位的稳定运行。基于此,本文将行政事业单位电算会计内控管理的强化路径作
胃与十二指肠溃疡病(以下简称本病)是临床常见病,近几年来,笔者自拟消溃散治疗本病50例,取得满意疗效。兹介绍如下。
在小学美术课中,美术作业评价能够有效提高学生美术的能力。笔者根据多年的教学经验分析了小学美术作业不恰当的评价方式,从课内评价和课后评价两个方面探讨了小学美术作业评
<正>一、所谓的"赤子之心"自《水浒传》产生以来,人们对李逵评价大多是正面的,几乎是一致赞扬的。第一位点评《水浒传》的"李卓吾"就说他是"情真意实,生死可托",甚至视为"忠
通过对ZPW-2000区间自动闭塞室内控制电路部分进行改进,有效解决了列车在区间运行分路不良,及短车在"小轨"区段内"丢车"问题,防止区间通过信号机因列车"丢车"出现错误升级。
随着新课程改革的不断深入,初中英语教学方法也不断创新。互动探究式教学方法作为一种有效的教学方法被广泛应用于初中英语教学,既注重"双基"的落实,又着眼于学生综合语言运
化学学科是初中阶段一门重要课程,也是一门重要的自然科学学科。初中化学学科作为中考理综学科的重要组成部分,学习时间仅有一年。但是从学科教学任务来说,教学工作量大。学
清末民初著名词家郑文焯因纳妾红冰,著有《冷红词》,且号冷红词客。然对郑文焯而言,"冷红"已不仅仅是自然物象、人物形象,而是浸透着其人生体验的一种生命境界。除了与红冰之