癌症驱动通路的启发式识别方法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:rserrrrr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是生物学研究领域的重要技术,被广泛应用于癌症治疗中。癌症是最常见的一种由于基因的突变,导致机体失去对细胞生长的正常调控,进而异常增生、分化的恶性肿瘤。随着二代测序技术的发展,癌症数据库也得到了长足发展。现在癌症数据库(The Cancer Genome Atlas,TCGA)的数据量非常大,如何从海量数据中挖掘有效信息就成为了当下的热点问题。在癌症的研究中,一个关键的问题就是如何区分基因突变中的“乘客突变”和“驱动突变”。传统的方法就是从概率模型的角度找出基因数据集中反复出现的基因。但由于基因突变的异质性,这种方法比较理论化。早期的无先验的方法(De novo Driver Exclusivity,Dendrix)和遗传算法虽然能在一定程度上识别某些驱动通路,但随机性比较大,容易陷入局部解。针对以上问题,本文则主要围绕基因矩阵模型来分析癌症中的驱动通路,具体研究工作包括:(1)提出了一种基于混沌-多种群遗传算法(Chaos Multi-population Genetic Algorithm,CMGA)的识别癌症驱动通路的方法。这种方法是一种无需先验知识的方法。本课题利用基因矩阵模型,将混沌方法和遗传算法各自优点结合起来,采取计算权重值的方式,来求得最终结果,达到优化解决该问题的效果。具体步骤是,我们首先在初始化种群的过程中,利用混沌算法的遍历性特点,遍历整个样本空间,优化抽样过程。然后在多种群遗传算法中,利用种群间的移民算子来加速算法的收敛过程。随后将该方法在1个模拟数据和4个临床数据上重复进行了大量实验,并且和以往的Dendrix、遗传算法等做了相关比较。在实验中,将各方法的平均权重值和有效运行次数进行了对比,CMGA方法的两个指标数值都是最大的。实验证明CMGA方法具有更好的稳定性能。(2)在Dendrix、CMGA算法中,所考虑的都是单通路识别的情况。但在现实生物个体中,基因间存在千丝万缕的联系,更应该考虑通路间的相互关系。驱动基因在基因矩阵中拥有的两个主要特征是:每条通路是同时具备高覆盖性和高互斥性的;通路间的基因有着协同突变的现象。因此,在CMGA的基础上,我们采用协同混沌-遗传算法(Co-occurring Chaos Mutli-population Genetic Algorithm,CCMGA),求解协同的多个驱动通路,使结果更加符合实际情况。同样,该方法也在1个模拟数据和4个临床数据中进行了大量实验。实验结果表明,该方法发现了癌症生理过程中的一些协作信号通路。
其他文献
本文先研究了2~8mol%Mo或WC组元添加对TiC–40Ni金属陶瓷显微组织、磁学和力学性能的影响规律,然后研究了2~8mol%WC组元添加对无磁TiC–6Mo–40Ni金属陶瓷显微组织、磁学和力
华庆地区位于鄂尔多斯盆地西南部,其中长6油层组是延长组砂体最发育、含油性最好的一个油层组之一,因为其成岩作用的复杂性,因此研究其成岩作用对之后的勘探开发起到了重要的
滴20井区位于准噶尔盆地东缘,构造单元隶属于滴南凸起上的滴水泉构造环带,毗邻克拉美丽山前构造带,是彩南油田新发现的潜力油气区。该区块目的层位是超覆于石炭系地层之上的
随着信息通信技术发展不断取得新突破,加快信息化方面的建设已成为各级党政机关创新发展的必要途径和重要举措。A机关贯彻中央关于加强行政机关信息化建设的部署要求,信息化建设和运用取得长足发展,计划建设包括业务、办公、人力资源、保障、公开服务等平台,建设4大类11个应用系统。人力资源项目作为重要组成部分,旨在实现对全条线干部队伍信息的基础功能管理,逐步实现智慧队伍管理建设,对于加强干部队伍建设和管理具有重
层状岩体是人类进行工程活动涉及最多的地质体,由于其抗压性能强常被用作工程材料和各类工程建设的基础,但同时本身具有非均质性、不连续性、不均匀性和各向异性等特征,抗拉性能弱,易发生弯拉破坏,如基坑底部隆起、隧道边墙及顶板弯折、采空区顶板弯曲变形以及陡倾层状斜坡的变形破坏等,给人类工程建设带来了严重的危害。现有研究表明,层状岩体变形破坏特性及力学性能与其自身的特殊性有着密切关系,变形破坏过程中逐渐产生损
丘陵作为世界陆地的五大基本地形之一,不仅为全球10%的人口提供了栖居地,而且为地球上30%~40%的人口供给着丰富的水源、矿产资源和动植物资源,是地球生物系统的重要支撑,对社
背景原发性肺癌是目前发达国家人群罹患的主要肿瘤之一。吸烟是导致肺癌的最常见原因,据美国国立癌症研究中心及美国环境保护总署估计,约有80%肺癌的产生与烟草有关。以美国
仿生眼技术具有可模拟生物眼睛感知外部环境的能力,应用前景十分广泛。而广域监控可解决当前视频监控效率低下的问题,还可提高防护效率。故本文以仿生眼技术在广域监控中的应
目的:本实验通过建立免疫相关性再障小鼠模型,并以此为研究对象,观察急再1号方对急性再生障碍性贫血(Acute Aplastic Anemia,简称:急再)小鼠Th17、Treg及造血调控因子IL-2、I
铁钻工无疑是提高国内自动化石油钻井水平的关键设备,能够极大地提高钻井的作业效率和降低生产成本。在铁钻工驱动和控制系统中,高效、低能耗以及响应速度快的液压系统无疑是