基于混合算法的癌症驱动通路发现方法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:assembly2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
众所周知,癌症是一种极其复杂的疾病,而且至今难以治愈。癌症可能是由于DNA复制时基因突变累积产生的,即基因畸变。目前,基因畸变可分为两类,第一类是对癌症扩散呈中性的突变(乘客突变),第二类则是能促进癌细胞增殖和无限扩散的突变(驱动突变)。识别驱动突变、驱动基因或驱动通路是理解癌症进展分子机制的关键。在海量的数据和突变中,由于存在许多噪声,而这些噪声对于解释和分析数据是一个不确定的因素。关键性问题就是,如何去除噪声、提取有效的数据以及如何从随机的乘客突变中把驱动突变区分出来,并确定为驱动通路。因此驱动通路的识别成为了生物信息学和医学领域的研究热点。本文主要围绕基因矩阵模型来识别癌症中的驱动通路,具体研究工作包括:(1)提出一种动态蚁群算法和遗传算法相结合的算法(Dynamically Heuristic Ant Colony Optimization and Genetic Algorithm,DACGA)。基于遗传算法的大范围全局搜索能力、快速性、随机性以及可扩展性等优点,结合蚁群算法并行性、正反馈性以及求解精度高等特性,把两个算法进行融合,并对融合算法中的适应性函数、交叉和变异等操作进一步优化,避免陷入局部最优。通过模拟数据集和真实数据集进行验证,实验结果表明该算法在一定程度上可以有效的提高算法的鲁棒性,并在精度上有所提高,而且在生物意义上,相比于其他的算法可以识别更多的有意义的驱动通路。(2)对于DACGA算法,当样本很大的时候,求最大权值子矩阵时的过程非常耗时,针对这个问题,在权值基因网络下,提出一种人工鱼群算法和遗传算法相结合的算法以识别驱动通路。首先通过高覆盖性过滤器进行数据处理,再根据高排他性过滤器构建有权值的基因网络,最后通过算法对权值基因网络进行识别驱动通路(weighted gene network and identify pathways by combinations of Artificial Fish Swarm Algorithm and Genetic Algorithm,WNA)。实验结果表明,该算法和其他的模型与算法相比,在运行时间上有了很大的提高,因此也更适用于大规模的数据集,而且在生物意义上能够识别出以前没有识别出来的驱动基因和驱动通路,获得比较好的结果。
其他文献
过渡金属氧化物的非常规铁电与多铁性研究是近年来凝聚态物理的重要研究课题。不同于传统铁电,混合型非常规铁电正逐渐成为多铁性物理及材料的研究热点,典型的如Ruddlesden-P
超声作用下微泡的声孔效应是一种极具潜力的介导药物输运/基因转染的新型手段,相较于其他方法,微泡声孔效应可以在有效提高靶向药物转染效率的同时减小对周围正常组织的副作
近几十年来,同步辐射装置发展较为迅猛,到目前为止同步辐射光源已经发展到了第三代。世界各国的同步辐射装置已采用具有实验效率高、可拓宽实验方法的二维X射线探测器。目前
研究目的以靶向EGFR的纳米抗体7D12为载体,南瓜蛋白作为“弹头”,采用基因工程的方法,设计、构建、表达及纯化重组免疫毒素rE/CUS,检测其体外抗肿瘤活性。研究方法1.构建重组
运动目标跟踪问题是如今计算机视觉领域中的一个非常重要的研究课题,吸引了国内外众多学者、研究人员以及企业人员进行相关问题的研究,并取得了非常显著的成果,成功地应用于
近年来,越来越多的Web服务发布在Internet上,当用户利用已有的细粒度服务创建粗粒度服务时,将会面临从庞大的服务集合中选择服务的问题。因此,如何重用已有的功能实体来组建
感应电机因其结构简单、成本低廉、制造容易、性能稳定等优势在理论研究和实际应用中得到广泛关注;目前感应电机驱动控制系统在交通运输、数控机床等领域中得到广泛应用。直
在当前社会的工程建设中,钢筋混凝土结构的应用非常的广泛,且混凝土材料在这种结构中占了很大的比重,所以,混凝土是结构的安全、耐久等性能的重要影响因素。由于混凝土材料具
奈奎斯特采样定理指出,对于带限信号,采样频率必须不小于信号最高频率的两倍方可精确重构原始信号。然而,随着信号带宽的增大、采样频率的提高,不仅给系统硬件设备带来巨大的
近些年基于闪存的固态盘已逐步取代传统硬盘,其读写速度更快、功耗更低、防震防噪声效果更好。然而现有固态盘读写速度与主存至少相差一个数量级,无法满足大数据存储、分析以