基于最大流的癌细胞药物反应预测方法研究

来源 :湖南师范大学 | 被引量 : 0次 | 上传用户:josiefeiv
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究癌细胞系对抗癌药物的反应是理解癌症生物学和研发新型抗癌疗法的关键,在癌症治疗中起着至关重要的作用。传统的研究癌细胞系-药物反应方法是基于临床实验的,这是一个时间和资金耗费巨大的过程。为了寻找一种投入低、周期短、临床前的方法,研究人员开始利用已知的生物数据对药物反应敏感性进行建模。研究表明,通过多种生物分子信息的有效整合能大幅提高细胞系-药物反应预测的准度率。本文主要研究通过有效整合多源数据,建立合适的模型,对细胞系-药物反应进行预测。所做的工作如下:(1)提出了一种基于异构网络的最大信息流模型用于预测细胞系-药物反应(Using Maximum Information Flow on Heterogeneous Network For Drug Response Prediction,MIF2DRP)。首先,下载得到多个数据库中的细胞系、药物和基因数据,通过对这些数据进行相似性度量和预处理,整合得到一个包含多源信息的三层异构网络。接着,将其转换为流网络,针对每种药物用最大流算法计算得到药物节点间和细胞系节点间的最大信息流,用该值来衡量细胞系-药物反应的作用关系。最后,通过阈值的设定将该细胞系对该药物的反应划分为敏感或耐药,得到最终预测结果。实验结果显示,与其他两种先进预测模型相比,MIF2DRP整体性能是最好的。(2)提出了一种基于最大流的随机森林模型预测细胞系-药物反应(A Random Forest Method Based on Maximum Information Flow For Drug Response Prediction,RFMMIF)。根据数据库、文献中已知的药物、细胞系特征数据信息和关系信息,经过预处理,得到一个药物关系网络和一个细胞系关系网络。接着通过最大流方法分别计算出两个网络中节点的重要性权重,根据该权重对已有的药物特征和细胞系特征进行加权,串联得到细胞系-药物对的特征向量。最后,经过特征选择,采用随机森林分类模型对细胞系-药物对进行分类完成预测。实验结果表明该方法具有良好的预测性能,在预测未知细胞系-药物反应上也有着不错的表现。
其他文献
本文主要研究了一些波动方程(组)初边值问题行波解的构造,依次对有限区间上的带有Neumann边界波动方程初边值问题的行波解与带有耦合初边值问题线性波动方程组的行波解进行了
生物质作为一种可再生资源,在近年来吸引了越来越多人的研究和关注,其中生物质中主要包含纤维素,半纤维素和木质素。木质素约占生物质总量的15-30%,由大量的芳香结构基元通过
随着我国经济的飞速发展以及科技水平的不断提高,城市化的进程不断加快,绿化用地也愈发紧张,为保障城市的生态环境,提高人们生活场所的舒适性,各种新型绿化呼之欲出,运用到绿
气候敏感度是衡量全球温度变化和温室气体浓度变化关系的重要指标。目前,对瞬时气候响应(TCR,或称气候敏感度)的模拟存在较多的不确定性。本文从海洋热吸收变化的角度讨论海
随着经济全球化,贸易自由化的不断深入,金融机构间的联系越来越紧密。金融网络在壮大的同时也使得金融危机发生的更加迅速。在金融危机期间大量的基金产品会发生巨大的回撤,
本文从单井地层划分入手,通过大量的钻井、化验等资料,利用井震结合准确标定层位,精细刻画断层,实现断层合理组合,分析构造发育史,提高构造图精度。在此基础上,通过单井沉积
高性能计算(HPC)通常是使用一定数量的处理器或通过网络管理集群中的若干台计算机这样的环境来对问题进行计算。并行计算是解决高性能计算问题的其中一种方式,它能让多条指令
本文在SOC可重用设计方法学的理论基础上,提出了基于IP核的可视化设计方法。该设计方法包括可视化IP核管理、可视化IP核调用、可视化IP核配置和可视化模块连接,同时提出了IP
河口沙洲是重要的湿地资源,对于沙洲面积的估算及其演变一直是人们关心的问题。但由于河口地区复杂的动力因素,海洋测绘难以获取河口沙洲Om线海图基面,并且耗时较长、花费昂
现如今,伴随着移动互联网技术的快速发展,计算机高速运行极大地提高了计算、逻辑判断和存储功能等方面的能力。面对电子商务和互联网金融等领域产生的大量数据,在“人工智能