基于深度神经矩阵分解的药物响应预测研究

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:zhiqi_xu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着精准医疗的发展,细胞系药物响应数据逐渐被应用于辅助癌症精准医疗决策。目前全球多家科研机构研发和公开了多个细胞系药物响应数据集。但受技术和成本的限制,仅靠体外生物实验完善数据存在局限性。为此,对现有的基础数据深入研究,建立高效准确预测药物与细胞系间响应的算法模型将有助于完善数据,进而帮助分析药物对细胞系的作用及潜在关联机制。本文深入分析了矩阵分解和神经网络原理,并将其应用于细胞系药物响应预测的方法研究。针对细胞系和药物特征不完善不统一的问题,构建向量嵌入神经网络(VENN)和自信息协同神经网络(SCNN)以辅助细胞系和药物特征的建模。VENN运用嵌入层将细胞系和药物的编号拓展成多元潜向量,基于多层感知机和嵌入层更新学习以实现对药物响应的预测。SCNN提取矩阵已有响应值作为细胞系和药物的真实偏好特征,并将其经多层神经网络投射到低维潜在空间中相互作用实现预测。针对常规矩阵分解低秩性和稀疏性限制的问题,构建深度神经矩阵分解模型(DNMF)引入非线性计算结构,通过深度神经网络来逼近药物或细胞系的非线性潜变量。DNMF中的输入层和隐藏层被视为矩阵分解中的基数矩阵和系数矩阵,分别表征药物和细胞系潜在因子矩阵,同时在网络中受反向传播优化求解。输出层最终输出完整的药物响应矩阵。针对进一步提高预测效果的目标,构建双分支深度神经矩阵分解模型(TBDNMF)。模型在DNMF的基础上同时保留线性分解和非线性分解结构,并结合基于矩阵列(药物)数目和基于矩阵行(细胞系)数目输入的分支设计了一个并联结构。模型基于多任务学习规则,将两个分支的权重相乘作为一个辅助学习目标。引入多个正则项构建联合损失函数,进一步提高预测效果和模型鲁棒性。在两个公开的药物响应数据集CCLE和GDSC上开展十折交叉验证实验将本文方法同先前部分方法进行了比较。结果表明,本文的方法对数据集全部数据的预测值和初始值呈现强正相关,证明了预测的可靠性。DNMF和TBDNMF的单个药物预测相关性超过了KBMF,DLN,RF,SRMF和WGRMF方法的结果。本文讨论了模型的参数设定和数据预处理方法对结果带来的影响。针对预测结果开展一系列的生物信息学案例表明,预测结果符合一定的生物学分布特性,并有效地描述药物和细胞系的潜在特征,为分析药物细胞系潜在关联机制提供参考。论文共包含图34幅,表6个,参考文献117篇。
其他文献
车联网作为5G移动通信的重要应用场景之一,其在提升交通效率、减少交通事故和保障车辆安全驾驶等方面具有重要意义。在车联网中,车辆利用先进的车载通信设备和技术,实现了车与万物(Vehicle to Everything,V2X)的互联通信,其主要包括车辆与车辆(Vehicle to Vehicle,V2V)的通信和车辆与基础设施(Vehicle to Infrastructure,V2I)的通信。然而
学位
在煤炭开采过程中会遇到各种复杂的地质构造,工作面过断层是煤矿开采常面临的问题。本文以核桃峪煤矿2804工作面过F27断层为工程背景,并采用数值模拟、理论分析以及现场工程实践的方法对工作面过断层问题进行分析,研究聚能爆破机理,提出深孔聚能爆破技术方案,并根据深孔预裂效果验证了技术合理性。研究成果如下:(1)根据断层赋存条件研究了断层的空间结构,分析不同过断层方案对核桃峪煤矿2804工作面F27断层的
学位
复杂结构厚煤层作为我国煤炭赋存的主要形式,其开采过程中常面临着放落块度大、回收率低等问题,造成大量煤炭资源浪费,因此,通过相关技术手段使初采采出率提高成为煤炭开采的研究重点。论文以上榆泉煤矿I011004综放工作面为研究背景,对复杂结构厚煤层初采期间促放技术进行了研究,具体成果如下:(1)经力学性质测定、微观结构扫描与工作面勘探结果掌握了煤岩体的强度及内部裂隙发育情况。煤层硬度系数f为1.0,属于
学位
微粒群优化算法(Particle swarm optimization,PSO)具有参数设置少、搜索速度快等优点,目前已在诸多领域得到了广泛应用。然而,随着大数据等新技术或应用场景的出现,很多实际问题变得越来越复杂,如分布式滤波器粒子路由问题。这些复杂问题不仅包含多个相互冲突的目标函数或性能指标,而且带有诸多约束。这些特征显著降低了传统PSO算法处理这些问题的能力。如何提升PSO算法的搜索性能并用
学位
甲醇制烯烃(MTO)技术是目前通过非石油途径生产低碳烯烃的重要方法,分子筛催化剂的制备与调控是该技术的核心。ZSM-5分子筛由于其特殊的骨架结构,具有独特的择形性、热稳定性,已广泛应用于工业催化领域,目前是甲醇制烯烃反应的重要催化剂之一。实现分子筛的绿色节能合成,制备高性能的MTO催化剂是当前研究的热点。传统的水热合成方法制备分子筛过程中需要添加有机模板剂,且往往体系中的原料不能被完全利用,容易造
学位
在2020年举行的党的十九届五中全会中,通过了《中共中央关于制定国民经济和社会发展第十四个五年规划和二〇三五年远景目标的建议》。建议指出要“确保人民生命安全、人民至上、生命至上,以人民生命安全为首要任务,切实提高公共安全保障能力。”当前,我国正在经历百年未有之大变局,国际形势风云变幻,国内深层次矛盾显露。随着我国新型城镇化进程不断加快,城市内生产要素快速流动,新旧问题叠加,呈现出极大的不确定性与不
学位
在近年来,在大规模有标签的数据集的加持下,基于深度学习方法的行人重识别技术获得了巨大的进步,甚至在某些数据集上识别成功率超过人类。然而,由于数据集采集的季节、地点、光照等因素的不同,不同数据集之间不可避免地存在着领域差异,使得在已有领域训练完成的行人重识别系统直接应用到另一领域时性能明显下降。而在现实生活中,受限于高昂的人力成本以及个人隐私政策,对每一个应用场景收集对应的有标签数据集事实上是不可能
学位
采空区遗煤自燃而引发矿井火灾,严重威胁矿井安全生产,并造成资源浪费和环境污染。液态CO2在防治煤自燃方面优点颇多,具有抑燃抑爆和快速降氧降温,效果覆盖范围广且不污染环境等特点,可对采空区等封闭区域快速部署。现有研究背景下CO2在微观层面上对煤自燃惰化作用研究仍需深入,下行通风工作面采空区注液态CO2的扩散降温规律仍需针对性研究。研究下行通风工作面采空区注液态CO2惰化作用及扩散降温规律,对矿井火灾
学位
煤炭在我国的能源结构中占据着重要的地位,煤炭的煤质检测是其贸易结算的主要依据,然而传统的煤炭检测实验室仍然有着诸如检测周期长、硬件投入成本高以及信息化低的弊端,因此研究出一种基于激光诱导击穿技术的能够进行煤质快速检测的实验室管理系统对于第三方检测实验室以及煤炭生产与使用等应用场景具有重要意义。本文首先分析了激光等离子体的形成机理与光谱特性,对获得的煤样激光诱导击穿技术(LIBS,Laser-Ind
学位
随着我国工农业和城市化不断发展,城郊农田蔬菜用地重金属镉(Cd)污染及可能引起的蔬菜安全问题成为社会关注的热点问题,而重金属原位钝化修复技术为解决上述问题得到了广泛研究和应用。羟基磷灰石(hydroxyapatite,HAP)作为一种比表面积大、易于离子交换、稳定、无二次污染和高效的土壤重金属污染钝化剂已被广泛研究,但是由于成本过高未能实现大规模使用。而钛石膏(red gypsum,RG)作为一种
学位