基于机器学习的DNA结合剂和人口服暴露量预测

来源 :中国科学院大学(中国科学院上海药物研究所) | 被引量 : 0次 | 上传用户:prcjzzz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
新药研发是一个漫长而复杂的过程,包括靶标的确证,靶标分子的筛选优化,临床前动物实验,临床试验等。随着计算机软硬件的快速发展,计算机能在药物研发的各个阶段辅助新药的研发。本文主要利用机器学习方法,针对靶标分子的筛选和药代动力学性质估算问题进行展开。研究主要包括两方面的内容:一是基于机器学习方法预测小分子与DNA的结合,该研究有助于靶向DNA的分子筛选和靶向DNA结合蛋白的分子过滤(第2章);二是基于机器学习方式预测人口服暴露量,该研究能辅助先导化合物优化和候选药物的选择(第3章)。虽然蛋白质是主要的药物作用靶点,但是在癌症治疗、抗感染和抗病毒研究中DNA仍然是一个有价值的药物靶点。在寻找靶向DNA结合蛋白的小分子的实验过程中,为了排除小分子与DNA结合而造成的假阳性,需要补充小分子和DNA结合实验。开发一种DNA结合剂预测方法,可以在购买或者设计合成化合物前筛选或者过滤可能与DNA结合的化合物,从而降低失败的风险和时间资源的浪费。第2章中,基于Ch EMBL数据库中收集的小分子与DNA结合数据,我们利用机器学习算法和神经网络算法构建了多个分类模型和一个最终的一致性模型。一致性模型在训练集和测试集上均具有良好的预测表现,训练集五折交叉验证中AUC值为0.947,测试集的AUC值为0.916。接下来,我们利用基于相似度的阈值来定义应用域。最后对模型进行解释性分析,与以往的研究相似,稠环芳烃易与DNA结合,片层结构易插入DNA碱基对之间。基于SARpy软件提取的警示结构补充了以往研究发现的片段类型。此外,通过对内部化合物库的预测和实验,验证了模型的预测准确性并发现了新的DNA结合剂。总之,本文构建了一个基于机器学习的小分子DNA预测模型,可用于筛选或者过滤可能与DNA结合的化合物,辅助靶向DNA和靶向DNA结合蛋白的药物分子的研发。在首次进行人体临床试验之前,估计人类的药代动力学性质是药物开发过程中非临床研究的主要目的之一。目前常用的方法有异速缩放法、基于生理学的药代动力学以及基于机器学习的方法。随着日益扩大的公开或者商业数据集,越来越多的人把目光投向具有优良预测潜力的机器学习方法。第3章中,基于Pharmapendium数据库中收集的人和大鼠口服暴露量数据,我们利用机器学习算法构建了多个回归模型和一个最终的一致性模型。一致性模型在训练集和测试集上均具有良好的预测表现。训练集五折交叉验证的R2值为0.674,测试集的R2值为0.670,训练集两、三和五倍误差内的化合物百分比分别为58.4%、74.5%和83.1%。通过对人口服给药剂量的分析,发现本模型的适用范围是人给药剂量大于1 mg时的场景,并且当给药剂量为1-100 mg的范围时,模型预测性能最优。最后对模型进行解释性分析,发现了一些可能对预测比较重要的指纹片段。总之,本研究构建了一个基于机器学习的人口服暴露量预测模型,可以帮助药物研究人员优化先导化合物或选择药物候选化合物。
其他文献
肿瘤的发生发展是遗传学和表观遗传学共同作用的结果,组蛋白甲基化作为重要的表观遗传修饰类型,相关修饰酶的异常是众多肿瘤的特征。因此,靶向组蛋白甲基转移酶是重要的抗肿瘤药物开发策略。本论文围绕组蛋白赖氨酸甲基转移酶核受体结合SET结构域蛋白3(nuclear receptor binding SET domain protein3,NSD3)和共激活蛋白相关精氨酸甲基转移酶1(coactivator
学位
天然产物具有结构新颖和生物活性多样的特点,是药物先导化合物、候选药物和创新药物的重要来源。从中医药中寻找结构新颖的活性天然产物一直是天然药物化学研究的重要方向之一。本文对冬青属植物铁冬青(Ilex rotunda)的干燥树皮(中药名为救必应)和乌桕属植物山乌桕(Sapium discolor)的干燥树皮的化学成分和药理活性进行了系统研究,以期从中得到结构新颖的活性化合物,进而阐明其药效物质基础,为
学位
本文叙述了由光气界面缩聚法制备四溴双酚A、双酚A和光气耐燃聚碳酸酯工艺。本工艺克服了双酚A和四溴双酚A因反应速度不同、产生各自的均聚物的缺点,能很方便地制得不同溴含量的耐燃共聚聚碳酸酯。耐燃共聚聚碳酸酯可以以任意比例与双酚A聚碳酸酯树脂共混,制备耐燃聚碳酸酯而不影响其物理机械性能。
期刊
经典名方泽泻汤始记于东汉张仲景所著《金匮要略》,临床用药历史悠久,由泽泻和白术按5:2的比例用水煎煮得到,具有利水除饮、健脾制水的功效。现收载于国家中医药管理局发布的《古代经典名方目录(第一批)》之中。现代药理学研究表明,泽泻汤对眩晕病以及高血脂、高血压、非酒精性脂肪肝(NAFLD)等代谢相关疾病的疗效确切,但其化学成分物质基础薄弱,对非酒精性脂肪肝的治疗机制仍不明晰,有待进一步研究和阐明。针对以
学位
跨省互联电网建设为新型电力系统提供了重要支撑。以输电为主的联网线路发挥的供电作用明显,而以备用、联络为主的联网线路利用小时数低,具有进一步挖潜的空间。在研究跨省互联电网错峰交易条件、交易模式、电价结算机制的基础上,类比储能的功能作用,提出了联网线路的备用、错峰运营思路,以及在电力市场中的运营模式。结合闽粤联网工程实例,分析2省错峰交易的电价空间、错峰交易规模和效益,表明储能式的错峰交易运营模式可适
期刊
目的:分析柴胡桂枝干姜汤加减治疗新型冠状病毒奥密克戎变异株感染的老年患者的验案,为疫病的防治提供中医治疗思路。方法:以真实世界运用柴胡桂枝干姜汤加减治疗新型冠状病毒感染(COVID-19)的验案基础为切入点,分别对上海市奥密克戎病毒株的新冠病毒感染特征、中医学对奥密克戎COVID-19病因病机的认识、奥密克戎COVID-19与《伤寒论》六经辨证、柴胡桂枝干姜汤的内涵及历史渊源、柴胡桂枝干姜汤治疗奥
期刊
肠道菌可参与药物代谢,由此对药物体内暴露产生重要影响,从而改变药物和相关代谢物的药代动力学和药效学特性,然而肠道菌介导的这些代谢存在明显的种属差异。黄酮醇类化合物是多种中药和植物药的活性成分,具有心血管健康保护的药理活性,主要以苷的形式存在,总结黄酮醇类化合物药代动力学文献结果表明,口服黄酮醇类化合物后原形及其代谢物的系统暴露水平明显低于展现其生物活性所需的浓度,这对阐明黄酮醇类化合物的药效物质基
学位
骨质疏松是类风湿关节炎常见的合并症,类风湿关节炎患者继发骨质疏松的概率是正常人的2倍,骨重塑失衡导致骨吸收增加而骨形成减少,早期表现为局部或区域性骨丢失,随着病情进展骨量进行性降低,晚期可出现全身性骨质疏松。骨转换标志物包括骨形成标志物和骨吸收标志物,在骨代谢过程中被释放至骨微环境,最终可从血液或尿液中检出,反映体内骨转换状况。与骨密度相比,骨转换标志物能更加敏感地反映类风湿关节炎早期的骨质破坏,
期刊
自身免疫性疾病(Autoimmune diseases,ADs)是由于自身免疫反应异常导致机体对自身抗原产生反应而产生的疾病。其中类风湿性关节炎(Rheumatoid arthritis,RA)和系统性红斑狼疮(Systemic lupus erythematosus,SLE)是两种常见的难治性ADs,已有的治疗手段存在副作用明显,个体差异大或价格昂贵等问题,因此仍需开发新的治疗手段。羟氯喹(Hy
学位
本文主要介绍了在重庆市轨道交通6号线支线区间隧道施工中,由于该线路下穿重庆主市区,不但周边环境极其复杂,地面建筑物及地下管线繁多,而且新建线路隧道还需下穿既有轨道交通隧道,同时线路所处区域地质较差,围岩等级较低并且下穿富水区域。上述多种因素造成该新建线路隧道施工难度很大,既要确保既有轨道线路及周边构筑物的安全,使地面沉降处于可控范围内,还要保障隧道施工安全,防止出现塌方及涌水突泥事故的发生。针对上
期刊