论文部分内容阅读
目的建立对药物分析学及药物开发重要的口服药物吸收属性及人体药动学参数预测模型。将预测得到的人体药动学参数引入药动学模型,以最终实现在临床实验之前预测出人体药时曲线。方法1.采用支持向量机与遗传算法、CDK分子描述符、100个药物的实验Caco-2细胞穿透性数据集(77个药物为训练集;23个药物为测试集)建立并验证Caco-2细胞穿透性预测模型。而后,采用丹参素Caco-2细胞穿透性实验验证该模型。2.采用随机森林方法、CDK分子描述符、212个化合物的数据集(170个化合物为训练集;42个化合物为测试集)建立并验证P-gp底物识别模型。3.采用随机森林方法、Dragon(?)分子描述符与234个化合物的数据集(188个化合物和46个化合物分别作为训练集和测试集)建立并验证口服药物吸收分数分类预测模型。4.采用遗传算法与多元线性回归方法、CDK分子描述符、122个药物的大鼠、狗、猴子和人体表观分布容积数据建立并验证基于分子属性和动物数据的人体表观分布容积多元线性回归模型。5.采用遗传算法与支持向量机、CDK分子描述符、122个药物的大鼠、狗、猴子和人体清除率数据建立并验证基于分子属性和动物数据的人体清除率支持向量机预测模型。6.从文献收集了10个药物的人体药物动力学数据;将10个药物的结构和动物数据代入人体药物动力学参数预测模型;将预测得到的药物动力学参数代入一室口服吸收模型以预测出入体药物动力学曲线。结果1.Caco-2细胞穿透性预测模型在训练集与测试集上预测值与实验值的相关系数分别为0.88和0.85。研究发现CDK分子描述符中的氢键供体数量和分子表面属性对于细胞穿透性预测具有重要作用。本课题组实验得到的丹参素Caco-2穿透性与模型预测值相符。2.P-gp底物识别模型对外部测试数据集的预测结果为P-gp底物、非底物及总集识别错误率分别为12.50%、16.67%、14.29%。212个化合物数据集上的留一法交叉验证识别正确率为77.4%。经过研究CDK分子描述符与P-gp底物识别的关系,表明原子极化性和、电荷偏表面积等分子属性对P-gp底物识别起到重要作用。3.口服药物吸收分数分类预测模型在训练集和测试集上分类正确率分别是98.89%和86.96%。随机森林方法定量了如极性分子表面积、logP等对口服吸收预测重要的分子描述符的重要性。该模型对主动转运药物稳定。4.基于分子属性和动物数据的人体表观分布容积多元线性回归模型的留一法交叉验证的相关系数和rRMSE分别为0.6495和0.3968。遗传算法筛选出了对于表观容积种间比例放大最为重要的10个分子描述符。“类药”性在人体表观分布容积预测方面起到了一定的作用。5.基于分子属性和动物数据的人体清除率支持向量机预测模型的留一法交叉验证的相关系数和rRMSE分别为0.6120和0.4061。遗传算法筛选出了对于中间比例放大最为重要的10个分子描述符。研究表明“类药”性在该模型中并不具有重要性。6.实现了10个药物的人体药物动力学曲线的预测。其中,2个药物较好;6个药物中等;2个药物较差。结果证明本文实现的方案能够有效预测人体药物动力学曲线。结论本文建立的口服药物吸收属性模型(Caco-2细胞穿透性预测模型、P-gp底物识别模型)与药物动力学参数预测模型(人体吸收分类预测模型、人体表观分布容积预测模型、人体清除率预测模型)均取得了良好的预测效能。所建模型均能单独应用于药物分析与药物开发实践。而最终实现根据动物数据和分子结构预测人体药时曲线更是对药动学参数预测模型的有效整合。文中的方法和结论对于药物分析研究、临床药物动力学研究及药物开发具有重要价值。