论文部分内容阅读
快捷地找出简单明了的数学模型是QSAR研究发展的趋势。本研究主要对PLS变量筛选方法进行了探索,探讨快速从大量分子描述符中提取与药代动力学活性参数重要相关的描述符的方法,选取药物分子体内吸收、分布、排泄等活性作代表,优化描述符集,最终建立PLS回归模型并进行校验。如以134个化合物分子透Caco-2细胞层系数log(P)为例,首先通过DRAGON软件快速计算这些分子的大量描述符,进而根据变量方差、非零样本数及变量间相关系数对其进行预处理;再通过多次利用PLS方法确定潜变量数A并计算相应描述符的VIP值,快速筛选与活性密切相关的优化描述符;最后应用优化描述符建立PLS回归模型,并对模型进行了严格的内部外部检验。从3764个描述符中快速选出了58个重要变量,PLS回归方法进行建模,得n=96,A=5,r=0.8548,RMSE=0.45,q=0.7576,RMSV=0.59,n_p=38,r_p=0.7432,RMSP=0.60,模型评估能力好,稳定性高,有一定外部预测能力,说明利用PLS变量筛选法,能获得重要相关变量,建立起具备良好性能的QSAR模型。同时,把该方法应用到对人体小肠吸收、经皮吸收和透胎盘屏障特性的模型分析中,获得良好性能QSAR模型。借助原始变量的投影重要性指标VIP来分析,与活性的重要相关的描述符,PLS变量筛选法为QSAR/QSPR研究中从大量描述符中提取具有良好稳定性和预测能力的描述符集,进行QSAR分析,提供了一种简单快速的方法。采用MEDV描述符来评估70个化合物的血脑屏障通透性的PLSR模型得到了建立和验证。PLSR模型M1(n=57, A=4, m=39, r=0.9202, RMSE=0.28, F=71.87,q=0.7956, RMSV=0.44,n_p=13,Rp=0.6649, RMSP=0.78)具有良好的估计能力,高稳定性,以及较好的预测能力。MEDV描述符能通过VSMP软件简单计算得到,能直接、快速地计算出一个分子的二维拓扑结构,表征出化合物分子环境中各原子的电性特征与原子间距离。MEDV描述符能很好的用于透血脑屏障特性的预测。通过对VIP值排序分析,获得了一些对血脑屏障通透性有重要影响的描述符,从而推导化合物中主要影响其血脑屏障通透性的分子结构有-CH3,-CH2-,=CH-,=C=,≡C-,-CH<,=CH<,=N-,-NH-,=O,和-OH。直观、简便地从分子二维结构上对血脑屏障通透性进行分析,这正是QSAR分析所期待的较理想结果。说明MEDV描述符也有可能较好地应用到药物的ADME参数的QSAR评估中。最后选用103个药物,采用PLS变量筛选方法对DRAGON和MEDV描述符进行筛选,对该103个分子的药物分子药代动力学的6个参数(包括人肠吸收、口服生物利用度、血浆蛋白结合率、分布容积、肾清除率和半衰期)进行了系统QSAR分析,分别获得了不同质量的六个QSAR模型。评价得除口服生物利用度和半衰期外的四个模型,质量较高,能用来可靠地预测其定义结构应用域范围内的药物分子对应活性,可快速、较系统预测对应ADME活性。在DRAGON描述符被利用的基础上,MEDV描述符能有较好的辅助性,用来进行药物的分子结构表征及其生物活性的QSAR研究。PLS变量筛选方法作为一种快速、有效的变量筛选方法,为QSAR方法研究提供了一种可能。研究中构建的QSAR模型的稳健性好,预测能力较强,在药物ADME活性系统评价上有一定参考意义,可在一定程度上代替动物实验,缩短药物研发周期,最终会为药物分子的设计和临床用药指导提供更多的数据支撑。