海洋抗肿瘤活性物质的定量构效关系研究

来源 :广东药科大学 | 被引量 : 0次 | 上传用户:lanqin2394
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
肿瘤(Tumor)是由遗传易感因素和内、外环境致癌因素多阶段、长时间相互作用的结局。恶性肿瘤是危害人类健康的最严重疾病之一,肿瘤的预防和控制是当今各国面临的严峻公共卫生问题。长期以来,人类致力于肿瘤药物的研发,海洋抗肿瘤活性药物几十年的发展已充分展现了它的巨大潜能,定量构效关系(Quantitative Structure-Activity Relationship,QSAR)研究是在一系列已知生物活性的化合物中寻找结构与其活性之间的量变关系,进而预测新的相关化合物活性,其在发掘及挑选具有明显生物活性的药物、辅助明确药物作用机制等方面都具有指导意义。目的1.通过海洋物质的QSAR研究,筛选出对抗肿瘤活性具有统计学意义的分子描述符并分析其理论意义,为新药开发及指导新物质的合成提供理论依据。2.尝试用不同方法构建QSAR模型,经分析比较获得最优模型,以期在模型的应用域范围内对新化合物的未知活性值进行预测。方法本论文以42个海洋Fascaplysin类吲哚碱物质和23种海洋Meridine类似物为研究对象,分别用指示指数及分子电性距离矢量指数等为分子符表示两种海洋类物质的分子结构,用多重线性回归法(Multiple Linear Regression,MLR)、逐步回归法、回归树及支持向量机算法(Support vector machine,SVM)进行变量筛选并建模,构建两种海洋类化合物抑制肿瘤细胞增殖活性的半抑制浓度(half maximal inhibitory concentration,IC50)与分子结构之间的QSAR模型,用训练数据集实验值和预测值之间的拟合相关系数R2、留一法交互检验(Leave-One-Out,LOO)系数Q2LOO、测试集实验值和预测值之间的拟合系数(R2ext)、外部预测的标准偏差(Standard Deviation of External Prediction,SDEP ext)和预测均方根误差(Root-Mean-Square Error of Prediction,RMSEP)评价模型的可靠性、鲁棒性、稳定性及内外部预测能力。比较各模型的评价参数选出最优模型,在模型的应用域范围内,用最优模型对化合物的未知活性值进行预测。结果42个海洋Fascaplysin类吲哚碱物质的变量筛选得到8个分子描述符X3、X4、X8、X9、X10、X13、X16和X19,线性模型统计量F=3.914,对应的P值为0.004552,说明模型具有统计学意义,其决定系数R2=0.7632,表明模型拟合较好。基于回归树对数据建立非线性模型,模型中纳入了X3、X8、X9、X10、X16和X19这6个变量,它们对于此次决策结果的贡献次数分别为:X3是4次;X8和X10均为2次;X9、X16和X19均为1次。MLR模型的内部检验系数R2和Q2LOO分别为0.7632和0.7501;回归树模型R2和Q2LOO分别为0.8078和0.7985,且两个模型的R2大于Q2但均未超过25%。模型外部检验结果显示,MLR模型除了28号化合物的预测结果严重偏离实验值外,其他9个化合物的残差值范围为(-0.68001.0131);回归树模型10个化合物的残差值范围为(-0.28640.6572),未出现严重偏离实验值的预测数据。两种建模方法的外部预测标准偏差SDEPext分别为13.2913和0.2983。逐步回归法筛选得到主要影响海洋meridine类似物抑制体外A549细胞系IC50值的关键分子描述符为AATSC5p、GATS3p、BCUTc-1l、SPC-6、minHBa、MLFERA和MATS1i。建立并检验模型,参数结果显示,SVM算法所建立6种模型的R2和Q2LOO均大于0.6,但R2均大于Q2LOO且超过了25%,表现出了明显的过拟合现象。MLR法建立的线性模型内外部检验的参数R2、Q2LOO、R2ext和RMSEP分别为0.9985、0.8884、0.8792及0.1243,R2-Q2/Q2的值为12.39%,即R2大于Q2LOO但未超过25%,模型未出现过拟合,模型可用。用MLR模型预测11种未知活性的meridine类似物的pIC50值,除22号化合物外,其他预测值分布较集中且相对均匀。结论1.主要影响海洋fascaplysin类化合物抑制周期蛋白依赖性激酶4的活性值IC50的分子描述符为X3、X8、X9、X10、X16和X19,其中变量X3和X16的系数是正值,表示该描述子与生物活性pIC50正相关;变量X8、X9、X10和X19的系数为负值,即该分子描述符与生物活性pIC50是负相关;指示描述符X19表示二联苯中苯环的相互位置,对位位置连接苯环时对增加化合物活性有利。2.主要影响海洋meridine类似物抑制体外A549细胞系IC50值的关键分子描述符为AATSC5p、GATS3p、BCUTc-1l、SPC-6、minHBa、MLFERA和MATS1i,其中MATS1i描述符的系数为正,即描述符MATS1i的存在能够提高meridine类似物的抗肿瘤活性值,因此,在进一步的药物研发及合成中靶向引进MATS1i描述子,可有效提高物质的抗肿瘤性能。3.MLR、回归树和SVM算法均可用于QSAR模型的建立,数据挖掘算法回归树和SVM是解决QSAR建模中分子描述符之间复杂非线性关系的较好方法,但如果变量间仅存在简单线性关系时,MLR仍是解决此类问题的首选。
其他文献
目的:应用常规超声和超声造影(Contrast enhanced ultrasound,CEUS),评价颈动脉斑块的稳定性[1,2],并结合病理组织学及免疫组化结果判断超声检查的准确性,探讨常规超声和CEUS
目前对旋转机械的趋势分析与寿命预测方法多依赖于故障特征参数的提取,时频分析方法广泛用于旋转机械的故障特征参数提取方法中。其中应用较多的时频分析方法有小波分解、经
新时代背景下我国品牌经济快速发展,商标战略不断推广深入实施,商标的表现方式变得多样,从传统的文字、数字商标向声音、气味等非可视性商标发展。气味商标作为一种新兴事物,
芳香腈类化合物广泛存在于各种天然产物中,是很多生物活性分子及药物分子的基本结构单元。另外芳香腈类化合物也是一类非常重要的合成中间体,在有机合成中具有重要应用。虽然
智能交通系统中有一个特殊的子系统-紧急救援系统,紧急救援系统的存在是为了解决生活中常见的意外事件。该系统的高效运行依赖于智能交通系统中其他的子系统,并且可以将交通监控中心与职业的救援机构连成一个有机的整体从而实现该系统的存在意义。在我们的日常生活中,交通事故的发生是不可预测的,这就需要完善的紧急救援系统的快速响应来减少事故发生造成的损失。一般来说,当事故发生时,会同时需要很多救援资源到场合作处理,
在工业、农业、生物医学等许多领域中,经常会遇到带有区组结构的试验。平衡不完全区组设计影响到试验设计的效益和成本,如何设计这样的试验,并对试验进行随机化安排,建模和分析,是
在互联网科技高度发达的今天,大数据逐渐成为计算领域的关注点和难点,具有非常重要的理论意义和研究价值。复杂网络社区检测问题就是当前一个非常重要的研究热点。为了实现对
空间制冷机作为卫星有效载荷的一部分,在如今的空间设备中已成为不可或缺的一部分,而机械制冷机的振动是制约其应用于敏感仪器的一项关键因素。压缩机作为机械制冷机的动力源
硼中子俘获疗法(boron neutron capture therapy, BNCT)是一种新型的放疗方法,其关键因素包括硼携带剂和热(超热)中子束。对二羟苯基丙氨酸硼(p-dihydroxyborylphenylalanine,BPA)是
在我国幅员辽阔,许多地区水网密布,埋藏着大量淤泥。随着经济发展和建设的需求,大量淤泥被清理出来。随之而来的,便是大量处理淤泥的需求。淤泥常具有高含水量、低强度等特点,如何妥善处理淤泥,将之用于工程建设当中,使其既满足工程建设和环境保护的需求,又具有一定的经济型,是一大难题。本文研究对象为安徽省淮南市湖泊底部淤泥,研究内容包括淤泥的基本物理性质、无侧限抗压强度、渗透性能和干湿循环特性。通过无侧限抗压