人工神经网络用于1,1-二苯基乙烯衍生物的QSAR研究

来源 :科学之友 | 被引量 : 0次 | 上传用户:zhugege521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:对于19个1,1-二苯基乙烯衍生物,分别采用人工神经网络(网络结构为3-7-1)和线性回归分析方法,建立了其抗雌激素活性/C与扩展的引力指数Go、17号氢原子的净电荷Q和24号氧原子与17号氢原子间库仑力KL之间的QSAR模型,ANN模型的相关系数R=0.9999。标准偏差SD=3,058 88E-4;MLB.模型的相关系数K=0.966 0,标准偏差SD=0.10t 0。结果表明人工神经网络是一种比较精密的拟合方法,具有良好的预测效果。
  关键词:人工神经网络;定量结构活性关系;1,1-二苯基乙烯衍生物
  中图分类号:0641 文献标识码:A 文章编号:1000-8136(2009)26-0093-03
  
  乳腺癌是女性常见恶性肿瘤之一,抗雌激素类药是其内分泌疗法的常用药物,因而开发新型高效的抗雌激素药物已成为一大热点。Gilbertm等通过实验发现1,1-二苯基乙烯衍生物在MVLN细胞中有一定的抗雌激素活性,具有开发为抗雌激素药物的潜能。文献在此基础上主要采用量化计算方法和拓扑指数法对其进行研究,得出1,1-二苯基乙烯衍生物在OOC下与小牛子宫雌激素受体间亲合力大小与扩展的引力指数(Go)、17号氢原子的净电荷(O)和24号氧原子与17号氢原子间库仑力(KL)较好的相关性。人工神经网络(artificial neural network,ANN)是一种信息处理技术,具有很强的非线性处理、自适应学习、自组织调整及容错抗噪声能力,通过学习确定输入与输出间的复杂的内部联系,实现对样本的识别与分类,对活性的估计与预测。本文应用人工神经网络方法,对1,1-二苯基乙烯衍生物采用3个主要的影响参数G0、O和KL进行了定量构效关系(quantitativestructure-activity relationships,QSAR)研究,并与多元线性回归法(multiple linear regression,MLR)即经典的Hanseh分析方法进行比较,结果表明人工神经网络具有更好的性能,有利于辅助完成新药活性预测及分子设计。
  
  1 原理与算法
  误差反向传播(backpropagafion,BP)模型是应用最广的一种神经网络。它由输入层、隐含层和输出层组成,各层次的神经元之间形成全互连接,各层次内的神经元之间没有连接见图1。每层由若干个神经元(又叫节点)组成,每个神经元包含一定信息量,相邻两层神经元之间通过连接权重相互联接,然后通过输入输出转换函数输出信息见图2。
  
  
  BP神经网络学习算法的学习过程由正向传播和反向传播两个过程组成。在正向传播过程中,输入信息由输入层经隐含层传向输出层,如果在输出层不能得到期望的输出,则转入反向传播,将误差信息沿原来的连接通路返回,修改各层节点间的连接权值,如此往复调整网络参数,使之误差函数达到极小为止。当训练结束时,将学习得到的规则表达在网络的权值中,利用这组权值,根据样本的输入特性参数,迅速输出预测结果。
  
  2 数据与软件
  
  本文采用文献叫报道的19个1,1一二苯基乙烯衍生物的3种结构参数(Go、Q和KL)和活性数据见表1,其分子结构见图3所示。抗雌激素活性以/C(C为经0.1nM雌二醇诱导过的荧光素酶失去50%的活性所需浓度)表示。首先从16个化合物样本中随机选取30个化合物作为训练样本集,用人工神经网络建立QSAR模型,然后用3个化合物作为预测样本集以检验模型的预测能力。采用自编的人工神经网络程序,在PD3.40GHz,2.00G内存的PC机上进行运算。
  
  3 网络参数与模拟结果
  
  对于1,1-二苯基乙烯衍生物亲合力的实验数据进行学习时采用ANN(3-7-1)网络结构,通过跟踪学习过程发现当学习速率等于0.7、动量因子等于0.8时,ANN具有良好的学习效果和收敛速度。19个样本的学习结果见表2,其中所列前15个化合物作为训练样本集,用BP人工神经网络建立QSAR模型,最后4个化合物为预测样本集,计算得出训练样本和预测样本的相关系数R分别为09999和0.9996,标准偏差SD分别为0.0027和0.011 5,说明该模型具有较好的预测能力。经BP人工神经网络算法得出的模拟值与实验值之间的残差比较小,19个化合物的残差值均小于0.10,其绝对值的平均值为0.004 2。由于ANN具有非线性处理及容错抗噪声能力和优势,其计算值与实验值更为接近。
  
  4 ANN与MLR比较
  
  采用多元线性逐步回归(MLt)分析法,对19种1,1-二苯基乙烯衍生物在4℃时与小牛子宫雌激素受体的亲合力进行了QSAR研究,获得了回归方程:
  10g1/C=1.586-2.122Go+37.198Q-4.383KL
  R=0.966,R’=0.932,RMS=0.1010,N=19
  (1)式中G。为扩展的引力指数;Q为17号氢原子的净电荷;KL为24号氧原子与17号氢原子间库仑力;R为相关系数,N为样本数。
  从回归方程(1)中可以看出,影响1,1-二苯基乙烯衍生物抗雌激素活性的3个因素是Go、O和KL,按统计学公式,可以得到这3个参量的标准系数分别为0.659、0.393和-0.263,即Go对其抗雌激素活性的影响最大,其次是Q,而KL的影响最小。Go与1,1-二苯基乙烯衍生物的抗雌激素活性高度相关,而Go不仅反映了分子中原子的电子分布,而且主要表征了分子的体积效应,即分子的体积越大,衍生物的抗雌激素活性越小,表明在进行抗雌激素药物设计时应尽量避免大取代基的引入;O越正,衍生物抗雌激素活性越大,表明Y取代基为吸电子基团对衍生物的抗雌激素活性有利;而KL的绝对值越大,即24号氧原子和17号氢原子间相互吸引力越大,衍生物抗雌激素活性越大。
  利用回归分析方法对19个化合物建立的模型得出相关系数R=0.966 0,标准偏差SD=0.101 0;对这19个化合物用ANN法计算的相关系数R=0.999 9,标准偏差SD=3.058 88E-4,结果明显优于回归法。图4表示对19个1,1-二苯基乙烯衍生物模拟的计算值与实验值的相关情况,可以看出,图中大部分数据位于过原点45。线的附近,并无明显异常点,表明影响1,1-二苯基乙烯衍生物在MVLN细胞中的抗雌激素活性大小的因素不仅复杂而且可能是非线性关系。
  
  5 结论
  
  上述QSAR模型的建立与分析结果均表明人工神经网络具有良好的拟合精度和较强的预测能力,特别适合处理复杂的非线性问题。由此可见,ANN作为一种有效的化学计量学工具。在QSAR研究中,特别是生物活性与描述参数变量之间隐含某些复杂的内在联系时将发挥重要作用。新颖的人工神经网络较传统的多元回归有许多优越之处,将成为定量构效关系及药物设计研究的有效方法。
其他文献
双离合,听起来是个让人有点摸不着头脑又枯燥乏味的技术名词,但若亲身体验过双离合技术所带来的加速度,一定会对这种全新的变速箱技术留下深刻印象。笔者初次接触双离合变速箱,是在试驾第五代GOLF GTI之时。这部“小钢炮”在该技术的支持下,动力之凶猛和不羁,让人至今难忘。而进一步的接触,则发现保时捷和宝马也分别在各自的招牌跑车上装备了双离合变速箱,由此带来的动力的跃进式提升,以及在油耗方面的明显下降,都
期刊
剩面包发干发硬,食不适口,弃之可惜。这里介绍几种简便易行的方法,可使剩物变美食,邀您试做。    布丁   这道点心的主要原料是剩面包150g~200g(可做一大碗),猪油或黄油少许,果酱(或豆沙或白糖)、鲜牛奶(或奶粉、麦乳精、可可粉等)、白糖、淀粉、水果丁各适量。  做法很简单:先将剩面包切成1cm~1.5cm见方的小丁,将1/2放入抹过一层油的大碗内,加少许水,使面包湿润而无多余水渗出,用勺
期刊
中国清徐文化名城,醋都葡乡物华天宝;晋商一脉黄河同源,佳地佳酿名乡名产。千年孕育百年成长,低温发酵高温醋化;地火熏蒸夏晒冬捞,春夏秋冬日月精华。天造地设水禾凝练,万顷明珠一瓮皆收;天地人和和谐之作,厚积薄发天酿佳品。陈酿老醋源自梗阳,贡品曾经享誉神州;御膳豪门宴请佳酿,流传街巷广赞英名。玄龄内助宁饮酸苦,多情拒纳御赐流莺;人间事味酸甜苦辣,古今陈醋无人能弃。农耕文化大众智慧,民间疾苦醋疗已久;南朝
期刊
摘要:文章针对大倾角回采综放工作面如何有效控制刮板输送机上窜下滑,提出在工作面上部斜切进刀和支架交错前移推进的技术,通过现场实践,对于大倾角回采支架防倒也采取了有效防倒措施,该技术的成功实施对于类似地质条件的综放工作面具有较强的借鉴意义。  关键词:大倾角;综放工作面;生产工艺;探索  中图分类号:TD714+.4  文献标识码:A  文章编号:1000—8136(2009)32—0019—02 
期刊
摘要:高温消解炉——分光光度计测试环境水质样品中的化学需氧量,具有简便快捷、减小二次污染、提高工作效率等特点,根据实验对测试条件加以优化选择后,其测试结果根据t检验和国标法测试结果之间无显著性差异。  关键词:高温消解炉;分光光度法;化学需氧量  中图分类号:0573.11  文献标识码:A  文章编号:1000—8136(2009)32—0010—02
期刊
2008年底,南非的纳塔尔公园举办了一场规模很大的拍卖会。拍卖会上陈列的都是一些珍稀之物,其中,一对硕大的雪羚羊角尤为引人注目,因为人们从未见过这样大的雪羚羊角。在人们的啧啧称奇声中,讲解员讲述了一个惊心动魄的故事……    狭路相逢    2002年5月,南非境内海拔3500m的喀斯兰巴山脉上仍覆盖着皑皑的积雪,但是打猎的最佳季节已经到了。这时,一支土著人的狩猎队来到了这里,领头的是老猎手卡斯特
期刊
摘要:随着城市经济的不断发展。人们对居住环境的要求越来越高,优美、舒适的居住环境已经直接影响到人们的心理、生理以及精神生活。居住区绿地是城市居民使用频率最高的活动空间,植物景观是其重要因素之一。文章结合太原市的实际情况,探讨了太原市居住区绿地的植物配置。  关键词:居住区;植物配置;太原市  中图分类号:S731  文献标识码:A  文章编号:1000-8136(2009)29-0156-02  
期刊
摘要:文章阐述了施工技术资料的定义和内容,着重剖析了施工技术资料的作用。  关键词:施工技术资料;作用  中图分类号:TU71 文献标识码:A 文章编号:1000-8136(2009)35-0082-02    在工程建设过程中,从施工准备、正式施工、竣工验收到交付使用,是一个长周期的复杂的质量、进度管理过程,为了让工程建设更加规范有序,也为了施工企业在市场竞争中证实自身质量的适用性和有效性,
期刊
摘要:青少年网络成瘾问题已成为急需解决的一大社会问题,引导青少年正确使用网络,预防和戒除青少年上网成瘾已经刻不容缓。  关键词:青少年网瘾;成因  中图分类号:G250.72 文献标识码:A 文章编号:1000-8136(2009)35-0099-02    由于长时间地使用计算机和进行网络互动,神经中枢持续处于高度兴奋状态,这将引起肾上腺素水平异常增高,交感神经过度兴奋、血压升高和植物神经功
期刊
摘要:经过对雷神公司ASR-10SS一次雷达信号传输系统的分析,去掉了原有的多模光端机,采用国产的、成熟的、经济的PCM复用器和PDH单模光端机,采用一种简洁的方法解决了雷神ASR-10SS一次雷达信号在单模光缆上的传输。打破国外的技术壁垒,具有一定的经济效益和社会效益。  关键词:信号传输;光缆  中图分类号:TN959.1  文献标识码:A  文章编号:1000-8136(2009)29-01
期刊