QSAR中变量的比较、选择及其应用

来源 :中南大学 | 被引量 : 0次 | 上传用户:xp509
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
定量结构活性关系(Quantitative structure-activity relationship, QSAR)和定量结构属性关系(Quantitative structure-property relationship,QSPR)研究现已经成为化学计量学研究的一个十分重要的分支。如今,已经发展为基于一些生物活性和某些物化或结构属性之间的关系的预测技术,在理论和计算化学、环境化学、药物化学以及生命科学等领域中得到广泛的应用。 本论文的研究主要涉及分子描述子之间关系的评价,模型变量的选择以及QSAR/QSPR在实际中的应用等。具体内容如下: 本文的第二章主要侧重于变量之间的相关性的研究。在块变量概念的基础上,提出了一种新的数学方法——子空间比较法——从多维空间的角度对块变量之间的相关性进行研究。该方法不仅可以得到各拓扑指数族之间的相关关系,而且为变量选择提供了一个强有力的依据。把该方法应用于530个烷烃分子的沸点数据,计算了这些化合物的5大类常用的拓扑指数,进行了相关关系研究,并建立了一个拟合和预测能力皆优的线性模型。其中,由多元线性回归模型得到的标准偏差s=4.08,模型回归系数R=0.9948。用每次剔除一个化合物的交互检验的预测误差的均方根RMSECV=4.38。此结果不仅证明了模型的稳定性,同时明显优于文献报道。 第三章继续围绕变量展开,主要考虑变量的选择问题。为了弥补传统的方法和遗传算法的不足,我们试图寻找一种既能克服如逐步回归法等传统方法的局部最优的弊端,又能得到稳健的最优子集的选择方法。在本文中提出了一种前向法与组合数学的方法相结合的序贯式子集选择方法。通过该方法的实例应用证明其在减少计算量的同时有效的避免陷入局部最优,是一种值得推荐的变量选择方法。 第四章主要注重实际问题的解决。粘度是化工与石油化学中重要的模拟参数,现有一组含有20多种化学类的352个化合物的粘度数据,由于其结构的多样性采用了量子化学等多类参数都未能建立理想的模型。迄今为止,最优的模型为R=0.92。我们计算了所有化合物的四类拓扑指数,首先结合子空间比较法对描述子之间的相关性进行研究。后用改进了空间正交化方法对变量进行正交化处理。采用均匀设计的思路把数据分为300和52个化合物两个集合,分别作为校正集和预测集。建立了一个具有较好的数学统计特性的有机化合物粘度的模型。其中拟合的结果显示复相关系数等于0.95,标准偏差等于
其他文献
1984年4月,在古登州港(蓬莱水城)发现明朝紫檀木大料,上刻有"永乐十年"的铭文,表明为明朝永乐年间造船使用的舵杆。经紫檀木专家周默先生实地考证,紫檀木产地为印度南部、西
学术界普遍认定,日本琴学复兴之祖、清初渡日僧东皋心越禅师的姓名为"蒋兴俦"或"蒋兴畴"。其实:(1)"兴俦"是东皋的法名,"蒋"是其俗姓,"蒋兴俦"一说并不成立;()"兴畴"一说来自
氮杂冠醚因其冠环中氮原子的软碱性质及本身特殊的空间构型,使氮杂冠醚对许多金属离子具有较强的选择络合作用;另外,氮杂冠醚不仅被用作仿酶基体,而且还可以作为取代基挂接到
元世祖忽必烈至元八年(1271)在大都兴建释迦舍利灵通塔、大圣寿万安寺,与元成宗铁穆尔元贞元年(1295)在五台山修建万圣祐国寺、大德五年(1301)修建释迦大塔的内在关联与政治
论文包含两部分内容:第一部分为毛细管电色谱整体柱的制备(第一、二、三章);第二部分为色谱方法学应用研究(第四、五章)。 第一章:毛细管电色谱文献综述。 第二章:第一次报道并
目的研究不同工艺参数对赤灵芝醇溶性蛋白提取率的影响,为探索赤灵芝醇溶性蛋白的工业化生产提供参考。方法以赤灵芝为原料,采用乙醇提取醇溶性蛋白,并通过单因素实验和正交实验
恢复性司法旨在恢复因犯罪行为引起的被害人、被告人和社区创伤,恢复平等、和谐的社会关系和秩序。未成年人恢复性司法模式与我国未成年人司法"双保护"及"教育为主、惩罚为辅
<正>祖籍诏安,渡海来台在17世纪前后,中国人口几乎已达到饱和点,往海外谋生的不计其数,其中以到台湾和南洋者为多,神冈吕家也随着当时移民潮来到台湾。吕氏祖籍地,位于闽南诏
会议
猪卵母细胞体外成熟作为一种很重要的胚胎生物技术,具有重要的理论和实际意义。本文综述了猪卵母细胞体外成熟培养的发展历程、体外培养影响因素以及优化策略,为猪卵母细胞成
近年来,人们在研究过渡金属气相反应中发现基态反应物(或中间体)和基态产物有着不同的自旋态。即不遵守“自旋守恒定律”。例如早过渡金属离子Sc+-V+以及它们的氧化物和二氧化