论文部分内容阅读
在过去的几十年,对量化的结构-分子活性/物理性质之间关系,简称量化的构效关系(QSAR/QSPR)的研究已经成为现代化学一个重要的分支。QSAR/QSPR研究一个基本的目的是通过一些简单的描述子(特别是那些单从分子结构,而不是试验数据的描述子),来预报化合物的复杂的物理,化学,生物性质。拓扑指数是一类直接从分子图形得来的数值描述子,它的出现为我们提供了一种方便的量化分子结构的方法,可以测量一些分子结构的特征,例如分支,形状和大小。然而,随着拓扑指数的发展,化学家们提出了越来越多的拓扑指数,其定义也变得越来越复杂,这就为QSAR/QSPR的研究带来了新的问题,如拓扑指数的解释和建模时指数的选择等。基于我们在量化的结构-物理性质之间的关系(QSPR)研究中遇到的这些问题,本论文包括了对拓扑指数的结构上的解释和定义上的归纳,以及变量选择方法在QSPR问题中的应用。 在论文的第一部分,我们从大量的拓扑指数的定义中分解出一些拓扑特征基的集合。不同的特征基的集合代表了分子结构不一样的信息,比如说:分子键的信息,原子的信息,等等。由此,每个特征基的集合都可以张成一个拓扑信息子空间。通过连接性指数x的拓扑特征基,我们可以用一个新的观点来解释这个连接性指数x在很多QSAR/QSPR研究中获得巨大成功的原因-那就是这个x指数在化学键的加权方式上的非人为性。然后,我们建议根据不同的物理性质和化学特性来调整一些拓扑指数赋予特征基上权的大小,从而将一些现存的拓扑指数进行重组.这个重组的方法被应用在第一个Zagreb小组指数M1上,改进的M1指数在跟某些性质的相关关系上体现出了很大的进步。另一方面,这些特征基也是拓扑信息空间的基。它们是拓扑指数的原始信息来源,而且比拓扑指数更容易对分子结构进行解释。我们将拓扑特征基的集合看作是