论文部分内容阅读
本论文通过对定量结构与活性主要是生化活性相关性研究中的一些难点问题的研究,提出了几种新型的化学计量学算法。1. 将粒子群优化算法改进,以适用于离散的组合优化问题,并减少了原算法陷入局部最优的几率。将改进的粒子群优化算法用于多元线性回归和偏最小二乘的变量选择,并用于血管紧缩素Ⅱ拮抗物的拮抗活性的研究。结果表明改进的粒子群优化算法能搜索到最优的变量组合,具有较快的收敛速度。2. 分析了一些训练神经网络的算法引起网络过拟合、局部最优的原因,将杂交的粒子群优化算法用于自适应训练多层前向神经网络。连续粒子群算法用于训练神经网络的权重,改进的离散粒子群算法用来确定网络的适宜结构。两种类型的粒子群优化算法相结合同时用于训练网络的结构和连接度。我们还提出了一个新的目标函数来确定适宜的网络结构和权重的最优值。我们用所提出的神经网络训练算法对芳香胺的致癌活性和偏端霉素类化合物的活性进行预测,并与用粒子群优化算法和遗传算法仅训练网络权重的结果做了对比,在这些方法中网络的拓扑结构是固定的。结果表明用所提出的杂交粒子群优化方法自适应训练神经网络能很快收敛到最优解,并在一定程度上避免了陷入局部最优和过拟合现象。3. 提出了粒子群优化分段建模的方法,首先用最小生成树方法对训练集中所有化合物聚类成最小生成树,再用改进的离散粒子群算法去分割最小生成树以获得满意的分段线性模型,还定义了一个新的目标函数来确定最优的分段线性模型。将粒子群优化分段建模方法用于预测1,2,4-三唑类化合物对血管紧缩素Ⅱ的拮抗活性,结果表明所提出的方法能有效的提高回归模型的拟合力。4. 改进了蚁群优化算法,将其用于构效关系研究的变量选择中,并将改进的蚁群优化算法用于1,2-二芳基咪唑类化合物的环氧酶-2抑制活性的定量构效关系分析。所得的结果与进化算法相对比可知,改进的蚁群优化算法比较简单,需要调节的参数少,是变量选择的有效方法,具有满意的收敛特性,能搜索到最优的变量。5. 修正了Cp统计量作目标函数来评价构效关系研究中变量的重要性,并与进化算法结合来搜索不同的变量组合,将其用于芳香胺的致癌活性的构效关系研究获得了满意的结果。另外,在酪氨酸激酶抑制剂的构效关系研究中,提出了新的电性参数(Qo,Qm和Qp)来描述取代基的性质,其中电性参数Qm描述取代基的性质显示了较好的结果。6. 通过一个岭参数构造正交信号校正的估计,提出了岭正交信号校正(ROSC),在一定程度上克服了去除有用信息的问题。论文中采用了广义交互检验定量结构与活性相关性研究中的新型化学计量学算法研究方法选择岭系数和确定正交信号校正组分数。对苯胺硫化物类化合物的环氧酶一2抑制活性的构效关系研究的结果表明:用ROSC预处理数据,可以减少模型复杂度和预测误差,从而改进偏最小二乘的回归模型。关键词:定量构效关系研究;变量选择;目标函数;粒子群优化算法;蚁群优化算法;神经网络;进化算法