支持向量机用于化合物构效关系的研究

来源 :上海大学 | 被引量 : 0次 | 上传用户：SOHOCJ

【摘要】

：

数据挖掘(DataMining)就是从大量的、不完全的、有噪声的实际应用数据中，提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。经过这数十年的发展，数据挖

【作者】

：

纪晓波

【机构】

：

上海大学

【出处】

：

上海大学

【发表日期】

：

2005年期

【关键词】

：

数据挖掘支持向量分类支持向量回归化合物构效关系

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

数据挖掘(DataMining)就是从大量的、不完全的、有噪声的实际应用数据中，提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。经过这数十年的发展，数据挖掘技术已经成为处理化学化工数据的常规手段。本文将支持向量机(supportvectormachine，SVM)，一种特别适合用有限已知样本训练建模，进而预报未知样本属性的数据挖掘新算法应用于若干化合物体系的构效关系研究。由于支持向量机算法的数学理论非常严格，同时考虑到拟合精度和对过拟合的抑制，故能基于小样本集作较可靠的计算机预报。其对所选体系的数据处理均得到了较好的预报结果，充分展现了SVM算法的优点和广阔的应用前景。主要研究工作分三部分：第一部分支持向量分类(SVC)算法用于药物构效关系研究。本工作由两个章节构成。 (1)3-甲基芬太尼衍生物(3-MF)的镇痛活性研究。将支持向量分类(supportvectorclassification，SVC)算法用于3-MF及其衍生物结构与镇痛活性关系的研究，用SVM预报结果来筛选结构参数。所建SVC模型分类结果为95.12％，对41个3-MF的活性类别留一法预报正确率为92.68％，明显高于主成分分析法(PCA)(85.37％)，Fisher法(87.80％)和KNN法(87.80％)。 (2)三唑类衍生物的抗真菌活性研究。用HyperchemTM软件计算了23个该类药物分子的量子化学参数，基于SVM的特征筛选方法找出了影响活性目标变量的主要特征参数，用SVC算法建立了活性与参数间的定性模型并用留一法进行了类别预报。结果为：训练集的分类正确率为91.3％，留一法预报正确率为91.3％，优于传统的PCA方法(83％)和KNN方法(74％)。在此基础上，进行了三唑类药物分子的初步设计工作。第二部分支持向量回归(supportvectormachine，SVR)算法用于二取代[(吖啶-4-酰胺基)丙基]甲胺类衍生物的活性研究。在通过HyperchemTM软件计算了40个该类药物分子的量子化学参数以及特征参数筛选后，用SVR算法对化合物的活性进行了定量建模和留一法预报。SVR建模的相对误差为4.47％，优于线性回归算法(5.58％)；留一法预报相对误差为6.819％，优于人工神经网络(ANN)算法(8.099％)。第三部分支持向量回归(SVR)算法用于偶氮染料分子的结构性质研究。将SVM特征筛选方法对已知偶氮染料分子分子描述符进行了压缩提取，讨论了有关结果。用特征筛选后的分子描述符构建了染料分子亲合力的SVR模型，并用留一法考察了SVR模型的预报能力与可靠性，同时还用多种传统方法对该体系进行了研究。结果是：ANN拟合最好，其平均相对误差MRE仅0.28％，优于SVR5.09％，MLR6.16％，PLS6.41％；SVR的预报正确率最高，其MRE为6.60％，而在训练中拟合最好的ANN其预报的MRE为10.89％，低于MLR9.30％和PLS9.52％。结果表明：与人工神经网络(ANN)法、多元线性回归(MLR)法和偏最小二乘(PLS)法相比，SVR算法可以得到预测精度更高，稳定性更好的染料分子结构与性质关系的数学模型。

其他文献

Application of remote-sensing-image fusion to the monitoring of mining induced subsidence

We discuss remote-sensing-image fusion based on a multi-band wavelet and RGB feature fusion method. The fused data can be used to monitor the dynamic evolution

期刊

subsidencewaveletfuseddecomposedtransformedentropybandsSPOTtextureinter

淀粉样蛋白纤维化的机理及相关分子间作用的研究

淀粉样蛋白纤维化是蛋白分子在特定条件下通过分子自组装而生成具有cross-?结构的纤维状聚集体的过程。这种蛋白纤维的基元结构由两个相互平行排列的多肽?-折叠片层构成。它的宽度一般为纳米级,而长度为几十纳米或达微米级,因此它是一种蛋白纳米线。蛋白纤维化聚集体在历史上曾长期被错误地认为是某种淀粉聚集体。这一历史误会也造成人们将其称为淀粉样纤维。淀粉样蛋白纤维化研究是近二十余年来国内外蛋白质科学研究领域

学位

铜(Ⅰ)催化的不对称C-N偶联反应研究

通过隔开的两个对映异位的基团进行简单的转换进行对映选择性去对称化，是不对称合成的高效和实用的方法。这种策略在有机催化和过渡金属催化的反应为手性化合物对映选择性的合

学位

乌尔曼反应不对称合成亚铜催化手性配体对映选择性

吡啶类席夫碱配合物合成结构和性质研究

本文对吡啶类席夫碱过渡金属配合物的合成、晶体结构、谱学等方面进行了研究。共合成了八个吡啶醛类席夫碱配体，选择其中的两个配体与过渡金属反应合成了八个席夫碱过渡金属配

学位

吡啶类席夫碱配体过渡金属配合物合成结构性质

独立学院思想政治教育运用新媒体技术的策略分析

新媒体时代的到来,改变着高校大学生学习和生活方式,高校思想政治教育工作也面临着新的机遇和挑战。作为高等教育重要组成部分的独立学院,如何面临新媒体时代对大学生思想政

期刊

思想政治教育新媒体技术独立学院新媒体时代教育工作者心理健康传播形态价值观取向政工人员就业指导课

Computational Studies on N-Heterocyclic-Carbene (NHC) and Transition-Metal Catalyzed C−X (X=H,C) Bon

学位

基于原子力显微术的生物分子免疫识别

本文基于原子力显微术(Atomic force microscopy, AFM),利用电化学、荧光半导体量子点(Quantum dots, QDs)标记、透射电子显微镜(Transmission electronic microscope, TEM),

学位

原子力显微术免疫识别免疫传感转铁蛋白转铁蛋白受体纤维粘连蛋白受体量子点细胞标记

基于石墨烯的过氧化氢电化学传感器的制备及应用

过氧化氢电化学传感器由于制备过程简单、制作成本低廉、易于操作、对待测物响应灵敏等优点,在医药卫生、环境监测、工业生产等领域具有潜在的应用价值。如何制备出响应速度

学位

石墨烯血红蛋白纳米氧化铜过氧化氢修饰电极

新型聚苯并咪唑基介电复合膜的制备及性能研究

随着现代工业的发展,对质量轻和大容量的储能材料需求越来越迫切。高介电性聚合物基复合材料同时具备介电性能优异,质量轻,易加工等优点,对储能材料的发展具有重要意义,然而

学位

聚苯并咪唑二氧化钛石墨烯负载二氧化钛银二氧化钛核壳型材料复合膜介电常数介电损耗

拥有吡啶基修饰环糊精的合成及分子键合行为

超分子化学是一门以分子识别和分子组装为主要研究内容的处于当代化学前沿的学科，被称之为环糊精的环聚多糖是超分子化学研究领域的一个重要研究方向，因为桥联环糊精拥有两个疏

学位

超分子化学桥联环糊精键合行为分子识别分子组装吡啶

支持向量机用于化合物构效关系的研究

与本文相关的学术论文