新型氨基酸结构表征方法及其在定量构效关系中应用研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:tomjohn3168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
肽与蛋白质的结构表征是其定量构效关系(Quantitative Structure-Activity Relationship, QSAR)研究的前提和重要内容。由于肽和蛋白质的空间结构及功能信息隐藏于一级结构即氨基酸序列中,因此,氨基酸的结构信息对肽及蛋白质的定量构效关系研究至关重要。本文从氨基酸的结构特征出发,构建了两种全新的氨基酸结构表征体系,即VHESH和VSTPV。VHESH(principal component score vector of hydrophobic, electronic, steric, and hydrogen bond properties)来源于20种天然氨基酸的113种物理化学性质,通过对其中50个疏水性质、23个电性性质、35个立体性质和5个氢键性质分别进行主成分特征提取而产生,其中VHSE1和VHSE2代表氨基酸疏水特性;VHSE3~VHSE6代表氨基酸电性特性;VHSE7和VHSE8则代表氨基酸的立体特性;VHSE9和VHSE10代表氨基酸氢键供体和受体特性。VSTPV(principal component score vector of structural and topological variables)则来源于166种天然及非天然氨基酸的85种拓扑结构信息,并经主成分特征提取而产生。与z-scale等其它氨基酸描述子比较,VHESH具有物理化学意义明确,表征能力强,结果易解释等优点;而基于氨基酸拓扑结构性质的VSTPV则具有计算方法简便,不依赖实验数据以及拓展性能好等优点。在肽定量构效关系研究中,将VHESH和VSTPV用于血管紧张素转化酶抑制剂、后叶催产素、人类1型双载蛋白SH3结构域亲和肽、阳离子抗菌肽及细胞穿膜肽的定量构效关系研究,都取得了较好构效关系建模结果。基于VHESH表征方法的构效关系研究发现:血管紧张素转化酶抑制剂第2残基电性与疏水性及第1残基立体等性质与生物活性呈正相关关系,而其第1残的电性等性质则与活性呈负相关关系;后叶催产素第1残基电性及疏水性质和第3残基立体及氢键性质与其生物活性呈显著正相关关系,而第2残基疏水、电性及立体性质与其活性呈负相关关系;分析影响人类1型双载蛋白SH3结构域亲和肽亲和性关键作用力可知,第P-3与第P2之间残基(含P-3与P2残基)的相应性质对亲和活性影响较为显著;阳离子抗菌肽第3残基电性性质,第6、7和12残基立体性质以及第11和12残基的疏水性与抗菌效价呈正相关关系,而第6、10和12残基电性性质则与抗菌效价呈显著的负相关关系;细胞穿膜肽的相关残基的物化性质及拓扑性质对其穿膜性能影响较大。应用VSTPV表征方法对以上体系进行构效关系研究亦取得了较优的建模和预测结果,且得出影响活性关键氨基酸位点与VHESH模型结果基本吻合。在以上研究基础上,根据最优定量构效关系模型,在模型应用域范围内分别设计了一系列全新分子,其预测活性与各体系最高预测活性相比均有不同程度提高。将VSTPV应用于含非天然氨基酸肽衍生物体系即血管舒缓激肽促进剂、牛乳清蛋白水解肽和弹性蛋白酶模拟底物的定量构效关系研究,取得了较好的结果。研究表明,血管舒缓激肽促进剂分子的第2、3残基相关拓扑信息与其生物活性呈强相关;牛乳铁蛋白水解肽的第6、8残基拓扑性质与其生物活性关系密切;弹性蛋白质模拟底物A、B残基部分变量的二次项和交互项对酶催化反应影响很大。应用定量构效关系相关理论和方法对蛋白质特性及功能预测进行了研究。基于VHESH和VSTPV结构表征基础上,对人免疫缺陷病毒蛋白酶裂解位点(HIV PR)、蛋白质磷酸化位点和蛋白质与RNA相互作用位点进行预测及特异性分析,取得了优于其他方法的预测结果。研究显示,HIV PR的第1、2、4、5和6残基的立体、氢键、电性及疏水性质或对应的拓扑性质是HIV PR被识别重要因素;磷酸化位点序列的P-3位点物化性质(VHESH)及其拓扑性质(VSTPV)对S、T和Y位点磷酸化影响最大;与RNA相互作用的蛋白质序列第2、5、6残基立体、疏性、电性和拓扑信息对RNA和蛋白质相互作用位点影响较大。构效关系建模方法与技术是定量构效关系研究的一个重要内容。本文比较了多元线性回归(MLR)、偏最小二乘(PLS)、线性判别分析(LDA)及支持向量机(SVM)等方法在肽及蛋白质结构与功能关系研究中应用。结果表明,MLR在满足相关条件前提下,通常可以取得较好结果;PLS可较好地解决变量数较多且存在多重共线性情况;LDA用于模式识别效果好,模型易解释;SVM能较好地解决小样本、非线性、高维数和局部最小等问题。此外,为提高模型质量,采用多元线性逐步回归(SMR)、遗传算法(GA)筛选变量。研究发现,这两方法能较好地删除原始变量中噪音信息。模型质量评价及其应用域现已成为建模方法学中的一个关键性问题。文中将全部样本划分为训练集和预测集两个部分,由训练集样本建立QSAR模型,通过内部和外部双重验证来对模型进行质量评价。采用的内部验证方法有留一法(leave one out, LOO)、留组法(leave 1/n out,LNO)、留多法(leave many out, LMO)以及Y随机排序验证(Y random permutations test)。在内部验证基础上,通过多种评价函数对模型的外部预测能力进行评价,以确保模型的真实有效性。在此基础上,以样本的X空间标准化模型距离为依据确定了模型的应用域,避免模型外推后给活性预测带来的较大误差及不确定性。
其他文献
当前,人力资源管理作为企业管理的关键所在,对企业竞争力的提升至关重要。文章通过研究人力资源在企业管理中的重要价值,分析了当前人力资源在企业管理中存在的主要问题,并针
白汤酱油是苏北一带生产的具有传统特色的淡色酱油,但其颜色却会随储藏时间的延长而由浅金黄色逐渐变为深红棕色,从而影响产品的色泽稳定性和消费者的可接受性,降低酱油的营
为了提高工模具的服役性能,采用中频反应溅射,无灯丝离子源辅助的方法沉积了(Cr,Ti,Al)N多元硬质薄膜。分别用电子能谱、X-射线衍射、显微硬度计、划痕仪和干涉显微镜分析了
金融资源配置的合理性及高效性,是充分发挥金融资源应用价值的基础保障,同时也是构建健康金融体系以及稳定经济市场的重要前提,对金融资源配置效率进行测度分析具有重要意义.
目的探讨挤压泵对下肢静脉血流动力学的影响,从中筛选促进静脉血液回流的最佳模式。方法用彩色多普勒超声检测10名20侧健康自愿受试者股静脉在平卧静息状态、踝关节主动伸屈
本文以产业组织理论的SCP(结构—行为—绩效)范式研究中国汽车产业组织结构的现状,实证分析了中国汽车产业的市场绩效同结构、行为之间的关系,验证了优化中国汽车产业组织结
<正>信息爆炸时代,什么逻辑决定消费行为。英文有句谚语叫You are what you eat。实际上,现在更确切的说法是,You are what you read。因为信息爆炸,我们只是选择了少部分信
智力障碍学生的心理问题严重影响了智力障碍学生的身心健康发展,导致了智力障碍学生的人格、性格、行为等方面的问题。文章介绍了对本班级一位自闭类的智力障碍学生进行的心
<正>9.滑行模式机动车的"滑行模式"是在发动机和电机从传动系统上退耦时车辆继续行驶的一项功能。此模式的优点是利用可用的动能使车辆继续行驶,而不是以阻力的形式浪费掉。
抗菌肽是先天免疫体系中一种古老而又重要的组成成分。目前,已经有超过1200种抗菌肽被分离或预测出来。这些抗菌肽能够抑制革兰氏阳性和阴性细菌、真菌、病毒及寄生物。除此之