基于生物学特征的蛋白质-DNA界面热点残基预测方法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:xxm181512619
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质和DNA是组成生命体复杂结构和功能的重要生物大分子。在各种生命活动中,它们之间的相互作用,即蛋白质-DNA相互作用,都有着相当重要的作用。而在蛋白质-DNA相互作用中,少部分氨基酸残基贡献了绝大部分的结合自由能,这部分残基被称为热点残基。研究蛋白质-DNA复合物结合机制和稳定性的一个关键就是识别其相互作用界面上的热点残基问题。丙氨酸扫描作为一种分析蛋白质表面上的特定氨基酸残基功能的生物实验技术,已经广泛应用于鉴定蛋白质-DNA中残基的结合自由能。这种实验技术将蛋白质-DNA界面上的氨基酸残基突变成丙氨酸,然后通过计算自由能的变化来识别热点残基。但是通过生物实验方法鉴定界面热点残基代价昂贵、耗时耗力,因此有必要发展识别蛋白质-DNA相互作用界面热点残基的计算方法。已有的计算方法大多使用基于分子动力学模拟的方法计算蛋白质-DNA结合自由能,进而预测热点残基。这类方法在构建预测模型时容易受到部分蛋白质结构的限制,并且预测效率也较低。而基于机器学习的计算方法则可以有效地克服这些不足之处。本文的主要工作如下:1.提出了基于一般性生物学特征的蛋白质-DNA热点残基预测方法。我们合并dbAMEPNI和SAMPDI两部分数据并筛选得到了64个蛋白质-DNA复合物共214个蛋白质-DNA界面残基,其中150个作为训练集,64个作为测试集。我们按照序列、结构、网络和溶剂可及表面积四个类别一共提取了114维特征。在比较分析了四种不同的特征选择方法后,提取了 10个最优特征。接着分别使用支持向量机、朴素贝叶斯、K近邻算法和随机森林来构建模型。并根据比较结果,最终使用支持向量机在10个特征上构建了预测模型PrPDH(Prediction of Protein-DNA binding Hot spot)。在训练与测试数据集上的比较结果表明,PrPDH预测性能相比其他方法性能更好,在训练集上的F1和AUC分别是0.721和0.803,在测试集上的F1为0.706,AUC为0.764。PrPDH的在线预测网址为http://bioinfo.ahu.edu.cn:8080/PrPDH/。2.提出了基于不同状态邻居信息的蛋白质-DNA热点残基预测方法。从蛋白质-DNA结合机制出发,在已有的10个最优特征基础上,分析蛋白质-DNA界面残基在结合和非结合DNA状态下的氢键、溶剂可及表面积、深度和突出指数特征,计算残基在作为供体时结合DNA链上相邻核苷酸产生的氢键数目,同时引入界面邻居残基的信息,改进溶剂可及表面积和残基深度、突出指数特征的编码方式,从而体现该残基在两种状态下的特征变化村相对于邻居残基的变化强度。最终共得到41维特征。然后使用基于支持向量机的递归特征消除法(SVM-RFE)并根据特征之间的相关性去除冗余并选择8维特征,结合支持向量机构建PrPDH-V2模型。通过模型的性能比较表明,PrPDH-V2相比PrPDH和其他方法在性能上有着较大的提升,在训练集上的F1为0.787,AUC为0.871,在测试集上的F1和AUC分别是0.755和0.852。实验结果表明,这种改进的特征编码方式能够有效识别蛋白质-DNA相互作用界面上的热点残基。
其他文献
随着清洁能源的不断发展,平板太阳能集热器在建筑供热领域使用愈加广泛,但在寒冷地区冬季使用时存在集热效率和集热量不高的问题。在集热器上加装反射板组成聚光型平板集热器
随着国内金融市场的发展和日益开放以及人民币国际化的逐步推进,国内经纪商和投资者对接入全球主流衍生品交易市场进行跨市场套利的需求也越发的强烈。会员结算系统作为衍生
导弹是国防领域的重要武器,导弹天线罩是其重要组成部分,其需要具备介电性能好、抗热震、热膨胀系数低等特性,多孔Si3N4陶瓷作为天线罩体能够满足上述要求。然而多孔Si3N4陶
辽宁北票山区荆条遍布,其作为生物能源石油草种,具有含油率和热值较高的特点。目前尚处于未开发利用阶段,国内外学者对其研究较少,具有一定的开发潜力。本文以荆条为研究对象
要想做一位优秀的班主任,就必须要从建立良好的师生关系做起。要想建立良好的师生关系,就必须用心去找寻一些行之有效的方法。本文着重探讨了如何建立良好的师生关系。
正面小偏置碰撞是汽车碰撞安全研究中的一种特殊的碰撞形式,因其在受到正面冲击力作用过程中,避开了车身前部主要吸能结构(防撞梁、吸能盒、前纵梁等),过多的碰撞能量被传递
职业院校的实训室是培养应用型人才的主要教学场所,近年来学校不断加大实训室的投入,实训室的使用率也逐渐增大。目前,部分院校实训室的管理系统仍存在管理方式落后,信息化程
目前,第三代制冷剂氢氟烷烃(HFCs)如1,1,1,2-四氟乙烷(HFC-134a)被广泛应用,但是其全球变暖潜值很高(GWP=1300),大量使用会引起全球气候变暖。氢氟烯烃(HFOs),如1,3,3,3-四氟丙烯(EZ-
利用海水、海砂等丰富的海洋资源拌制混凝土,可以有效减少淡水、河砂等自然资源的消耗,对于海洋工程,特别是岛礁开发建设具有重要意义,因而日益受到关注。然而,海水、海砂中
倾转旋翼无人机既有多旋翼飞机的垂直起降和悬停能力,又具有固定翼飞机航时长、速度快、飞行效率高等突出特点,已成为无人机平台研究领域的热点。倾转旋翼无人机的过渡模态是