基于序列信息对十种金属离子结合残基的识别

来源 :内蒙古工业大学 | 被引量 : 0次 | 上传用户:YNiit562552379
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
众所周知,金属离子在生命进程中扮演重要角色。超过三分之一的蛋白质结构中包含有金属离子,它们参与了酶催化,维持蛋白质结构,以及扮演监管角色。这些功能均通过蛋白质与金属离子配体的相互作用来实现。因此识别蛋白质中的金属离子结合残基极为重要,这对分子药物的设计具有指导价值。基于序列信息识别蛋白质中金属离子结合残基,主要工作如下:(1)十种金属离子Zn2+,Cu2+,Fe2+,Fe3+,Ca2+,Mg2+,Mn2+,Na+,K+和Co2+结合残基数据集均来自BioLiP数据库,筛选分辨率好于3?,序列长度大于50个残基和序列同源性低于30%的蛋白质链。使用滑动窗口方法得到了十种金属离子的最佳窗口分别为7,13,9,9,9,9,7,9,11,11。(2)对十种金属离子结合残基数据集进行统计分析,发现位点氨基酸具有较强的保守性,以位点氨基酸为特征参数用位置权重矩阵打分算法对十种金属离子结合残基进行识别,五交叉检验下的总精度高于62.7%,马氏相关系数高于0.335。结果显示Zn2+,Cu2+,Fe2+,Fe3+和Co2+配体结合残基的结果较好,而Ca2+,Mg2+,Mn2+,Na+和K+配体结合残基的结果并不理想。(3)为了进一步提高识别结果,通过研究结合残基的生物背景,添加了氨基酸组分、亲疏水、极化电荷、预测的二级结构和溶剂可及性面积信息作为特征参数。为了避免支持向量机算法的过训练,使用矩阵打分和离散增量算法将一些特征降维优化,并输入到支持向量机对十种金属离子结合残基进行识别。五交叉检验下得到了较好的识别结果,预测的总精度和马氏相关系数均高于74.8%和0.502。并通过组合特征参数的支持向量机计算,分析了各种金属离子配体结合残基对特征参数的敏感性。为了增强模型的实用性,对金属离子数据集进行了独立检验,并与前人研究的结果进行了对比,发现预测趋势与前人的结果一致。(4)引进了随机森林算法。把与SVM算法相同的组合特征参数输入随机森林算法中,五交叉检验下的识别结果略低于SVM算法下的识别结果。将未优化降维的特征参数输入随机森林算法中,五交叉检验下的识别结果比SVM算法下的识别结果稍好,尤其是对Ca2+,Mg2+,Mn2+配体。(5)搭建了预测平台,建立了一个金属离子配体结合残基的在线预测服务网站,免费对外开放,为相关研究提供便利和帮助。
其他文献
哈尼族当代文学的出现是在20世纪70年代以后,随着哈尼族新一代人才的成长,他们写出了反映哈尼族现实生活和思想感情的小说、散文、诗歌等文学作品,标志着哈尼族文学结束了没
我国中小学教师专业标准忽视了"教师作为知识分子"角色。教师专业标准是技术理性的产物,技术理性抑制了教师的批判性思维向度,异化了教育过程中教师和学生的关系,解构了"教师
基于相似理论,从基本控制方程出发,推导并分析了柴油机喷雾燃烧过程中重要的无量纲数,阐明了不同尺寸柴油机扩散燃烧过程、预混燃烧过程及喷雾过程存在相似性的理论依据。在
未成年人犯罪记录封存制度在我国的确立虽具有重大历史意义,但其规定过于原则,使得该制度存在适用范围比较狭窄、适用主体模糊、适用程序不明、缺乏相应配套机制等问题。有必
岳麓书院坐落在湖南长沙湘江西岸的岳麓山风景区内,占地面积2.1万平方米。这座书院的建筑群前望湘江,背靠堆青叠绿的岳麓山,互相连接、合为整体,展现出我国古代建筑气势恢宏
对于身心关系这一笛卡尔传统难题的破解,近10年来涌现出了许多新的理解维度和解释水平。强物理主义的心身同一论已逐渐消退,心智主义的"心物并存论"、现象学的"身体主体论"和
食品安全事故频发,保障食品安全已引起社会广泛关注。刑法作为保障食品安全的最后一道屏障,由于其对危害食品安全犯罪的定性不当、保护范围较窄、保护滞后等问题,有大量危害
<正> 肖像描写是文学塑造人物形象、展示人物 性格的重要手段,也是“小说中最困难的一部分。”(马卡连珂语。)《红楼梦》中的肖像描写极富特色,绘形传神,富有创新意义。中学
本文在较全面阐述电喷发动机工作原理及电喷发动机现代检测解码器技术的基础上,重点对电喷发动机的重要传感器之一,空气流量计进行了研究和讨论。发动机电子控制燃油喷射系统