蛋白质相互作用预测方法的研究与蛋白质超二级预测系统的开发

来源 :中国科学技术大学 | 被引量 : 1次 | 上传用户:minglinjiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质间相互作用以及蛋白质构象和功能等问题已是后基因组时代的重要课题。伴随着高通量的实验手段的出现,生物学数据在量上急速增长。海量的生物学数据迫切需要我们发展计算学方法来研究蛋白质间相互作用以及蛋白质构象和功能。本文正是从计算学的角度来研究蛋白质相互作用和蛋白质的超二级结构预测。本文的工作主要包括以下几个方面:(1)我们提出了一种仅基于蛋白质序列信息的蛋白质相互作用预测方法。我们从蛋白质序列出发,通过将一种有效的氨基酸分类方法与区域编码方法相结合构成了本文中的区域蛋白质序列编码方法。我们提出的这种新的蛋白质序列编码方式能够充分地捕获序列上多个重叠的连续和间断的残基结合模式,从而更精确的描述了蛋白质相互作用信息,因为蛋白质相互作用的一个重要特征是相互作用经常发生在序列上的间断区域,在这些区域中,那些序列上相距较远的残基通过蛋白质的折叠从而在空间上相距很近。我们提出的区域蛋白质序列编码方法与最近邻算法相结合的蛋白质相互作用预测模型在酿酒酵母蛋白质相互作用数据集上有着优异的表现。对于独立数据集大肠杆菌蛋白质相互作用数据集的预测结果表明我们提出的区域蛋白质序列编码方法有着优异和稳定的表现。考虑到蛋白质相互作用的复杂实质,我们提出的方法是对蛋白质相互作用预测手段的一个有效补充。(2)我们提出了一个基于神经网络的新的方法来预测蛋白质中的β-发夹结构。不同于此前的方法,我们的方法采用了径向基函数神经网络并结合蛋白子序列的自相关编码方式来预测β-发夹结构。自协方差编码方式是一种基于氨基酸残基序列相关系数的编码方式,该编码方式同时考虑序列内部长程相互作用和序列之间的协同进化关系,从生物学角度来看更符合蛋白质序列是长程相关的这一事实。径向基函数神经网络是一种新颖有效的前向型神经网络,具有较高的运算速度和外推能力。在我们的方法中,机器学习方法径向基函数神经网络首次应用于β-发夹结构预测并取得不错的效果。(3)在我们提出的新方法基础上我进一步开发出了基于径向基函数神经网络的β-发夹预测系统,该β-发夹预测系统借助现代模式识别技术,实现了对于输入的氨基酸序列进行一系列运算包括二级结构预测,ECE模式序列提取,自协方差编码方式来提取蛋白质序列片段的特征信息,利用软件内镶嵌的基于径向基函数神经网络的分类系统根据所提取的特征进行识别,预测输入的氨基酸序列是否具有β-发夹结构。
其他文献
烟草(Nicotiana tobacum)NtRab5b是一个植物特异性的小GTP结合蛋白,定位于内吞途径,参与烟草幼苗对盐胁迫的反应。本研究发现,NtRab5b蛋白氨基端预测为豆蔻酰化修饰位点的第2位Gly介导其与膜的结合,该位点的突变(Gly突变为Ala)导致NtRab5b(G2A)-GFP失去膜定位功能,非特异的弥散分布于细胞质和核内。结果表明,转基因细胞中NtRab5b(G2A)在mRNA
中国移动IT云是中国移动内部私有云,承载着中国移动集团内各单位业务系统,是中国移动智慧中台的底座,目前已形成"一云多中心"格局,已建设十几万台服务器规模。中国移动IT云数据中心数智化运维是通过集成三维可视化、3D建模和视频监控等技术,将数据中心机房的三维高精度模型、设备属性、设备实时数据和生产运维数据融合,结合AI图像识别、机器人巡检和AR智能运维能力,实现数据中心机房的远程控制管理,提高数据中心
在蛋白质翻译的过程中,能量产生于GTP水解成GDP并释放无机Pi的过程。核糖体上存在一个GTPase-associated center( GAC)区域。GAC主要负责激活参与蛋白质翻译的GTP酶(translational GTPase,trGTPase)的GTP水解活性。GAC由三个重要的组件组成:23S rRNA上的sarcin-ricin loop (SRL),L10和L7/L12蛋白组成
本篇硕士学位论文的主要内容包含两部分.第一部分研究了带有相依结构的齐次与非齐次样本的次序统计量在通常随机序意义下的比较,将Ma(1997)中关于独立样本的结果推广到相依样本情形.第二部分给出均匀分布随机变量线性组合的分散序结论的一个简化证明.该结论表明当均匀分布随机变量的刻度参数在某种超优序下越大,对应的线性组合在分散序意义下越大.其最早的证明是由Korwar (2002)和Khaledi & K
在胚胎的发育过程中,ClassⅡa家族组蛋白去乙酰化酶(HDAC)与肌肉增强因子(Myocyte Enhancer Factor 2 ,MEF2)之间的相互作用为组织编排特化提供了一个信号模式。这里我们介绍了在外源基因诱导的体细胞重编程过程中该信号通路调控细胞命运的惊人作用。ClassⅡa HDACs和MEF2因子在成体细胞中的表达量比较低,然而随着重编程的进行它们的表达量却以不同程度地稳步上升。
芽胞杆菌为能够产生芽胞的革兰氏阳性菌,且具有分泌蛋白能力强、发酵基础良好等特性,在生物合成酶制剂、维生素、氨基酸、核苷及抗病毒类药物中具有广泛的应用。近年来,随着分子生物学的快速发展,芽胞杆菌的遗传操作方法日臻成熟。但是实验操作步骤繁琐和引入抗性标记等问题在一定程度上制约了芽胞杆菌菌种的定向改造和基因工程菌的构建。因此,建立高效、快速的新型芽胞杆菌遗传操作系统具有重要的意义。本研究以芽胞杆菌模式菌
[db:内容简介]
[db:内容简介]
[db:内容简介]
本文采用位于武汉物理与数学研究所(31 N,114 E)的瑞利-钠荧光双波长激光雷达的2002–2010年的探测资料,从107个夜晚的Rayleigh雷达观测数据中,筛选出了32个具有典型重力波扰动特性的观测资料,求出大气温度的相对扰动以及重力波势能密度,并对其进行功率谱分析。利用得到的分析结果可以描述武汉地区甚至中低纬度上空中层大气30–55km高度范围内重力波传播的重力波谱特征及随季节变化特征