基于集群环境的三种蛋白质GO功能注释方法的实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:q3177848
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在获得了海量的实验数据后,生物信息学目前面临的下一项艰巨任务就是尽可能快速地从这些数据中提取有意义的信息,提供给生物学家们思考分析以及进一步探究其表达的生物学含义。解决方法之一就是建立针对海量数据的高性能生物信息自动分析web平台。在以上任务中,预测蛋白质功能是具有重要意义的一步。基因本体(GO)是一套具有动态形式的控制词汇,其结构为有向无环图。基因本体精确定义了蛋白质的功能以及功能间的关系,被广泛应用于蛋白质功能注释研究中。本文通过以下三种方法对蛋白质GO功能进行了预测:(1)基于blast比对程序(blastp、psi-blast)的同源搜索,提取结果中的SwissProt关键词,并将关键词映射到GO;(2)基于InterProScan的蛋白质模体、家族和结构域搜索对蛋白质功能进行预测;(3)基于一款实现了支持向量机的软件GOKey,对蛋白质序列特征和理化特性进行比较分类,并预测蛋白质功能。涉及到的数据库及程序资源包括UniProt、RefSeq、InterPro、Ensembl。现已将Ensembl蛋白质数据库中的Novel蛋白质全部注释,并提供网页查询。为实现Linux集群环境下的自动注释平台,完成了blast程序,InterProScan,GOKey及其比对数据库在Linux集群上的安装与自动更新,并提供了这些工具及计算结果数据库的网页接口。为充分利用集群的并行计算能力,该网页接口实现了对提交任务的划分。经测试表明,集群的并行计算能力能够大大缩短各种注释方法的计算时间,为生物学家提供了更加快速的信息获取方式。
其他文献
2012年以来,中国区域性股权市场进入快速发展阶段,海峡股权交易中心作为福建省按照"一省一家"原则设立的区域性股权市场,经过3年多的实践探索,初步形成了涵盖股权、债权、金
在介绍振动沉拔桩机振动桩锤工作原理和主要参数的基础上,建立了其动力学模型,并进行力振动分析,为桩机的设计和研究提供了一定的理论依据。
文章通过对南水北调中线京石段应急供水工程临时通水期,沿线各建筑物监测资料成果分析,评估临时通水期各建筑物的安全状况。结果表明:该段应急供水工程各建筑物通水期间运行基
堆石料开采控制爆破技术不但要控制其最大粒径,还要控制其石料级配,按给定的级配进行爆破。文章从爆破石料的颗粒组成的R—R分布函数入手,建立了堆石料爆破块度和级配预测模型,并
[目的]比较Wiltse肌间隙入路与传统入路伤椎置钉内固定治疗无神经损伤胸腰椎骨折的临床疗效。[方法]回顾性研究2012年2月~2015年8月收治的87例单节段胸腰椎骨折患者,其中采用W
本研究运用混合方法从活动理论视角探究高校英语教师的研究实践与认知状况。全国60余所不同类型高校1043名英语教师接受了问卷调查,其中12人参与后续访谈。研究发现:多数教师
Considering that diverse fire severities can affect soil properties differently,the aim of this study was to examine to what extent changes in soil properties c
Soil characterization is a vital activity to develop appropriate and effective restoration protocols for mine wastelands while insights into the total content o