真核生物基因组结构自动注释系统研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:trjycp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自从全基因组测序成为可能以来,基因组结构注释(包括了解基因组DNA中的基因组成、结构及其调控元件)成为生物信息学研究的重要问题。为此,需要建立基因组结构自动注释系统,快速方便地得到基因组上的基因及其结构元件信息等;与此同时,需要采用相关的技术和手段保存和管理注释数据,并使该数据信息能为全球web用户访问和使用,必要时还须提供数据的安全保护等。此外,由于基因组结构注释系统的计算量庞大,还需要基于高性能计算资源进行基因组结构注释计算。针对以上问题,从事了如下几个方面的工作:制订了整合不同的数据信息(如蛋白质序列、cDNA/mRNA序列、EST序列、全基因组序列等)和不同的基因结构预测方法(如蛋白质序列比对、EST序列分析、从头预测等)对基因组基因结构进行自动注释的整体流程,建立了基因组结构自动注释系统的整体框架。从基因结构规律提炼、EST数据挖掘利用、模型与算法设计、软件研制等方面对真核生物基因结构预测进行了研究,研制出了基因结构从头预测、基于EST的基因外显子区域识别等软件。建立了基因组结构注释数据库。以基因组结构注释元件为核心建立了数据库概念模型,可有效存储和管理基因组结构注释数据。基于数据库一次生成、多次访问的特征,通过采用允许冗余、允许关系表属性发生变化、细分实体等手段提高了数据存取效率。通过建立索引、依据坐标聚集性存储数据、数据预排序、分割数据、序列以二进制数据文件形式存储等措施,实现了对web检索访问、可视化浏览访问以及计算存取等的有效支持。采用数据库代码生成器降低了数据库开发代价。研制开发了基因组可视化浏览器,实现了对基因组结构注释数据的可视化浏览访问等。采用了国际三大著名基因组浏览器共同采用的显示“轨道”的方式可视化展示注释元件,并针对其存在的不足,提出了以注释元件为中心组织相关数据、聚集同类同层次数据以及基于SVG技术提供方便的交互式操作等改进措施。以自适应步长的轨道漫游和自适应分辨率的轨道放缩等措施完善了以染色体为中心的导航策略。建立了在高性能计算环境下整合上述注释软件、数据库以及web访问接口等的基因组结构自动注释系统。采用基于网格计算和集群计算的两级调度体系结构完成了基因组结构自动注释系统在高性能计算环境下的部署。
其他文献
悠悠人类发展史上,古今中外有多少神话般的传说,高悬着多少聚讼不解的疑案,成为解析人类文明中的千古之谜。过去学历史,从来就认为人类的文明史没有超过10,000年,有文字记载
比较分析了多参数作用下双单元法梁单元模型与实体单元仿真模型的计算误差,阐述了双单元法的优势与不足,分析表明双单元法工程应用具有可行性。基于通用有限元建模技术提出双
领导行为与企业绩效关系的研究一直倍受学术界关注。本研究将战略柔性(资源柔性和能力柔性)作为中介变量,研究动态环境下变革型领导行为对企业绩效的影响并提出研究假设,通过
自从Benoit B.Mandelbrot的《Fractal Geometry of Nature》一书于1982年出版后,分形受到了各行各业人士的关注,在许多科学领域得到了一定的应用。但是严格而且正式地定义分形
图论是数学的一个分支,特别是离散数学的一个重要分支,它在物理、化学、天文、地理、生物学,尤其是计算机科学中有非常广泛的应用。 本文主要研究图的标号问题。图的标号
2015年5月,国务院办公厅发布《关于深化高等学校创新创业教育改革的实施意见》(国办发[2015]36号)文件,提出了“大众创业、万众创新”的新要求,我校认真贯彻落实国务院和省政
<正> 自从核潜艇问世以来,各国共建造了近600艘核潜艇。这种水下巨鲸潜入海底以后,频频发生事故。由于各国常常对这些不幸的事件三缄其口,所以很难准确地说出目前已经发生过
随着全球对中遗的越来越重视,与申遗息息相关的旅游档案也应当受到各个部门的重视。旅游档案工作的好与坏,更是影响着世界遗产的申报及管理。本文不仅阐述了申遗的重要性及其带
随着深度学习知识广泛的应用到生活中的各个领域,对于深度学习的研究显得尤为重要。近年来,有关深度学习的模型层出不穷,每一模型的变种模型也有很多,而如何选择合适的模型应
目的:探究将中医护理应用在糖尿病并发脑梗塞中的效果.方法:选取2012-01/2015-01我院收治的80例糖尿病合并脑梗塞患者作为研究对象,治疗期间对其进行中医护理,评价患者的临床治