论文部分内容阅读
牦牛是高寒高海拔地区特有的家畜,主要分布在我国青藏高原海拔3000-5500米以上的地区,并为高原地区的牧民提供了吃、住、行等基本生存保证。牦牛适应高海拔地区的严寒、缺氧、缺草等恶劣自然条件,使其成为哺乳动物中研究低氧适应性的理想模式物种。在第二代高通量测序技术的驱动下,我们用时多年开展了牦牛全基因组测序,以便为研究人员提供高质量基因组序列;在获得基因组序列的同时,我们也花费了近五年的时间构建和优化牦牛基因组数据库,提供高质量的参考基因集以及高密度的遗传图谱,让广大研究人员方便地访问牦牛基因组数据资源,从而获得对牛类基因功能和分子育种研究有用的信息。我们采用多种生物信息学方法构建牦牛基因组数据库(Yak Genome Database:http://me.lzu.edu.cn/yak),收集、分析、存储和共享牦牛基因组和相关数据资源;尤其是使用了Mercator和MAVID软件,对人、黄牛和牦牛的基因组数据进行了全基因组比对,完成了相应的共线性同源区域的分析和展示;整合了3头家养牦牛和3头野生牦牛的基因组重测序数据,以及SNP、InDel和结构变异等遗传变异的分析结果。数据库使用Ubuntu开源系统平台,数据的存储和检索采用PostgreSQL数据库管理系统。网页服务器采用了Apache开源网页服务器,并在服务器端使用PHP语言动态生成网页。客户端使用I Frame框架和Javascript语言进行页面的展示和交互,其中主要使用了jQuery框架和jQuery UI用户界面代码库。牦牛基因组数据库具有信息含量丰富、使用方便、分析工具齐全的特点。数据库采用GBrowse作为基因组数据浏览器,可以方便地查看牦牛基因组上任意感兴趣的区域,并能同时显示基因序列、基因功能、GC含量、非编码RNA、重复序列、SNVs以及SNPs等信息。数据库中支持多种检索方式,可以通过基因注释的关键词、基因名称、基因编号以及GO号进行检索,也可以使用网站中提供的BLAST工具通过序列相似度对牦牛的基因组序列、编码序列和氨基酸序列进行搜索。牦牛基因组数据的另一个重要功能是展示基因具体信息,在每个基因的页面用户可以浏览蛋白质结构域信息、GO分类信息、基因相似性注释信息、基因家族信息和KEGG等注释信息。基因信息页面也提供了基因序列下载的功能,可供用户单独下载使用。此外,数据库中还提供了共线性浏览器,用于浏览人、黄牛和牦牛的全基因组比对信息,帮助研究人员快速的查看基因的共线性和同源关系。该数据库和分析平台的建立不仅能为牦牛基因功能和比较基因组学研究提供坚实的基础,而且能够为深入了解牦牛的起源和进化、阐明牦牛在高原极端环境中生存的分子机制提供重要的资源和辅助工具。此外,通过整合家养牦牛和野生牦牛群体基因组数据,该数据库还将在牦牛重要农艺性状基因挖掘以及分子育种改良研究中发挥巨大的作用。本数据库相关的内容已经发表在BMC Genomics、Nature Genetics等杂志上。该数据库已经被访问和下载2000多次。