论文部分内容阅读
牦牛是我国西部高寒高海拔地区特有的家畜,主要分布在我国青藏高原海拔3000米以上的地区。牦牛经过长时间的自然选择,能够适应高海拔地区寒冷和低氧的自然环境,是研究极端环境适应性的模式物种之一。我们应用第二代高通量测序技术完成了牦牛基因组序列图谱的绘制工作;并通过与其低海拔黄牛的基因组序列比较,对牦牛在基因组水平上的适应性进化进行了深入分析。组装产生的牦牛基因组序列Contig N50长度为20Kb,Scaffold N50长度为1.5Mb,总碱基数为2.66Gb,接近于先前报道的黄牛基因组大小。牦牛基因组总测序深度为65×,超过98%的碱基测序深度大于20×,因此具有非常高的单碱基正确性。用Fosmid和转录组数据对组装结果进行评估,发现组装的scaffolds覆盖了基因组90%以上的常染色质区和95%以上的基因区,并且具有非常好的完整性。我们识别了超过三百七十万个杂合SNP位点,比黄牛基因组高2.5倍,说明牦牛个体基因组具有更高的遗传多样性。我们共注释出22,282个蛋白编码基因,平均转录本长度为29,107bp,平均编码序列长度为1,475bp,平均内含子个数为8个,各项指标均与黄牛和人的基因集一致。基因集中97.5%的基因能在公共数据库中找到与之相似的同源序列。对心,肝,肺,胃,脑,脾,肌肉和卵巢这8个组织进行转录组测序,并应用转录组数据对注释的基因集进行评估,发现牦牛基因集中71%的基因有转录组数据的支持,证实了基因注释的准确性。牦牛基因组测序的完成使我们能够从基因组水平研究哺乳动物的抗逆适应性进化,识别进化过程中自然选择对牦牛基因组作用的范围和强度。使用共线性的方法,我们从人、黑猩猩、小鼠、狗、马、黄牛和牦牛这七个物种中鉴定了8,923个高质量的同源基因。通过评估牦牛和黄牛谱系特异的选择压力,我们发现牦牛的同义替换数(Ks)显著小于黄牛,四重简并位点(4DTV)分析也具有相同的结果,说明牦牛相对于黄牛具有较低的中性进化速率。但是牦牛的ω(Ka/Ks)却显著高于黄牛,说明牦牛经历了更多的适应性进化导致其积累了较多氨基酸突变。进一步对发生适应性进化的基因进行功能富集分析发现,牦牛中参与线粒体氧化磷酸化和低氧应答途径的基因发生了更多的适应性进化,与这两个途径相关的正选择基因数量也明显多于黄牛。这些证据共同表明,线粒体氧化磷酸化和低氧应答途径相关基因在牦牛适应高原极端环境过程中起了关键作用,因而经历了更强的适应性进化。