论文部分内容阅读
猪(Sus scrofa)作为重要的家畜以及生物学模型,在生物学研究领域占有重要地位。家猪于一万年前在近东和中国被独立驯化,其群体间表型和基因型的巨大差异隐藏在各自的基因池内。目前猪的遗传学研究多是基于单个个体的参考基因组,而单个参考基因组在代表整个物种遗传多样性上的不足已经在其他物种中被多次强调。因此,既能体现猪物种内的共性又能体现不同品种间差异的泛基因组(Pan-genome,pan源自希腊语‘παν’,全部的意思)的构建变得十分必要。本研究基于最新的猪参考基因组(Sscrofa11.1)和11个世界范围内具有地理和表型代表性猪种的从头组装基因组,构建了猪泛基因组。同时,利用87个全基因组重测序、92个转录组以及来自12个样本接近3T的Hi-C数据等,从基因组、转录组、三维空间结构等多个层面对猪的泛基因组进行了解析。研究结果总结如下:1.本研究将11个不同品种猪的从头组装基因组与猪参考基因组进行基因组间比对,鉴定了72.5Mb非冗余泛序列(约占全基因组的3%),并以此构建了猪的泛基因组。通过将泛序列与外群物种基因组进行同源性比对,进一步证明了泛序列的真实性,并表明很多泛序列很可能为祖先序列。2.基于泛序列在欧洲猪和中国猪中的频率信息进行聚类分析,很明显的区分出与其遗传背景一致的群体模式。同时,本研究发现了约9Mb的泛序列在中国猪中的频率显著高于欧洲猪。其中一条长14.3Kb并包含参与脂肪代谢通路的TIG3基因的泛序列,在中国猪中高频且具有可观的表达,很可能与中国猪的特异表型相关。3.本研究将Hi-C数据与泛基因组结合,提供了一种将泛序列定位回参考基因组的新策略。本研究证明在某些个体中,泛序列所代表的等位类型比参考基因组等位类型与侧翼序列具有更强的互作,并且具有潜在的功能。同时,本研究鉴定了泛序列在A/B区室(A/B compartment)、拓扑关联结构域(Topologically associating domains,TAD)以及调控上的特性,证明了泛序列的加入将有助于更准确地描述整个基因组的三维结构。4.除此之外,本研究还构建了猪泛基因组数据库(http://animal.nwsuaf.edu.cn/code/index.php/pan Pig)。该数据库综合了基因组、转录组和调控数据,可使科研人员更便利地使用泛基因组进行生物学研究。综上,本研究使用多个来自不同品种的从头组装基因组,构建了猪的泛基因组。新鉴定的72.5Mb的泛序列,极大的丰富了猪的变异数据库。同时,本研究表明基于泛基因组进行下游分析,可以提供更全面的基因组变异、全基因组表达谱以及基因组三维空间结构。进一步证明了从单个个体的参考基因组到泛基因组转变的重要性与迫切性。