应用非参考基因组序列解析世界牛品种遗传资源及泛基因组构建

来源 :华中农业大学 | 被引量 : 0次 | 上传用户:sinjorzhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
牛不同品种和不同个体之间差异的基因组序列是控制其形成不同表型和具有不同经济价值的主要原因。在牛上长期使用单一品种/个体(海福特牛)的基因组作为参考展开研究,严重局限了对不同品种和个体优异遗传资源的挖掘。本研究针对以上问题,利用较高深度的测序数据(>15×)检测了31个品种450头牛相对海福特牛参考基因组序列存在的差异(插入变异)序列;评估了未知序列插入变异的生物学效应,并进一步挖掘未知序列插入变异的遗传资源;最后利用57个品种898个个体的二代数据在海福特牛参考基因组的基础上构建出具有多品种代表性的泛基因组,对泛基因组上未知序列进编码能力注释,初步形成具有代表性的牛参考基因组。主要研究结果如下:(1)在测序深度>15×的31个品种450头牛的二代高通量测序数据集中共检测出58,862个未知序列插入变异位点,同一插入变异位点最多被检测出791次,插入序列的总长度约为194 Mb,插入序列的平均长度是315 bp;插入序列长度主要富集在50-1000 bp。值得注意的是,在不同群体中,瘤牛中发生的插入变异数量(1886)和长度(343 bp)均大于普通牛群体,相比海福特牛中插入变异的数量(1110)和长度(305 bp)明显较大。初步证明海福特牛参考基因组的局限性。分别对插入位点进行基因功能元件的注释分析,发现插入位点在牛基因组的非基因区富集,有23,423个插入位点出现在基因区,并且只有22%出现在编码区,可能对基因编码序列产生影响。(2)利用插入变异展开群体结构学分析。主成分分析显示,第一主成分可将瘤牛(Bos indicus)、杂交牛和普通牛(Bos taurus)三个群体明显区分开,同时,血统分析也得到相同的结果,证明了未知序列的插入变异在不同牛品种中存在选择性差异。对瘤牛和普通牛群体进一步通过计算插入变异位点的群体分化指数(Fst),共鉴定出333个显著差异位点(前1%)。这些显著插入位点共影响到190个基因。对受影响的基因进行功能富集分析,GO和KEGG结果表明两个群体中的插入变异位点显著富集(p<0.05)在与嗅觉、免疫和物质代谢方面有关的条目中,表明牛参考基因组中缺少与相关生物功能有关的序列信息,和前期报道结果一致。(3)依据57个品种共898头牛(测序深度>5×)的二代高通量测序数据,共提取出4,285,821,838条未与参考基因组成功比对的序列,经组装得出2,791,151条连续的序列片段(contig),去除长度在1000 bp以下和被分类成污染物的序列,共获得543,702条序列片段。通过序列相似性比对,最终鉴定出总长约74 Mb的38,980条代表性序列。以最新的牛参考基因组(ARS-UCD1.2)为主体,结合牛参考基因组上缺少的非参考基因组序列,构建出一个代表这898头牛基因组信息的牛泛基因组。这些非参考基因组序列占牛泛基因组的2.662%。(4)通过单端锚定序列(one-end-anchor reads)定位法、间接比对(Indirectly blast)定位法和EST序列定位法可分别定位到300条、1256条和23条非参考基因组序列,运用定位信息与已知注释文件比对可注释出170个蛋白质编码基因(protein coding gene)、13个长链非编码RNA(LncRNA)、7个假基因(pseudogene)和309个外显子(exon)。在所有38,980条非参考基因组序列中,有16,078条(41.25%)序列被预测为具有编码蛋白质和转录的能力。本研究从基因组中插入变异入手,解析了插入变异在不同牛群体中的分布特征和生物学效应,充分说明了单一参考基因组的局限性和偏好性,并在此基础上初步构建出代表898个个体的牛泛基因组,为养牛产业的基因组选择育种和遗传信息的挖掘乃至结构变异导致的疾病的治疗和预防提供了必要的参考序列信息。
其他文献
最新的μ反常磁矩aμ≡(g-2)μ测量结合了费米国家加速器实验室(FNAL)和布鲁克海文国家实验室(BNL)E821的实验结果,给出aμExp=116592061(41)×10-11(0.35ppm),实验值和标准模型的预言值的偏差Δaμ=(251±59)× 10-11,意味着在统计学意义上二者偏离高达4.2σ。这说明该偏差偶然发生的几率仅为几万分之一,是可能存在超出标准模型新物理的直接证据。另一
学位
随着计算方法和计算机技术的发展,原子光谱的理论计算值往往可以达到和精密实验测量值相当的精度,实验和理论的相互促进是该领域发展的主要动力之一。在众多原子中,少电子原子体系的精密谱理论和计算一直是大家关注的热点之一。该方向的研究主要是以量子力学(QM)、量子电动力学(QED)为理论基础,采用现代数值计算方法作为理论手段,依托现代原子光谱实验测量的数据作为对照,达到检验基本物理理论、确定基本物理常数和原
学位
化石燃料的开发和使用造成了地球资源的短缺和环境的污染。开发和使用无污染可持续的清洁能源已迫在眉睫,质子交换膜燃料电池是一种具有高能量密度和转换效率的新型能源。铂碳催化剂作为质子交换膜燃料电池主要组成之一,存在成本高、催化效率低、易一氧化碳中毒等问题限制了其商业化应用,其中CO中毒是铂基催化剂催化效率降低的主要原因之一,目前防止CO中毒主要是通过低温下CO催化氧化的方法来去除燃料中残留的少量CO气体
学位
蛋品产业在我国畜牧业中占据着重要的地位。近年来,绿壳蛋因其特殊的颜色和较高的营养价值愈发受到消费者的喜爱,绿壳蛋也得到了越来越多的研究。鑫农绿壳蛋鸡来源于江汉鸡中产绿壳蛋的群体,目前正在培育中。本研究以鑫农绿壳蛋鸡为试验群体,通过对其进行选育,构建种鸡家系,进行下一世代的繁育;通过对种鸡群体内的母鸡绿壳基因进行分型鉴定,测量30与40周龄的蛋壳颜色L、a、b值,分析不同绿壳基因型(O/O型与O/o
学位
STSE教育关注科学(Science)、技术(Technology)、社会(Society)与环境(Environment)之间的联系,强调将科学技术进步、社会发展和环境保护等融入到科学知识的教育中,是提高中学生科学素养的一种有效方式。我国2017版普通高中物理课程标准也提出,要把握物理学科在STSE教育中的优势,在高中物理教学中渗透STSE教育,培养学生的物理核心素养。高中物理教科书中的STSE
学位
乳源活性肽Val-Pro-Pro(VPP)是乳蛋白来源的生物活性肽,具有良好的抗炎、降血压、抗水解等功能。然而,VPP能否能缓解犊牛肠道炎症尚不清楚。本研究拟通过荷斯坦犊牛以及SPF C57BL/6小鼠为研究模型探讨VPP对腹泻犊牛生长、腹泻、肠道健康、血液生化指标、肠道微生物结构的影响。试验一采用随机区组设计,按出生日期、体重及遗传背景相近原则将18头荷斯坦犊牛随机分为两组(n=9):对照组晨饲
学位
学位
重味介子唯象衰变在检验标准模型和寻找新物理等方面发挥着重要作用,跃迁形状因子是介子弱衰变中一个重要非微扰物理量,光前夸克模型为非微扰物理量的计算提供了一个概念上简单,唯象上可行的理论框架,被广泛应用于非微扰物理量的计算。本文在光前夸克模型下,对P → T跃迁形状因子进行了详细研究。首先,本文介绍了光前场论的相关理论,包括光前动力学,QCD光前量子化以及一般形式下量子电动力学(QED)和量子色动力学
学位
近年来,随着人们对纳米材料研究的不断深入,人们对半导体材料的要求越来越高。影响二维半导体材料在电子器件等领域应用的主要因素有:材料的带隙、载流子迁移率、磁性等等。其中,黑磷拥有合适的禁带宽度以及较高的载流子迁移率,吸引了科研工作者们极高的研究兴趣。但是在实际应用中,通常用掺杂、外加电场、外加应力等方法对材料性质进行调控,扩展材料的应用范围。掺杂是一种简易可行的方法,通过掺杂可以改变材料的带隙,调节
学位
学位