论文部分内容阅读
辽宁绒山羊是世界上最优秀的绒山羊品种之一,以其绒毛品质优良、产绒量高、适应性强、遗传性能稳定而在国内外享有盛誉。但是由于缺乏参考转录组信息,导致目前对该品系绒山羊的绒毛生长的分子调控机理还缺乏足够的认识。针对这一问题,本研究采用Roche454测序技术对辽宁绒山羊转录组进行了测序和从头拼装。并对获得的拼装序列进行了基因预测、功能聚类和代谢通路分析、简单重复序列预测以及比较基因组学分析。最后,利用辽宁绒山羊转录组序列作为参考基因,进行了常年长绒型与季节长绒型辽宁绒山羊皮肤差异表达基因的筛选研究,以及常年长绒型与季节长绒型陕北白绒山羊皮肤差异表达基因的筛选与分析。主要研究结果如下:(1)利用Roche454GS FLX平台对辽宁绒山羊转录组进行测序,最终得到804,601条高质量序列,平均长度为403bp。利用Newbler v.2.5软件进行拼装后获得117,854个非冗余唯一基因(unigenes),包括13,194个重叠群序列(isotigs)和104,660个单一序列(singletons)。(2)利用EMBOSS工具包对拼装得到序列进行基因预测,从117,854个unigenes中找到蛋白质编码序列。预测得到的蛋白质序列与NCBI的nr蛋白质数据库进行比对,发现24,614个unigenes具有明确的生物学功能。预测得到的蛋白质序列进一步与SwissProt-TrEMBL数据库、COG数据库和KEGG数据库进行比对。其中17,356个unigenes被分配到6,700个GO条目,这些GO条目可以归类到3个主要的分类条目和59个次级分类条目;46,778个unigenes被归入COG的25个分类条目;3,548个unigenes被分配到300个KEGG代谢通路。(3)采用MISA程序,从辽宁绒山羊unigenes中搜索到2,781个简单重复序列(SSR)。并利用primer3为958个SSRs设计了引物。通过比对分析,1,326个SSRs可以匹配到山羊基因组上,93个SSRs序列可以完全匹配到山羊蛋白质编码基因上。(4)所有的辽宁绒山羊unigenes与NCBI非冗余核酸数据库进行比对,其中42,254个unigenes可以匹配到17,532个不同的基因。进一步计算了这17,532个基因被unigenes覆盖的比例。(5)所有的辽宁绒山羊unigenes与山羊基因组序列比对,97,236(82.51%)辽宁绒山羊unigenes被定位到山羊的30条染色体上。所有的辽宁绒山羊unigenes和已报道山羊蛋白质编码基因比对,35,551(30.17%)个辽宁绒山羊unigenes可以匹配到11,438个山羊蛋白质编码基因。将不能匹配到山羊蛋白质编码基因上的unigenes与牛(Bostaurus)和人(Homo sapiens)参考基因进行比对,预测得到67个新山羊基因。(6)采用Illumina Solexa技术,筛选常年长绒型和季节长绒型辽宁绒山羊皮肤组织差异表达基因。共计获得1,748个具有明确生物学功能的差异表达基因。进一步从中筛选出31个角蛋白和角蛋白关联蛋白基因,这些基因与绒毛生长关系密切。(7)采用Illumina Solexa技术对常年长绒型陕北白绒山羊和季节长绒型陕北白绒山羊皮肤组织基因表达谱进行测序研究,分别获得的5,614,110和7,167,309条cleanreads。以辽宁绒山羊转录组拼装序列作为参考基因,根据基因的表达丰度,筛选出108个差异表达基因。进而通过差异表达基因GO的显著性富集分析,发现显著富集的GO条目大多与细胞外结构及其组成有关。通过差异表达基因的代谢通路显著性富集分析,差异表达基因在氨基酸代谢、免疫疾病、信号分子及其相互作用和碳水化合物代谢这4个通路中显著富集。本文进行的辽宁绒山羊转录测序、功能注释及比对分析为更好的研究辽宁绒山羊转录组提供了丰富的基础资料,这将会促进辽宁绒山羊绒毛生长分子调控机理的研究。获得的简单重复序列可以用于辽宁绒山羊遗传图谱构建、数量性状位点分析、遗传多样性评价等研究。此外,常年长绒型和季节长绒型辽宁绒山羊与常年长绒型和季节长绒型陕北白绒山羊皮肤差异表达基因的筛选和分析,将促进绒山羊绒毛生长分子机理的深入研究。