论文部分内容阅读
动物T细胞受体(T cell receptor, TCR)基因由多个不同的高度同源的基因家族组成,通过全基因组测序很难获得这些基因片段的准确序列和排列位置。 本研究通过在NCBI中发布的鸡TCRα、β、γ和δ基因位点的基因片段序列定位了鸡TCR基因位点的区间,并确定了与该区间对应的细菌人工染色体(Bacterial Artificial Chromosome,BAC)克隆。经过酶切鉴定和BAC末端PCR验证后,采用Illumina公司的高通量测序平台对这些克隆进行重新测序和组装。 本文运用ABYSS软件和Phrap软件对这些克隆的测序数据进行组装和优化,既得到了鸡TCR基因位点的新的序列,同时也发现了鸡参考基因组的几个组装问题。鸡TCRγ(TRG)基因位点的克隆174P24经过组装得到含有10个scaffolds的基因组草图,较完整地覆盖了鸡TRG基因位点及两侧区域;通过PCR扩增和测序证明了scaffolds内部结构的正确性,发现鸡参考基因组2号染色体上49748865 bp~49749161 bp之间长约296 bp的序列不存在,以及可变基因区多处序列组装问题。鸡TCRβ(TRB)基因位点组装得到27个500 bp以上的scaffolds,发现TRBV基因片段集中的长约80 kb区间的结构比较复杂、重复序列较多,推测这个区间内参考基因组标注的一个长约40 kb的缺口不存在。对鸡TCRα/δ(TRA/D)基因位点的组装发现,这长约1100 kb区间内重复序列较多、基因片段间同源性较高,组装难度很大。 综上,本研究通过对鸡TCR基因位点BAC克隆的测序和组装分析,得到鸡TRG基因位点的草图,找出几处与参考基因组不同的序列,发现鸡参考基因组TRB基因位点和TRA/D基因位点的几个组装问题。本研究虽然未能得到完整和准确的鸡TCR基因位点的序列信息,但仍为基因组复杂区域的研究提供了参考和建议。