论文部分内容阅读
中华绒螯蟹(Eriocheir sinensis),又称河蟹、大闸蟹,是我国重要的水产养殖经济蟹类,年产量达到30万吨,年产值已经超过200亿元。随着水产养殖的发展及养殖集约化程度不断扩大,中华绒螯蟹病害发生日益频繁,苗种种质严重退化,在带来巨大经济损失的同时,也制约了其产业的可持续发展。运用新一代高通量测序技术,以转录组为平台,在全基因组范围内规模化筛查与抗病相关的SNP位点及主要免疫通路的关键基因,不仅能达到理论的深入化、系统化,对其健康养殖、病害防治也具有很重要的实践意义。中华绒螯蟹基因组大而复杂(约1.68G),目前已知的基因组信息还很匮乏。相比之下,转录组数据较易获得,可通过高通量测序快速完成。基于转录组水平,能够分析全基因组范围的基因表达和调控。为全面激活相应免疫通路,获得丰富、高表达的免疫相关基因,本研究采用革兰氏阴性菌溶藻弧菌、革兰氏阳性菌藤黄微球菌和真菌酵母菌三种菌的混合菌液联合刺激中华绒螯蟹,以刺激后的中华绒螯蟹成体主要免疫组织肝胰腺和蚤状幼体全个体为材料,通过Illumina HiSeq2000双端测序获得转录组数据。经Trinity软件从头拼接组装获得转录本序列,通过Blast比对获得基因注释和功能分类信息,从中筛选出蟹类免疫信号通路相关的重要基因,并进行基因差异表达分析和SNP标记筛选。实验主要结果如下:(1)成功构建了中华绒螯蟹成体肝胰腺和蚤状幼体两个转录组测序文库,并利用Illumina HiSeq2000高通量技术平台进行测序,每个转录组均获得大于4G的数据产出。肝胰腺和幼体中分别得到40776652和46099408条raw reads,经过滤除去接头和低质量序列后各得39763094和44767566条clean reads,reads平均读长约为100bp。进一步的从头拼接组装得到70300和100252条unigene序列,对应的N50值为1834和2095bp,平均长度分别为354和372bp。(2)通过Blast算法分别将两转录组的52074和65535个非冗余unigene与不同公共数据库中的基因进行同源比对,共有21740和22477条注释到Nr、Nt、Swiss-Prot、GO、COG、KEGG等数据库中,分别占各自总数的41.75%和34.30%。GO分析将18734和23188条unigene分类到生物过程、细胞组分和分子功能三大本体中,其最大优势子类别依次为细胞过程、细胞和细胞部分、连接形式。COG功能分析分别将12243和23188条unigene分到26个COG类别中,且发现可能与免疫信号相关的功能有信号传导机制类和防御机制类。KEGG代谢通路分析分别将11938和11454条unigene归到六大类生化途径中,并发现各有1290和1402条与免疫系统、信号传导、信号分子及其相互作用三类途径有关的基因。(3)在中华绒螯蟹肝胰腺和幼体转录组中全面系统地筛选出与多种免疫通路如Toll通路、IMD通路、Jak-Stat通路和MAPK通路等相关的大量功能基因序列,并首次在蟹类中检测到Spatzle、MyD88、Pelle、TRAF6、IMD、IKK、JAK、STAT、FGF、PTP、JIP1等基因的表达,为蟹类免疫分析、疾病控制提供资源。(4)肝胰腺和幼体转录组中分别检测到60517和49555个SNP标记位点。肝胰腺中颠换位点数为39534个,转换位点数为29083个,颠换:转换比为1.36;肝胰腺中颠换位点数为32085个,转换位点数为17470个,颠换:转换比为1.84。进一步的免疫分析分别从35和38个通路相关基因中检测到183和176个SNP位点,多数基因所含SNP数为1个。经后续实验验证和应用研究,这些SNP可能用作中华绒螯蟹抗病相关分子标记。(5) RPKM标准化分析肝胰腺和幼体转录组中的差异基因,发现3531个unigene表达水平有差异,其中2192个在肝胰腺中上调表达而幼体中下调表达,另外1339个在肝胰腺中下调表达而在幼体中上调表达。GO富集分析显示2345个差异表达基因参与生物过程,1878个参与细胞组分,1822个参与分子功能。KEGG富集分析显示,1531个差异基因参与到246个KEGG代谢通路中。大量Toll、IMD、Jak-Stat和MAPK等通路相关免疫基因和分子标记的识别筛选,将促进中华绒螯蟹免疫防御和分子生物学研究,从而推动蟹类健康养殖。