论文部分内容阅读
本研究构建了虾夷扇贝闭壳肌均一化cDNA文库,共得到4595条高质量的表达序列标签(Expressed sequence tags,ESTs)。通过聚类组装这些ESTs,得到平均长度为544 bp的非重复序列(unigene)3061条,其中重叠群654个,单序列2047条。我们把这些unigene在3个蛋白质数据库(GenBank非冗余蛋白质数据库、InterPro数据库和同源基因信息库(Clusters of Orthologous Groups,COG))中进行检索。结果显示:Blastx分析得到1522tmigene与GenBank中已知功能或预测功能的序列有同源性;InterProScan检索得到1237unigene.这些序列包含了727种蛋白质结构域:有460 unigene在COG中被检索注释。通过对这3种不同比对结果的比较,共有1646 unigene被注释。利用BLAST2GO软件对3061个unigene进行Gene Ontology(GO)分类,共有889个unigene在3个类别中(生物过程,细胞过程,分子过程)被注释。其中与“生物过程”相关的有577个,与“分子功能”有关的有801个,与“细胞组分”有关的有334个。在“生物过程”这个体系中,大部分基因与“生理过程(physiological process)”和“细胞过程(cellularprocesses)”有关,分别占到这个体系的94%和87%。在“分子功能”体系中,63%的基因与“抗氧化剂活性(antioxidant activity)”相关,其次是“催化活性(catalytic activity)”,占到46%。在“细胞组分”体系中,90%基因被分到“细胞(cell)”类,38%基因被分到“细胞器(organeiles)”类,32%基因被分到“巨分子复体(macromolecular complex)”类。根据京都基因和基因组百科全书(Kyoto Encyclopedia ofGenes and Genomes,KEGG)的注释分析,有345 unigene被归于103种代谢通路中。在这些unigenes中,105(30.5%)个属于“代谢(metabolism)’’类。在这一类中大多数基因被分到“氨基酸代谢(amino acid metabolism)”、“糖代谢(carbohydrate metabolism)”和“能量代谢(energymetabolism)”这三个亚类中。在其他的大类中,“蛋白质家族(protein families)”占21.7%,“遗传信息加工(genetic informationprocessing)”占18.5%,“细胞过程(cellularprocesses)占11.6”:根据Blastx和KEGG注释结果,有66个unigene与遗传信息处理有关。这些unigene被分成4大类:“折叠,排序,降解”、“复制与修复”、“转录”和“翻译”。根据Blastx注释结果,得到49种免疫相关基因。这些免疫相关基因被分成5大类:免疫识别、应激基因、蛋白酶和蛋白酶抑制因子、细胞信号转导因子和其他基因。这些免疫相关基因可以为我们提供贝类在抵抗疾病和受到环境压力时进行免疫反应的重要信息。综上,本研究可以为贝类的遗传学研究提供一些基础信息。