论文部分内容阅读
随着人类基因组计划的实施和推进,蛋白质组学的研究也越来越受到科研人员的关注。现阶段液相质谱串联质谱法成为了蛋白质鉴定的核心技术。但是此项技术高度依赖于已有的蛋白质数据库,很难应用于新蛋白的发现与研究。因此,这种方法严重阻碍了未知基因组的非模式生物蛋白质组的研究与发展。针对上述情况,我们提出了一个新策略。该方法可以利用已有的基因组数据库来不断完善未知基因组生物的基因组信息,从而获得这些生物的蛋白质组数据库用于后续的蛋白质组分析和研究。 新策略运用了我们自主开发的、稳定、精确、容错率高的FANSe高速序列比对算法(Fast and Accurate mapping tool for Nucleotide Sequencing datasets)逐次修正已知近缘物种的基因组,以期获得研究物种的真实基因组。实验中,我们提取了一株没有完整参考基因组的短小芽孢杆菌(Bacillus pumilus)菌株的DNA进行了全基因组测序,并提取了该菌株的全蛋白进行了质谱鉴定。为了有效的评估修正后基因组对于蛋白质组研究的影响,我们采用了修正前后两种蛋白质数据库对实验菌株全蛋白的质谱鉴定结果进行了MASCOT搜库。结果显示:与原始库相比,修正库能够提高11.5%的蛋白鉴定率和14.2%的肽段鉴定率。 研究表明,基于新策略得到的蛋白质数据库能够明显的提高肽段和蛋白质的鉴定效率。更重要的是,新策略能够鉴定氨基酸序列的突变,从而发现肽段和蛋白质的变异。新策略对于非模式生物蛋白质组的研究将具有极大的促进作用以及深远的影响。