论文部分内容阅读
运用隐马尔可夫模型,利用Perl编程,以几种模式生物的蛋白质数据库为基础,构建了目标基因的全基因组预测的新方法。该方法具有高通量,准确度高且操作简易等优点,特别在多结构域蛋白家族预测上更显优势。应用该方法对几种模式生物的全基因组PPR和TPR蛋白家族进行了预测,其中粳稻日本晴中含有536个PPR蛋白、199个TPR蛋白;籼稻9311中含有519个PPR蛋白、177个TPR蛋白;拟南芥中含有735个PPR蛋白、292个TPR蛋白;红藻中6个PPR蛋白、32个TPR蛋白;蓝细菌以及古细菌中没有PPR蛋白,但蓝