论文部分内容阅读
基因预测是目前计算生物领域非常重要的一个研究课题。虽然目前许多基因预测工具达到了一定的准确率,但在这些工具的使用中,或是由于其方法本身的局限性,或是由于其使用的困难性,这些工具不适于生物和医学工作者。针对这种情况,本论文提出了两个算法,为开发一个易于综合各种工具并可保证较好准确率的基因预测平台提供有效的算法基础,用于预测人类DNA序列中的基因。
由于基因预测中基本的两类方法已不能满足发现更多更新的基因需要,人们提出了综合法和序列比较分析法。随着人类对某些物种基因组的认识越来越全面,序列比较分析法变得越来越重要。本文归纳总结了目前序列比较分析法中普遍采用的算法,详细阐述了两种运用序列比较分析方法的工具,并从其结构、使用和性能上做出了全面地比较。随后,本文对目前广泛采用的综合法进行了归纳与研究,分析和使用了基于该方法的三种工具,对它们的结构、使用和性能进行了纵向和横向的比较。通过对序列分析比较法和综合法的研究与分析,发现序列比较分析法可以加强综合法工具的性能,由此从两类工具中分别选定了一个在性能和使用的方便性方面都最有优势的工具用于下一步的研究工作。同时通过生物学上的研究,发现在序列分析比较法中,小家鼠和犬类的基因组对预测人类基因起着很关键的作用。基于上述研究,本文提出了综合应用两类工具的结果来预测基因的两种算法,以小家鼠和犬类的基因组的比较数据库作为数据源,对两种算法进行了测试。测试与比较结果表明,这两种算法在若干性能上比仅基于综合法的工具或者仅基于序列比较分析法的工具都要优越,而且两种算法对预测不同的基因信息有各自的优点。