论文部分内容阅读
本文介绍了基因预测及启动子区域预测的研究现状,总结了常用的特征和方法;同时结合翻译始点等新特征,设计了一个新颖的预测算法来预测启动子区域。
本文的主要工作和特色如下:将全长cDNA序列与基因组序列作比对,获得启动子区域和辅助功能点的数据集用于训练。使用在基因预测上具有良好效果的判别分析方法,训练时获得各特殊功能点的判别函数,在预测时综合使用各判别函数进行预测。根据启动子区域是否与CpG岛相关,选用不同特征分别进行训练,这将提高与CpG岛相关的启动子区域的预测效率。对于第一外显子中包含翻译始点的情况,算法使用了翻译始点附近的寡聚物频率、翻译始点与转录始点的距离等特征。