论文部分内容阅读
序列比对是生物信息学中最重要和最基础的研究方向,是研究物种间同源性关系的重要手段。随着生物序列数据的飞速增长,如何提高序列比对速度和灵敏度成为生物序列比对研究需要迫切解决的问题。
本文将最优化方法应用到生物序列比对中,从而提高序列比对的效率。主要研究内容和取得的成果如下:
1.提出基于拉格朗日约束神经网络(LCNN)的自适应生物序列比对方法。把数字信号处理与生物序列分析融入到一起,通过建立风险函数并根据最优原则获得生物序列相关性指标,得到序列比对结果。
2.研究空位种子(Spaced Seed)理论和灵敏度计算模型,并在此基础上提出了基于最优搜索的空位种子寻找和计算方法,实现在有限时间资源限制条件下以最大概率寻找到具有最高灵敏度的空位种子,从而大大提高空位种子的计算效率。
3.构造与空位种子相关的重叠有向图(Overlap Digraph)模型,根据重叠有向图权值函数提出空位种子优劣判断准则。通过实验可以证明重叠有向图模型可以在很短的时间内得到灵敏度最优或者接近最优的空位种子。
4.在前人研究的基础上,进一步对插入-删除种子进行更为深入的研究,并从数学上对插入-删除种子(In-del Seed)进行定义,建立插入-删除种子灵敏度计算模型。提出了基于种子重叠复杂度的计算方法,并通过flip函数对候选种子进行构造。该方法能够在较短时间内找到给定权值和相似度等参数下的最优插入-删除种子,并从实验上证明插入-删除种子具有更高的灵敏度,同时给出在权值从9到15的最优插入-删除种子的计算结果。
本文研究的内容主要是针对生物序列比对,将最优化理论和方法应用到比对过程中,并在现有算法的基础上,提出新的序列比对算法和模型,为实现快速、高效的生物序列比对提供新的思路和方法。经过实验测试,算法在灵敏度上等同于最优或非常接近最优结果,但在计算时间和效率上大大提高,可以为生物信息学的相关研究提供一定的支持和帮助。