论文部分内容阅读
调控元件是指基因周围能够与特异性转录因子结合而影响转录水平的DNA功能序列。作为一种重要的转录调控元件,转录因子结合位点的识别已经成为当前的研究热点。准确的预测、识别算法有助于人们识别不同转录因子的目标基因,进而研究转录因子结合位点在上游调控区中的位置对转录调控的影响。
本文是基于位置权重矩阵打分函数算法预测碱基关联三联体转录因子结合位点的方法。由于已有的位置权重矩阵打分函数算法主要是针对单碱基位点保守性利用位置权重矩阵预测转录因子的结合位点。这种方法虽然可以迅速地识别出转录因子结合位点,但是由于位置权重矩阵模型假定:结合位点序列中的碱基具有独立的贡献与转录因子的结合力。然而,最近的实验研究证明这种假设是不完全的,结合位点的碱基之间存在着相互作用、共同贡献与转录因子的亲和力,考虑在非编码区中也应该与编码区中一样,以三个连续的碱基来编码一个蛋白质,因而研究三联体碱基更具有生物学意义。本文基于以前的研究,将位置权重矩阵打分函数算法应用到碱基关联三联体,利用位置权重矩阵预测转录因子结合位点。本文算法的实现采用的是C++语言,通过实验证明了其可行性和有效性,并且通过跟已有的三种预测转录因子结合位点的算法进行比较,均获得了较高的预测成功率,说明基于PWMSA预测碱基关联三联体转录因子结合位点的预测性能要优于单碱基的位点权重矩阵。