论文部分内容阅读
转录因子结合位点是转录因子结合到DNA的特定核苷酸序列,在细胞中转录因子常常扮演信使的作用。细胞接收到外界刺激后,激活某些转录因子,激活后的转录因子与DNA上的转录因子结合位点相结合,将RNA聚合酶吸引到转录因子结合位点附近,启动转录过程的发生,可见转录因子结合位点的计算预测是研究基因转录调控的重要环节,准确的预测算法将有助与人们研究转录因子结合位点在基因上游的调控位置及其转录因子结合位点的分布。目前已知的转录因子结合位点预测的方法准确性不是很高,无法提供准确的预测结果。为此本文提出一种新的转录因子结合位点的预测方法,该方法是基于卡方检验和对应分析而进行的。
本文基于对应分析的方法,预测酵母RP基因上游序列潜在的转录因子结合位点,并对这些调控模体之间可能存在的组合调控关系进行了分析。第一,通过卡方检验和对应分析方法抽提出样本中潜在的转录因子结合位点。结果发现模体与实验得到的转录因子结合位点符合率均达到91%。第二,分别对每一组中的模体两两配对,并运用卡方检验和对应分析方法抽提出组合调控模体对。第三,通过分析转录因子结合位点与TSS位点的距离分布,我们发现大部分的转录因子结合位点分布在距TSS200bp-500bp的范围;在此基础上我们对转录因子结合位点分布进行分析,结果显示模体和模体对在序列中的位置的分布是一个近似的正态分布,模体对之间的距离在0bp-100bp约40%,这表明短距离的间隔可能更有利于两模体的相互作用。
以往对于转录因子结合位点及组合调控的预测是基于位点出现的次数,而本文是基于位点在整个样本序列里出现的基因条数,并且发现模体在序列中的位置的分布是一个近似的正态分布。