论文部分内容阅读
染色质免疫共沉淀技术将模体识别问题拓展到了全基因组范围,但因数据量过大,传统的模体识别算法往往运算过慢从而无法很好地解决此问题。为了解决传统算法的缺点,提出一种用于ChIP.seq数据的替换显露子串寻找问题的算法FastESE,通过测试集和控制集的比对找出显露子串并搜索其(l,d)替换实例组成相应的位置概率矩阵,再使用权重信息量对这些子串进行聚类,最终找出集合中的替换显露子串。使用真实的ChIP.seq数据对该研究算法进行有效性验证,实验结果表明,FastESE可以在合理时间内有效解决ChIP.seq中的