论文部分内容阅读
在生物领域,对DNA与蛋白质相互作用的研究是对基因表达与调控进行了解的重要手段。随着ChIP-seq技术在这些领域的应用日益广泛,如何对大量Chip-seq数据进行处理分析并获取生物医学信息成为非常有意义的研究课题。目前,绝大多数ChIP-seq数据分析方法都忽略了其作为全基因组上一维信号的特性而只关注其局部统计性质,缺少一个基于信号处理方法的ChIP-seq数据分析研究的理论方法。
本文将ChIP-seq数据转换成一维信号,提出一个系统的信号处理框架并设计出相关信号处理算法,包括ChIP-seq数据的读取和直方图化算法,针对ChIP-seq数据一维信号的NL-means去噪算法,富集区域的查找算法和基因组序列的比对算法。通过对ChIP-seq数据的一系列处理分析,获取具有一定长度的富集区域,将其与参考基因组序列进行比对,得到重叠与非重叠区域。这一系统理论框架的提出,是对现有ChIP-seq数据处理分析方法的有效补充和信号处理领域新的应用。实验结果表明,框架中的信号处理算法可以对ChIP-seq数据进行有效的处理分析,获取染色体上DNA片段与癌症等疾病的关联特征,丰富疾病的诊断和治疗方式,具有重要的临床意义。