论文部分内容阅读
MicroRNA(miRNA)是一类非编码小RNA分子,通过调控其目标基因(mRNA)在许多生物进程中扮演重要角色,其功能失调会导致各种人类复杂疾病甚至是癌症的发生,因此对人类疾病的发生及发展过程中有着重要影响。研究miRNA功能调控模块是了解miRNA调控机制的重点途径之一,因此如何识别miRNA功能调控模块成为人们揭开人类复杂疾病发生机理的关键。目前有关miRNA调控网络构建大多是基于miRNA和mRNA表达数据的统计相关性,而基于此类方法识别出的miRNA调控关系仅仅只代表其样本统计意义上的强相关性,并不能正确地体现实际的直接调控关系,有研究表明miRNA和目标基因mRNA之间存在因果调控关系;另外网络流(the Network Flood)相对于拓扑特性更能解释发生在权重和节点间的调控关系。为了更好地体现miRNA和目标基因mRNA间的调控,本文结合miRNA和mRNA之间的因果关系以及网络流理论分别提出两种不同的miRNA功能调控模块识别算法,主要研究工作有:(1)提出了一种基于因果关系的miRNA功能模块识别算法CALM(the CAusaL-Modules)。CALM算法首先整合基因表达数据以及位点绑定信息,利用IDA策略识别miRNA-mRNA因果调控关系后通过不同miRNA的目标基因之间的GO功能相似性获取到的miRNA之间协同作用关系构建miRN A-miRNA协同调控网络,在该网络中采用聚类技术识别miRNA簇,通过邻居节点扩展策略添加或删除目标基因,得到miRNA因果调控模块。通过实验表明,CALM算法降低了基于统计相关性预测miRN A与mRNA关系的假阳性,识别出的miRN A功能模块显著富集于更多的生物过程。(2)为了进一步提高在稠密网络中miRNA调控模块识别算法的效率以及更好地体现miRNA与目标基因间的调控信息,本文提出一种基于网络流的miRNA功能调控模块识别算法FLDM(the FLooD-Module)。首先利用一种新的量化miRNA和目标基因之间调控的方法来对miRNA因果调控网络进行加权处理;然后利用网络流理论将miRNA因果调控网络转化为miRNA流网络(the Flood Network),再通过对子网进行最小化划分得到一系列候选miRNA调控子网;最后通过整合或者删除子网得到miRNA调控模块。实验表明,该算法在稠密网络中比CALM算法表现更好,且识别出的miRNA功能模块生物意义显著。