论文部分内容阅读
miRNA作为真核生物中一种重要的调控子,其调控作用对于生物过程至关重要,严重影响着基因的表达。其与多种癌症密切相关,研究miRNA对于癌症的临床治疗和药物设计都有重要作用。同时,miRNA与miRNA之间存在着协同合作关系,它们通过共同作用于基因,影响着基因的表达。miRNA与其协同合作miRNA,及其调控的目标基因,共同形成调控网络中的gene-miRNA功能模块。功能模块在生物细胞功能的产生发展过程中发挥着载体的作用,因而如何识别调控网络中的gene-miRNA功能模块对于探讨疾病生命机制以及产生原因有着举足轻重的生物意义。对此,本文提出了两种不同的miRNA调控网络上的gene-miRNA功能模块识别算法,主要研究工作有:目前已存在的gene-miRNA功能模块识别算法很多无法识别重叠的功能模块,同时研究表明融合多网络能有效提高算法的识别精度,由此提出一种新的基于改进的马尔可夫聚类的gene-miRNA功能模块识别算法MCLM。算法首先利用多网络融合进行miRNA-miRNA加权,构建miRNA功能相似性网络;然后对于已得到的miRNA功能相似性网络,运用改进的马尔可夫聚类算法,获取miRNA簇;最后,对于每个miRNA簇,针对每个miRNA,利用随机森林分类算法对其目标基因进行排名,选取排名靠前的基因加入相应的miRNA簇当中,最终识别调控网络上的gene-miRNA功能模块。实验表明,算法MCLM所识别的gene-miRNA功能模块参与大量的生物过程,具有很重要的生物意义。上述算法虽能有效识别重叠的功能模块,但只是笼统的挖掘出与某种疾病有关的gene-miRNA功能模块。为了进一步识别出特定疾病子类型相关的功能模块,提出了一种基于双聚类和贝叶斯网络的gene-miRNA功能模块识别算法BBM。算法首先利用双聚类算法(SAMBA)构建gene-sample模块;然后针对每个gene-sample模块,利用模块内基因的平均PCC值和PPI数据进行模块扩充,并通过计算模块的显著性p-value值过滤掉不符合要求的模块;最后针对每个GSM,通过计算各个miRNA与模块内基因的相关性,对miRNA进行排名,选择排名靠前的miRNA加入模块,最终识别调控网络上的gene-miRNA功能模块。实验表明,BBM算法能有效识别具有重要生物意义的特定疾病子类型的gene-miRNA功能模块,对于理解调控网络进而揭开人类复杂疾病发生机理具有显著的作用。