论文部分内容阅读
miRNA是近几年生物信息学领域的研究热点。它在人类疾病的产生、发展等过程中都起到非常关键的作用。虽然可以通过生物实验的方法挖掘出某些致病miRNA,但是这里面往往会存在两方面的问题,首先实验方法的代价高、周期长;其次对于挖掘出的致病miRNA,如何确定哪些是最关键的致病miRNA。本文从生物信息需学的角度提出了一种寻找关键致病miRNA的方法,从而能够利用预测分析的方法为miRNA研究者的生物实验提供一定的指导,进而为基因疾病的诊断、药物的开发提供一定的依据。本文的研究工作包括三个部分。首先,我们从相关的生物信息数据库及参考文献中收集了miRNA和靶基因的关系对,miRNA和疾病的关系对,以及关键miRNA和疾病的关系对,整理成了三个数据集:miR2Target、miR2Disease和keyMiR2Disease。数据集miR2Target用来构建整个miRNA生物网络,虽然它并不能完全反映人体内所有miRNA构成的生物网络,但是该网络却一定是这个大的生物网络的一个真实子集,能真实反映它包含的miRNA之间的关系,是我们进行后续研究的基础。数据集miR2Disease被用来在miRNA生物网络中提取出某种疾病的致病miRNA生物网络,这一过程的实现建立在miRNA的基本功能不变性上。数据集keyMiR2Disease被用来评价和控制疾病miRNA生物网络的演化。其次,我们在数据集miR2Target上,利用二部图的方法,构建了一个miRNA生物网络,即如果两个miRNA的靶基因集合有相同的部分或它们的靶基因在蛋白质互作网络上显著互作或它们的靶基因在GO功能类上显著互作,则我们都在这个miRNA之间建立一条连接边,并依据具体情况给这条边赋予权值。最后,我们在上述构建的miRNA生物网络上利用数据集miR2Disease的信息提取出某种疾病的致病miRNA生物网络,由于这种网络中包含的致病miRNA的数量也是比较大的,不能锁定那些关键的miRNA,所以接下来,我们利用数据集keyMiR2Disease中的信息,并通过网络聚类演化的方法在致病miRNA生物网络中找到了一个包含大部分关键致病miRNA的最小集合。按照上述过程,本文构建了一个含有233个结点,7066条边的miRNA生物网络,它是一个有权无向图。在这个生物网络中有11个miRNA的度为零,hsa-mir-21和hsa-let-7a间的连接权值最大为60。以疾病Autoimmune Diseases为例,本文在miRNA生物网络中提取出一个含有38个结点的致病miRNA网络,然后依据keyMiR2Disease中的信息,按照不同的边的权值下限对致病miRNA网络进行演化,最后得到一个含有13个结点,8个关键miRNA的小网络,在演化的过程中有5个记录的关键miRNA丢失。在对miR2Disease中的疾病进行相同的分析后,我们发现关键致病miRNA在致病miRNA生物网络中一般处在较低的层次上,而且关键致病miRNA在致病miRNA生物网络中一般具有较大的簇系数和平均度值。