论文部分内容阅读
诸多全基因组测序项目结果表明,哺乳动物的基因组中存在非编码RNA的转录。进一步的研究表明,这些非编码RNA在很多生命活动过程中起着重要的作用。近年来关于非编码RNA的研究主要集中在小非编码RNA上,对于长非编码RNA的研究相对很少。随着测序技术的进步,研究者通过实验得到了海量关于长非编码RNA的数据,如何从这些数据中去挖掘出长非编码RNA的功能信息成为一个重大的挑战。现有的关于长非编码RNA的数据大多是表达谱数据,研究者往往通过对表达谱数据进行预处理后进行聚类分析来进行功能信息挖掘。2011年Liao等人利用大量的表达谱数据建立了编码-非编码共表达网络,2012年Guo等将蛋白质相互作用网络数据与Liao等建立的共表达网络数据进行了融合,建立了节点类型包括编码基因与非编码基因的“双色网络”,为预测长非编码RNA功能提供了新的数据和思路。本文提出了一种新的利用双色网络进行长非编码RNA功能预测的方法。该方法通过在双色网络上建立马尔科夫随机场模型,利用吉布斯抽样对网络中的非编码节点进行功能预测。通过在随机网络与该网络上的实验结果比较,说明了该网络的拓扑结构的确提供了关于功能的有效信息,并通过编码节点上的交叉验证分析了该方法的性能。最后对非编码节点的预测结果进行了个例分析,个例分析结果表明,本文提出的方法可以有效的覆盖一些lnc-GFP方法无法预测的功能,可作为一种新的方法利用双色网络对长非编码RNA进行功能预测。