论文部分内容阅读
微小RNA(miRNA)是一种可以调控基因表达的单链RNA。研究表明miRNA的异常表达会引起多种复杂疾病发生。揭开miRNA和疾病之间的相互作用有利于了解疾病的致病机理,并对疾病的早期诊断和药物研发具有重要意义。构建可靠的miRNA与疾病关联预测模型可以为传统生物实验提供高概率的潜在疾病-miRNA关联用于验证,从而减少生物实验次数并降低时间开销和资金花费。本文基于miRNA和疾病相关数据,结合贝叶斯矩阵分解算法和图正则化转导回归算法构建了两个疾病-miRNA关联预测模型。相比传统的机器学习方法,贝叶斯矩阵分解有着更高的预测精度,并且降低了计算复杂度。基于异构网络的图正则化转导回归方法可以高效提取稀疏网络上的信息,从而提高模型的预测精度。本文提出的第一个模型是基于贝叶斯矩阵分解算法的关联预测模型(KBMFMDA)。首先利用miRNA相似性和疾病相似性将miRNA和疾病投影到统一的子空间,然后在子空间中,应用共轭贝叶斯概率公式来推理该投影子空间的目标输出。最后将子空间的两个目标输出的乘积作为miRNA和疾病关联预测得分。KBMFMDA在全局、局部两种留一交叉验证和五折交叉验证中的AUC分别是0.9132、0.8708和0.9008+/-0.0044,优于许多先前的模型。对结肠肿瘤、淋巴瘤和食管肿瘤三种疾病进行的三种案例研究显示,KBMFMDA预测的前50名疾病相关的miRNA中,分别有44、47和48个被数据库验证。实验结果表明KBMFMDA模型具有可靠且高精度的预测性能。本文提出的第二个模型是基于异构网络的图正则化转导回归算法预测miRNA与疾病关联(GRTRMDA)。首先构建关于miRNA、lncRNA和疾病的三层异构网络,然后初步预估计没有已知相关疾病的miRNA和lncRNA与疾病的关联得分,最后利用转导回归方法求解异构网络中miRNA与疾病的关联分数。GRTRMDA在全局、局部两种留一交叉验证和五折交叉验证中的AUC分别是0.9057、0.8372和0.9033+/-0.0008,优于许多先前的模型。对淋巴瘤、乳腺肿瘤和食管肿瘤三种疾病进行的三种案例研究显示,GRTRMDA预测的前50名疾病相关miRNA中,分别有44、44和50个被数据库验证。实验结果表明了GRTRMDA模型能够准确预测miRNA与疾病的潜在关联。