基于贝叶斯矩阵分解和异构网络算法的microRNA与疾病关联预测研究

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:xujuenrong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微小RNA(miRNA)是一种可以调控基因表达的单链RNA。研究表明miRNA的异常表达会引起多种复杂疾病发生。揭开miRNA和疾病之间的相互作用有利于了解疾病的致病机理,并对疾病的早期诊断和药物研发具有重要意义。构建可靠的miRNA与疾病关联预测模型可以为传统生物实验提供高概率的潜在疾病-miRNA关联用于验证,从而减少生物实验次数并降低时间开销和资金花费。本文基于miRNA和疾病相关数据,结合贝叶斯矩阵分解算法和图正则化转导回归算法构建了两个疾病-miRNA关联预测模型。相比传统的机器学习方法,贝叶斯矩阵分解有着更高的预测精度,并且降低了计算复杂度。基于异构网络的图正则化转导回归方法可以高效提取稀疏网络上的信息,从而提高模型的预测精度。本文提出的第一个模型是基于贝叶斯矩阵分解算法的关联预测模型(KBMFMDA)。首先利用miRNA相似性和疾病相似性将miRNA和疾病投影到统一的子空间,然后在子空间中,应用共轭贝叶斯概率公式来推理该投影子空间的目标输出。最后将子空间的两个目标输出的乘积作为miRNA和疾病关联预测得分。KBMFMDA在全局、局部两种留一交叉验证和五折交叉验证中的AUC分别是0.9132、0.8708和0.9008+/-0.0044,优于许多先前的模型。对结肠肿瘤、淋巴瘤和食管肿瘤三种疾病进行的三种案例研究显示,KBMFMDA预测的前50名疾病相关的miRNA中,分别有44、47和48个被数据库验证。实验结果表明KBMFMDA模型具有可靠且高精度的预测性能。本文提出的第二个模型是基于异构网络的图正则化转导回归算法预测miRNA与疾病关联(GRTRMDA)。首先构建关于miRNA、lncRNA和疾病的三层异构网络,然后初步预估计没有已知相关疾病的miRNA和lncRNA与疾病的关联得分,最后利用转导回归方法求解异构网络中miRNA与疾病的关联分数。GRTRMDA在全局、局部两种留一交叉验证和五折交叉验证中的AUC分别是0.9057、0.8372和0.9033+/-0.0008,优于许多先前的模型。对淋巴瘤、乳腺肿瘤和食管肿瘤三种疾病进行的三种案例研究显示,GRTRMDA预测的前50名疾病相关miRNA中,分别有44、44和50个被数据库验证。实验结果表明了GRTRMDA模型能够准确预测miRNA与疾病的潜在关联。
其他文献
根据摩尔定律的描述,随着集成电路技术的不断发展,晶体管的尺寸在不停的减小,集成度变高,性能提升。但在器件的尺寸等比例缩小的同时,各种不良效应也越发明显。如今的微电机
为探究亚洲热带植物地理分布格局与形成机制,现以亚洲热带特有属风筝果属为例。首先按照风筝果属物种分布范围和特有性将风筝果属物种分为三类:广布种、区域特有种和狭域特有
乒乓球是一项速度快、旋转强、落点要求高的运动,“力量、速度、旋转、落点和弧线”五大要素构成了乒乓球运动的基础。乒乓球在我国乒乓球运动之所以能够长盛不衰,是与我国对
近年来,面临经济发展和供给侧结构性改革的要求,并购重组成为我国企业整合资本技术资源、快速增强企业竞争力的重要方式。自2015年以来并购重组出现了爆发式增长,随着并购数
在供给侧结构性改革背景下,交叉持股作为企业治理手段其重要性日益凸显,目前学者已针对其动机和效应展开了丰富的研究。但是还缺乏从网络的视角来讨论交叉持股对股价崩盘风险
近年来,增强现实、机器人导航和同时定位与地图构建等技术引起了学术界和工业界的广泛关注,其中基于影像的定姿定位技术是一项关键任务。相机姿态估计是根据从3D场景中获取的
20世纪90年代以来,随着商会史研究的深入发展,同业公会研究逐渐受到学界重视,并呈现出研究的繁荣景象。作为其中重要的同业公会组织,银行公会研究所取得的丰硕成果令人侧目。
随着软件规模的不断扩大,软件故障诊断的难度也随之提升。软件日志记录软件运行时信息,在软件故障诊断中占据重要地位。但开源软件的日志质量参差不齐。一方面,日志开发缺少
具有通信网络的非线性控制系统应用于生活中的很多领域。除了一般工程系统外,更是对经济系统和军事系统起着举足轻重的作用。在非线性控制系统建模时,Takagi–Sugeno(T-S)模
行人重识别是许多行人安全和社区监控等应用中的一个重要视觉任务,旨在从多个非重叠摄像头中查询或匹配同一身份的行人。但是,由于摄像角度、身体姿势、光线强度等因素干扰,