基于异质网络和多数据融合的circRNA与复杂疾病关联关系预测研究

来源 :陕西师范大学 | 被引量 : 0次 | 上传用户:ssdkln
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
环状RNA(circular RNA,circRNA)是一类单链共价闭合并且不含有5’帽子及3’尾巴的非编码RNA。研究表明,探索circRNA在人类生理和病理过程中发挥的作用具有重要意义,确认疾病状态下失调的circRNA有助于了解复杂疾病的发生和发展机制。由于circRNA具有组织特异性、稳定性等特性,因而成为一类潜在的生物标志物。识别circ RNA与疾病的关联关系有助于探索circRNA在疾病发生过程中所发挥的作用,然而利用传统的生物学实验方法识别疾病相关的circRNA具有成本高、耗时长等缺点。本文首先建立了收录实验验证circRNA-疾病关联关系的专用数据库,然后通过整合多个与circRNA和疾病相关的数据资源,利用基于复杂网络和深度学习算法提出了四种挖掘疾病相关circRNA的计算方法,从而为医学、生物学等研究人员对失调circRNA进行生物学实验验证提供指导,进而为药物的开发及临床诊断奠定一定的基础。本文所做工作如下:(1)根据已经被实验验证的circRNA与疾病之间的相互作用及相关信息建立了 CircR2Disease数据库,并对数据库内收录的circRNA与疾病的关联关系进行简要分析。由于目前通过实验验证的疾病相关的circRNA分散在已发表文献中,尚缺乏专门收录circRNA-疾病关联信息的平台和资源。因此,我们通过阅读与疾病相关的circRNA研究文献,从中抽取circRNA与疾病之间的关联关系,并建立了首个收录circRNA-疾病关联相关信息的在线数据库CircR2Disease,该数据库用于收集、存储和管理被实验证实的疾病相关circRNA信息,而且有助于科研人员对数据的获取与应用。(2)提出了一种基于KATZ模型的circRNA-疾病关系预测方法(KATZHCDA)。KATZHCDA方法充分利用circRNA表达谱、疾病表型相似性、circRNA高斯核相互作用相似性、疾病高斯核相互作用相似性以及已知的circRNA-疾病关联信息构建了 circRNA-疾病异质网络。然后,计算该异质网络中circRNA与疾病结点之间不同长度的路径,从而预测circRNA与疾病之间的相关性。为了探索circRNA和疾病相关的四种相似性衡量方式对预测结果产生的影响,我们分别利用留一法(leave-one-out cross validation,LOOCV)和五折交叉验证(5-fold cross validation,5-fold CV)评价KATZHCDA模型的预测性能。结果显示,KATZHCDA模型的开发为临床验证复杂疾病相关的circRNA奠定了基础。(3)基于circRNA-疾病网络的拓扑和结构特征,提出了一种基于双向随机游走和circRNA调控相似性的circRNA-疾病关联关系预测方法(BWHCDA)。考虑到circRNA可以竞争性结合微RNAs(microRNAs,miRNA)并调控基因表达,我们利用circRNA-miRNA之间的相互作用信息来衡量circRNA之间的调控相似性,随后结合疾病语义相似性、高斯核相互作用相似性和circRNA-疾病的已知关联信息构建circRNA-疾病异质网络。然后,同时在circRNA相似性网络和疾病相似性网络上运行随机游走算法,分析该异质网络被循环二分图覆盖的情况,并根据候选关系对得分挖掘潜在的circRNA-疾病关联关系。实验结果表明,BWHCDA模型是一种预测疾病相关circRNA的有效工具。(4)鉴于已知的circRNA-疾病相关性数据中含有噪声,提出了一种基于低秩矩阵和标签传播的circRNA-疾病关联关系预测方法(LLPHCDA)。首先利用一种低秩矩阵恢复方法去除关联矩阵中存在的噪声,并得到一个新的低秩邻接矩阵。通过整合circRNA之间的序列相似性和circRNA高斯核相互作用相似性构建了circRNA相似性网络,通过整合疾病语义相似性及疾病高斯核相似性构建了疾病相似性网络,然后将重构的低秩circRNA-疾病矩阵作为标签,分别在circRNA相似性网络和疾病相似性网络中运行标签传播算法,从而预测潜在的circRNA-疾病关联关系。结果表明LLPHCDA模型可以有效的挖掘疾病相关circRNA。(5)基于卷积神经网络(convolutional neural network,CNN)框架可以有效地学习稀疏性特征的优点,提出了一种基于多相似性特征融合和双层卷积神经网络挖掘疾病相关的circRNA的方法(MSFCNN)。首先,基于circRNA、miRNA、疾病相关的生物学和拓扑学特征计算获得四种circRNA相似性矩阵和七种疾病相似性矩阵。然后,利用相似性核融合(similarity kernel fusion,SKF)方法将多种相似性分别融合为一个circRNA相似性矩阵和一个疾病相似性矩阵。基于与circRNA、疾病、miRNA之间的相关的三种生物学假设构建了特征矩阵,并利用卷积神经网络从特征矩阵中学习circRNA与疾病之间的原始全局表示。通过多种评价标准以及案例分析表明MSFCNN模型的预测性能优于支持向量机(support vector machine,SVM)、随机森林(random forest,RF)及多层感知机(multilayer perception,MLP)等传统的机器学习方法。因此,本文构建的CircR2Disease数据库对进一步挖掘疾病相关的circRNA奠定了基础。另外,我们基于该数据库中收录的circRNA-疾病关联关系,整合多种circRNA、miRNA和疾病的相关信息开发了四个计算模型对疾病相关的circRNA进行了预测,从而为医学、生物学等研究人员验证疾病相关的circRNA奠定基础。
其他文献
随着空间探测技术的发展,火星探测成为类地行星研究的热点和焦点,极大地推动了多种学科的发展。风沙地貌过程是现代火星最普遍最活跃的地貌过程,蕴含火星地表过程、环境和演化历史的丰富信息。本文着眼于火星沙丘地貌,力图通过系统分析不同环境条件下沙丘地貌的类型、分布、格局和物质组成等特征,揭示沙丘地貌的成因及其对环境的反映。利用覆盖火星全球的高分辨率遥感影像,在地理信息系统软件的支持下,从全球尺度上分析沙丘地
白铁矿FeS2是一种无磁性的半导体。由于以前的研究结果给出了较小的带隙值,使得它一直被认为是恶化黄铁矿光伏性能的不利杂质。近年来,大量的理论和实验表明白铁矿带隙并不低于黄铁矿,稳定性与黄铁矿相似,并且它本身具备非常优异的性能,例如高的吸收系数,优异的热电性能,良好的锂离子和钠离子储存性能,较大的扩散系数,突出的电化学水氧化性能等等。因此,白铁矿的应用范围逐渐被拓宽。本文采用基于密度泛函理论的第一性
当电磁波入射到金属结构上时,金属结构当中的自由电子与入射的电磁波产生相互耦合,并在金属结构表面形成共振的近场电磁波,这种现象在光学中称为表面等离激元(Surface Plasmon,SP)。SP具有耦合作用强和高度局域化的光学特性,与SP密切相关的电磁共振强烈地依赖于具体的微纳结构。因此,SP提供了在亚波长尺度上控制光的可能性。通常,可以通过改变微纳结构的几何尺寸、形状和材质来控制SP的共振特性,
气泡在许多领域有着重要的应用,如声空化现象、海洋工程中螺旋桨的侵蚀、化学工程中声化学反应速度的有效调控、医学超声包膜气泡等。自声空化现象被发现之后就引起了研究人员的广泛关注,并迅速成为流体力学、超声学、物理学、声化学等学科的热门课题。在实际工程应用中,空化气泡通常是以泡群或者空化云形式存在的,是一个多泡体系的问题,在气泡之间存在着极其复杂的耦合作用,这种耦合作用及历史中不清晰,探索气泡之间的耦合作
经典的计算机网络利用线路相互连接,网络拓扑结构固定。为了应对一些特殊的情况,作为无线自组织网络其中之一的移动机会网络应用而生。区别于传统计算机网络,移动机会网络的通讯方式是依靠网络中每一个终端节点的随机移动完成。源节点携带消息在一定区域内运动,当与任意邻居节点相遇的时刻,创造了短暂的通讯时机,移动机会网络路由的研究核心就是作为节点的终端相互之间的通讯机制。常规移动机会网络通讯机制研究的重心在一般体
由于具有独特的表面等离激元特性,金属微纳结构能够产生光异常透射、光增强吸收及光学手性等新颖的光学现象。光异常透射现象可以应用在滤波器、偏振器件和近场光学等领域,研究者探究了圆形及三角形纳米孔结构、纳米狭缝结构等的光学透射特性,但这些结构的透射光谱都表现出较窄的透射峰,限制了其在宽频滤波器中的应用;光的增强吸收对光伏电池、超级透镜和热成像等应用具有重要的研究价值,纳米棒阵列结构、金属/介质叠层结构及
随着物联网、云计算、大数据等新型网络形态和服务环境的兴起,越来越多的密码系统被应用于诸如移动设备等安全性较差的场合,攻击者能通过各种边信道攻击(如时间攻击、电源耗损、冷启动攻击及频谱分析等)获得系统秘密信息的内部状态,我们把这种攻击称为密钥泄露攻击。在密钥泄露攻击下,密码系统的密钥泄露事件频频发生。因此,设计抵抗密钥泄露攻击的可证明安全公钥密码方案,是当前密码学研究领域的一个重要研究方向。身份基密
模糊集在多属性决策问题中起着非常重要的角色。直觉模糊集是模糊集的扩展,它引入了非隶属度,满足隶属度和非隶属度之和不大于1。作为直觉模糊集的一种推广,图片模糊集由元素的三个隶属度组成,分别称为肯定隶属度,中立隶属度和否定隶属度,以使它们的总和不大于1。在已有关于图片模糊集的文献中,研究者成功开发了几种算法来解决聚类、模糊推理和决策等不同的问题。然而,模糊集理论、直觉模糊集理论和图片模糊集理论只能解决
强激光场作用下的原子与分子电离研究是当前强场物理的研究热点之一,强场电离也是强场现象的基础。随着激光技术发展,人们已经可以实施更复杂的操控,比如分子的准直和取向。计算能力的进步,也允许人们进行更高维度的模拟。由于分子自身包含更丰富的结构特性,在强激光场驱动下出现了一系列不同于原子的现象,这些现象得到了研究人员的广泛关注。已有研究表明与对称分子相比,强激光场驱动下的不对称分子电离过程又呈现出了许多新
背景:应激性精神障碍的研究及治疗一直是神经科学的热点问题。在人类或啮齿类动物中,不可避免的会遭受长期的、重复的、强烈的社会击败应激,严重影响个体身心健康。在社会交往中,长期处于从属地位会导致个体出现持续性的社交回避、社会互作缺陷等社会行为异常,且该问题因药物治疗成本、副作用和复发率较高等原因仍未被很好的解决。近些年,模拟人类社会欺凌的长期社会击败应激模型(Chronic social defeat