基于生物网络的致病miRNA预测及模块识别算法研究

来源 :湖南大学 | 被引量 : 3次 | 上传用户:bxybown
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然界中许多复杂系统,如生物分子系统、生态系统等,皆可抽象成为复杂网络。近年来,随着生物技术的快速发展和后基因组时代的到来,大量真实的生物数据不断涌现,从系统水平对生物网络展开研究是当前生物信息学领域研究的热点之一,对于揭示生命现象本质以及疾病发病机理等具有重要的促进作用。当前,有关癌症等复杂疾病的研究是生物医学中极具价值和挑战性的课题,而完全基于生物实验来探索疾病发生的本质无疑是一项耗时且成本巨大的工作。因此,如何有效地利用海量组学数据并挖掘有价值的信息来辅助生物学研究,对于进一步理解和认识生命活动的内在规律等具有重要意义。生物分子网络作为一种特殊的复杂网络,它是利用生物组学数据研究各种生物现象的有力工具,基于生物网络的研究有助于系统的认识分子间的相互作用规律,同时也能够清晰地反映特殊状态下(如疾病发生等)各分子的行为特性和协同作用模式。本文以生物网络为主要研究对象,以数据挖掘、机器学习等方法为技术手段,在充分利用当前海量数据资源的基础上,主要针对人类复杂疾病致病miRNA的预测算法以及癌症特异的调控功能模块识别算法进行了研究,具体研究工作概述如下:(1)针对当前许多基于生物网络识别疾病关联miRNA的模型忽视了对不同网络拓扑特征和结构差异性等考虑的问题,通过分析发现,在由miRNA相似性网络、疾病相似性网络和miRNA-疾病已知关联信息构成的异构网络中,绝大部分已知miRNA-疾病关联被环状二分子图(CBG,circular bipartite graph)覆盖,因而基于大部分潜在miRNA-疾病关联也可能被CBG子图所覆盖的假设,提出了一种新的基于二分子图和非平衡随机游走的疾病miRNA预测算法BRWH。该算法首先利用疾病之间的语义关系以及已知miRNA-疾病关联信息等数据,分别对疾病之间的相似性和miRNA之间的相似性进行了评估,从而完成异构网络的构建;随后,根据不同相似性网络拓扑结构存在的差异,采用非平衡随机游走的机制来实现潜在miRNA-疾病关联的预测。实验结果表明,与现有经典算法相比,BRWH算法取得了更优的性能。(2)针对当前疾病相关miRNA的预测算法普遍对已知的miRNA-疾病关联信息过度依赖的问题,提出了一种基于多信息融合的miRNA-疾病关联预测算法KRLSM。由于现有的实验验证的miRNA-疾病关联信息十分有限,为了降低已知关联先验信息对模型性能的影响,该算法首先通过整合多种可靠的生物数据,并采用不同的相似性计算方法对疾病或miRNA相似性进行综合的评估,同时基于线性组合方式将对应的不同相似性矩阵进行整合,从而减小矩阵的稀疏性;随后,利用克罗内克积(Kronecker Product)矩阵性质将独立的miRNA空间和疾病空间合并为miRNA-疾病空间,并基于此空间应用正则化最小二乘法识别疾病miRNA候选。实验结果表明,KRLSM算法在已知miRNA-疾病关联较为稀疏的实验场景中同样能够取得较好的预测效果。(3)上述BRWH和KRLSM算法虽然在特定实验场景中预测效果较好,但是无法应用于新疾病和新miRNA的场景,或在该种场景中预测效果欠佳。针对不存在任何已知关联信息的新疾病或新miRNA的相关预测问题,提出了一种基于图正则化非负矩阵分解的疾病关联miRNA预测算法GRNMF。该算法首先通过借助新疾病或新miRNA在对应相似性网络中的邻居信息以及这些邻居对应的相互作用谱,采用加权K近邻谱的方式对原始miRNA-疾病关联矩阵进行更新;同时,为了保持原始样本空间的近邻几何特性,基于更新后的矩阵以及相似性网络,采用图正则化非负矩阵分解的方法来识别潜在的疾病关联的miRNA。与其他算法相比,GRNMF算法不仅在关联信息稀少的场景中预测效果更优,同时也能针对新miRNA或新疾病进行潜在miRNA-疾病关联的预测。(4)针对当前许多lnc RNA、miRNA等非编码RNA分子的生物学功能以及它们对应的调控模式仍然知之甚少的问题,提出了一种基于多维癌症组学数据识别调控功能模块的算法Ce Module。该算法有效地整合了lnc RNA/miRNA/m RNA表达谱,同时通过充分利用lnc RNA、miRNA和m RNA之间的互作数据,基于联合正交非负矩阵分解的框架将模块识别问题转换为一个目标优化问题,并采用L1正则化范数和基于网络的正则化约束条件来提高模块识别的准确性,最后利用交替迭代乘性更新算法对目标函数求解。实验结果表明,Ce Module算法所识别的调控模块不仅包含了许多与癌症相关的lnc RNA/miRNA/m RNA,同时这些模块也显著性富集于许多经典的生物过程或通路,通过生存分析也进一步发现了多个模块具有潜在临床诊断价值。
其他文献
8月5日,在岸和离岸人民币兑美元汇率双双出现大幅波动,并跌破7元关口,创阶段新低。$$“破7”突如其来,但也在意料之中。分析人士指出,稳定不等于固定,适时打破人民币汇率不会“破7
报纸
推动农垦高质量发展,产业发展是强大引擎,制度建设与规范管理是根本保障。江苏农垦连云港运通房地产开发有限公司高度重视管理创新,着力增强制度执行力与内控管理创新,党建引
导致地面控制井下安全阀(SC-SSSV)失效的最常见原因是,从地面到井下安全阀的液压控制管线出现故障,这些故障不仅造成油气井产量损失,而且还需要进行费用昂贵的修井作业。为了
本文研究的目的在于探索任务依托式教学应用于英语专业高级英语课程的可行性,通过实验验证任务依托式教学是否对学生综合运用英语的水平有根本性的提高。研究结果表明,任务依
发菜又叫头发菜、地耳筋等,因贴地生长,形似乱发,又有地毛之名。我国西北干旱半干旱地区,特别是宁夏、甘肃、青海、内蒙古、新疆等省区甚多。内蒙古西部一些地方因盛产发菜而
期刊
白莲河抽水蓄能电站工程建设周期较长、投资大、设备种类繁多,是国家"十一五"时期重点工程项目。湖北白莲河抽水蓄能有限公司在建设中通过加强基建财务管理,注重基建资金管理
<正>在经历了连续3年国家政策对市场的引导调控之后,2011年中国食用油市场的走势表现出较为温和的态势,并处于可控范围之内,农户种植利益得到保障,但随着国家加强政策调控,市
以某古城墙修缮工程坍塌事故为例,分析事故发生的原因,指出城墙内部填土施工质量控制不严是导致城墙坍塌的直接原因;地基承载力不足、同一段城墙的内外侧分期施工、建设过程
笔者结合实际工作经验,对变电站除湿装置进行研究。简要的论述了变电站潮湿问题所带来的危害,并在简要介绍变电站除湿装置的主要组成及运作方式的基础上,阐述了变电站除湿装
研究了不同种类填料对充油苯乙烯-乙烯/丁烯-苯乙烯(O-SEBS)聚/丙烯(PP)共混材料摩擦学和力学性能的影响以及滑石粉(Talc)粒径和用量对O-SEBS/PP/Talc体系各项性能的影响。结