基于因果分析的微生物交互关系预测方法研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:wenpeson
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
肠道微生物是一个复杂、动态的生态系统,在人体健康中扮演着重要的角色。从微生物时间序列数据推断微生物之间的动态相互作用,对于理解人体肠道内微生物的合作和竞争机制是十分重要的。随着高通量测序技术的进步,海量微生物组时间序列数据得以公开,成为系统推断微生物之间因果关系的基础。本文从多元线性回归模型、状态-观测模型以及最大熵估计模型的基础上从发,研究了基于微生物组时间序列数据的因果关系推断方法。主要贡献如下:首先,提出一种结合了深度玻尔兹曼机和多元线性回归的模型来推断微生物之间的因果关系。深度玻尔兹曼机是一个由随机神经网络组成的概率模型,通过条件概率和边缘概率得到微生物之间的因果关系。通过将深度玻尔兹曼机与图正则化向量回归模型进行结合,得到的因果网络具有更好的可解释性,可以同时起到筛选子集和组聚类的作用。使用一组抗生素扰动下的肠道微生物组时间序列数据作为实验数据、以预测平均平方误差作为评价标准,验证了所提出方法的可行性。其次,提出了一种基于状态-观测概率模型的方法来推断微生物之间的相互作用。在状态-观测模型的参数估计中我们引入贝叶斯自适应Lasso算法,该算法是一个层次概率模型,加入自适应惩罚对参数进行约束解决了参数和不确定性的结合问题。这一改进可以更好地解决数据噪音问题,使得模型具有较好的可解释性和预测能力。本研究使用抗生素扰动下的肠道微生物时间序列数据和女性阴道微生物时间序列数据,以预测平均平方误差作为评价标准,验证了所提出模型比现有方法在预测精确度上有一定的提高。最后,提出一种最大熵估计模型来推断微生物之间的因果关系。已有模型都是有参估计模型,这需要根据观测样本建立相对应的方程模型,一般需要大量的参数估计。针对此问题,本研究提出一种无参估计方法--最大熵估计模型,进行微生物之间的因果关系预测。该方法建立在联合熵公式的基础上,通过线性优化得到最大值点,从而通过得到的条件转移熵推断微生物之间的因果关系。最后在抗生素扰动的肠道微生物时间序列样本数据上,验证了最大熵方法的预测性能。本研究提出的三种模型为基于时间序列数据推断微生物因果关系提供了新的方法。
其他文献
信息化时代的不断发展促使获取位置信息的服务在休闲娱乐、救助治疗、生活服务等方面逐渐成为必不可少的角色。全球定位系统(Global Positioning Systems,GPS)在室外定位中有着良好的表现,但由于室内环境复杂,卫星信号受到严重的衰减,导致室内定位无法使用GPS,因此室内定位成为了新的研究热点。伴随带有惯性器件的智能终端逐渐被普遍使用,基于惯性导航的行人航迹推算(Pedestrian
随着互联网技术快速发展、智能移动终端性能的不断提升和中国城市化进程的不断推进,室内位置信息逐渐成为各项工作中最重要的信息,促使了基于位置服务(Location Based Servic
犯罪是国家非常重视的社会问题,它直接影响着经济的发展、儿童的健康成长、社会治安以及人民群众的生活质量。因此对一个城市整体犯罪情况进行建模和评估是十分有必要的,包括
随着近些年人工智能技术的发展,在各种复杂的工业应用中,机器人从原先的协助人类进行一些简单工作,越来越多地开始转向自主完成某些复杂任务。为了赋予工业机器人更强自主性
马尔可夫跳变系统是由有限数量的子系统组成的复杂随机系统,可以有效地描述系统的突变,为系统模型的描述提供了理论依据,其模式切换由马尔可夫过程控制。滑模控制是一种有效
目前,海量移动设备的接入,高清视频、直播、物联网、VR/AR等应用的兴起,推动光通信的持续发展。100G DP-QPSK相干光通信系统得益于相干检测技术和DSP技术的繁荣,成为目前光通
信息网络中数据的爆发式增长给数据分析、网络信息挖掘等工作带来了巨大的挑战。为了有效解决这些问题,网络表示学习应运而生。网络表示学习通过分析网络中的信息,将高维网络
随着计算机图形学的发展,三维网格模型成为了许多几何应用的重要组成部分,尤其被应用于一些对网格质量要求较高的场景中如数值模拟和三维打印等。然而由于现有的三维网格获取
近年来,光学Tamm态(OTS),一种被局域在两种不同介质接触面的表面波。由于具有易被激发、对电磁波的强局域性等特性受到了研究者们的关注。不同于表面等离激元,光学Tamm态的激
结构损伤识别检测在国家推进现代化的过程中越来越成为一个重要的研究领域,结构损伤识别的方法也多种多样。其中,把采集结构受到激励后的动力响应作为损伤的基础是全局损伤识