基于谱聚类的肠道菌群分析

来源 :任玉艳 | 被引量 : 0次 | 上传用户:yinlefeng1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
肠道菌群与诸多人类重大疾病相关,比如,肝硬化、糖尿病、肥胖症、自闭症等,研究在不同条件下肠道菌群结构差异具有重要意义。传统聚类方法识别肠道菌群数据中结构模式时,对噪声敏感,运行时间长,无法处理不规则数据。而谱聚类不仅可以聚类任意形状的样本数据,能够收敛于全局最优解,对数据分布的适应性更强,计算量小,且具有更高的性能。因此本文采用谱聚类(Spectrum)方法来分析肠道菌群结构,以轻微肝性脑病和2型糖尿病数据集为例。由于菌群数据在测序过程中存在物理上的缺失或者是采样不足,导致测序数据包含大量零。因此,首先采用成对比率几何平均值(Geometric mean of pairwise ratios,GMPR)方法对肠道菌群进行归一化,然后采用Spectrum方法分析肠道菌群结构,最后与网络分析方法进行核心菌群结构比较。Spectrum算法在单类人群上聚类性能表现不佳,同时也存在一定的缺陷,因此对Spectrum算法进行了改进,改进过程如下:在计算欧几里得距离时,为了避免忽视每个样本/特征所对应的不同特征值大小在该样本中所占据的权重,因此提出一种基于特征加权的相似度矩阵。为了避免传统谱聚类的灵敏度问题,将拉普拉斯矩阵替换为Hessian矩阵,并通过找到Hessian矩阵的特征值的特征向量对样本点进行聚类。为了能够调整聚类中心数K,利用ISODATA聚类算法代替原本的Kmeans算法。实验结果表明,GMPR的组内相关系数(ICC)为0.919,其重现性明显优于其他归一化方法。并且GMPR+Spectrum算法的运行时间、标准化互信息(NMI)、戴维森堡丁指数(DBI)、Calinski-Harabasz指标(CH)、兰德指数(RI)、调整兰德指数(ARI)远优于其他聚类算法M3C、i Cluster Plus。并且GMPR+改进Spectrum与改进Spectrum、Spectrum、GMPR+Spectrum方法相比,GMPR+改进Spectrum算法的NMI、DBI、CH、RI、ARI优于其他算法。GMPR+Spectrum与GMPR+改进Spectrum算法不仅在性能上表现良好(如GMPR+改进Spectrum在轻微肝性脑病中的NMI为0.372,DBI为4.202,CH为4.429,RI为0.815,ARI为-0.000),并且可以识别出不同类型患病人群在肠道菌群上的结构差异,挖掘出肠道微生物组的关键细菌(如轻微肝性脑病患者中的乳酸杆菌,肝硬化患者中的布劳特氏菌属,普雷沃菌属等),识别出的关键细菌或许可以为疾病的肠道微生物组研究提供新的参考。
其他文献
生肖成语具有天然的趣味性,是二语学习者学习语言和文化的良好教学材料。生肖“牛”成语数量多、文化附加义丰富,生肖“牛”和人们联系的紧密程度不同,从而造就了不同的社会心态和语言应用。在汉语作为第二语言教学中,生肖“牛”成语的应用并不广泛。学习地道的常用生肖成语可以增强语言表达的凝练性、趣味性和准确性,有助于增加学习者的使用率,减少对成语使用的回避。
期刊
目的 采用石墨炉原子吸收光谱仪(Graphite furnace atomic absorption spectrometry,GFAAS)自动进样器的在线富集功能,改进GFASS测定饮用水中铊元素的方法。方法 取10 ml水样添加0.1 ml硝酸,用石墨炉原子吸收光谱仪在线富集功能进样测定,测定结果与国标方法(GB/T 5750.6-2006)进行比较。比较采用t检验,以P<0.05为差异有统计
期刊
猪流行性腹泻(Porcine epidemic diarrhea,PED)是一种由猪流行性腹泻病毒(Porcine epidemic diarrhea virus,PEDV)引起猪的一种传染性肠道疾病,会导致猪出现腹泻、呕吐和脱水。PEDV对不同年龄段和不同品种的猪均可感染,以一周龄内新生仔猪最易感,病死率可高达95%以上,对养殖业造成严重危害。近年来,由于PEDV基因变异引起了广泛的PED疫病爆
学位
稀疏多元多项式插值是利用多项式的稀疏结构及其给定的插值点信息重构黑盒函数的一种有效策略,被广泛应用于科学和工程领域。传统的基于Prony方法的稀疏插值算法,其复杂度与多项式项数和次数相关,遇到大规模问题时由于执行多个高阶代数运算而效率较低。提出一种新的求解稀疏多元多项式插值问题的算法,核心操作是利用模算术解析单变元多项式的系数,避免了传统方法必需的高阶方程组求解、高次方程求根等。该算法设定一变元为
期刊
跨河桥梁是交通行业重要的渡河建筑物,而洪水对桥梁下部结构产生的冲刷和掏空,将直接影响桥梁的安全。防洪评价是水利行业的一项系统工程,本文结合《公路桥涵养护规范》(JTG H11-2004)中的相关规定,从交通行业,对涉水桥梁进行防洪评价,并以某工程评价为实例,为国内交通行业的相关从业人员介绍一种简单可行的防洪评价方法。
期刊
<正>在“双碳”目标下,立足新发展阶段,准确识变、科学应变、主动求变,走好新时代煤化工转型升级之路2021年中央经济工作会议指出,实现碳达峰碳中和是推动高质量发展的内在要求,要坚定不移地推进,但不可能毕其功于一役。在今年全国两会期间,习近平总书记参加内蒙古代表团审议时强调,“绿色转型是一个过程,不是一蹴而就的事情。要先立后破,
期刊
目的:探讨丙酸氟替卡松联合大环内酯类抗生素在肺炎支原体(MP)感染伴喘息患儿中的治疗作用。方法:选取本院2021年2月~2022年3月住院治疗的肺炎支原体肺炎(MPP)患儿共80例为研究对象,随机分为红霉素组(40例)和联合治疗组(40例),红霉素组给予红霉素注射液输液治疗1周,联合治疗组在红霉素基础上加用丙酸氟替卡松雾化吸入1周,比较治疗前和治疗1周后两组临床症状体征评分、白介素(IL)-4、I
期刊
吸收解吸是一种典型的化工单元,在工业中广泛应用于制取产品、分离混合气体、废气治理等方面。吸收解吸实训装置有效衔接了仿真教学与工业实际生产之间的环节,为培养行业岗位需求的技能提供良好的平台。为提升吸收解吸控制精度、简化数据处理、实现系统的优化控制,本文采用上位机和下位机的方式构建控制系统。采用触摸屏和三维力控组态软件作为上位机实现双路控制,它们均可对装置中阀门状态、气泵状态进行远程监控和操作,实时显
期刊
带电作业技术是保证电力配送网络安全可靠连续运行、减少电网维护成本和提高供电质量的一项关键技术。我国已建成世界上规模最大的电网,但目前配网线路的带电检修作业仍几乎全部由人工完成,由于电网作业环境的复杂性和危险性,检修人员的生命安全得不到有效保证,事故伤亡率较高。近二十年来,国内外研究机构研制了多款配网带电作业机器人,举升机构将电动或液压机械臂举升至作业场景,操作人员在高空绝缘斗内或地面通过遥操作进行
学位
世界范围内生态系统的破坏和退化问题,使生态系统修复的工作得到了国内外学者的广泛关注。近年来,随着山水林田湖草生命共同体理念在中国被提出,并逐渐被推行,各组成要素的生态过程愈发被认为是相互影响、相互制约、以及不可分割的。生态系统的三个重要特征是整体性、综合性和系统性,由此,从综合的角度考虑生态系统修复应该更为科学。但是,目前生态保护修复分区的研究,仍然对于生态系统问题诊断的综合性考虑不足,未能彰显山
学位