微生物组学下游数据分析与可视化软件包开发及应用研究

来源 :南方医科大学 | 被引量 : 0次 | 上传用户:javaoak
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究背景:近几年,高通量测序技术的发展极大地加速了微生物组学相关研究的数据增长。然而如何快速有效地挖掘这些数据仍然存在一定困难。在目前的微生物组学下游数据分析的计算方法中,仍然缺乏有效的数据结构来存储与管理相关数据,缺乏灵活、可组合的统一的分析语法来进行统计分析与可视化。研究目标:针对这两个问题,本论文首先对当前解析微生物组学上游分析产生的结果数据的工具进行调研分析,设计了一个综合的数据结构,并开发了统一的简洁分析语法,构建了相应的开源R软件包,进一步采用这些软件包,分析相关疾病人群的肠道微生物组数据。研究方法:第一章设计并开发了 MicrobiotaProcess的R软件包。它提供了一个全面的数据结构MPSE,从而能够更好地整合初始数据与中间分析结果数据,提高了下游分析数据的整合与探索。围绕这个数据结构,本人对下游分析任务进行了模块化划分,并且基于整洁框架(tidyframework)设计了一系列分析功能。这些功能既能独立地执行简单任务,也可以组合执行复杂任务,这使得用户能够有效地探索数据,进行个性化分析以及搭建相关的分析工作流程。除此之外,由于MPSE数据结构继承了一些R社区中的一些基础结构,如SummarizedExperiment与treeedata,使得MicrobiotaProcess也可以与R社区中的其他软件包进行互操作,进一步拓展了其分析能力。同时还通过几个示例说明MicrobiotaProcess用于分析微生物组数据以及其他生态数据的简洁性。其可以连接上游数据,提供灵活的下游分析组件,并提供可视化方法来帮助用户呈现和解释结果。第二章为了使用户能够使用统一整洁(tidy)的语法进行微生物组学中的系统发育树或者微生物物种分类树的注释以及比较分析,本人在本章中设计并开发了ggtreeExtra的R软件包。该软件包继承了 ggtree以及ggplot2的图形语法。它提供了一个geomfruit图层,用来连接ggtree可视化的进化树以及ggplot2或者ggplot2拓展包定义的几何图层。该软件包是一个通用系统发育树注释可视化的工具,可以被用于多种相关领域,在本论文中,该软件包主要被用于不同分组中差异物种的比较可视化分析。第三章应用本论文开发的相关软件包,对绝经后骨量减少及骨质疏松人群的肠道菌群数据进行挖掘分析,发现绝经后骨质疏松人群的肠道菌群多样性与对照组之间具有显著差异。而且,与对照组相比,绝经后骨量减少患者中变形菌门下相关物种的丰度显著更高。研究结果本研究主要设计开发了用于微生物组学数据下游分析时的数据整合存储,分析与可视化的开源软件包来解决当前微生物组学数据分析中缺乏有效的数据结构来存储相关数据,缺乏灵活、可组合的统一简洁分析语法的问题。这些软件包将成为微生物组学以及其他生态学数据分析的重要资源。MicrobiotaProcess与ggtreeExtra 的开发版网址分别为 https://github.com/YuLab-SMU/MicrobiotaProcess与 https://github.com/YuLab-SMU/ggtreeExtra,其发行版网址分别为https://www.bioconductor.org/packages/MicrobiotaProcess 与https://www.bioconductor.org/packages/ggtreeExtra。
其他文献
目的近年来乳腺癌发病率在世界范围内逐渐呈上升趋势,已居全球恶性肿瘤发病率首位。乳腺癌的治疗由单纯手术走向局部和全身治疗并重的个体化治疗,并逐渐进入精准医学时代,即将个体疾病的细胞、分子和基因等遗传学信息用于指导诊疗,用分子生物学技术推动肿瘤的精准医学发展。因此,寻找更多更有价值的靶点及开发针对性治疗手段将持续成为今后研究的热点。MiRNAs广泛参与真核细胞的分化、生长、凋亡、转移等生物学过程,鉴于
学位
<正>近年来,随着数字技术的普及与应用,我省小学美术数字化教学从试点探索到全省推广,取得了一系列丰硕成果,有效提高了课堂效率。但由于小学美术数字化教学还处于起步阶段,美术数字化教学应用较少,部分美术教师认识不足,严重制约了美术数字教学的发展。笔者通过参与小学美术数字化教材的创编和教学实践研究,积累了一些经验,希望能给广大美术教师提供指导和帮助,不断推动我省小学美术数字化教学的改革与发展。一、小学美
期刊
60%以上先天性耳聋是由遗传因素引起,人工耳蜗(CI)是目前解决重度耳聋唯一有效的方法,基因检测有助耳聋精准诊断、预测CI术后效果。具有多种耳聋基因突变的患者在CI后取得满意的听觉表现,这表明识别遗传背景有助于预测CI后的表现。但仍有部分患者CI术后效果不理想。诱导干细胞(iPSC)领域的进展为开发基于人类听觉感觉细胞的生物学治疗带来了机遇,为了解耳聋的发病机制并确定新的治疗策略提供了先机。第一部
学位
研究背景及目的:胃癌是全球常见恶性肿瘤之一,具有发病率高、死亡率高的特点,严重威胁人类生命健康。肿瘤的侵袭和转移仍是导致胃癌预后不良的主要因素,对其机制的深入研究及寻找可能的预防、治疗靶点是该领域亟待解决的问题。上皮-间质转化(epithelial-mesenchymal transition,EMT)在原发上皮恶性肿瘤细胞侵入临近正常组织中发挥关键作用,是肿瘤转移的重要过程之一,但其具体机制仍未
学位
目的本项目拟通过对正常骨盆解剖研究,开发设计一种适合国人的新型骨盆全内支架固定系统,分析其力学稳定性,并在临床中探讨基于骨盆环内固定理念的钉棒系统治疗骨盆骨折的临床疗效和在骨盆后环损伤的新的固定模式,为临床医生提供一种新的治疗思路。方法测量正常骨盆解剖学数据,设计、制备骨盆全内支架。采用接骨板加骶髂螺钉、前环内支架加骶髂螺钉、前后内支架固定和环形全内支架固定骨盆骨折有限元模型,用有限元方法考量其应
学位
高脂血症是临床上常见的以血浆甘油三酯(triglyceride,TG)和/或胆固醇升高为特征的脂质代谢紊乱。肝脏是维持脂质代谢稳态的枢纽器官,过多的脂质沉积在肝脏会导致非酒精性脂肪肝(non-alcoholic fatty liver disease,NAFLD)。NAFLD是最为普遍的慢性肝脏疾病,目前仍没有特异性治疗药物,主要的治疗手段以减肥和调节饮食为主。课题组前期利用动脉粥样硬化患者血浆筛
学位
背景及目的:腹腔镜全胃切除的消化道重建尤其是食管空肠吻合,目前仍存在较大的技术挑战,是制约腹腔镜全胃切除术的技术瓶颈,在一定程度上限制了该微创技术的应用和推广。然而,尽管全胃切除的消化道重建方式众多,但各有利弊,尚无统一标准术式。所以,如何更快捷、更安全地完成食管空肠吻合值得关注和探究。因此,本研究分析本中心的腹腔镜全胃切除消化道重建方式的优劣,并向全国胃肠外科医生进行问卷调查,明确腹腔镜全胃切食
学位
背景胰腺癌是人类最致命的癌症之一,其5年存活率低于10%。随着测序技术及生物技术的发展,m6A修饰及lncRNA成为肿瘤研究中的热点,并因其肿瘤特异性以及稳定性,可能作为潜在肿瘤标志物,而找到可用于胰腺癌诊断及治疗靶点的lncRNA临床意义重大。目的通过分析国际癌症基因组联盟(ICGC)和癌症基因组图谱(TCGA)中胰腺癌的数据集,并利用二代测序(NGS)技术及MeRIP测序技术,筛选出胰腺癌患者
学位
背景免疫检查点抑制剂(immune checkpoint inhibitors,ICIs)治疗是癌症革命性新疗法,极大地延长癌症患者的生存期。然而,ICIs可能会引起一系列独特的免疫相关不良事件(immune-related adverse events,irAEs)。免疫检查点抑制剂肺炎(immune checkpoint inhibitors pneumonitis,CIP)是常见的潜在致命性
学位
研究背景和目的胃癌(gastric cancer,GC)是全球癌症发病率和死亡率的主要贡献者,好发于亚太高收入地区及东亚地区,是全球癌症死亡的第四大常要原因(7.7%),临床诊断阶段较晚,生存率较低。尽管胃癌的多模式治疗取得了进展,但复发和转移仍很常见,与肿瘤受到复杂的分子谱共改变模式和患者内部基因组异质性的阻碍有关。有学者研究发现减数分裂结构特异性内切酶1(essential meiotic s
学位