微生物群落宏基因组大数据的特异序列识别算法研究及实现

来源 :厦门大学 | 被引量 : 0次 | 上传用户：Nathan_YM

【摘要】

：

微生物群落是地球上生物多样性最为丰富的资源，广泛存在于海洋、土壤、河流及大气等自然环境，以及人体的口腔、皮肤、消化系统中。揭秘微生物群落的组成、结构与功能将极大地提

【作者】

：

宋年丰

【机构】

：

厦门大学

【出处】

：

厦门大学

【发表日期】

：

2016年期

【关键词】

：

微生物群落宏基因组特异性序列识别算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

微生物群落是地球上生物多样性最为丰富的资源，广泛存在于海洋、土壤、河流及大气等自然环境，以及人体的口腔、皮肤、消化系统中。揭秘微生物群落的组成、结构与功能将极大地提高人类对世界的认识，为健康、环境、农业及能源等领域带来变革与创新。比较与分类不同环境中的微生物群落是深入理解复杂微生物世界的重要手段。对于来自不同环境中的微生物群落（例如病人与健康人的肠道微生物），探索其不同类别微生物群落之间的差异及识别类别特异的物种或基因，对于理解微生物与宿主之间的关系有着重要的作用。　　宏基因组数据是指直接从环境样本中测序整个微生物群落中所有物种的遗传物质。当前大多数的分析方法依赖于基于参考序列的序列相似度配准，但由于现有微生物参考数据库的不完整性，因此该类方法很难覆盖微生物群落中的所有物种。同时，要从来自上千个物种的上亿条DNA随机测序读段中，拼装出单个的复杂宏基因组数据到具体微生物（例如特定的细菌株或者病毒等）的基因组序列存在着极大的挑战。因此，本文提出无需参考序列，即一种免于配准的微生物群落特异序列的识别方法。针对来自不同类别（例如病人和健康人）的数百个微生物群落测序样本，在每个样本的上亿条随机测序读段中，识别出不同类别群落的特异序列，从而为寻找可能的生物标记和后续的生物分析提供重要的参考信息。　　本研究提出基于长k-tuple(k＞30bp)序列作为特征来刻画微生物群落的方法，构建基于1028量级的特征过滤和处理流程，从而进一步识别出不同类别宏基因组测序大数据中的特异tuple，并通过分类来验证特异tuple的准确度和有效性。随后，在基于所获取的特异tuple的基础之上，通过序列拼装得到特异序列(contigs)，并从进化分类学水平、基因预测及功能注解和代谢通路等层面识别出能够描述微生物群落特征的生物学意义。　　本文将所建立的方法应用到IBD(Inflammatory Bowel Disease)和肝硬化(LiverCirrhosis)两种疾病的人体肠道微生物群落高通量宏基因组测序数据中。我们的方法能识别出特异性序列，且分类效果较已发表的结果相比有显著的提高。对于IBD宏基因组数据的特异性序列，本文从物种层面识别出了病人与健康人肠道微生物群落在物种组成上的差异;从基因层面识别出了多个与病原体相关的基因及所对应的具体微生物物种;从代谢通路上识别出了多个与蛋白质消化与吸收、氨基酸合成和金葡菌感染等相关的代谢通道。这些具体的生物意义对于进一步理解IBD的病因和特征等方面具有重要意义。　　本文的研究表明长k-tuple更适合刻画微生物群落特征。识别出的特异性序列对于理解微生物群落与宿主之间的关系、发掘微生物群落潜在的生物标记提供了新的研究方向。

其他文献

基于组播和广域网传输的语音混沌保密通信及ARM实现

随着移动互联网、社交网络、大数据、云计算等网络信息技术的飞速发展,人们越来越关注多媒体数据的通信安全,例如图像、语音、视频等。而具有海量性、实时性及强相关性等特点

学位

混沌实时语音嵌入式ARM组播广域网NISTWIFI

Endoscopic submucosal dissection vs laparoscopic colorectal resection for early colorectal epithelia

AIM: To compare the short term outcome of endoscopic submucosal dissection(ESD) with that of laparoscopic colorectal resection(LC) for the treatment of early co

期刊

colorectalsubmucosaldissectionneoplasmsrectumcolonsuperiorityshorterexci

电动汽车充电调度策略及风电消纳的博弈方法研究

在能源短缺和环境污染的双重压力下，各国大力发展电动汽车产业和风电等新能源产业。然而大规模电动汽车的无序充电行为不仅会影响区域电网的平稳运行，还会影响电动汽车充电代理

学位

电动汽车充电调度策略风电消纳非合作博弈

面向多无线传感器网络干扰问题的信道分配研究

无线传感器网络（WSN）具有低成本，低功耗和方便部署等特点，在工业、农业、军事等多个领域得到了广泛应用。由于节点大规模的密集部署，多个不同应用的无线传感器网络将共存于同一个

学位

多无线传感器网络信道干扰动态分配遗传算法粒子群算法

基于磁流变液微驱动控制技术研究

随着微机电系统（MEMS）的发展，微流体的驱动和控制技术已经成为微流体系统发展需要解决的关键技术。磁流变技术在兼顾流体传动优点的基础上增加了电磁可控特性，可以弥补流体在微机

学位

磁流变液微管道耦合模型磁场发生器驱动控制

物价为何如此飞涨

为什么一方面老百姓都在喊物价飞涨,另一方面企业家在抱怨产品卖不出去,打折销售呢?我国究竟是通货膨胀还是通货紧缩? Why, on the one hand, are ordinary people calling

期刊

通货紧缩打折销售物价问题生活必需品物价统计银行存款利率大米价格买东西城市弱势群体石油价格

用于工业异构网络控制系统的有线无线协议转换装置研究与实现

随着经济和技术的发展，制造业对自动化程度的要求不断提高，现场总线控制技术在重大装备中的应用更加广泛和深入。传统分散控制系统(DCS)与现场总线控制系统(FCS)结合的FDCS系统

学位

现场总线以太网工业无线网络多任务操作系统工业异构网络

软件构件技术在汉语学习系统中的研究与应用

随着软件开发规模和复杂性不断提高,随着社会对软件开发速度和数量要求不断提高,“软件危机”愈加明显的暴露出来,提高软件生产率成为软件产业当务之急。为了解决“软件危机

学位

软件构件CBD汉语学习

陈文辉:金融改革条件下如何推进保险资金运用

保险资金运用要服务好主业。保险资金运用,首先应当服务好主业,实现保险资金的保值增值,不要一味贪大求全。此外,投资能力也决定了术业要有专攻,作为保险公司,能够较好地运用

期刊

保险资金运用陈文辉保险专家管理时代投资能力改革条件中国保监会贪大求全养老保险负债结构

2005年清华大学美术学院教师作品展获奖作品

请下载后查看，本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.

期刊

展获清华大学学院教师狼牙山五壮士陶盘王洪亮陶艺服装设计吴波

微生物群落宏基因组大数据的特异序列识别算法研究及实现

与本文相关的学术论文