微生物组大数据生态—进化融合可视化平台构建与算法研究

来源 :中国科学院大学(中国科学院深圳先进技术研究院) | 被引量 : 0次 | 上传用户:yanmu1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着新一代基因测序技术的高速发展,宏基因组的发展越来越快,传统生物实验难以满足宏基因组研究的需求,于是就需要借助计算机来完成后续的数据分析。由于宏基因组数据直观上,人类无法观察到任何信息,于是就需要一个足够好的可视化平台,使得微生物组数据能为我们人类所能阅读。本文完成了微生物组大数据进化生态融合可视化平台构建,用于做微生物数据分析。这里主要包括三个部分:可以与用户互动的基于的宏基因组可视化平台、基于进化树最优分割的有监督机器学习技术研究与微生物物种生态功能网络结构学习技术研究。宏基因组可视化平台的基本功能是对微生物组数据进行可视化,包括热图,系统发育树,物种群落构成,富集分析以及微生物群落多样性可视化,比起其它的宏基因组可视化平台,我们这一部分的特色是我们的工具可以通过筛选某些进化树的分枝,实现热图、进化树、物种群落构成图等同时一起改变为仅表现当前所选分支的信息,更方便于我们观察该分枝的信息。基于进化树最优分割的有监督机器学习技术研究与微生物生态功能网络结构学习技术研究,是两种用于从微生物数据中提取特征用于后续机器学习的方法。我们将它同时整合到我们的平台里。基于进化树优分割的有监督机器学习技术研究是我们平台的一个特色的功能,传统的宏基因组的数据分析,都是基于进行的,我们通过引进了进化树的信息,利用贪心搜索的思想,得到了一些的祖先节点与其它的一些的组合,将他们作为我们后续数据分析的对象,在我们测试的数据集上,它的结果比传统的仅仅使用做数据分析的表现显得更加优秀。同样的微生物物种生态功能网络结构学习技术研究是我们平台的另一个特色功能,通过之间的相似关系,得到相似矩阵,这可以看成是一张图的矩阵表示,然后利用图嵌入技术生成了二阶的相似矩阵,再使用谱聚类的方式聚成若干个类,我们可以将若干个类作为一个模块,每一个模块里都包含了若干的,于是每一个模块的数据都可以看作是一个特征,我们就可以将这些新的特征用于后续的数据分析。最后,我们目前的平台可以应用与人类慢性疾病数据的研究,将用户的数据上传到我们的平台,我们的平台就可以将数据迅速的可视化出来,通过统计手段得到哪些与疾病具有明显关联,以及通过我们的基于系统发育树的有监督机器学习技术研究与物种生态功能网络结构得到哪些组合在一起,对于疾病的诊断有明显的辅助作用。
其他文献
针对传统的专家分类在网络条件下的不足,提出了大众化分类的相关概念,并简要分析了其功能及应用,认为在网络条件下,应将大众化分类作为传统的专家分类的必要补充。
中小企业融资与信息化建设的关系是十分密切的。中小企业融资难固然有多方面的原因,有的原因甚至是主导性的,但是中小企业自身的竞争力的提升、可持续发展能力的增强、治理结构
家,是什么。一千个人也许就有一千种理解。有人说,家是一栋房子,也就只是供人居住的场所。有人说,家是一份情怀,使人时时刻刻思念的牵挂,有人说,家是一个港湾,是包容脆弱,包裹眼泪的树
随着现代技术的飞速发展以及高新技术向皮革产业的渗透,传统的聚丙烯酸酯涂饰剂不足以满足功能化的需求。而聚丙烯酸酯/无机纳米复合皮革涂饰剂具有卫生、耐黄变、抗菌、防水
重点介绍了中国科学院科技成果信息服务平台从数据获取、数据加工、数据发布到数据交换以及数据管理的系统设计流程,简要介绍平台的功能实现,最后对其总结。
目的 研究支气管哮喘患儿白介素和TNF-α与肺功能、免疫功能的关系。方法 将178例支气管哮喘患儿分为发作组(急性发作期,107例)及缓解组(缓解期,71例),另取同期体检健康者83
针对物流机器人路径规划的问题,结合蚁群算法的特点,提出了一种基于A~*算法改进的蚁群算法,目的是当物流机器人工作时,采用所提出的方法使其可以沿着一条距离最短的路径行进。该方法通过使用双向搜索的A~*算法来预先搜索一条最短路径作为较优解,之后以此路径经过的节点为中心,线性地改变信息素,提高较优解路径附近节点的信息素浓度,实现了对传统蚁群算法的改进。在20 m×20 m的栅格地图内对3种算法进行仿真试
江苏恒通不动产物业服务有限公司成立于2009年11月,是恒通建设集团有限公司下属子公司。公司注册资本3000万元,具有国家物业管理一级资质。公司目前设有总经理办公室、财务部
本文简要介绍了企业信息门户的基本概念和语义Web的基本知识,分析了设计门户的传统方法和语义方法的区别,构建了基于语义技术的电子商务门户框架,最后给出了此框架的微观技术实
科学技术的迅速发展对现代经济发展起到很大的促进作用,而技术转移是促进经济发展的最直接方式。本文通过对技术转移中信息资源的相关文献的整理,从技术转移中信息资源的研究意