基于宏基因组数据的原核微生物泛基因组网络构建及可视化方法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:lmwtz7x8f0
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在分子生物学中,常用泛基因组来?述在一个进化分支下所有基因的集合。菌种的泛基因组的基因信息通常比单一菌株更为丰富,有助于其遗传多样性的研究。传统泛基因组研究工具主要关注基因含量,忽略了基因在基因组中的上下文信息;另外,现有可视化工具通常以线性方式对泛基因组进行展示,当进行比较的基因组数量增多时此种方法的展示结果可读性较差,且无法便捷地获取基因的生物学注释;此外,现有工具不能实现对数量庞大且不断增长的宏基因组测序数据进行有效挖掘。
  为填补泛基因组研究中的这些空缺,本研究开发了一个泛基因组分析流程,可接受宏基因组组装序列作为输入,实现对基因信息及基因间连接关系的?取,并以参考基因组为骨架构建泛基因组网络,最后在网络数据展示平台中进行交互式可视化。本研究利用模拟数据对该流程的性能进行了评估。
  将其应用于5个大肠杆菌病原菌株的分析,发现在编码外膜蛋白的基因簇上,不同菌株的基因序列或基因排列顺序不尽相同,在临床关心的H抗原和O抗原相关基因簇中基因多样性尤为明显。进一步将其应用于760个人肠道微生物宏基因组测序数据中,在得到的大肠杆菌泛基因组中,相应蛋白的多样性与5个单菌基因组的泛基因组相似,且更为复杂。前述两个泛基因组网络的H抗原基因簇中均存在功能未知的基因,预示其可能具有与该基因簇表达调控相关的功能。此外,本研究还发现可移动遗传因子在该泛基因组中的分布十分广泛,且其存在多具有菌株特异性。
  相比传统工具,本研究得到的分析流程能够更好地组织、呈现泛基因组。首先,把基因间的连接关系囊括进泛基因组分析,有利于发现结构变异;同时可对未知功能基因进行定位,进而推测其可能参与的生物学过程,指导下游的功能验证实验设计。其次,以网络图的方式组织、可视化泛基因组,既可避免冗余信息的反复出现,亦可实现交互式地对泛基因组网络上的元素进行搜索、个性化展示及生物学注释信息的获取,可促进新变异的发现。最后,由于该流程可接受宏基因组组装序列作为研究起点,丰富了可用于泛基因组研究的数据来源,尤其有助于对现有实验方法难以培养的物种的研究。
其他文献
上个世纪90年代以来,文化研究逐渐成为中国社会一文化批评主要话语资源之一,本文正是在这样一个大的背景下探索孟子的社会文化批评话语。文章以孟子的主导思想为线索,通过深入分析孟子的思想产生的独特社会背景和理论背景,解释孟子对政治、经济以及异己文化批评的真正目的,进而理解和把握孟子文化批评理论的深刻涵义。此外,通过分析其对当代中国文化建设及文化批评理论建设的双重启示,旨在揭示孟子文化批评理论对当代中国文
学位
对黄宗羲政治思想的研究,国内外己经取得了丰硕的成果,观点主要有以下几种:第一,认为黄宗羲的政治思想仍没有超出传统民本思想的范畴。第二,黄宗羲的政治思想己经具有现代民主的部分特征。第三,黄宗羲的政治思想是介于传统民本与现代民主之间,为通向民主的桥梁。本文将主要通过对黄宗羲政治思想进行解析,认为黄宗羲的政治思想是基于对儒家传统文化的汲取但又取得了超越,与西方民主思想比较既有相同之处又有所区别,是"本土
学位
近年来胡宏思想研究逐渐受到人们的关注,本文“绪论”概括介绍了研究背景、研究方法和研究意义,回顾了学术界研究现状,并对本文的创新性进行了阐述。  基于此,本课题选择了胡宏思想中最具生命力的价值文化形态——经世致用的思想特征为切入点,从以下几个方面,对胡宏经世致用思想进行系统深入的研究,即经世致用思想的哲学基础、经世致用思想在政治经济思想中的具体体现、提倡实事的为学之道、其经世致用思想对湖湘仕子产生的
学位
长期以来,不管是发达国家还是发展中国家,贫困与反贫困的斗争始终没有停止过。为了消除贫困,各国政府都是竭尽所能采取各种防范或者解决措施针对不同群体实施救助。社会救助政策在各国的实施被认为是反贫困最为有效的方式方法之一。社会救助制度是社会保障制度的重要内容之一,也是各国最基本的社会保障制度之一,它是为贫困所设立的最后一道安全网。社会救助对于解决贫困人口的基本生存问题至关重要,对社会经济的发展具有重大意
延安出版业是中国共产党领导下的新民主主义文化事业的一部分,在我国现代新文化出版史上写下了光辉的一页。对于延安出版业的系统研究,有助于了解延安出版业的光辉历程,明析其历史作用与历史贡献,对于新时期弘扬延安出版业形成的出版优良传统具有重大的现实意义。  本文在分析延安出版业发展历史背景的基础上,分为两个阶段对延安出版业进行宏观考察,同时在微观层面上研究了延安出版物稿酬、广告与出版人日常生活,并对延安出
学位
研究背景:  单纯疱疹病毒1型(HSV-1)是一种人类嗜神经病毒,人群感染率高,且易发生潜伏感染,在一定条件如紧张焦虑等刺激下,处于潜伏状态的病毒被激活引起复发感染,引起一系列严重症状。目前对原发性HSV-1感染和疾病再激活的治疗是非选择性的,主要是无环鸟苷等嘌呤核苷类及其类似物,如阿昔洛韦(Acyclovir)、泛昔洛韦(Valaciclovir)等,他们的作用靶点是病毒DNA聚合酶,抑制病毒的
学位
研究背景:  随着当今社会人们生活环境和生活方式的变化,各种癌症的发病率呈现不断上升的趋势。而目前在全球范围内,肺癌的发病率和死亡率都位居所有癌症相关疾病的首位。据统计,全球每年新增肺癌病例约200万人,其中死于肺癌的病例高达176万人,死亡率达88%。研究表明,吸烟、大气污染、职业和环境接触、电离辐射和遗传等因素是影响肺癌发生发展的主要诱因。尽管目前人们利用外科手术、化疗和分子靶向治疗等技术手段
学位
[研究背景]  吸烟是引起早死或残疾的重要因素之一。吸烟可增加心血管疾病、呼吸系统疾病、癌症的发病率,提高缺血性中风、抑郁、帕金森病和阿尔茨海默病以及血管性痴呆等神经退行性疾病的患病风险。短期戒烟可引起体重增加,血糖控制恶化,但长期戒烟可减低多种疾病的患病风险,延长预期寿命。尼古丁是香烟烟雾中的主要成分,也是引起吸烟上瘾的物质,还可引发氧化应激以及炎症反应参与脑缺血性中风、阿尔茨海默病等疾病的发展
[目的]构建复制型的含萤火虫荧光素酶(luciferase)报告基因的重组人3型腺病毒和含“四半胱氨酸”(tetracysteine,TC)标签的重组人4型腺病毒,为人3、4型可视化重组腺病毒的应用奠定基础。  [方法]  1.PCR扩增luciferase报告基因,克隆入去掉EGFP基因的人3型腺病毒穿梭质粒pSKA3E3LR(EGFP),经双酶切后与人3型腺病毒骨架质粒pBRAd3-EGFP的
[背景]  心脑血管疾病的发生发展被认为与血管内皮细胞衰老密切相关,与衰老或长寿相关的基因在维持血管功能方面扮演重要角色。肌细胞增强因子2A(Myocyteenhancerfactor2A,MEF2A)在促进内皮细胞及内皮祖细胞增殖和维持内皮正常功能方面发挥重要作用,MEF2A的功能缺失突变与冠心病的发生紧密相关,也直接导致心脏发育缺陷。MEF2A还参与细胞呼吸链相关分子的表达调控,对细胞的能量代