基于SMRT测序技术的药用植物遗传序列研究

被引量 : 0次 | 上传用户:jyd965243
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我国药用植物资源丰富,但由于种类繁多且遗传背景复杂等原因,药用植物的基因组学与转录组学研究难度较大,目前整体尚处于起步阶段,先进测序技术和分析手段应用的欠缺是导致这一现状的重要因素。单分子实时(single molecule real-time, SMRT)DNA测序技术,是通过大规模实时记录单个DNA聚合酶在零模波导(zero-mode waveguide, ZMW)纳米孔中以样品DNA为复制模板催化DNA合成的过程,获得样品DNA碱基序列信息的高通量DNA测序技术。在DNA测序技术的发展历史中,SMRT属于第三代,也是目前世界上最先进的DNA测序技术,自2009年问世以来,助力解决了生物学和医学领域诸多重要问题。SMRT的技术原理对解决高通量测序时代药用植物学研究领域的一些关键问题具有显著优势,但相关研究尚属空白。本文以重要药用植物以及药用真菌为例,进行了基于SMRT测序技术的药用植物基因组混合组装、叶绿体全基因组序列组装、全长转录本测序的实验研究。基因组序列是进行药用植物系统生物学研究的基础,本研究的第一部分以模式药用植物丹参(Salvia miltiorrhiza)为例,应用SMRT测序技术对丹参的基因组长片段(8-10kb)随机打断文库进行测序。实验中所使用的二倍体丹参预测的基因组大小约为615Mb,基因组构成复杂,本研究在已有下一代测序技术(next generation sequencing, NGS)数据的基础上,引入约4Gb长度大于2000bp的矫正过的long reads(来自约8GB的SMRT测序数据),并采取基于long reads的混合拼接策略进行组装。获得了60,349个contig,平均contig长度为8.69kb,contig的N50长度为12.4kb,序列总长度为524 Mb,覆盖85%预测到的丹参基因组。加入mate-pair数据后,得到21,045条scaffold,平均scaffold长度为25.56kb,scaffold的N50长度为51.02kb,最长scaffold为388.31kb,序列总长度为538Mb, BAC文库的测序结果验证了序列与组装的准确性。与已有的Ilumina、454单独拼接的结果进行比较,原碎片化的拼接结果得到大幅度改善,并应用于后续丹参酚酸生物合成基因的挖掘与分析,证明SMRT测序技术的介入可以显著提高复杂药用植物基因组的拼接质量。叶绿体基因组序列是药用植物超级条形码(super-barcode)鉴定的研究基础,也是研究叶绿体基因工程、叶绿体序列分子标记开发以及植物系统发育研究的重要数据来源。本研究的第二部分内容是以贝母属三种药用植物湖北贝母(Fritillaria hupehensis)、太白贝母(Fritillaria taipaiensis)和卷叶贝母(Fritillaria cirrhosa)为例,分别于群落中采集多个植株的叶片进行混合,构建短片段插入文库进行基于环状一致测序策略(circular consensus sequencing, CCS)的SMRT测序,全程无PCR引入,在不使用参考基因组的前提下拼接得到了每个物种的叶绿体全基因组一致序列,经Sanger测序验证了测序和拼接的准确度为100%,且验证序列中变异频率低于15%的单核苷酸多态性位点(single nucleotide polymorphism, SNP)均得到了验证。叶绿体基因组序列分析显示,三种贝母属药用植物的叶绿体基因组均呈典型的四分体结构,长度在151,691bp至152,145bp范围内,编码135个基因,8个rRNA基因,38个tRNA基因,18个基因含有内含子,infA、ycf15和ycf68基因中间发现终止密码子,在贝母中可能是假基因。其中太白贝母叶绿体基因组中发现了20个SNP位点,变异频率在9.38%-45.45%之间;卷叶贝母叶绿体基因组中发现了70个SNP位点,变异频率在9.60%-50.00%之间,提示了川贝母群落可能存在的SNPs分布特征。此外,本研究也通过比较基因组的研究手段,对贝母属药用植物超级条形码的相关研究进行了有益的探索,物种间的叶绿体基因组序列比较分析给出了种间变异较大的基因,基于叶绿体基因组序列的百合目系统进化分析给出了黑药花科(Melanthiaceae)更接近于百合目基部的新证据。研究结果显示,SMRT-CCS策略在药用植物叶绿体基因组全序列获取上具有巨大优势和普遍推广意义。转录组数据是研究药用植物功能基因、次生代谢调控机制的重要基础。本研究的第三部分以本课题组已发布基因组数据的药用真菌灵芝(Ganoderma lucidum)为研究对象,设计总mRNA均一化后分片段构建文库的策略,使用SMRT测序技术直接对反转录得到的灵芝子实体期全长cDNA进行测序,并以灵芝P450基因家族进行生物信息学验证,结果显示本方案的转录组覆盖度良好,具有较强的全长转录本测序能力,克服了已有的高通量转录组测序技术无法直接从5’到3’完整描述RNA信息从而真实地反应RNA异构体信息的弊端,并提示灵芝转录组中大量可变剪接现象的存在。分析结果也反映出,在SMRT测序技术的现有能力下,全长转录本的序列准确性需要进一步提高以适应后续分析。综上所述,本文以重要药用植物和药用真菌为例,进行了基于SMRT测序技术的药用植物基因组学与转录组学的开创性研究,分别提出了行之有效的实验策略与分析方法。总之,SMRT测序技术在药用植物学研究领域具有重要价值和巨大的应用潜力,有助于推动我国传统药学进入生命科学研究前沿领域,在药用植物优良品种选育、药用植物分子鉴定和次生代谢产物合成路径解析等方面产生巨大影响。
其他文献
为了消除电网谐波污染、提高功率因数,需要在电子设备的输入端增加功率因数校正(Power Factor Correction, PFC)变换器。由于脉动的瞬态输入功率与恒定的输出功率之间的不平
中国共产党第十八次全国代表大会提出的社会主义核心价值观,为当代大学生提供了判断是非的价值尺度与行动准则。社会主义核心价值观作为当代中国道德准则与价值目标,为大学生
从媒体融合的实践来看,我国媒体融合受到政治、市场与技术三重逻辑的影响。三者既有各自的运行规则,也会以不同的组合方式在不同的历史阶段相互影响,以形成不同的传媒融合过
目的:观察中晚期非小细胞肺癌患者长期服用金福安汤的安全性。方法:将40例符合临床入组标准、不适合化疗或不愿意接受化疗的中晚期肺癌患者随机分为治疗组和对照组,两组各20例,
胃脘痛,是一种古今常见的内科病证,这一病名始见于《黄帝内经》,是消化系统疾病中所表现出的一种主要病证,其中以胃脘部疼痛为主要症状,同时还会伴有脘腹胀满,不思食,暖腐吞
目的:对于经保守治疗后无效,而手术探查又未解除静脉危象的病例,临床上常应用指端侧小切口放血配合肝素棉球湿敷切口的方法来处理,虽取得一定的疗效,但也存在一些问题。本研究
目的:应用彩色多普勒超声诊断仪检测2型糖尿病患者并发糖尿病足的下肢动脉血管病变情况,分析其病变的好发部位及管腔狭窄严重程度的图像特征。方法:①实验对象:选择2004,2006于沈
本文指出公共图书馆实行免费服务的真正目的不是简单的取消一系列仅在图书馆事业发展中占很少比例的读者"入门"费,而是在免费基础上打造优质图书馆资源,让人民共享文化发展成
目的:探讨中医辨证施治在寰枢椎脱位围手术期的临床疗效。方法:遵循中医“辨证施治”的治疗原则,将寰枢椎脱位患者围手术期的治疗分为三期,前期以活血化瘀,行气止痛为主,中期辅
<正>近年来,秦皇岛港股份有限公司第二港务分公司(以下简称"二公司")着力探索国企改革与国企党建同向而行、双向融入的有效路径,目前已初步形成了"以改革强党建、以党建促改