高通量测序技术在农业研究中的应用

来源 :山东农业科学 | 被引量 : 0次 | 上传用户:wgqlogin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:随着高通量测序技术的不断发展和测序成本不断降低,高通量测序近几年在现代农业研究领域中得到了充分应用,为新品种选育和品质改良带来了新的科研方法和解决方案,加快了新品种的育种进程。高通量测序技术的主要应用方向包括对农作物和栽培品种进行全基因组从头测序和深度重测序、遗传差异分析、分子标记开发、遗传连锁分析、表观遗传分析和转录组分析等。本文系统阐述了近几年高通量测序技术在农业研究中的应用进展,展示高通量测序在现代农业研究领域的广泛应用前景。
  关键词:高通量测序;农业生物技术;全基因组测序;重测序
  中图分类号:Q503文献标识号:A文章编号:1001-4942(2013)01-0137-04
  双螺旋结构的发现、遗传密码的破解、第一个完整基因组图谱的绘制完成[1]让科学家越来越认识到测序在生物学研究中的重要作用。作为最重要的分子生物学分析方法之一,DNA测序不仅为遗传信息的揭示和基因表达调控等基础生物学研究提供重要数据,而且在基因诊断和基因治疗等应用研究中也发挥着重要的作用。
  1977年Sanger等发表了利用末端终止反应的DNA测序方法,使得大规模、自动化的DNA测序成为可能,并成功地测定了包括人类基因组、水稻基因组等在内的若干生物的基因组序列[2]。随着科学的发展,传统的Sanger测序技术由于成本过高、通量较低、耗时耗力等缺点,较大地限制了DNA测序的应用。自2005年以来,以罗氏公司的454技术、Illumina公司的Solexa技术和ABI公司的SOLID技术为标志的高通量技术相继诞生。高通量测序技术堪称测序技术发展历程的一个里程碑,该技术使得获得核苷酸序列数据的单碱基测序费用相对于Sanger测序急剧下降,可以对数百万个DNA分子同时测序,这使得对同一物种的转录组和基因组进行细致全貌的分析成为可能,随之也给基因组学研究带来了更多的新方法和新方案。目前,高通量测序技术已广泛应用于动植物全基因组测序、基因组重测序、转录组测序、小RNAs测序和表观基因组测序等方面。本文对高通量测序技术在农业研究中的一些具体应用进行了综述。
  1全基因组重测序
  全基因组重测序是对已知基因组序列的物种进行不同个体的基因组测序,并在此基础上对个体或群体进行差异性分析。全基因组重测序的个体,通过序列比对,可以找到大量的单核苷酸多态性位点(SNP)、插入缺失位点(InDel,Insertion/Deletion)、结构变异位点(SV,Structure Variation),通过生物信息学手段,分析不同个体基因组间的结构差异,同时完成注释。随着测序成本的降低及可拥有参考基因组序列物种的增多,基因组重测序已经成为动植物育种研究中迅速有效的方法之一,在全基因组水平上进行扫描并检测与重要性状相关的位点,对育种研究具有重大的科研与产业价值。
  11利用重测序进行进化分析及SNP筛选
  Lai 等(2010)[3]对6个玉米(Zea mays)骨干自交系进行了全基因组重测序,共发现1 273 124个单核苷酸多态性位点(SNPs), 得到30 178个1~6 bp的插入缺失位点(InDels),新发现的这些SNPs和InDels提供了1个高密度的全基因组标记信息,同时也鉴定出数百个基因获得与丢失变异(Presence/Absence Variations, PAVs)。Jiao等(2012)[4]利用高通量测序技术对来自不同区域以及不同年代的278份玉米自交系基因组进行了系统分析,阐述了现代玉米育种过程中发生的基因组遗传变化规律,平均每个品系得到了2倍的数据,获得了13万亿个碱基对和27 818 705个单核苷酸多态性位点的信息量。Huang等(2010)[5]利用高通量测序技术结合自主研发的基因型分析方法,对517份水稻地方品种资源进行了约1倍深度的测序,获得了270 Gb数据,构建了高密度的水稻单体型图谱(HapMap),鉴定了大约360万个SNP位点。并利用373个籼稻品种对水稻株型、产量、籽粒品质和生理特征等14个农艺性状进行全基因组关联分析研究,通过连锁分析鉴定的位点可解释约36%的表型变异。Zheng等(2011)[6]对3个高粱(Sorghum bicolor)品系进行了全基因组重测序, 每株测序深度为12倍, 以已测的美国籽实高粱基因组序列为参考进行信息分析,发掘出1 057 018个SNPs、 99 948个1~10 bp长的InDels、 16 487个PAVs 和17 111 个拷贝数变异。同时, 在甜高粱和籽实高粱序列中鉴定出近1 500个序列结构差异基因,这些基因参与糖与淀粉代谢、木质素和香豆素合成、核酸代谢、胁迫应答和DNA 修复等生物学过程。
  12利用重测序技术鉴定突变体突变基因
  正向遗传突变与适应性进化是创造出带有希望性状的新变异有机体的有力工具和途径,高通量技术的出现,使突变体在亲本株系拥有参考基因组的情况下,可以快速准确地获得这个突变体的基因组信息,快速完成对突变位点的定位和鉴定。
  Ashelford 等(2011)[7]对一个拟南芥突变体ebi-1的回交系进行基因组重测序, 随后又通过对突变体的表达数据进行调查使得候选SNPs数目得以有效缩小,最终成功鉴定出1个在AtNFXL-2基因中引起ebi-1突变表型的SNPs 位点。该研究证实利用回交系材料可以降低遗传背景噪音, 对其进行测序分析可有效减少候选SNPs 数目,利用二代测序技术直接对突变体和野生型测序成为鉴定突变体突变位点的直接有效的策略。主要的农艺性状是由多基因控制的,单个基因仅引起较小的表型效应,故而对其鉴定和克隆非常困难。Abe等(2012)[8]利用基因组重测序技术分析一个日本骨干水稻栽培品种Hitomebore的7个突变体,鉴定出来包含了淡绿色叶片及半矮生突变表型相关突变位点的唯一基因组区域,该突变位点平均初定位区域为21 Mb。结果显示,这种基于对一个分离群体中呈现有用表型植株的DNA混合后而进行的全基因组测序可以加速水稻及其他作物的遗传改良。   2全基因组de novo测序
  全基因组de novo测序也称为从头测序,是直接对某个物种进行基因组全测序,然后利用生物信息学方法对序列进行拼接和组装,得到完整的物种基因组序列。基因组测序对研究物种的基因组和功能基因信息、阐明物种的进化及其生长发育具有重要的意义。植物基因组通常较大且结构复杂,利用Sanger测序来测定全基因组序列花费巨大且费时费力,大大地限制了基因组信息在农业中的应用效率,而高通量测序以成本低、通量高、快速等特点使物种全基因组测序成为可能。Huang等(2009)[9]完成的黄瓜(Cucumis sativusL)全基因组测序是世界上第一个完成全基因组测序的蔬菜作物,该工作的完成对黄瓜及其他近缘物种的遗传改良、基础生物学研究等具有重要的意义。 研究人员利用高通量测序技术结合Sanger方法对黄瓜进行了约72倍深度的测序,经过拼接与组装后获得了2435 Mb的序列,大概覆盖了黄瓜基因组728%的区域。熊猫(Ailuropoda melanoleuca)是第一次完全采用高通量测序技术完成基因组全测序的大型物种。苹果(Malus domestica Borkh)、金小蜂(Nasonia vitripennis, N giraulti和 N Longicornis)等多个物种的全基因组测序都是采用了新一代的测序技术。随着新一代测序技术的飞速发展,基因组测序所需的成本较传统技术大大降低,时间周期也大大缩短,大规模地物种全基因组de novo测序渐入佳境, 基因组学研究也迎来新的发展契机和革命性突破。
  3转录组测序研究
  转录组是指特定组织或细胞在某一功能状态下转录出来的所有RNA的总和,包括mRNA和非编码RNA。转录组测序是指通过新一代高通量测序技术对cDNA测序,利用统计相关reads数计算出不同mRNA的表达量,发现转录水平的SNP、新的mRNA等,该技术可以从表达水平、等位基因特异性表达、RNA编辑、含有重要信息的融合基因转录子、差异剪接等方面展开相关研究。Zhang等(2010)[10]用8种不同水稻(Oryza sativa L)样品的不同组织于不同时期混合建库,通过转录组技术分析了栽培稻的第1张转录组图谱,结果在水稻8种组织样品中检测到大约27 000个基因的表达和38 000个转录单元,证实了约9 000个基因发生可变剪接,同时鉴定出了234个由反式剪接产生的转录融合基因,表明融合基因比预期的更为普遍。Wu等(2010)[11]利用采集的接种霜霉病后4~8 d葡萄叶片混合样,通过Solexa技术测序获得了15 249个候选差异表达基因。这些研究结果表明,基于高通量测序的de novo转录组分析可在非模式动植物物种, 特别是在基因组大且复杂的物种中,可有效地用于新基因的发现和新分子标记的开发。
  4外显子组测序
  外显子组是指全部外显子区域的集合,该区域包含合成蛋白质所需的重要信息,涵盖了与个体表型相关的绝大部分功能性变异,能够直接发现与蛋白质功能变异相关的遗传突变。外显子组序列捕获及第二代测序是一种新型的基因组分析技术,可以将感兴趣的基因组区域定制成特异性的探针。相比于全基因组重测序, 外显子组和目标区域测序更加经济高效。 目前, 在医学基因组学研究领域,外显子组和目标区域测序技术已经应用到寻找人类各种疾病相关的致病基因和易感基因的研究中;而在动植物研究中,已有的报道主要集中在小鼠(Mus musculu)[12]中, 在大豆(Glycine max)[13,14]、牛(Bos taurus)[15]、果蝇(Drosophila melanogaster)[16]等物种中也有部分报道。
  5小分子RNA测序
  小分子RNA是一类长约20~30个核苷酸的非编码RNA分子,其介导的转录后基因调控是植物中的一种新型基因调控机制。它在植物生长发育和适应外界各种环境胁迫的过程中起着非常重要的作用。植物中小分子RNA数量巨大、种类繁多,而高通量测序技术的出现大大加快了它们的发现过程。Wei等(2009)[17]对飞蝗进行了小RNAs测序。通过与miRBase数据库比对鉴定出50个保守的miRNA家族, 并在没有飞蝗参考基因组序列的情况下, 通过生物信息分析技术发现了185个飞蝗特有的miRNAs家族。Moxon等利用454-FLX 法分析了番茄叶片和果实中的小分子RNA表达情况,结果表明:番茄miR390 和miR1917在果实中的表达量远高于在叶片中,而且miR1917的靶基因LeCTR1在番茄成熟过程中应答乙烯时表达量显著下调,因此认为这2个miRNA 可能参与了番茄果实的发育过程。
  新一代测序技术的诞生对分子生物学的深入研究发挥了巨大的促进作用,以新一代测序技术为基础的转录组测序和全基因组测序相比,成本很低,数据量大,且不易受遗传背景限制,可构建丰富的表达基因数据库,为进一步研究提供重要基础和依据。除文中所阐述的几方面的测序外,还有表观基因组测序、降解组测序等多样的测序类型,本文中所罗列的试验实例,仅仅是高通量测序在农业研究中的部分案例。现在高通量测序已被广泛应用于以转录组测序等为代表的功能基因组学研究中。随高通量测序技术而出现的数字基因表达谱(DGE)测序、小RNAs 测序、降解组测序、DNA甲基化测序、染色质免疫共沉DNA 测序等新方法为科学家们进行分子生物学相关研究提供了更多的选择。总而言之, 高通量测序技术给基因组学研究带来了一个高效的新平台和巨大的发展机遇。
  尽管高通量测序技术有诸多的优势,但其局限性也不容忽视。海量测序数据的产生及分析给研究者提出了巨大的挑战,如何充分挖掘隐藏在原始数据中的生物学意义及如何对数据进行分类、存档成为一个亟待解决的课题。高通量测序技术不适合小规模测序,传统的Sanger测序法无疑还是最佳的选择,将与高通量测序技术长期并存,在短期内还不会被淘汰。另外,高通量测序技术只是研究的开端,现在我们所能解释的生物学现象和机制还很有限,即使获得了基因组信息,如何去解释和应用它,仍是一个长远的问题。参考文献:   [1]Sanger F,Air G M,Barrell B C,et al Nucleotide sequence of bacterior phage phiX174 DNA[J] Nature,1977,265 (5596):687-695
  [2]Sanger F,Nicklen S,Coulson A RDNA sequencing with chain-termination inhibitors[J]Proc Natl Acad Sci,1977,74(12):5463-5467.
  [3]Lai J,Li R,Xu X,et al Genome-wide patterns of genetic variation among elite maize inbred lines[J]Nat Genet,2010,42:1027-1030
  [4]Jiao Y,Zhao H,Ren L,et al Genome-wide genetic change during modern breeding of maize[J] Nat Genet,2012,44:812-817
  [5]Huang X,Wei X,Sang T,et alGenome-wide association studies of 14 agronomic traits in rice landraces[J]Nat Genet,2010,42:961-967
  [6]Zheng L Y,Guo X S,He B,et alGenome-wide patterns of genetic variation in sweet and grain sorghum(Sorghum bicolor)[J] Genome Biol,2011,12:R114
  [7]Ashelford K,Eriksson M E,Allen C M,et al Full genome re-sequencing reveals a novel circadian clock mutation in Arabidopsis[J]Genome Biol,2011,12(3):1186-1198
  [8]Abe A,Kosugi S,Yoshida K,et alGenome sequencing reveals agronomically important loci in rice using MuMap[J] Nat Bio,2012,30:174-178
  [9]Huang S W,Li R,Zhang Z,et alThe genome of the cucumber, Cucumis sativus L[J] Nat Genet,2009,41(12):1275-1281.
  [10]Zhang G J,Guo G W,Hu X D,et al Deep RNA sequencing at single base-pair resolution reveals high complexity of the rice transcriptome[J]Genome Research,2010,20(5):646-654
  [11]Wu J,Zhang Y L,Zhang H Q,et al Whole genome wide expression profiles of Vitis amurensis grape responding to downy midew by using Solexa sequencing technology[J] BMC Plant Biology,2010,10:234
  [12]Fairfield H, Gilbert G J, Barter M, et al Mutation discovery in mice by whole exome sequencing[J]Genome Biol,2011,12(9):R86
  [13]Haun W J, Hyten D L, Xu W W, et al The composition and origins of genomic variation among individuals of the soybean reference cultivar Williams 82[J] Plant Physiol,2011,155:645-655
  [14]Bolon Y T, Haun W J, Xu W W, et al Phenotypic and genomic analyses of a fast neutron mutant population resource in soybean[J] Plant Physiology,2011,156: 240-253
  [15]Cosart T, Beja-Pereira A, Chen S, et al Exome-wide DNA capture and next generation sequencing in domestic and wild species[J] BMC Genomics,2011,12:347
  [16]Wang H, Chattopadhyay A, Li Z, et al Rapid identification of heterozygous mutations in Drosophila melanogaster using genomic capture sequencing[J] Genome Res,2011,20:981-988
  [17]Wei Y Y, Chen S, Yang P C, et al Characterization and comparative profiling of the small RNA transcriptomes in two phases of locust[J]Genome Biol,2009,10(R6):1-18
  [18]Moxon S J R, Szittya G, Schwach F,et alDeep sequencing of tomato short RNAs identifies microRNAs targeting genes involved in fruit ripening[J]Genome Research,2008,18(10):1602-1609
其他文献
摘要:根据山东省肉羊主要养殖区的产业调研情况,阐述了全省肉羊养殖、屠宰及加工业的发展现状和存在的主要问题,提出了应对策略。  关键词:肉羊;屠宰;加工;发展现状  中图分类号:S826.9+2(252)文献标识号:A文章编号:1001-4942(2013)04-0118-05  羊肉具有高蛋白、低脂肪、低胆固醇等特点,是一种营养保健肉质食品,深受广大消费者的青睐[1]。目前,随着人们生活水平的不断
期刊
摘要:都市农业园区的出现为我国现代农业发展注入了新的动力。通过对济南市都市农业园区建设的现状分析,针对园区建设和发展中的问题,提出济南市都市农业园区的发展对策,为园区建设提供一定的理论依据。  关键词:济南;都市农业园区;现状;发展对策  中图分类号:F301.24文献标识号:A文章编号:1001-4942(2013)01-0152-03  自2009年开始,按照“面上提升、点上突破、分类建设、梯
期刊
摘要:回顾了农业物联网应用的重点模式,在此基础上,以向阳坡生态园区的农业物联网建设为着力点,针对温室、塑料大棚和大田,提出了农业科技园区温室农业物联网立体交叉综合应用模式。该模式强调节点和多样化的终端应用,尝试提出了大田分布式物联网节点的布局模式,初步搭建了大田种植区耦合物联网技术的农业空间信息平台;并突出农机和农艺建模的融合,指出了农业信息建模是农机和农艺相结合研究应用的重要切入点之一,为进一步
期刊
摘要:从优质花生鲁花14的cDNA文库中发现一条序列,全长为1 399 bp,3′端含有polyA尾,通过blastx搜索得知其为蛋白激酶基因,命名为AhSTK。以该花生cDNA序列为模板设计引物,克隆得到花生AhSTK基因。序列分析表明,AhSTK基因的开放阅读框长度为1 080 bp,编码359个氨基酸,预测其分子量为389 kD,等电点为642,编码的蛋白质无信号肽,无跨膜结构,预测定位于细
期刊
摘要:采用陷阱法和植株拍打法,在崂山茶区选择有代表性的2个茶园进行系统调查和标本采集,初步调查到茶园蜘蛛13科27种。优势种为八斑鞘腹蛛Coleosoma octomaculatum和草间钻头蛛Hylyphantes graminicola,分别占蜘蛛总数的634%和160%。介绍了茶园蜘蛛种群以及2个优势种的年度消长规律。研究表明,连续降雨可影响蜘蛛数量,使用化学农药对蜘蛛存活影响较大。茶园种植
期刊
摘要:滑菇子实体多糖(fruiting body polysaccharide,FPS)在抗氧化、增强机体免疫力等方面有重要作用。通过Plackett- Burman试验和响应面方法得到FPS的最佳提取条件:提取次数255,乙醇浓度95%,乙醇倍数322倍,其理论预测值为2488%;对提取参数取整后,其实验值为2453%。在FPS浓度为500 mg/L时,对羟基自由基、超氧阴离子和DPPH的自由基
期刊
摘要:马铃薯晚疫病是马铃薯的第一大病害。利用分子生物学和基因工程技术,从马铃薯野生种质资源中分离抗病基因,并将其转化到优良栽培品种中,是提高马铃薯晚疫病抗性高效快捷的方法之一,目前已有多个来自不同野生种质资源中的晚疫病抗性基因被分离或定位。本文主要概述了近年来马铃薯抗晚疫病基因的研究现状。  关键词:马铃薯;晚疫病;抗性基因  中图分类号:S43532文献标识号:A文章编号:1001-4942(2
期刊
摘要:在山东济南和浙江杭州、河南焦作三地进行了毒死蜱在花生上最终残留试验,采用气相色谱法测定毒死蜱在花生及土壤中的残留量。结果表明,施药后到采收期时花生中的毒死蜱残留量均低于0.2 mg/kg。30%毒死蜱微囊悬浮剂用于防治花生蛴螬,施药剂量不超过2 250 g a.i./hm2 (推荐高剂量)、施药1次是安全的。  关键词:毒死蜱;花生;气相色谱;残留  中图分类号:Q781文献标识号:A文章编
期刊
摘要:赤霉素2-氧化酶(GA2ox)是赤霉素合成过程中起负调控作用的一种关键酶,催化有活性的赤霉素生成无活性的赤霉素。从花生荚果发育不同时期的转录组序列中筛选到GA2ox的基因片段,采用5′-RACE方法克隆了花生GA2ox基因的全长cDNA序列。序列分析表明,花生GA2ox蛋白氨基酸序列含有和其他植物同样保守的结构域。通过qRT-PCR技术对GA2ox基因在花生不同组织器官中的表达分析,发现所检
期刊
摘要:对朝阳市喀左县蔬菜保护地用秸秆覆盖进行栽培定位试验,未覆盖秸秆及未加菌肥的土壤作为对照(CK);只覆盖秸秆未加生物菌肥的土壤为1#;覆盖秸秆同时加生物菌肥的土壤为2#,每隔一定时间采集土壤样品。试验结果表明:土壤中细菌数量最多,其次是真菌数量。土壤微生物数量: 2#>1#>CK;土壤过氧化氢酶、转化酶、脲酶和碱性磷酸酶活性:2#>1#>CK,这几种酶的活性与土壤微生物的数量呈正相关。  关键
期刊