论文部分内容阅读
摘要:自人类基因组计划完成以来,基因组学进入功能研究时代。基因组研究技术引入水产动物的研究后,推进了水产动物基因组的结构和功能研究,解析和诠释了水产动物生物学现象的遗传基础和分子机制,在遗传育种、疾病防治和医药等方面的研究应用也取得较大进展。本文综述了基因组学研究中的测序技术、DNA分子标记技术、基因芯片、RNAi和基因编辑等技术的研究现状,总结这些技术在水产动物中的研究应用,分析其在水产动物研究中的机遇和挑战,为水产动物的发育、繁殖和抗逆育种等研究应用提供重要基因资源基础。
关键词:基因组;测序技术;功能基因组学;水产动物
中图分类号: Q789;S917文献标志码: A
文章编号:1002-1302(2017)15-0001-06
细胞是生命活动的基本单位,基因则是细胞进行遗传活动的物质基础。基因具有一致性、稳定性和连续性;不同的细胞、基因存在个体差异性,研究基因遗传信息的差异对理解生命演变具有重要意义[1]。基因组学的研究分为结构基因组学和功能基因组学,及其延伸学科为转录组学、蛋白质组学、代谢组学和系统生物学等。基因组学研究工具有研究基因组结构的测序技术、DNA分子标记技术和基因芯片等,研究功能基因的技术有转基因、基因敲除、反义技术、RNAi技术和基因编辑技术等。测序技术为基因组研究提供大量准确精细的数据,推动了基因组学、系统生物学等学科的发展。DNA分子标记技术和基因芯片主要应用于遗传图谱的构建,对重要经济性状基因的定位和图位克隆,给基因组结构和功能研究提供强大的辅助育种基础。基因敲除技术、小分子干扰RNA、反义技术、转基因技术、抗体技术和基因编辑技术等是对一个或多个靶基因的研究,还有针对多重靶标的化学基因组学;这些都是在了解基因组结构基础上,对基因组的功能验证和开发利用,同时基因组学技术的应用也开始由实验室研究走向染色体疾病检测、病毒与细菌鉴定和肿瘤检测等临床应用。
蓬勃发展的基因组学为水产动物的研究提供了方向,基因组学研究技术也为水产动物的基因组结构和功能研究提供了有力工具。人类基因组计划完成初始,水产动物的基因组研究还停留在关键基因克隆和部分经济性状基因的标记育种中,随着测序技术、DNA分子标记和基因敲除等技术的引入,基因组学在水产动物中的研究应用日新月异,已成为生物学研究的热点。水产动物研究操作方便、与人类基因有许多共同点,因此用作解决遗传、发育和免疫等生命相关科学问题的模式动物。基因组学技术推进水产动物基因组结构和功能的研究,有利于解析和诠释水产动物生物学现象的遗传基础和分子机制[2]。开展重要水产生物功能基因组学研究,得到与抗病、抗逆、生长、生殖等重要性状相关的功能基因,明确这些基因的遗传基础、功能和表达调控机制,可为水产养殖、抗病育种及生殖调控提供具有重要应用价值的基因资源。
1基因组测序技术
1.1测序技术的研究进展
人类基因组计划完成以来,成本低、速度快的测序技术得到飞速发展,为生命科学研究作出了卓越贡献。2000年人类基因组草图完成时,仅42个物种拥有全基因组序列,至2015年在NCBI数据库中已有774种动物和植物具有基因组序列。Sanger等提出双脱氧链合成终止法测序技术,开启了全基因组测序时代,其后基于焦磷酸法和链接酶法测序原理的第二代高通量测序(next-generation sequencing,NGS)技术迅速成为了现在研究基因组结构的重要工具;基于单个分子信号检测的DNA测序被称为单分子测序(single molecule sequencing,SMS)或称为第三代测序(third generation sequencing,TGS)和第四代纳米孔测序研究也走入我们的视线[3-4]。各大测序公司都推出自己的平台,其原理各有不同,并在通量、读长、准确度、速度和成本等方面也不相同,但均在基因组测序、重测序、转录组和表观遗传学等研究中发挥了重要作用,并逐渐应用于个性化医疗和遗传诊断等临床服务。目前,主流运用的NGS测序技术中Illumina的测序性价比高,Roche的测序片段较长,ABI的准确度相对略有优势,为研究提供了更多选择。各代测序技术也在原有的基础上更新,如Thermo公司最新的NGS系统Ion S5和Ion S5XL在测序时间、总数据量、平均深度以及总读数都较其他二代测序技术突出[5]。第四代纳米孔测序,虽然商业化测试的仅有Oxford Nanopore[6]和GenapSys这2家公司,但其在价格、通量和时间等方面的优势,把进行个人基因组测序成为可能。除全基因组测序技术外,还有一些针对基因组内特殊问题专门应用的测序技术,如:Koh等[7]、Ding等[8]分别研发的Ribose-seq、emRiboSeq和EndoSeq测序技术,可鉴定和定位在DNA复制、修复过程中插入基因组中的核糖核苷酸分子,完善了全基因组序列信息。
通过测序技术测出一个物种基因组序列片段,需经过组装拼接,最终获得该物种基因组序列图谱,并应用于基因组学研究当中,方可全面了解一个物种的基因组组成、基因调控和分子进化等。根据某一物种基因组的复杂程度可分为简单基因组测序和复杂基因组测序2类,利用以RAD、GBS技术为基础的简化基因组测序技术可在极短的时间内开发出成千上万的SNP标记,是当前测序技术的一种热门应用[9]。测序方法策略有基因组从头测序、基因组重测序、泛基因组测序,还有针对性较强的线粒体基因组测序、全基因组甲基化测序、外显子组深度测序等。基因组一般测序从基因组水平上对物种的生长、发育、进化、起源等重大问题进行研究,将加深我们对物种的认识,在新基因的发现、物种改良等方面发挥巨大作用;基因组重测序可以寻找出大量的单核苷酸多态性位点(SNP)、插入缺失位点(insertion deletion,InDel)、结构变异位点(structure variation,SV)和拷贝数变异(copy number variation,CNV)等变异信息,在群体水平上研究物种的进化历史、环境适应性、自然选择等方面,从而获得生物群体的遺传特征,有助于快速发现与动植物重要性状或人类疾病相关的重要变异基因等;外显子组深度测序能够经济高效地检测一个物种基因组中全部外显子区域,最直接体现基因功能,进而发现与蛋白质功能变异相关的遗传突变;甲基化组测序可绘制单碱基分辨率的DNA甲基化图谱,用于研究特定DNA区域甲基化与特定表型之间的关联,为疾病发生与治疗的相关研究提供基础;目标区域深度测序是指对感兴趣的特定基因组区域进行高通量测序,寻找与各种复杂疾病相关的致病基因和易感基因[10]。 1.2测序技术在基因组学研究中的应用
目前,研究者已经对40多种常见水产动物进行基因组测序(表1),为水产动物研究与应用提供了一大批与生长、发育、繁殖、营养、免疫、抗逆等相关的候选基因,同时全基因组的功能注释也为水产生物物种特有生物学现象的遗传基础和分子机制解析提供了全方位基因层面的生物信息证据,丰富了水产动物的遗传资源,也为物种进化研究提供参考。由于水产动物基因组结构复杂,重复序列高,经济、快捷、目的性较强的简化基因组测序和外显子组深度测序将是水产动物基因组研究的重要方法之一。
抗逆是水产动物基因组应用研究的一大热点,同时也是育种的新思路。Colbourne等对水蚤基因组的测序,使水蚤成为首个完成基因组测序的甲壳类动物[11]。研究显示,水蚤基因组大小仅200 Mb,却包含30 907个基因,大约是人类基因的1.3倍,超过1/3的基因为水蚤世系所独有;分析认为水蚤基因组内含有较少的非编码DNA和较高的基因重复率,使其拥有较多的基因。功能研究水蚤基因家族共表达及其在代谢信号通路中的作用证实重复并非随机分布,其中大部分旁系同源基因在不同环境中具有不同的表达模式;分析水蚤独有基因发现这些基因对生态环境变化极其敏感,为研究生活在淡水中的生物如何适应环境变化提供了分子基础。牡蛎维持调控近海和内湾生态系统的稳定,是潮间带极端环境的代表物种,Zhang等采用fosmid合并策略(针对高度复杂性和多态性的基因组)测序并组装了太平洋牡蛎基因组约559 Mb,预测拥有 28 027 个基因[12]。对数据分析,发现针对环境压力变化热休克蛋白70有助于牡蛎耐受高温,存在以48个凋亡抑制蛋白基因为主的抗凋亡系统,这些基因和旁系同源基因通过调控自身的基因表达,使得牡蛎能较好地适应和应对环境压力;发育方面研究显示与机体体节发育相关的Hox基因簇被破坏;同时该团队也对贝壳的形成进行研究,在贝壳中鉴定出259种贝壳蛋白,大部分为非分泌性蛋白,贝壳基质与动物的结缔组织、基底膜的细胞外基质具有相似性,如血细胞及外来体参与调控纤丝的形成。
大数据的基因组对免疫应答和免疫细胞信号传导等免疫学基础研究产生很大的影响,并为疾病诊断与治疗提供新线索。斑马鱼是一种常用的重要模式生物,其透明胚胎特别适合进行发育,Howe等研究发现斑马鱼与人类共享约70%的蛋白编码基因,且与人类疾病相关基因中有84%可以在斑马鱼中找到对应基因,目前在斑马鱼中已经鉴定出与人类疾病有关的3 188个基因突变[13-14]。水产养殖的黄鱼极易受到细菌、病毒和寄生虫传染,黄鱼抗病力下降显著地影响了水产业,Wu等绘制了大黄鱼基因组序列草图,并证实受到正选择作用的快速进化基因富集在与先天免疫相关的一些信号通路上,并鉴别出一些先天防御基因如Toll样受体、白细胞介素和肿瘤坏死因子等在感染后显著下调,揭示出大黄鱼具有发育良好的先天免疫系统[15]。
漫长的历史进化过程中,物种内和物种之间的基因组存在差异,研究这些差异和其稳定的遗传是研究进化的核心。从事比较基因组学研究的Simakov等对帽贝(Lottia gigantea)、海蠕虫(Capitella teleta)和水蛭(Helobdella robusta)3个冠轮动物(Lophotrochozoans)进行基因组测序,研究小组还开发用于快速简便搜索基因组间相似性的计算工具来比较分析各物种基因组的差异,成功追踪17个结构相似对称动物共同祖先的“祖先连锁群”(ancestral linkage groups),分析功能并测试进化过程的假说[16]。
2DNA分子标记和生物芯片技术
2.1DNA分子标记技术研究进展
DNA分子标记能够反映生物个体或种群间基因组中某种差异特征的DNA片段,是重要的生物標记之一,具有成本低廉、操作简单和信息量大等特点,是开展遗传作图、关联分析、群体遗传分析以及生态多样性分析等研究的基础。DNA分子标记技术分为:基于DNA和DNA杂交的RFLP、DAF和原位杂交等;基于PCR技术的RAPD、AFLP、STS、SCAR、SRAP和RP-PCR等;基于重复序列为基础的微卫星DNA、小卫星DNA、SSR、和SRS等;基于DNA测序分析的EST、SNP、CNV和线粒体DNA标记等[17-18]。AFLP和SNP位点分布广泛的特点决定了其在高饱和度遗传图谱构建中将发挥重要作用;SSR应用广泛、多态性高的特点适合于不同家系和群体遗传图谱的比较和整合,但须筛选出微卫星标记,才能在QTL定位和连锁图谱构建中发挥更大的作用;EST标记和其他遗传标记应用将为基因定位与克隆、比较基因组研究和物理图谱的构建起到关键作用;DNA条形编码技术可准确、快速、有效地进行物种鉴定;与芯片杂交合用的多样性序列芯片技术(diversity arrays technology,DArT)较广应用于基因组型分析研究中[18-19]。分子标记技术广泛应用于遗传连锁图谱的构建、遗传多样性分析、种质资源鉴定、重要经济性状基因定位、图位克隆和物种系统发育等方面。
虾、蟹等水产动物基因组研究相对滞后,水产动物的生长、繁殖、抗逆和抗病等重要数量性状研究大多还是依赖DNA分子标记技术。水产动物中的分子标记研究较多也较成熟,国内外学者利用分子标记对水产动物进行遗传多样性分析、遗传结构和种质资源的鉴定[20],在重要水产动物中筛选出重要性状相关的功能基因[21-22],阐明了其中一些重要基因的功能及其表达调控机制,并剖析其相关遗传基础,为生长发育、生殖调控、抗病育种和水产养殖等提供一大批具有重要潜在价值的基因资源库。物种进化的本质是基因组的进化,分类学中可利用DNA分子标记精确分析其速度和种属分类[23-24],同时利用分子标记在有关物种间进行遗传或物理作图的比较基因组学研究;例如,对斑马鱼基因组研究发现斑马鱼与人类大约70%的蛋白编码基因相似,并且已确定的人类疾病相关基因中有84%可以在斑马鱼中找到对应基因[13]。Jiao等建立贝类全基因组选择育种分析评估系统时,利用种群、个体间的遗传标记分型技术检测变异后与性状间进行连锁,研发了低成本、高通量遗传标记分型技术[25]。 3.3基因編辑技术
基因组编辑技术是在基因组水平上对特定位点DNA序列进行突变、插入或缺失等改造的遗传操作技术,基因编辑不同于RNAi引起基因的“上调”或“下调”,是对基因组的永久改变。目前,测序技术和算法工具日新月异,但无论模式或非模式生物基因组编辑技术的研究仍然相对滞后,并且还存在诸多局限。基因组编辑是基于DNA双链断裂(double strand break,DSB)和机体的修复机制所产生的新技术。其中,修复机制主要包括:(1)非同源重组末端连接(non-homologous end joining,NHEJ)修复;(2)同源重组(homologous recombination,HR)修复;(3)单链退火(single strand annealing,SSA)修复。制造DSB过程中,天然切割核酸酶识别序列单一、难改变靶标,现常使用人工核酸内切酶(engineered endonuclease,EEN):锌指核酸酶(zinc-finger nucleases,ZFNs)、类转录激活因子式核酸酶(transcription activator-like effector nucleases,TALENs)[40-42]、归巢核酸内切酶和RNA靶向编辑技术成簇间隔的短回文重复序列系统(clustered regularly interspaced short palindromic repeat sequences,CRISPR-associated genes;CRISPR/Cas)[41]等。
CRISPR/Cas9系统通过将入侵病毒或外源DNA片段整合到CRISPR中,并利用相应的CRISPR RNAs(crRNAs)来指导同源序列的降解,从而提供免疫性;是细菌和古细菌在长期演化过程中形成的一种特异性免疫保护机制,可抵抗入侵的病毒及外源DNA[43]。在细菌及古细菌中,CRISPR系统共分成3类,其中Ⅰ、Ⅲ类需要多种CRISPR相关蛋白(Cas蛋白)共同发挥作用,而Ⅱ类系统只需要1种Cas蛋白即可,这为其能够广泛应用提供了便利条件[44-45]。由于PAM(proto-spacer adjacent motifs)序列结构(5′-NGG-3′)简单,几乎可以在所有的基因中找到大量靶点,如今CRISPR/Cas技术在可编辑位置、拓展性和操作等方面都表现出强大的优势,但CRISPR/Cas的特异性不高,靶向识别序列存在1个或多个错配依然能被剪切,所以现在面临的最大问题是脱靶效应(off-target effect)即基因组中非目标位置产生非必要的DNA突变[44,46]。解决这一问题可根据基因组数据改变sgRNA的设计策略,提高Cas9核酸酶特异性如双切口酶法,Mali等开发的DB-PACE方法可大大提高核酸酶的DNA结合能力和切割特异性[47];Zhang等确定了金黄色葡萄球菌Cas9复合物(SaCas9)的晶体结构,还证实该酶的高效DNA切割和精确的DNA靶向[48]。
斑马鱼具有饲育容易、胚胎透明、体外受精、突变种多、遗传学工具成熟等诸多优点,是研究基因编辑的模式动物[2]。Zu等应用斑马鱼研究同源重组中的TALEN精确突变[49];Lundgren等对CRISPR在斑马鱼中的编辑研究进行综述,为进一步研究CRISPR系统提供参考[50]。
4展望
每个全基因组序列的完成就意味着基因多样性的完善和对这一物种基因组进行开发利用的开端,基因研究的基本任务是研究、编辑和利用目的基因,即开发人们需要有优良性状的基因产物,尤其致病基因在临床医药应用具有很高的开发价值,面对尚不清楚功能的基因,随着研究的深入,也可能成为具有高开发价值的功能基因。基于已测得的水产动物全基因组序列图谱,结合比较基因组学研究方法,通过RNAi和基因编辑验证、改善基因功能,对基因组进行深度解析,了解水产动物基因组结构和功能特征,极大地推动研究者对水产动物基因组的有效开发和深度利用,从而批量发掘生长、生殖、抗逆等重要性状相关功能的基因,研究其作用机理和调控网络,明确基因型与表型关联性,为深入开展水产动物遗传育种工作提供基因资源。研究分子设计育种的理论和方法,分析基因、系统调控网络对环境的反应,开发生长、发育、抗性等技术平台,为性状改良和品种培育提供理论基础。开发编码具有特殊营养或应用价值的多肽和蛋白基因,筛选水产动物特有的药物功能基因或药物合成相关的功能基因。同时,各种技术也需要协作使用,如:NimbleGen序列捕获芯片与454测序技术相结合可以检测完整的人类外显子组[52],微阵列分析和RNAi技术相结合可提高靶定基因过程的特异性和效率等。基因表达谱、同位素标记相对和绝对定量蛋白质组学技术和糖微阵列技术等多种组学技术综合应用开发水产动物的生命资源也是必然趋势。
参考文献:
[1]李振刚. 分子遗传学[M]. 3版.北京:科学出版社,2012:17-25.
[2]桂建芳. 水生生物学科学前沿及热点问题[J]. 科学通报,2015,60(22):2051-2057.
[3]Shendure J,Ji H. Next-generation DNA sequencing[J]. Nature Biotechnology,2008,26(10):1135-1145.
[4]Chen Y S,Lee C H,Hung M Y,et al. DNA sequencing using electrical conductance measurements of a DNA polymerase[J]. Nature Nanotechnology,2013,8(6):452-458.
[5]Niedringhaus T P,Milanova D,Kerby M B,et al. Landscape of next-generation sequencing technologies[J]. Analytical Chemistry,2011,83(12):4327-4341. [6]Feng Y,Zhang Y,Ying C,et al. Nanopore-based fourth-generation DNA sequencing technology[J]. Genomics,Proteomics
关键词:基因组;测序技术;功能基因组学;水产动物
中图分类号: Q789;S917文献标志码: A
文章编号:1002-1302(2017)15-0001-06
细胞是生命活动的基本单位,基因则是细胞进行遗传活动的物质基础。基因具有一致性、稳定性和连续性;不同的细胞、基因存在个体差异性,研究基因遗传信息的差异对理解生命演变具有重要意义[1]。基因组学的研究分为结构基因组学和功能基因组学,及其延伸学科为转录组学、蛋白质组学、代谢组学和系统生物学等。基因组学研究工具有研究基因组结构的测序技术、DNA分子标记技术和基因芯片等,研究功能基因的技术有转基因、基因敲除、反义技术、RNAi技术和基因编辑技术等。测序技术为基因组研究提供大量准确精细的数据,推动了基因组学、系统生物学等学科的发展。DNA分子标记技术和基因芯片主要应用于遗传图谱的构建,对重要经济性状基因的定位和图位克隆,给基因组结构和功能研究提供强大的辅助育种基础。基因敲除技术、小分子干扰RNA、反义技术、转基因技术、抗体技术和基因编辑技术等是对一个或多个靶基因的研究,还有针对多重靶标的化学基因组学;这些都是在了解基因组结构基础上,对基因组的功能验证和开发利用,同时基因组学技术的应用也开始由实验室研究走向染色体疾病检测、病毒与细菌鉴定和肿瘤检测等临床应用。
蓬勃发展的基因组学为水产动物的研究提供了方向,基因组学研究技术也为水产动物的基因组结构和功能研究提供了有力工具。人类基因组计划完成初始,水产动物的基因组研究还停留在关键基因克隆和部分经济性状基因的标记育种中,随着测序技术、DNA分子标记和基因敲除等技术的引入,基因组学在水产动物中的研究应用日新月异,已成为生物学研究的热点。水产动物研究操作方便、与人类基因有许多共同点,因此用作解决遗传、发育和免疫等生命相关科学问题的模式动物。基因组学技术推进水产动物基因组结构和功能的研究,有利于解析和诠释水产动物生物学现象的遗传基础和分子机制[2]。开展重要水产生物功能基因组学研究,得到与抗病、抗逆、生长、生殖等重要性状相关的功能基因,明确这些基因的遗传基础、功能和表达调控机制,可为水产养殖、抗病育种及生殖调控提供具有重要应用价值的基因资源。
1基因组测序技术
1.1测序技术的研究进展
人类基因组计划完成以来,成本低、速度快的测序技术得到飞速发展,为生命科学研究作出了卓越贡献。2000年人类基因组草图完成时,仅42个物种拥有全基因组序列,至2015年在NCBI数据库中已有774种动物和植物具有基因组序列。Sanger等提出双脱氧链合成终止法测序技术,开启了全基因组测序时代,其后基于焦磷酸法和链接酶法测序原理的第二代高通量测序(next-generation sequencing,NGS)技术迅速成为了现在研究基因组结构的重要工具;基于单个分子信号检测的DNA测序被称为单分子测序(single molecule sequencing,SMS)或称为第三代测序(third generation sequencing,TGS)和第四代纳米孔测序研究也走入我们的视线[3-4]。各大测序公司都推出自己的平台,其原理各有不同,并在通量、读长、准确度、速度和成本等方面也不相同,但均在基因组测序、重测序、转录组和表观遗传学等研究中发挥了重要作用,并逐渐应用于个性化医疗和遗传诊断等临床服务。目前,主流运用的NGS测序技术中Illumina的测序性价比高,Roche的测序片段较长,ABI的准确度相对略有优势,为研究提供了更多选择。各代测序技术也在原有的基础上更新,如Thermo公司最新的NGS系统Ion S5和Ion S5XL在测序时间、总数据量、平均深度以及总读数都较其他二代测序技术突出[5]。第四代纳米孔测序,虽然商业化测试的仅有Oxford Nanopore[6]和GenapSys这2家公司,但其在价格、通量和时间等方面的优势,把进行个人基因组测序成为可能。除全基因组测序技术外,还有一些针对基因组内特殊问题专门应用的测序技术,如:Koh等[7]、Ding等[8]分别研发的Ribose-seq、emRiboSeq和EndoSeq测序技术,可鉴定和定位在DNA复制、修复过程中插入基因组中的核糖核苷酸分子,完善了全基因组序列信息。
通过测序技术测出一个物种基因组序列片段,需经过组装拼接,最终获得该物种基因组序列图谱,并应用于基因组学研究当中,方可全面了解一个物种的基因组组成、基因调控和分子进化等。根据某一物种基因组的复杂程度可分为简单基因组测序和复杂基因组测序2类,利用以RAD、GBS技术为基础的简化基因组测序技术可在极短的时间内开发出成千上万的SNP标记,是当前测序技术的一种热门应用[9]。测序方法策略有基因组从头测序、基因组重测序、泛基因组测序,还有针对性较强的线粒体基因组测序、全基因组甲基化测序、外显子组深度测序等。基因组一般测序从基因组水平上对物种的生长、发育、进化、起源等重大问题进行研究,将加深我们对物种的认识,在新基因的发现、物种改良等方面发挥巨大作用;基因组重测序可以寻找出大量的单核苷酸多态性位点(SNP)、插入缺失位点(insertion deletion,InDel)、结构变异位点(structure variation,SV)和拷贝数变异(copy number variation,CNV)等变异信息,在群体水平上研究物种的进化历史、环境适应性、自然选择等方面,从而获得生物群体的遺传特征,有助于快速发现与动植物重要性状或人类疾病相关的重要变异基因等;外显子组深度测序能够经济高效地检测一个物种基因组中全部外显子区域,最直接体现基因功能,进而发现与蛋白质功能变异相关的遗传突变;甲基化组测序可绘制单碱基分辨率的DNA甲基化图谱,用于研究特定DNA区域甲基化与特定表型之间的关联,为疾病发生与治疗的相关研究提供基础;目标区域深度测序是指对感兴趣的特定基因组区域进行高通量测序,寻找与各种复杂疾病相关的致病基因和易感基因[10]。 1.2测序技术在基因组学研究中的应用
目前,研究者已经对40多种常见水产动物进行基因组测序(表1),为水产动物研究与应用提供了一大批与生长、发育、繁殖、营养、免疫、抗逆等相关的候选基因,同时全基因组的功能注释也为水产生物物种特有生物学现象的遗传基础和分子机制解析提供了全方位基因层面的生物信息证据,丰富了水产动物的遗传资源,也为物种进化研究提供参考。由于水产动物基因组结构复杂,重复序列高,经济、快捷、目的性较强的简化基因组测序和外显子组深度测序将是水产动物基因组研究的重要方法之一。
抗逆是水产动物基因组应用研究的一大热点,同时也是育种的新思路。Colbourne等对水蚤基因组的测序,使水蚤成为首个完成基因组测序的甲壳类动物[11]。研究显示,水蚤基因组大小仅200 Mb,却包含30 907个基因,大约是人类基因的1.3倍,超过1/3的基因为水蚤世系所独有;分析认为水蚤基因组内含有较少的非编码DNA和较高的基因重复率,使其拥有较多的基因。功能研究水蚤基因家族共表达及其在代谢信号通路中的作用证实重复并非随机分布,其中大部分旁系同源基因在不同环境中具有不同的表达模式;分析水蚤独有基因发现这些基因对生态环境变化极其敏感,为研究生活在淡水中的生物如何适应环境变化提供了分子基础。牡蛎维持调控近海和内湾生态系统的稳定,是潮间带极端环境的代表物种,Zhang等采用fosmid合并策略(针对高度复杂性和多态性的基因组)测序并组装了太平洋牡蛎基因组约559 Mb,预测拥有 28 027 个基因[12]。对数据分析,发现针对环境压力变化热休克蛋白70有助于牡蛎耐受高温,存在以48个凋亡抑制蛋白基因为主的抗凋亡系统,这些基因和旁系同源基因通过调控自身的基因表达,使得牡蛎能较好地适应和应对环境压力;发育方面研究显示与机体体节发育相关的Hox基因簇被破坏;同时该团队也对贝壳的形成进行研究,在贝壳中鉴定出259种贝壳蛋白,大部分为非分泌性蛋白,贝壳基质与动物的结缔组织、基底膜的细胞外基质具有相似性,如血细胞及外来体参与调控纤丝的形成。
大数据的基因组对免疫应答和免疫细胞信号传导等免疫学基础研究产生很大的影响,并为疾病诊断与治疗提供新线索。斑马鱼是一种常用的重要模式生物,其透明胚胎特别适合进行发育,Howe等研究发现斑马鱼与人类共享约70%的蛋白编码基因,且与人类疾病相关基因中有84%可以在斑马鱼中找到对应基因,目前在斑马鱼中已经鉴定出与人类疾病有关的3 188个基因突变[13-14]。水产养殖的黄鱼极易受到细菌、病毒和寄生虫传染,黄鱼抗病力下降显著地影响了水产业,Wu等绘制了大黄鱼基因组序列草图,并证实受到正选择作用的快速进化基因富集在与先天免疫相关的一些信号通路上,并鉴别出一些先天防御基因如Toll样受体、白细胞介素和肿瘤坏死因子等在感染后显著下调,揭示出大黄鱼具有发育良好的先天免疫系统[15]。
漫长的历史进化过程中,物种内和物种之间的基因组存在差异,研究这些差异和其稳定的遗传是研究进化的核心。从事比较基因组学研究的Simakov等对帽贝(Lottia gigantea)、海蠕虫(Capitella teleta)和水蛭(Helobdella robusta)3个冠轮动物(Lophotrochozoans)进行基因组测序,研究小组还开发用于快速简便搜索基因组间相似性的计算工具来比较分析各物种基因组的差异,成功追踪17个结构相似对称动物共同祖先的“祖先连锁群”(ancestral linkage groups),分析功能并测试进化过程的假说[16]。
2DNA分子标记和生物芯片技术
2.1DNA分子标记技术研究进展
DNA分子标记能够反映生物个体或种群间基因组中某种差异特征的DNA片段,是重要的生物標记之一,具有成本低廉、操作简单和信息量大等特点,是开展遗传作图、关联分析、群体遗传分析以及生态多样性分析等研究的基础。DNA分子标记技术分为:基于DNA和DNA杂交的RFLP、DAF和原位杂交等;基于PCR技术的RAPD、AFLP、STS、SCAR、SRAP和RP-PCR等;基于重复序列为基础的微卫星DNA、小卫星DNA、SSR、和SRS等;基于DNA测序分析的EST、SNP、CNV和线粒体DNA标记等[17-18]。AFLP和SNP位点分布广泛的特点决定了其在高饱和度遗传图谱构建中将发挥重要作用;SSR应用广泛、多态性高的特点适合于不同家系和群体遗传图谱的比较和整合,但须筛选出微卫星标记,才能在QTL定位和连锁图谱构建中发挥更大的作用;EST标记和其他遗传标记应用将为基因定位与克隆、比较基因组研究和物理图谱的构建起到关键作用;DNA条形编码技术可准确、快速、有效地进行物种鉴定;与芯片杂交合用的多样性序列芯片技术(diversity arrays technology,DArT)较广应用于基因组型分析研究中[18-19]。分子标记技术广泛应用于遗传连锁图谱的构建、遗传多样性分析、种质资源鉴定、重要经济性状基因定位、图位克隆和物种系统发育等方面。
虾、蟹等水产动物基因组研究相对滞后,水产动物的生长、繁殖、抗逆和抗病等重要数量性状研究大多还是依赖DNA分子标记技术。水产动物中的分子标记研究较多也较成熟,国内外学者利用分子标记对水产动物进行遗传多样性分析、遗传结构和种质资源的鉴定[20],在重要水产动物中筛选出重要性状相关的功能基因[21-22],阐明了其中一些重要基因的功能及其表达调控机制,并剖析其相关遗传基础,为生长发育、生殖调控、抗病育种和水产养殖等提供一大批具有重要潜在价值的基因资源库。物种进化的本质是基因组的进化,分类学中可利用DNA分子标记精确分析其速度和种属分类[23-24],同时利用分子标记在有关物种间进行遗传或物理作图的比较基因组学研究;例如,对斑马鱼基因组研究发现斑马鱼与人类大约70%的蛋白编码基因相似,并且已确定的人类疾病相关基因中有84%可以在斑马鱼中找到对应基因[13]。Jiao等建立贝类全基因组选择育种分析评估系统时,利用种群、个体间的遗传标记分型技术检测变异后与性状间进行连锁,研发了低成本、高通量遗传标记分型技术[25]。 3.3基因編辑技术
基因组编辑技术是在基因组水平上对特定位点DNA序列进行突变、插入或缺失等改造的遗传操作技术,基因编辑不同于RNAi引起基因的“上调”或“下调”,是对基因组的永久改变。目前,测序技术和算法工具日新月异,但无论模式或非模式生物基因组编辑技术的研究仍然相对滞后,并且还存在诸多局限。基因组编辑是基于DNA双链断裂(double strand break,DSB)和机体的修复机制所产生的新技术。其中,修复机制主要包括:(1)非同源重组末端连接(non-homologous end joining,NHEJ)修复;(2)同源重组(homologous recombination,HR)修复;(3)单链退火(single strand annealing,SSA)修复。制造DSB过程中,天然切割核酸酶识别序列单一、难改变靶标,现常使用人工核酸内切酶(engineered endonuclease,EEN):锌指核酸酶(zinc-finger nucleases,ZFNs)、类转录激活因子式核酸酶(transcription activator-like effector nucleases,TALENs)[40-42]、归巢核酸内切酶和RNA靶向编辑技术成簇间隔的短回文重复序列系统(clustered regularly interspaced short palindromic repeat sequences,CRISPR-associated genes;CRISPR/Cas)[41]等。
CRISPR/Cas9系统通过将入侵病毒或外源DNA片段整合到CRISPR中,并利用相应的CRISPR RNAs(crRNAs)来指导同源序列的降解,从而提供免疫性;是细菌和古细菌在长期演化过程中形成的一种特异性免疫保护机制,可抵抗入侵的病毒及外源DNA[43]。在细菌及古细菌中,CRISPR系统共分成3类,其中Ⅰ、Ⅲ类需要多种CRISPR相关蛋白(Cas蛋白)共同发挥作用,而Ⅱ类系统只需要1种Cas蛋白即可,这为其能够广泛应用提供了便利条件[44-45]。由于PAM(proto-spacer adjacent motifs)序列结构(5′-NGG-3′)简单,几乎可以在所有的基因中找到大量靶点,如今CRISPR/Cas技术在可编辑位置、拓展性和操作等方面都表现出强大的优势,但CRISPR/Cas的特异性不高,靶向识别序列存在1个或多个错配依然能被剪切,所以现在面临的最大问题是脱靶效应(off-target effect)即基因组中非目标位置产生非必要的DNA突变[44,46]。解决这一问题可根据基因组数据改变sgRNA的设计策略,提高Cas9核酸酶特异性如双切口酶法,Mali等开发的DB-PACE方法可大大提高核酸酶的DNA结合能力和切割特异性[47];Zhang等确定了金黄色葡萄球菌Cas9复合物(SaCas9)的晶体结构,还证实该酶的高效DNA切割和精确的DNA靶向[48]。
斑马鱼具有饲育容易、胚胎透明、体外受精、突变种多、遗传学工具成熟等诸多优点,是研究基因编辑的模式动物[2]。Zu等应用斑马鱼研究同源重组中的TALEN精确突变[49];Lundgren等对CRISPR在斑马鱼中的编辑研究进行综述,为进一步研究CRISPR系统提供参考[50]。
4展望
每个全基因组序列的完成就意味着基因多样性的完善和对这一物种基因组进行开发利用的开端,基因研究的基本任务是研究、编辑和利用目的基因,即开发人们需要有优良性状的基因产物,尤其致病基因在临床医药应用具有很高的开发价值,面对尚不清楚功能的基因,随着研究的深入,也可能成为具有高开发价值的功能基因。基于已测得的水产动物全基因组序列图谱,结合比较基因组学研究方法,通过RNAi和基因编辑验证、改善基因功能,对基因组进行深度解析,了解水产动物基因组结构和功能特征,极大地推动研究者对水产动物基因组的有效开发和深度利用,从而批量发掘生长、生殖、抗逆等重要性状相关功能的基因,研究其作用机理和调控网络,明确基因型与表型关联性,为深入开展水产动物遗传育种工作提供基因资源。研究分子设计育种的理论和方法,分析基因、系统调控网络对环境的反应,开发生长、发育、抗性等技术平台,为性状改良和品种培育提供理论基础。开发编码具有特殊营养或应用价值的多肽和蛋白基因,筛选水产动物特有的药物功能基因或药物合成相关的功能基因。同时,各种技术也需要协作使用,如:NimbleGen序列捕获芯片与454测序技术相结合可以检测完整的人类外显子组[52],微阵列分析和RNAi技术相结合可提高靶定基因过程的特异性和效率等。基因表达谱、同位素标记相对和绝对定量蛋白质组学技术和糖微阵列技术等多种组学技术综合应用开发水产动物的生命资源也是必然趋势。
参考文献:
[1]李振刚. 分子遗传学[M]. 3版.北京:科学出版社,2012:17-25.
[2]桂建芳. 水生生物学科学前沿及热点问题[J]. 科学通报,2015,60(22):2051-2057.
[3]Shendure J,Ji H. Next-generation DNA sequencing[J]. Nature Biotechnology,2008,26(10):1135-1145.
[4]Chen Y S,Lee C H,Hung M Y,et al. DNA sequencing using electrical conductance measurements of a DNA polymerase[J]. Nature Nanotechnology,2013,8(6):452-458.
[5]Niedringhaus T P,Milanova D,Kerby M B,et al. Landscape of next-generation sequencing technologies[J]. Analytical Chemistry,2011,83(12):4327-4341. [6]Feng Y,Zhang Y,Ying C,et al. Nanopore-based fourth-generation DNA sequencing technology[J]. Genomics,Proteomics