论文部分内容阅读
水蛭(Leech)俗称蚂蟥,是环节动物门蛭纲动物的统称。营外寄生生活,短暂寄生于鱼类、爬行类、哺乳类的体表,吸血为食;或取食软体动物。其中吸血种类因在吸血过程中产生高效的抗凝血活性物质而被中、西医广泛应用于临床治疗血栓性疾病。除水蛭素外,有多种抗凝血活性物质被报道。但这些抗凝血活性物质的合成途径及其在水蛭演化中的形成过程并不清楚。基因组包含了一个物种全部的遗传信息,是生物生命活动和演化研究的基础。完整的基因组常被称为全基因组图谱,包括一个物种的全部基因序列,以及这些基因的数量、位置、功能,相互关联关系等信息。构建物种的全基因图谱不仅能为研究基因的表达机理及演化模式奠定基础,而且通过将这些基因信息与其它物种的基因组进行比较基因组研究,能够揭示生物物种形成和生理机能演化的途径和机制。但由于目前测序技术成本很高,图谱构建与分析都具有一定难度等原因,只有少数模式生物及与人类密切相关的生物进行了全基因组测序。在水蛭中仅有分布于美国,取食软体动物的泽蛭(Helobdella robusta)的全基因组被报道。中国药典收录的三种医用水蛭:日本医蛭(Hirudo nipponica),宽体金线蛭(Whitmania pigra),菲牛蛭(Hirudinaria manillensis)都没有基因组数据。对这些物种进行全基因组图谱构建与比较基因组分析,将有助于发现新的抗凝血物质、阐述其作用机制,同时可以探讨水蛭吸血习性的形成过程,为进化生物学和医学发展提供数据。本研究应用了目前先进的三代长片段Pacbio sequel测序技术,二代Illumina测序技术获得DNA与RNA数据,对日本医蛭、宽体金线蛭、以及菲牛蛭的基因组进行组装、注释,及比较基因组分析。研究结果如下:1、水蛭基因组数据获取、组装和注释本研究使用二代short-read Illumina测序分别获取了日本医蛭、宽体金线蛭、菲牛蛭12.43 Gb、12.34Gb、12.23Gb DNA序列数据,基于k-mer分布估测了基因组大小及杂合度。使用三代Long-read Pacbio SMRT cell测序分别获取了日本医蛭、宽体金线蛭、菲牛蛭17.46 Gb、13.50 Gb、14.98 Gb数据,质控后经falcon纠错,在wtdbg中完成组装。Repeatmodeler与repeatMasker联合注释重复序列,Augustus、PASA、GeMoMa、EVM等软件用于基因数量及位置的鉴定。通过与GO、KEGG、interproscan数据库blast 比对对基因功能进行注释。已知抗凝血酶蛋白序列从Swiss-prot库中下载,tBlastn 比对组装所得的基因组来寻找全部相似基因序列。使用二代short-readIllumina测序分别获取了日本医蛭、宽体金线蛭、菲牛蛭43.05 Gb、43.29 Gb、41.80 Gb的RNA序列数据。每个物种包含两组:取食前与取食后。使用Hisat2+stringtie将这些转录组reads 比对至对应的参考基因组,比对效率最好的样本用于差异基因表达分析。在Orthomcl中鉴定同源基因。单拷贝同源基因连接后在MAFFT中比对,beast中构建时间分歧发育树(Timetree)。PamlX用于计算基因进化速率。CAFE筛选的直系同源基因家族列表用于种间比较。2、日本医蛭、宽体金线蛭和菲牛蛭的精细基因组图谱构建日本医蛭、宽体金线蛭、菲牛蛭组装的基因组大小分别为170.4 Mb、164.9 Mb和 151.7 Mb,contig\scaffold N50分别为1.78 Mb、2.88 Mb、2.28 Mb。统计组装结果的scaffold数,显示日本医蛭、宽体金线蛭、菲牛蛭分别为713,467,455,最长的scaffold分别可达3.97 Mb、6.46 Mb、5.92 Mb。这些组装参数均优于现有的泽蛭Helobdella robust 基因组,与目前多数无脊椎动物基因组的测序水平相近。本研究从日本医蛭、宽体金线蛭、菲牛蛭精细基因组图谱上,分别鉴定出了23,131、20,582、21,005个基因,核心基因完整性BUSCO检测显示分别有93.1%、94.1%、90.1%的核心基因被找到。全部基因使用现有数据库进行注释,结果显示在日本医蛭、宽体金线蛭、菲牛蛭组上分别有18,493、16,884和17,051个能够获得功能注释,其中分别有167个、155个、238个与抗凝血有关。本研究还获取了日本医蛭、宽体金线蛭,菲牛蛭的高精度线粒体基因组(mitochondrial DNA,mtDNA),其长度分别为19,917、18,670、15,454。这些mtDNA基因组高度保留了多细胞动物mtDNA的基因构成(13 PCGs+22 RNAs+2 RNAs),但使用三代Pacbio测序long reads组装出的结果显示,日本医蛭与宽体金线蛭中拥有之前未发现的长达5000余bp的非编码序列。3、基于转录组的抗凝血酶基因表达模式分析基于注释的精细基因组图谱,对三种水蛭在取食前后的差异表达基因进行比较。结果显示在日本医蛭、宽体金线蛭,菲牛蛭中分别有14,356、13,549、13,360条基因在取食前后表达,其中表达的抗凝血相关基因分别有104、93、128个。包括Hirudin在内的抗凝血、促血流相关的功能基因只在日本医蛭与菲牛蛭中差异表达。而宽体金线蛭表达的抗凝血基因与医蛭相似,但表达水平差异在取食前后不明显。4、水蛭抗凝血机制的演化比较日本医蛭、宽体金线蛭和菲牛蛭的基因组,结果发现以Hirudin/Antistasin基因家族为代表的抗凝血酶基因在水蛭演化过程中发生了直系同源基因数量的增加。抗凝血酶基因的出现不是快速进化的结果。基于单拷贝同源序列建树的结果,我们推测这些基因的出现是伴随着物种分化发生的,时间节点在约65 Mya附近。该时间点上,哺乳动物在地表开始取代爬行动物,我们推测水蛭抗凝血特性是伴随着哺乳类的崛起,由食性驱动而发生共同进化的结果。宽体金线蛭的吸血、抗凝血相关基因发生了退化,仅在基因组上仍保留有序列;该物种在脂类代谢等方面发生的强进化适应是这种演化方向的体现。