论文部分内容阅读
目的:对名贵药用植物人参进行全基因组测序、组装和初步的生物信息学分析,并初步分析其中的微卫星(SSR)位点,开发微卫星引物,以期为人参的分子生物学、功能基因组学和辅助育种等研究提供全基因组水平的背景支持。方法:通过第二代高通量测序技术(Illumina Hiseq2000测序技术)对野山参、大马牙、二马牙、高丽参、西洋参五种参类进行全基因组测序,并对序列进行初步的校正拼接组装。使用MISA程序查找人参基因组中的微卫星序列,并对其分布特征进行了统计分析和深入探讨;然后,截取SSR位点及其上下游序列,将这些SSR区域在五种参类之间进行同源比对,对于在五种参类中表现出多态性的位点,使用Primer3软件设计SSR引物,如此设计出的引物多态性比例会非常高。利用全基因组测序reads,与已有的所有叶绿体基因组进行比对,进行过滤,选取与已有叶绿体序列同源的reads进行拼接组装,以期得到人参的完整叶绿体基因组序列。结果:测定了五种参类的基因组,覆盖度大致在66倍至134倍,测序平均读长为100bp,将校正过的reads进行初步的拼接组装后,其中大马牙得到长度在200bp以上的contig有2324338条,长度在500bp以上的contig有320628条contig,最长的contig为15438bp,scaffold有524051条,总长度达到了3,036,436,415bp。选取长度在200bp以上的coting序列在五种人参基因组中进行微卫星SSR的查找与统计。在野山参基因组中总共找到311992个SSR位点,其中以二核苷酸重复类型的SSR数目最多,其次是单核苷酸重复、三核苷酸重复类型。选择在五种参类中存在多样性的SSR位点(67处)进行了引物设计。从人参的测序数据中,比对筛选得到叶绿体同源的reads,然后Velvet、Cap3和Gapcloser等软件进行拼接组装,结果显示大马牙人参叶绿体基因组序列总长度为147309bp。对大马牙人参叶绿体基因组序列进行了注释,结果显示有154个基因,包含了光合作用相关基因、tRNA基因、rRNA基因、核糖体蛋白基因等。在人参叶绿体基因组序列中检测SNP位点,得到可用于鉴别人参品种的单核苷酸多态性候选差异位点58个,其中23个位点位于基因编码区,在线粒体同源序列区域则检测到3250个潜在的SNP位点,并进行了测序验证。结论:本研究采用第二代测序平台进行了大规模的人参基因组测序,原始数据覆盖了人参基因组的66倍到134倍,进行了初步的拼接组装之后,从全基因组水平进行了SSR位点的查找,并根据五种参类存在的多态性位点,设计了SSR引物。同时创新性的利用全基因组测序数据,筛选、拼接得到人参叶绿体基因组序列,方便快捷,而且可以从叶绿体基因、线粒体同源序列中检测单核苷酸多态性SNP位点,高效利用了测序数据。本研究为后续人参的功能基因组学研究以及分子育种提供基因组背景。