论文部分内容阅读
栉孔扇贝Chlamys farreri (Jones et Preston1904)作为双壳类的一种,是我国极具商业价值的重要经济种。本研究借助二代测序平台,建立了栉孔扇贝高通量SNP开发与分型技术,构建了高精度图谱,进行了经济性状的精细定位,绘制了基因组框架图谱,并实现了遗传图谱与序列图谱的整合,为扇贝基因组学研究提供了较为全面的序列信息和整合的资源工具,也为双壳贝类生长繁殖机制、进化适应性机制和基因组辅助育种研究提供了新的起点。1栉孔扇贝高通量SNP开发与分型技术的建立本研究首先对2b-RAD技术进行了改进和优化,包括限制性内切酶选择、选择性碱基确定和barcode设计三方面,建立了高通量SNP开发技术。本研究还开发了适合无参照基因组的非模式生物作图群体的SNP分型策略,将共显性和显性标记的分型算法整合成流程化软件RADtyping,并对其分型结果进行了评价。拟南芥拟测交F1群体模拟数据的分型结果评价显示:当亲本测序深度均超过10x,高于98%的位点源于基因组单拷贝区,说明RADtyping可有效过滤重复序列。当亲本和子代测序平均深度均达20x,共显性标记分型准确性达97%;显性标记分型准确性则在较低测序深度下就可达98%。对作图群体而言,当每个亲本和子代的平均测序深度均至少20x则可满足分型准确性的要求。通过比较两套重复测序文库分型结果发现,共显性标记一致性达96%,显性标记分型一致性达99%。对RADtyping分型得到的8个共显性和8个显性标记位点进行Sanger测序的结果显示共显性标记验证率达96%,显性标记验证率达97%,验证了RADtyping在无参照基因组SNP分型的准确性。2栉孔扇贝高精度图谱构建和重要经济性状的QTL定位本研究构建了栉孔扇贝首张高密度遗传连锁图谱。整合图谱包含3,806个SNP,分布于19个连锁群,图谱总长1543.4cM,标记平均间隔为0.41cM,基因组覆盖率达99.5%,623个SNP注释到功能基因,平均重组率为1.3cM/Mb。生长性状的QTL定位显示:于1号和3号连锁群分别检测到一个显著的QTL区间,各解释表型变异的11.4%和16.9%。关联分析结果与QTL定位有较为一致的趋势,验证了QTL定位的可靠性。3号连锁群QTL区间内的f68558标记位于转录因子PROP1(Homeobox protein prophet of Pit-1)的内含子中,已知PROP1具有调控生长激素分泌的作用,在动物中生长激素可调控生长、细胞分裂和再生,推测PROP1基因可能是控制栉孔扇贝体尺性状的主效基因。性别相关的QTL被定位于11号连锁群的0.37cM的区间,关联分析鉴别到27个显著与性别相关的标记(P <1E-6)且位于QTL定位的区间中。标记f93422位于转录因子ZNFX1(NFX1-type zincfinger-containing1)中,已有研究表明河豚中ZNFX1与性别决定基因AMHR2(anti-Mullerian hormone receptor type II)紧密连锁。本研究为解析扇贝生长和繁殖调控机制提供了候选位点。3栉孔扇贝全基因组序列图谱绘制及与遗传图谱的整合本研究根据扇贝基因组高度杂合高重复序列含量的特点,选用家系来源的一只贝为材料,搭配构建不同长度DNA插入片段文库进行测序,获得栉孔扇贝的基因组测序数据。组装采用先将两套杂合contigs分出后,单倍体基因组单独拼装再整合的策略进行栉孔扇贝全基因组框架图谱的绘制。拼接共获得143,162条scaffolds,scaffold N50为528.6Kb,总长度约805Mb;Contigs共192,003条,contig N50达到21.5Kb,总长为777Mb。基因组scaffolds覆盖了93%的转录组序列,基因预测获得20,573个基因,其中62.7%的基因获得功能注释,基于同源比对和从头预测获得的重复序列占基因组序列的12.7%。借助遗传图谱,与基因组框架图谱和物理图谱进行了整合。从染色体水平,排序了2,923条scaffolds。栉孔扇贝基因组框架图谱的获得,为解析双壳类系统进化、环境适应机制和生长、发育、繁殖等生物学问题提供了重要基础资源,同时为栉孔扇贝基因组精细图谱绘制奠定了基础。