论文部分内容阅读
太湖猪(Sus scrofa)是分布于我国太湖流域的地方猪种,因繁殖力高而著称,且其兼具抗病性强、肉质鲜美、耐粗饲等诸多优点,是生猪遗传改良的重要资源。但太湖猪也存在生产性能较弱的显著劣势,常规育种及常用的分子育种方法对于生长性能的选择往往会带来其他性状性能降低的副作用。基因编辑是能够实现对目标DNA序列精准编辑的技术,若能够在基因组水平上比较中西方品种的差异,预测太湖猪可通过基因编辑提高生产性能的位点,无疑将为进一步揭示猪的重要经济性状遗传机制、改良我国地方品种遗传资源起到极大的推动作用。然而目前大部分研究的方向主要是sgRNA的编辑效率及脱靶概率,或者针对单个基因或位点设计CRISPR/Cas9靶位点,很少有报道关于适合利用基因编辑提升畜禽性能的靶点的筛选和最优sgRNA的推荐的研究。全面系统的综合7个太湖群体与西方品种的基因组信息进行靶点筛选和sgRNA推荐的研究工作目前尚未见报道。因此,本研究利用458头太湖地方品种猪和西方品种猪的测序数据,结合猪数量性状基因座(Quantitative Trait Locus,QTL)数据库、基因本体(Gene Ontology,GO)、通路分析(Ingenuity Pathway Analysis,IPA)数据库等生物信息学技术,开展了以下研究:1、依据猪QTL数据库筛选得到猪生长相关QTL1052个,并映射QTL中所含基因10352个,利用GO-Sim软件计算各基因和生长相关GO语义相关性,得到二级候选基因428个。利用IPA数据库对候选基因的通路分析结果证明获得的候选基因与胚胎发育(Embryonic Developm-ent)、机体发育(Organismal Development)、细胞生长(Cellu lar Grow-th)、骨骼和肌肉系统发育(Skeletal and Muscular Phylogen y)等功能相关。2、完成了对猪基因组中PAM位点和前导间区序列的筛选与分析。在猪基因组中,共检测到127,353,502个前导间区序列邻近基序(protospacer adjacent motif,PAM)位点,平均每20-bp存在1个PAM位点,共观察到5种PAM类型,包括TGG、AGG、GGG、CGG和NGG,占比分别为34.52%,32.61%,26.43%,6.43%和0.0082%。结果表明猪基因组中包含大量PAM位点和前导间区序列,可通过使用CRISPR/Cas9系统进行基因组编辑。3、完成了对太湖猪特异的SNP筛选与注释,结果显示各个太湖群体的特异SNP数量大约在30000~40000个左右,分布较为均匀,将特异SNP映射到生长相关候选基因后,筛选得到太湖猪群体二花脸、枫泾、嘉兴黑、米猪、中梅山、沙乌头、小梅山的生长相关特异SNP数量分别为412、282、372、414、393、279、458个,各个品种间没有显著的数量差异。在此基础之上利用公式(1-3)计算得分,作为各个太湖群体的推荐的生长相关基因编辑位点。4、筛选各太湖群体生长相关基因编辑位点上下游共100-bp范围内所有可能的sgRNA,并对每一个得到的sgRNA进行脱靶分析和编辑效率预测,依据得分,本研究为上文中7个太湖群体中的每一个基因编辑位点提供4个最优的sgRNA,为利用基因编辑提高太湖猪的生产性能提供数据基础。5、为了共享目前关于适宜太湖猪生长相关基因编辑位点的相关研究结果,方便其他相关研究者能够快速的获取本论文的研究数据与结果,我们搭建了GSGE网络数据平台。该平台主要提供相关结果的查询与浏览,包括品种特异SNP及其具体得分情况;候选基因信息的查询浏览及通路可视化;sgRNA脱靶分析结果;最优sgRNA推荐等功能。本文在缺少猪生长相关候选基因数据库的情况下,利用多种生物信息学手段对候选基因进行分析。考虑太湖群体与西方群体的遗传差异是造成两者生产性能差异的决定性因素,又综合分析了品种特异SNP所在基因GOSim值(即与生长性状相关性)、SNP卡方检验P值(即不同品种间等位基因频率差异)和是否位于基因启动子位置等信息预测适宜太湖猪生长相关基因编辑的位点,为后续研究提供数据基础。最后我们建立了一个网络数据库平台GSGE(Growth Sites for Gene Editing),共享前述分析得到的适宜太湖猪生长相关基因编辑位点的相关研究结果,方便其他相关研究者能够快速的获取本论文的研究数据与结果。