通用型RGEN基因编辑位点筛选系统开发及优选位点数据库构建

来源 :西北农林科技大学 | 被引量 : 0次 | 上传用户:gjsh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工核酸内切酶的不断研发和改进,位点特异性基因编辑逐渐成为多个物种各研究领域的热门技术。近年来,源于酿脓链球菌的Cas9蛋白(SpCas9)由于其高效率、多功能和便于操作等特点已经成为最受欢迎的RNA介导的核酸内切酶(RGEN),广泛应用于各物种基因组靶位点修饰相关研究中。尽管CRISPR/Cas系统已经公认具有较高的靶位点编辑活性,但是这项技术造成的相对较高的脱靶突变率仍然是影响应用效果和范围的主要难题。先前的研究发现,Cas9等RGEN引起的脱靶效应具有一定的规律性。单链引导RNA(sgRNA)序列中与前间区序列临近基序(PAM)相邻的8到12个碱基决定Cas9蛋白的结合特异性,而Cas9-sgRNA打靶系统的脱靶位点与靶序列相比最多具有10个错配碱基。因此安全性是基因编辑技术研究与应用过程中的重要考虑因素。目前GUIDE-seq是鉴定RGEN引发的脱靶突变的最准确的方法。利用该突变检测技术在Cas9等基因打靶研究中发现了一些脱靶发生率极低的靶位点序列,这些位点的预测脱靶位点数量也相对较少。这个现象说明通过计算机程序预先分析和评估脱靶效应是提高定点打靶技术的特异性和安全性的重要环节。目前,虽然已经有多款CRISPR/Cas系统相关的应用程序发布,但是其中大部分为在线软件,在sgRNA的模式、输入序列长度、物种等方面具有一定的限制,仅适用于某些物种的小规模分析。而提供可下载版本的程序主要为Perl语言脚本,不便于大部分不能熟练编程和使用程序语言的生物学研究人员使用。更重要的是,现有的RGEN相关程序由于受到算法选择的限制,导致在全基因组范围内预测的脱靶位点不完全,造成靶位点脱靶效应被低估,不利于后续实验研究。此外,随着高通量测序技术的发展,越来越多的研究聚焦于利用RGEN技术进行全基因组大规模筛选,鉴定与细胞活性、耐药性以及肿瘤发生发展相关的重要基因。因此,迫切需要适用于大规模RGEN编辑技术的方便快捷具有通用性的生物学软件。本研究利用新算法开发了RGEN相关的综合应用程序TQPF(Tremendous Qualified Pattern Finder)。通过对牛和人全基因组序列进行大规模靶位点和脱靶效应分析,探究安全基因组打靶的规律,构建含脱靶位点信息的优选靶位点数据库CRISPRBase,并提出一个评分体系作为靶位点筛选的重要参考标准,为后续试验研究提供安全可靠的打靶位点提供方法。本研究的主要内容如下:1.设计并开发了一个多功能应用程序包TQPF,由“Pattern Finder”“OT Searcher”和“One Step Off-Target Analysis”三部分组成,采用“流水-管道”式核心算法,适用于包括简并碱基在内的任意模式序列的区配搜索,全基因组范围脱靶位点扫描以及快速分析预测结果。“流水-管道”算法可以实现快速读取碱基序列,对全基因组进行无偏差扫描。高度自定义设计功能、用户友好型界面、方便和强大的数据分析功能以及可扩展的应用范围等特点使TQPF软件优于其它程序。2.通过小样本检测寻找脱靶突变的发生规律,根据在此过程中产生的原始数据规模评估全基因组靶位点筛选适用的参数。结果证明与靶位点相比具有较少错配碱基的位点易真正发生脱靶突变。考虑到原始数据的生成量和计算机存储能力,确定以最大碱基错配数为6的脱靶位点合集来评估全基因组靶位点的安全性。3.设计以TQPF程序为主要工具的大规模靶位点筛选流程,并对牛全基因组和人癌症及胚胎发育基因合集序列进行CRISPR/Cas9靶位点筛选和脱靶效应预测。在此基础上构建CRISPRBase数据库,便于大规模靶位点数据的存储、检索和更新。4.CRISPRBase共收录经过初步筛选流程得到单独存在于基因组上的的2293508条牛靶位点序列和727886条靶向10116个与人癌症及胚胎发育相关基因的位点序列。分析数据库中这些低风险靶位点在基因组中的位置分布并总结规律。在全基因组脱靶位点统计信息规律的基础上,提出“靶位点评级体系”,为快速筛选靶位点提供参考标准,帮助评估和选择安全打靶位点。5.筛选数据库中符合“TTTVN20NGG”模式的Cpf1和Cas9通用靶位点序列,分析其概率、染色体区域分布和基因覆盖度,为多用途打靶位点筛选提供参考。6.对牛奶蛋白基因CSN1S1、CSN1S2、CSN2和BLG序列以及24号和28号染色体的基因间隔区序列的靶位点进行筛选,选择位置合适、潜在脱靶位点数量较少的靶序列进行切割效率检测。利用重组分析检测靶位点被Cas9蛋白造成DNA双链断裂诱发同源重组的效率。结果表明被筛选出的靶位点均可以被Cas9蛋白切割并引发同源重组修复,其中CSN2位点的切割效率最高,可以作为奶牛乳腺生物反应器的高效率安全靶位点。综上所述,本研究提出的TQPF程序是一个适用于用户自定义高通量模式序列筛选和分析的综合应用软件,其采用的“流水-管道”式新算法实现了全基因组快速无缝扫描,使搜索结果更加准确。此外,本研究构建了CRISPRBase数据库提供优选靶位点及其详细信息,并揭示了全基因组范围RGEN靶位点和脱靶效应的特征。因此,本文的研究结果可以降低基因组编辑技术过程中潜在的安全隐患,由此促进RGEN介导的位点特异性打靶的应用。
其他文献
解旋酶普遍存在于真核生物、原核生物以及病毒体内,其功能涉及核酸代谢的各个途径,并参与介导多种细胞应激反应,其中包括细胞凋亡、衰老和自噬等,帮助细胞应对复制错误和内源性或外源性诱导的DNA损伤。此外,解旋酶途径出现缺陷将导致机体和组织的衰老以及神经系统缺陷等一系列问题。Pif1作为ATP依赖性的SF1B解旋酶,由于其在酵母中维持线粒体DNA稳定性所发挥的重要作用而被首次发现,目前所有真核生物和某些细
端粒酶是一种特殊的逆转录酶,它的核心催化区由蛋白质催化亚基—端粒酶逆转录酶(Telomerase reverse transcriptase:TERT)和RNA亚基—端粒酶RNA(Telomerase RNA:TER)两部分组成。与其他逆转录酶相比,端粒酶最大的特点就是能够以自身携带的一段RNA序列为模板,反复合成端粒DNA,从而解决真核生物线性染色体的末端复制问题,维护基因组的完整性。然而,端粒
蝎蛉科Panorpidae是长翅目Mecoptera最大的科,包含8属约500种。蝎蛉属Panorpa是蝎蛉科最早建立的属,物种多样性最为丰富,包含约270个物种。学者依据形态特征将不同区系的蝎蛉属物种划分为多个种团。中国地区雄性腹部第6节无臀角的蝎蛉被划分为大卫蝎蛉种团P.davidi group。该种团的物种在形态上存在较强的异质性,形态和分子系统发育表明,大卫蝎蛉种团是并系群,急需进行厘订。
基于石英晶体微天平(QCM)技术的生物传感器可以实时、无标记地检测生物分子的相互作用,获得亲和力和动力学等丰富的相互作用信息,为深入研究生物分子相互作用过程,进一步研究相互作用机理提供了一种强有力的检测手段,在科学研究、药物研发和疾病诊断等领域得到了广泛的应用。然而,在分子相互作用研究中,要想全面的分析生物分子的相互作用,仅依靠亲和力和动力学参数是远远不够的。生物分子结合和解离过程中的热力学参数(
牛结核病是一种由结核分枝杆菌引起的慢性免疫疾病,在畜牧业中造成巨大的经济损失并且严重危害人类公共健康。近年来,研究人员对来自中国14个省份的总计2201份血液样本进行牛结核流行性调查研究,结果显示奶牛感染结核菌的阳性率达到6.4%。尽管消灭牛结核病的计划在发达国家已经取得显著成绩,但是据权威统计,在世界范围内每年由牛结核病造成的经济损失仍然高达30亿美元。在密集养殖的状态下,使牛群达到无结核病存在
体细胞转基因技术广泛的应用于基因功能研究和转基因动物育种过程中。转基因过程是一个多步骤过程,任何阶段的效率低下都会引起基因转移系统效率降低甚至导致外源基因不能表达。因此,需要采取策略来促进外源基因透过细胞膜,通过细胞质迁移到细胞核并转运通过核膜,从而能有效地表达。微管蛋白乙酰化是一种微管常规修饰,参与多种细胞功能的调节,包括纤毛组装,细胞内运输,细胞运动,以及轴突生长。SIRT2是一种微管蛋白去乙
原牛(Bos primigenius)大约在150-200万年前起源于南亚地区,在更新世时期扩张到亚洲、非洲北部和欧洲等地区。现在的家牛在生物学分类上可分为瘤牛和普通牛,瘤牛有瘤峰,主要分布在南亚和非洲东部地区;普通牛没有瘤峰,主要分布在欧洲、非洲和亚洲。前人研究发现,瘤牛和普通牛分离时间25-100万年前。现在普遍认为,瘤牛和普通牛各自有一个驯化起源,瘤牛在8500年前在南亚地区驯化,而普通牛的
丙酮酸激酶亚型2(PKM2)是肿瘤专有代谢类型有氧糖酵解过程的关键驱动者,除了具有代谢酶活性,其在多种肿瘤中发挥的非代谢功能也逐渐被发现,使其成为癌症研究中的热点分子之一,针对PKM2作为靶点而进行的肿瘤治疗探索在多种肿瘤类型中开展。作为代谢异常的肿瘤细胞之一,胰腺癌的有效治疗手段十分有限,病人的愈后并不理想,对其发挥重要功能的新靶点以及治疗方式的探寻对于延长胰腺癌病人的生存时间具有重要意义。目前
由苹果黑腐皮壳菌(Valsa mali)引起的苹果树腐烂病,是苹果上的一种毁灭性真菌病害。一旦病菌侵入到苹果树枝干的韧皮部和木质部,生产上只能利用外科手术及化学药剂进行防治,但是化学药剂由于很难达到树皮和树干深层,无法很好的控制病害,从而导致生产上严重的产量和经济损失。因此,解析苹果黑腐皮壳菌的致病机制对于开发新的腐烂病防治策略具有重要意义。病原菌通过G蛋白所调控的cAMP/PKA(the cyc
维生素C(Vitamin C,VitC)是人和动物必需的营养物质。科学界对于VitC功能几乎所有的认识都基于它作为电子供体,即作为天然还原剂的化学性质,主要表现在VitC能够清除细胞代谢过程中产生的活性氧自由基(reactive oxygen species,ROS),保护重要的生物大分子免于氧化损伤,维持细胞的正常功能。对VitC研究的一次重大突破,在于发现VitC是亚铁离子(ferrous i