论文部分内容阅读
【中图分类号】R373【文献标识码】A【文章编号】1632-5281(2015)11
摘要:密码子优化是蛋白质高效大量表达的方案之一,目前由于工业生产的需要,有些蛋白质需要大量表达以投入生产,但是在表达这些蛋白质的时候,很多都是异源表达或者基因本身序列GC含量比例不当等一些原因,导致表达量不高,还有一些是含有终止密码子或载体上的酶切序列,这些都会影响到蛋白质的表达,但这些都可以通过密码子优化,使要表达的基因序列适合相应的宿主,达到大量表达的目的。密码子优化涉及到的优化点有基因合成、载体构建、基因转录、mRNA翻译、酶切位点设计,翻译后修饰等,最终目的是使蛋白高效大量表达。
关键词密码子优化重组蛋白高效表达
随着生物技术的发展,已经有越来越多的领域利用异源表达系统生成出重组蛋白,也有很多相关学者致力于这方面的研究,在蛋白质重组表达中,很多研究者在设计方案时比较注重选择合适的表达载体和宿主系统,而往往忽视基因本身是否与载体和宿主系统为最佳匹配这样一个实质性问题。实际上基因本身也会直接影响到蛋白质的表达,如何通过对基因本身进行优化使之能够达到最优表达也应成为研究者设计方案时所注重的一点。基因的最优表达可以通过对基因的重新设计和合成来实现,本文将从以下几个方面来探讨蛋白质表达中基因的密码子优化策略。
1. 消除稀有密码子
遗传密码子有64种,但是每种生物倾向于利用的密码子不同。那些被频繁利用到的称为这种生物的最适密码子,那些不被经常利用的则称为稀有密码子。在做蛋白质重组表达过程中所用到的宿主有大肠杆菌,酵母,哺乳动物细胞,植物细胞和昆虫细胞等,这些宿主在不同程度上都表现出对密码子的偏爱,如果要表达的基因的密码子不是宿主表达所偏爱的密码子,就会影响到基因表达的速率和丰度。另外,如果稀有密码子出现在靠近蛋白质N端,或者稀有密码子连续出现3个以上,则蛋白质的翻译速率会大大降低○1。因此对稀有密码子进行改造则显得尤为重要,这可以通过基因合成来实现。
首先确定要表达某条基因之前,先确定需要用的宿主,然后查询这条基因中存在的相对于宿主的稀有密码子,这可以通过网站查询来实现,一般查询稀有密码子的网站有http://gcua.schoedl.de/seqoverall.html,通过网站查询相应宿主的稀有密码子,如果要表达的基因含有的稀有密码子太多,则需要对密码子进行优化,消除稀有密码子,将优化后的序列重新合成,如果稀有密码子不是很多,在10%以内可以则通过点突变来消除相应的稀有密码子。另外还有专门用于密码子优化的软件,如DNA 2.0。
2. 调整GC含量
研究表明,基因序列中的GC含量也是基因设计和优化中的重要指标,不同物种内GC含量显著不同,在用宿主表达外源基因时要注意外源基因的GC含量。GC含量可以间接的影响基因的表达和调控。基因GC含量过高或过低都将会影响到基因的表达,一般是使表达水平降低。可以通过基因密码子优化来调整基因内的GC含量,使之能够达到正常水平,这点可以通过基因合成来实现。基因GC含量的预测和调整一般都可以通过软件来进行分析。
3. 增加mRNA的稳定性
蛋白质的表达调控一般分为两种,即转录水平的调控和翻译水平的调控,一般转录水平的调控起到关键性的作用,但同时翻译的效率与mRNA的降解又直接相关。蛋白表达已多次被证明与mRNA的稳定性相关,但目前对于mRNA的稳定性优化不是很成熟,一方面,过高的mRNA的稳定性也就意味着高GC含量以及稳定的二级结构,这些都不利于蛋白质的高效表达,因此mRNA稳定性的优化有待进一步研究。
4. mRNA的二级结构
由于核糖体只能与单链的RNA结合起始翻译,而较大的折叠自由能可能会减缓核糖体的延伸从而降低翻译效率。因此如果mRNA形成较大且稳定的茎环结构或发卡结构,特别是在起始密码子附近形成这种稳定的二级结构将会影响mRNA在翻译过程中与核糖体的结合和延伸,从而降低翻译效率最终影响到蛋白的表达○2。因此可以通过mRNA二级结构的优化尤其是翻译起始区二级结构的优化来提高蛋白质的表达水平。
5. 其他因素
密码子优化的因素还包括密码子的重复、核糖体结合位点、起始密码子环境、终止密码子环境、酶切位点的设计、合理的接头设计、融合基因、纯化标签等,通过进一步的设计,使基因得到进一步的优化,检查无误后可进行基因合成,以用于后续的蛋白表达。
6.讨论
经过大量实验验证,经过密码子优化后的基因的表达量明显高于没有做密码子优化的基因,由此可以看出密码子的优化和蛋白质的有效表达有着密切的联系。比如Kudla等构建的包含154中不同随即密码子同义突变的GFP蛋白突变体库,研究mRNA折叠自由能对翻译效率的影响实验,以及Desmit等通过对噬菌体NS2的外壳蛋白基因的同义密码子突变体在大肠杆菌中的表达,定量分析了翻译起始区mRNA的二级结构与翻译起始效率的关系实验表明较大的折叠自由能会降低蛋白质的翻译效率。另外Punginelli等通过突变大肠杆菌FdnG信号肽的第一个精氨酸R5,降低了翻译起始区强稳定性茎环结构的形成,显著降低了mRNA该区域的折叠自由能,使蛋白质的表达增加了60倍。总之,通过有效的基因优化可以明显提高蛋白表达量,这为蛋白质的大量表达和量化生成提供了很好的前提。同时还有很多存在的问题需要去进一步的研究以达到更高的效果。
1.ClarkeTFt,Clark PL. Rare codons cluster. PLoSONE,2008,3(10):e3412.
2.Kudla G, Murray AW, Tollervey D, et al. Coding-sequence determinants of geneexpression in Escherichia coli. Science, 2009,324(5924): 255?258.
摘要:密码子优化是蛋白质高效大量表达的方案之一,目前由于工业生产的需要,有些蛋白质需要大量表达以投入生产,但是在表达这些蛋白质的时候,很多都是异源表达或者基因本身序列GC含量比例不当等一些原因,导致表达量不高,还有一些是含有终止密码子或载体上的酶切序列,这些都会影响到蛋白质的表达,但这些都可以通过密码子优化,使要表达的基因序列适合相应的宿主,达到大量表达的目的。密码子优化涉及到的优化点有基因合成、载体构建、基因转录、mRNA翻译、酶切位点设计,翻译后修饰等,最终目的是使蛋白高效大量表达。
关键词密码子优化重组蛋白高效表达
随着生物技术的发展,已经有越来越多的领域利用异源表达系统生成出重组蛋白,也有很多相关学者致力于这方面的研究,在蛋白质重组表达中,很多研究者在设计方案时比较注重选择合适的表达载体和宿主系统,而往往忽视基因本身是否与载体和宿主系统为最佳匹配这样一个实质性问题。实际上基因本身也会直接影响到蛋白质的表达,如何通过对基因本身进行优化使之能够达到最优表达也应成为研究者设计方案时所注重的一点。基因的最优表达可以通过对基因的重新设计和合成来实现,本文将从以下几个方面来探讨蛋白质表达中基因的密码子优化策略。
1. 消除稀有密码子
遗传密码子有64种,但是每种生物倾向于利用的密码子不同。那些被频繁利用到的称为这种生物的最适密码子,那些不被经常利用的则称为稀有密码子。在做蛋白质重组表达过程中所用到的宿主有大肠杆菌,酵母,哺乳动物细胞,植物细胞和昆虫细胞等,这些宿主在不同程度上都表现出对密码子的偏爱,如果要表达的基因的密码子不是宿主表达所偏爱的密码子,就会影响到基因表达的速率和丰度。另外,如果稀有密码子出现在靠近蛋白质N端,或者稀有密码子连续出现3个以上,则蛋白质的翻译速率会大大降低○1。因此对稀有密码子进行改造则显得尤为重要,这可以通过基因合成来实现。
首先确定要表达某条基因之前,先确定需要用的宿主,然后查询这条基因中存在的相对于宿主的稀有密码子,这可以通过网站查询来实现,一般查询稀有密码子的网站有http://gcua.schoedl.de/seqoverall.html,通过网站查询相应宿主的稀有密码子,如果要表达的基因含有的稀有密码子太多,则需要对密码子进行优化,消除稀有密码子,将优化后的序列重新合成,如果稀有密码子不是很多,在10%以内可以则通过点突变来消除相应的稀有密码子。另外还有专门用于密码子优化的软件,如DNA 2.0。
2. 调整GC含量
研究表明,基因序列中的GC含量也是基因设计和优化中的重要指标,不同物种内GC含量显著不同,在用宿主表达外源基因时要注意外源基因的GC含量。GC含量可以间接的影响基因的表达和调控。基因GC含量过高或过低都将会影响到基因的表达,一般是使表达水平降低。可以通过基因密码子优化来调整基因内的GC含量,使之能够达到正常水平,这点可以通过基因合成来实现。基因GC含量的预测和调整一般都可以通过软件来进行分析。
3. 增加mRNA的稳定性
蛋白质的表达调控一般分为两种,即转录水平的调控和翻译水平的调控,一般转录水平的调控起到关键性的作用,但同时翻译的效率与mRNA的降解又直接相关。蛋白表达已多次被证明与mRNA的稳定性相关,但目前对于mRNA的稳定性优化不是很成熟,一方面,过高的mRNA的稳定性也就意味着高GC含量以及稳定的二级结构,这些都不利于蛋白质的高效表达,因此mRNA稳定性的优化有待进一步研究。
4. mRNA的二级结构
由于核糖体只能与单链的RNA结合起始翻译,而较大的折叠自由能可能会减缓核糖体的延伸从而降低翻译效率。因此如果mRNA形成较大且稳定的茎环结构或发卡结构,特别是在起始密码子附近形成这种稳定的二级结构将会影响mRNA在翻译过程中与核糖体的结合和延伸,从而降低翻译效率最终影响到蛋白的表达○2。因此可以通过mRNA二级结构的优化尤其是翻译起始区二级结构的优化来提高蛋白质的表达水平。
5. 其他因素
密码子优化的因素还包括密码子的重复、核糖体结合位点、起始密码子环境、终止密码子环境、酶切位点的设计、合理的接头设计、融合基因、纯化标签等,通过进一步的设计,使基因得到进一步的优化,检查无误后可进行基因合成,以用于后续的蛋白表达。
6.讨论
经过大量实验验证,经过密码子优化后的基因的表达量明显高于没有做密码子优化的基因,由此可以看出密码子的优化和蛋白质的有效表达有着密切的联系。比如Kudla等构建的包含154中不同随即密码子同义突变的GFP蛋白突变体库,研究mRNA折叠自由能对翻译效率的影响实验,以及Desmit等通过对噬菌体NS2的外壳蛋白基因的同义密码子突变体在大肠杆菌中的表达,定量分析了翻译起始区mRNA的二级结构与翻译起始效率的关系实验表明较大的折叠自由能会降低蛋白质的翻译效率。另外Punginelli等通过突变大肠杆菌FdnG信号肽的第一个精氨酸R5,降低了翻译起始区强稳定性茎环结构的形成,显著降低了mRNA该区域的折叠自由能,使蛋白质的表达增加了60倍。总之,通过有效的基因优化可以明显提高蛋白表达量,这为蛋白质的大量表达和量化生成提供了很好的前提。同时还有很多存在的问题需要去进一步的研究以达到更高的效果。
1.ClarkeTFt,Clark PL. Rare codons cluster. PLoSONE,2008,3(10):e3412.
2.Kudla G, Murray AW, Tollervey D, et al. Coding-sequence determinants of geneexpression in Escherichia coli. Science, 2009,324(5924): 255?258.