论文部分内容阅读
目的:顺式作用元件是位于DNA分子中调节基因表达的序列,对基因表达调节有重要的作用,但是这些顺式作用元件的功能及调节基因表达的作用机制大部分仍然未被阐明。研究顺式作用元件调控影响基因表达的作用机制,对于研究生物表观遗传、分化、衰老和肿瘤发生等生物学现象具有重要的意义。增强子是一种活化基因的顺式作用元件,能够增强基因表达,在调节基因表达过程中发挥着重要作用。基因表达调节是当前生物学中的一个焦点问题,与衰老,分化,肿瘤发生等多种生物学现象相关。为了更深地理解这些生物学现象,必须阐明基因表达调节的机制。虽然基因表达调节机制非常复杂,但是可以用简化的系统进行研究。为了研究短序列增强子活化基因的作用机制,我们在前期工作中建立了一个简化的研究系统:利用Alu元件抑制GFP报告基因表达,用绿色荧光蛋白表达系统研究短序列DNA及其衍生序列的增强子活性。本研究室在前期工作中,由14个拷贝的Alu同向串联(Alu×14)插入到p EGFP-C1质粒中GFP报告基因的下游,从而构建C1-Alu×14质粒。我们发现将C1-Alu×14质粒瞬时转染He La细胞后,Alu×14序列对GFP报告基因表达具有显著抑制作用;短序列AA(5′-GTGAAATAAATGCAAATAAAGT)插入C1-Alu×14质粒中GFP基因和Alu×14序列之间构建的C1-AA×2-Alu×14质粒瞬时转染He La细胞后,短序列AA可以部分解除Alu×14序列对GFP报告基因表达的抑制作用,表现出一定的增强子活性。在本研究中,我们重点研究的是AA序列及其突变序列调节GFP报告基因表达的作用机制及增强子序列的结构对基因表达所产生的影响。Alu元件是人的主要短散布核元件(SINE),有一百多万拷贝,大约占全部人类基因组的十分之一,在生物进化过程中SINE一直是强制存在,因此多数学者认为SINE具有重要的生物学功能。然而,至今为止多数Alu元件的生物学功能仍未阐明。许多证据表明Alu元件属于沉默子,其可以抑制基因表达。在细胞核中Alu RNA作为转录协同抑制物,是反义转录组中最多的部分,具有以顺式作用或者反式作用的方式下调正义表达的可能性。我们的前期研究表明Alu元件通过触发染色质紧密包装抑制GFP报告基因表达。虽然认为Alu元件属于沉默子,但是在看家基因和高表达染色体中,Alu元件含量却十分丰富,这个矛盾现象长期困扰着生物学家。为了研究基因组中Alu元件的生物学意义,我们做了一些关于Alu元件的实验研究和生物信息学分析。方法:1 DNA模板及引物的合成。委托北京赛百盛基因技术有限公司合成携带适当的核酸内切酶识别位点的引物及DNA模板。本论文中所用到的引物及DNA模板的名称和具体序列参见论文的附表。2表达载体的构建。2.1 AA及其衍生序列相关表达载体的构建。设计带有合适的2个限制性内切酶(Ecor I/Xba I或Kpn I/Nhe I)酶切位点引物,以AA及其衍生序列为模板进行PCR扩增出携有4个限制性内切酶Ecor I/Xba I和Kpn I/Nhe I酶切位点的DNA序列。利用限制性内切酶Ecor I/Kpn I分别双酶切AA及其衍生序列PCR产物和C1-Alu14质粒,随后用T4 DNA Ligase连接同时带有相同粘性末端的AA及其衍生序列小片段和C1-Alu14表达载体大片段,随即通过表达载体转化、质粒提取等步骤获得构建插入一个AA及其衍生序列的表达载体。分别用HindⅢ/NheⅠ和HindⅢ/XbaⅠ双酶切含有一个AA及其衍生序列的表达载体,获取AA及其衍生序列的目的基因小片段和C1-AA-Alu14表达载体大片段,通过T4 DNA Ligase连接以上AA及其衍生序列的目的基因小片段和C1-AA-Alu14表达载体大片段,从而获得含有两个AA及其衍生序列的表达载体。2.2 Alu相关表达载体的构建。Alu序列为通过PCR扩增含有人染色体Xq13.1中的Alu序列的RP11-29107克隆模板获得;Lac Z序列(J01636.1)扩增自大肠杆菌;4TMI(5′-GTGAAATAAATGCTTTTTTTGT)是我们在前期研究中发现的一个具有较高增强子活性的22nt寡核苷酸序列;CMV启动子扩增自质粒pc DNA3.1+(1-882bp),其包含完整的CMV启动子。质粒的构建方法同前,所构建的表达载体均通过酶切和基因测序(委托北京诺赛基因组研究中心有限公司完成)进行鉴定。3细胞转染包括瞬时转染和稳定转染。用脂质体转染试剂LipofectamineTM2000瞬时转染处于对数生长期的He La细胞,利用G418试剂筛选获得稳定转染的He La细胞,详细方法见论文正文。4荧光显微镜观察将重组质粒表达载体转染Hela细胞后,在荧光显微镜下观察计数GFP荧光阳性细胞数。首先用荧光显微镜在紫外光照射下计数视野中GFP阳性细胞数,然后再在白光照射下记录相同视野中的细胞总数,每个样本至少记录500个细胞,计算GFP细胞阳性率。实验数据结果用均数±标准差(x±SD)表示。GFP荧光细胞阳性率=(GFP荧光阳性细胞个数/相同视野中细胞总数)×100%5 RT-PCR利用Trizol法从He La细胞中提取总RNA,用DNase I将总RNA中的DNA降解后,通过9-nt随机引物和逆转录酶等构成的逆转录体系将RNA逆转录为c DNA,然后以逆转录产物为模板,进行PCR扩增GFP基因。6聚丙烯酰胺凝胶电泳(PAGE)通过PAGE观察22nt寡核苷酸构象。为确定AA序列是否通过非典型碱基互补形成二级结构,我们委托基因合成公司合成了七个长度为22nt的DNA单链,用PAGE和银染法观察这七个DNA单链的构象,本实验采用含T碱基丰富的序列作为PAGE的marker。在20%的聚丙烯酰胺凝胶中进行不同温度、不同离子强度、变性胶和非变性胶条件下的PAGE,银染后,观察DNA单链在不同条件下的电泳迁移率,通过DNA单链的电泳迁移率,推测其是否具有形成不同二级结构的能力,从而推测基因空间构象和基因生物学功能之间的关系。7流式细胞仪检测通过流式细胞仪检测转染质粒后的He La细胞中GFP的表达情况,此项工作委托河北医科大学第四医院科研中心完成。荧光表达强度用GFP标记量表示。GFP标记量等于阳性细胞均道值乘以阳性细胞百分率(超过门值的阳性细胞百分数),再乘以100。GFP标记量=XM×Gated%×1008生物信息学分析获取五个不同物种(人、狗、猫、大鼠、小鼠)的α珠蛋白基因簇及其侧翼序列的基因序列,这些序列来源于以下数据库:Homo sapiens(assembly GRCh38)(http://www.ncbi.nlm.nih.gov/genome/?term=hu man);Canis lupus familiaris(assembly Can Fam3.1)(http://www.ncbi.nlm.nih.gov/genome/?term=dog);Felis catus(assembly Feliscatus-6.2)(http://www.ncbi.nlm.nih.gov/genome/?term=cat);Rattus norvegicus(assembly Rnor6.0)(http://www.ncbi.nlm.nih.gov/genome/?term=rat);Mus musculus(assembly GRCm38.p2)(http://www.ncbi.nlm.nih.gov/genome/?term=mouse。利用重复序列遮蔽服务器(Repeat Masker server)(http://www.repeatmasker.org)检测α珠蛋白基因簇及其侧翼序列中的重复序列。人类α珠蛋白基因簇及其侧翼序列突变会导致血红蛋白病,因此我们从以下数据库获取了人血红蛋白病患者的α珠蛋白基因簇及其侧翼序列的基因突变数据:Hb Var database(http://globin.bx.psu.edu/hbvar/menu.html)。结果1质粒表达载体的构建及鉴定通过酶切和基因测序两种检测手段鉴定本文实验中所用的质粒表达载体均正确。2 AA及其衍生序列对GFP基因表达的影响质粒转染He La细胞后,在荧光显微镜下观察计数,通过比较荧光阳性细胞率,我们发现22R,4TMI,AA可以活化GFP报告基因,而4T,TT,7Pie A和7Pie T不能活化GFP报告基因,结果具有统计学意义。AA序列中的T碱基逐一突变为A,G,C而衍生的15个序列均具有增强子活性,其中大部分突变序列的增强子活性略低于AA序列,结果具有统计学意义。3 AA序列在转录水平增强GFP报告基因表达AA序列活化GFP报告基因能力强于7pie A序列,为了研究AA序列活化GFP报告基因的机制,我们利用RT-PCR方法检测GFP RNA表达水平。为增加实验的准确性,我们采用三对引物扩增不同位置的GFP RNA。研究发现AA序列比7pie A和Alu14序列能够诱导更多的GFP RNA。这些结果与GFP蛋白检测结果一致,从而说明质粒中插入AA序列可以增加细胞内GFP RNA含量。由于基因的转录增加或者RNA降解减慢都可能造成细胞内RNA含量增加,即GFP RNA含量增加可能发生在转录水平,也可能发生在RNA降解水平。为了研究这个问题,我们利用放线菌素D抑制RNA生成,再采用RT-PCR检测GFP RNA含量。在相同实验条件下,假设细胞中的RNA降解速率相同,实验发现质粒中插入AA序列的GFP RNA含量要高于质粒中插入7pie A序列的GFP RNA含量,这些结果表明,AA序列诱导更多GFP报告基因蛋白表达是GFP报告基因转录增加的结果,即AA序列增强GFP报告基因表达发生在转录水平。4利用PAGE观察DNA寡核苷酸构象在室温条件的PAGE中,利用20%变性胶PAGE我们发现AA等7个22 nt寡核苷酸序列的电泳迁移率不同,从快到慢依次为7pie A>AA>22R>4T>4TMI>TT>7pie T。7pie A,AA,22R,4T,4TMI,TT,7pie T序列中A碱基的数目分别为14,12,8,7,6,2,0。通过相关性分析我们发现A碱基的数目多少与电泳迁移率快慢成正比关系。由此表明含A碱基较多的序列比含T碱基较多的序列的电泳迁移率要快。然而,在1×TBE和低温条件的PAGE中,4T序列的电泳迁移率最快,其迁移速度快于15 nt marker的迁移速度;在1×TB-10 m M Mg Cl2和室温条件的PAGE中,22R,4T,AA,7pie A和4TMI的电泳迁移率介于22 nt markers和19 nt markers之间;在1×TB-10 m M Mg Cl2和低温条件的PAGE中,22R,4T,AA,7pie A和4TMI的电泳迁移率介于19 nt markers和15 nt markers之间。5表达载体中正义Alu和反义Alu组合活化GFP报告基因将表达载体C1-4TMI-Alu×14-CMV-Alu×2(4TMI-Alu-sense-sense),C1-4TMI-Alu×14-CMV-Alu×2as(4TMI-Alu-sense-antisense)稳定转染He La细胞后,经流式细胞仪检测发现转染4TMI-Alu-sense-antisense质粒的GFP标记量是转染4TMI-Alu-sense-sense质粒GFP标记量的4倍,其中转染4TMI-Alu-sense-antisense质粒所产生的GFP标记量最高,这表明正义Alu和反义Alu组合可以活化GFP报告基因,促进GFP报告基因表达。6正义Alu和反义Alu组合活化GFP报告基因具有细胞种属来源依赖性将表达载体C1-4TMI-Alu×14-CMV-Alu×2(4TMI-Alu-sense-sense),C1-4TMI-Alu×14-CMV-Alu×2as(4TMI-Alu-sense-antisense)稳定转染He La细胞后,经流式检测可见4TMI-Alu-sense-antisense明显活化GFP报告基因,而以上质粒转染BHK21细胞,却没有见到明显的基因活化作用。7正义Alu和反义Alu活化GFP报告基因具有增强子依赖性无增强子、1个增强子、2个增强子表达载体转染He La细胞诱导的GFP标记量之间的比率为1:3.3:12.7,此结果表明表达载体诱导GFP标记量随着增强子数目增加而上升。8正义Alu与反义Alu适当搭配活化GFP报告基因需要足够多的Alu拷贝数当5’端Alu上游与3’端Alu上游均存在增强子时,Alu-sense-antisense表达载体随着3’端Alu拷贝数的增加,表达载体诱导的GFP标记量上升。由此可以看出正义Alu与反义Alu适当组合活化GFP报告基因需要足够多的Alu拷贝数。9正义和反义Alu组合在稳定转染条件下才能够活化GFP报告基因Alu-sense-sense和Alu-sense-antisense表达载体在瞬时转染He La细胞48小时时GFP标记量达到最高峰,两组表达载体所诱导的GFP标记量之间没有明显的差异。然而Alu-sense-antisense表达载体稳定转染He La细胞24天后开始表现出明显的活化GFP报告基因能力,说明正义和反义Alu适当组合活化GFP报告基因必须在稳定转染条件下才能够实现。10不同物种α珠蛋白基因簇重复序列分布经生物信息学发现人类及其他四种动物α珠蛋白基因簇中SINE含量丰富,SINE在α珠蛋白基因簇中分布明显高于其在β珠蛋白基因簇中分布,α珠蛋白基因簇HBZ基因上下游100kb范围内的SINE基础频率明显高于其在全基因组分布的平均值。这表明SINE在五个物种的α珠蛋白基因簇中可能发挥同样作用,这与α珠蛋白基因表达可能有关。11基因大片段缺失导致的人类血红蛋白病经对人类α珠蛋白基因簇基因缺失数据的生物信息学分析发现,很多类型的基因缺失突变可以导致人类血红蛋白病,然而在众多基因缺失病例中,我们发现唯独没有保留HBA1基因同时HBA1下游基因大面积缺失的病例。通过国际千人基因组基因数据库(http://browser.1000genomes.org/)查询了正常人HBA1下游基因变异数据,同样没有发现保留HBA1基因但HBA1基因下游基因大面积缺失的数据。12根据实验研究和生物信息学分析结果,本文中提出了重复序列活化基因模型:重复序列连同其他非编码序列使基因处于转录和非转录的临界状态,重复序列所起的作用主要是抑制基因表达,是沉默子,基因一旦转录,转录产物中的重复序列RNA形成网格(RNA networks)活化基因,形成转录的正反馈,即转录产物作为输入激活输出。结论1 AA序列具有增强子活性,能够活化基因,促进基因转录。2 AA序列可能通过非典型互补形成不稳定茎环结构,发挥增强子活性。3 Alu元件正反组合活化基因必须同时满足五个条件,否则引起基因沉默。这五个条件是:(1)存在正义和反义Alu组合;(2)细胞种属来源依赖性:在He La中Alu能够活化基因,在BHK21细胞中Alu不能活化基因;(3)Alu元件上游必须存在增强子;(4)足够多的Alu拷贝数;(5)稳定转染。提示Alu元件使基因沉默,然而其一旦转录正反适当组合则有活化基因作用。4提出重复序列活化基因模型:基因组中的基因处于转录和非转录的临界状态,基因一旦转录,转录产物中的重复序列有活化基因作用。