论文部分内容阅读
研究背景: 近期研究表明,长链非编码RNA(Long non-coding RNA,lncRNA)参与了有机体生命活动的各个方面,并且发挥着重要的调控作用。人肝癌细胞株HepG2是一种常见的细胞株,被广泛用于细胞代谢的研究,是生命科学研究中重要的实验材料。本研究基于RLM-RACE及高通量测序技术结合生物信息学分析方法,旨在建立HepG2细胞lncRNA全长转录组文库,为进一步研究lncRNA在HepG2细胞中潜在的调控机制提供良好的基础。 研究方法: 1.HepG2细胞RACE Adapter-DNA文库制备 挑选状态良好的HepG2细胞,使用QIAGEN miRNeasy?Mini Kit提取细胞总RNA,用DNase I除去RNA中残留的基因组DNA。DeNovix超微量紫外可见分光光度计检测RNA吸光度验证所提取RNA的纯度,快速琼脂糖凝胶电泳验证RNA的完整性。使用RLM-RACE试剂盒将RACE Adapter连接至RNA并逆转录,获得RACE Adapter-cDNA。随后进行半随机引物PCR,非特异性扩增含有RACE Adapter的序列,得到RACE Adapter-DNA文库。 2.生物信息学方法分析RLM-RACE高通量测序数据 对测序获得的原始数据进行质量评估,使用Cutadapt软件去除RACE Adapter序列及FastQC软件检测到的测序接头,将获得的clean reads用Tophat软件比对到人的hg19基因组。通过使用Cufflinks软件拼接好的转录本与NONCODE数据库注释lncRNA转录本进行比对分析,对数据库lncRNA的5和3端进行重新注释。 3.全长克隆及菌种保存,验证生物信息学方法拼接转录本 根据生物信息学分析获得的重新注释的转录本设计可以扩增lncRNA全长的引物。回收PCR产物,连接至T载体,重组质粒由DH5α感受态转化,挑取阳性单克隆菌落,经菌落PCR和测序鉴定后,阳性克隆菌液于-80℃保存。 4.构建lncRNA稳定表达细胞株及FISH定位 从大肠杆菌中调取目的序列,经双酶切连接至慢病毒表达质粒,菌落PCR和测序鉴定重组质粒构建成功后,提取重组慢病毒表达质粒,与病毒包装质粒共转染293T细胞,产生病毒。病毒纯化浓缩,检测病毒滴度,取适量病毒感染HepG2细胞,72小时后观察目的细胞绿色荧光蛋白表达情况及进行嘌呤霉素筛选。嘌呤霉素筛选一周后,将含有抗性的细胞扩大培养,用qPCR检测lncRNA表达水平。冻存部分稳定高表lncRNA的细胞株,其余细胞继续传代,进行相关的功能研究及FISH定位。 研究结果: 1.生物信息学方法分析RLM-RACE高通量测序数据结果 经生物信息学方法对RLM-RACE高通量测序数据分析后,通过转录本重构,对收录在NONCODE数据库中的lncRNA进行重新注释,5RACE样本最后获得319,043个转录本,3RACE样本最后获得306,273个转录本。将5 RACE样本和3RACE样本的分析结果整合,最终获得9,978个两端均重新注释的转录本,不排除其中含有新的转录本。 2.慢病毒感染HepG2细胞后,细胞中目的lncRNA表达水平显著升高 用适量慢病毒感染HepG2细胞,经嘌呤霉素筛选后,共建立14个稳定高表达特定lncRNA的细胞株,其中7个细胞株高表NONHSAT100436,另外7个细胞株高表NONHSAT080052。qPCR检测结果显示,NONHSAT100436高表株表达量改变最大的细胞株Fold Change=149.995,平均Fold Change=115.427;NONHSAT080052高表株表达量改变最大的细胞株Fold Change=140.695,平均Fold Change=110.858。 3.LncRNA NONHSAT100436和NONHSAT080052在HepG2细胞中的定位 FISH结果显示,用lncRNA NONHSAT100436和NONHSAT080052特异性探针检测HepG2细胞中相应 lncRNA的定位,胞质中可见由探针发出的较亮的红色荧光,说明这两个lncRNA主要存在于胞质。 研究结论: 本研究中,我们在RLM-RACE技术的基础上,联合高通量测序作为一种试验方法,应用于HepG2细胞转录组全长的检测,结合生物信息学方法对高通量测序数据进行分析,获得了数量可观的转录本。本次实验结果表明,大多数lncRNA较mRNA更长,外显子数量更少,具有不同的可变剪接体。该试验方法可作为一种新型高效的细胞转录组注释工具,实现对lncRNA全长的快速获取,同时避开了单克隆挑取和一代测序,是一种精确、快速和经济的方法。