论文部分内容阅读
研究目的: 肝癌是世界上最常见恶性肿瘤之一,居全球恶性肿瘤排名第五位,约占全球癌症相关死亡人数的三分之一,是我国高发的危害极大的一类恶性肿瘤。肝癌可分为原发性肝癌(primary liver cancer)和转移性肝癌(metastatic hepatic carcinoma)两大类。在原发性肝癌中,肝细胞癌( hepatocellular carcinoma,HCC)占到大约80-90%。目前认为HCC发生是一个多因素、多步骤的复杂过程,既受环境因素的影响,又受基因因素的影响。流行病学和实验数据表明,乙型肝炎病毒(HBV)和丙型肝炎病毒(HCV)慢性感染、黄曲霉毒素、饮水污染、酒精过度摄入、性激素、亚硝胺食物、微量元素等都是导致肝癌发生的危险因素;另外肝硬化、非酒精性脂肪性肝病(NAFLD)、血色病、慢性胆汁淤积、遗传及肥胖也与癌的发生有关。其中HBV或HCV病毒感染、酒精以及肝硬化是导致肝癌的主要原因。我国是个乙肝大国,乙型肝炎病毒携带者占全球感染1/3,我国的HCC多在乙肝肝硬化的基础上发展而来,如何有效地干预HCC的发展和治疗已成为一个亟待解决的重大问题。因此,寻找HCC的发病机制,寻找有效的治疗靶点具有重要意义。尽管对HCC的分子机制的理解有所进展以及HCC的治疗方法有所改善,肝癌患者的总体生存时间仍是有限的。近年来,随着手术技术的不断更新、放化疗的普遍应用、靶向药物以及生物免疫治疗等各种新技术的发展,与以往的肝癌死亡率相比已经有了很大提高,但肝癌患者的长期生存率、带瘤生存率及术后复发情况仍不乐观。HCC恶性程度高,起病隐匿,进展迅速,容易转移,死亡率高,其总体5年生存率不足5%。肝癌病人确诊越晚,其预后效果越差。晚期诊断严重限制了肝癌治疗手段的选择,因此,肝癌的早期发现非常重要,阐明肝癌的发生以及早期转移的具体机制将有助于寻找早期诊断肝癌的肿瘤标记物。 长非编码RNA (long non-coding RNA,lncRNA)作为ncRNA家族的重要组成成员之一,越来越受到大家的重视。lncRNA是一类转录本长度在200nt-100kb之间的非编码RNA分子,缺少完整的开放阅读框,定位多样化,位于细胞核、细胞质或细胞器内,在真核细胞内被普遍转录,但缺乏蛋白质编码能力。长链非编码RNA数量多、来源广、不稳定,其机理复杂多样。近年来的许多研究表明,LncRNAs能够在多种水平上调控基因的表达,包括转录水平调控(转录激活或转录抑制)、转录后修饰(剪接, RNA降解和翻译)、染色质重塑(表观遗传基因表达,基因沉默,基因印记和染色质修饰)等。lncRNAs不仅在维持机体的正常生理功能及发育过程中起着重要的调控作用,其异常表达与疾病的发生发展尤其是肿瘤的恶性进展亦密切相关。现已发现在肺癌、胃癌、乳腺癌、前列腺癌等多种恶性肿瘤中存在lncRNA异常表达,其作用机制可能主要参与肿瘤的发生、生长、浸润、复发转移等过程,提示在肿瘤的发生发展过程中lncRNA可能起到癌基因或抑癌基因的作用。目前,lncRNA在肝癌中的研究仍较少,在过去的十几年里,研究者发现了多种与肝癌相关的lncRNAs,包括起上调作用的lncRNAs(如HULC、H19、UCA1、HOTAIR、MVIH等),起下调作用的lncRNAs (如MEG3、PTENP1、DREH、LET、WT1-AS等),它们能通过直接或间接的方式调控细胞增殖、细胞凋亡、上皮-间质转移(EMT)、自噬、侵袭和转移等,从而促进或抑制肿瘤的发生及进展。虽然一些lncRNAs的功能和机制已在肝癌中被鉴别出来,但肝癌组织中的绝大多数lncRNAs的表达模式,可能的生物学功能和分子调控机制尚不清楚。因此仍有必要继续寻找与肝癌相关异常表达的lncRNA,并探索其功能,进一步挖掘其分子生物学机制,从而更加完善肝癌的分子基础研究。然而,长链非编码RNA如何导致肝癌的发生、转移和复发在很大程度上仍是未知的。 本课题利用四个公共数据集(癌症基因信息数据库(TCGA)RNA测序数据,一个RNA测序数据集和两个微阵列数据集)全面分析正常肝组织及肝癌组织中lncRNA表达谱的差异,并初步筛选出与肝癌相关的差异表达的lncRNAs,从而为lncRNA的深入研究打下基础。为了进一步探究差异表达的lncRNAs是否与肝癌患者的生存时间相关,本研究分析了lncRNA的表达水平与肝癌患者的总生存率和无复发生存率之间的关系。为了进一步探究lncRNAs是否与肝癌的转移有关,本课题组利用肝癌组织早期复发转移和晚期复发未转移的lncRNAs表达谱筛选出差异表达的lncRNA并确定两条lncRNAs,PVT1和SNHG7。课题组进一步探讨PVT1和SNHG7在肝癌细胞中的生物学功能,进而从新的角度阐明肝癌发生发展的机制,为今后临床分子治疗肝癌提供理论依据。 研究方法: 1.下载TCGA 数据库及GEO 数据库中HCC组织及其配对的正常组织或癌旁组织的RNA测序数据、基因芯片数据和相应的临床数据。 2.对下载数据进行lncRNA注释,并利用R软件及Mann Whitney U检验法分析TCGA数据及GEO数据集中差异性表达的lncRNAs。 3.GISTIC 2.0软件分析HCC临床样本中lncRNA基因组位点DNA拷贝数的缺失或获得。 4.利用单变量Cox回归分析lncRNA的表达水平与肝癌患者的总体生存率和无复发生存率之间的关系。根据lncRNA表达水平的中位值,将肝癌患者分为lncRNA的高表达组和低表达组,采用对数秩检验法比较两组生存率分布。 5.运用生物学信息方法分析GSE67260数据集中早期复发的HCC组织样本(1年以内,肝外侵袭和转移)较晚期复发HCC样本(超过2年,肝外无浸润和转移)中差异表达的lncRNA,并鉴定出两条HCC转移相关的lncRNA,PVT1,SNHG7。 6.利用RNAi技术在HCC细胞中敲低PVT1,SNHG7的表达水平。 7.CCK8细胞活力实验检测HCC细胞中敲低PVT1和SNHG7表达后细胞的增殖活力变化。 8.功能缺失实验检测HCC细胞中敲低或上调PVT1和SNHG7表达后细胞的侵袭能力变化。 结果: 1.应用四种基因数据库全面分析正常肝组织及肝癌组织中lncRNA表达谱的差异,通对lncRNA注释和差异表达分析显示,在TCGA数据集中有1939条lncRNAs表达失调(其中1295条上调,644条下调);GSE77509数据集中有657条lncRNAs差异表达(249条上调和408条下调);GSE64041数据集中有103条lncRNAs表达失调(31条上调和72条下调);GSE70880数据集中有335条lncRNAs是差异表达的(176条上调和159条下调)。进一步交叉分析表明,347条lncRNAs至少在两个数据集中一致的上调或下调。以上结果表明,在肝癌组织中存在大量的lncRNAs表达水平失调。 2.通过分析TCGA数据库HCC中差异表达的lncRNAs所在基因组位点的拷贝数变化,结果表明31条lncRNAs位点有基因拷贝数的获得,41条lncRNAs位点有基因拷贝数的缺失。表明许多失调的lncRNAs是和其基因组位点的拷贝数扩增或缺失有关。 3.通过单变量Cox回归分析肝癌中与生存相关lncRNAs表达水平,结果表明,22条上调lncRNAs和18条下调lncRNAs与肝癌患者的总体生存率显著相关,而11条上调的lncRNAs和10条下调的lncRNAs与肝癌患者的无复发生存率显著相关(P值均<0.05)。具有较高的RP1-228H13.5和TMCC 1-AS1表达水平的肝癌患者具有较短的总生存时间,而具有较高的RP11-307C12.11和较低的LINC00205表达水平的肝癌患者具有更短的无复发生存时间。 4.通过比较肝癌组织早期复发转移和晚期复发未转移的lncRNAs表达谱,数据分析显示,与晚期复发的肝癌组织相比,在早期复发的肝癌样本中有156条lncRNAs表达上调,36条lncRNAs表达下调。进一步交叉分析表明,与正常肝组织相比,在早期复发的肝癌样本中有5条lncRNAs表达上调,2条lncRNAs表达下调。结果表明PVT1和SNHG7可能参与肝癌细胞的侵袭和转移。 5.通过设计PVT1和SNHG7的siRNA,并转染到HuH1细胞以敲低PVT1和SNHG7的表达,CCK8 细胞活力实验显示敲低PVT1和SNHG7表达水平能够损害HuH1细胞的增殖活力。 6.Trans well实验显示,与对照组细胞相比,敲低PVT1和SNHG7的表达水平使肝癌细胞的侵袭能力受损;而上调PVT1和SNHG7的表达水平能够促进肝癌细胞的侵袭能力。 结论: 与正常肝组织或癌旁组织相比较,肝癌组织中存在着大量的异常表达的lncRNAs,且许多异常表达的lncRNAs与其基因组位点拷贝数扩增或缺失有关,提示这些差异表达的lncRNA可能在HCC的发生发展过程中起着重要的作用。此外,一些lncRNA表达水平与HCC患者的预后(总生存率和无复发生存率)显著相关,提示这些lncRNA可作为预判HCC患者生存时间的独立评估因子。另外,部分lncRNA,比如PVT1和SNHG7,可能通过调控肝癌细胞的增殖、侵袭和转移能力在HCC的发生、进展以及复发过程中发挥着重要的作用。