论文部分内容阅读
多年来肿瘤基因组分析的主要关注点是鉴别驱动突变,尤其是关注一些重要的基因,例如TP53、PTEN、CDKN2B以及其调节区域的驱动突变。然而,最近的研究发现肿瘤中的大多数突变不是驱动突变(drivingmutation)而是伴随突变(passenger mutation),与此同时,还发现表观遗传失调在肿瘤的发生和发展过程中起着重要的作用。表观基因组修饰主要是通过DNA修饰酶和组蛋白修饰酶进行的,这些酶被长链非编码RNA(lncRNAs)带到特定的基因组位点,因此lncRNA是基因表达表观遗传调控的主要调控因子。迄今研究者们尚不清楚哪些lncRNAs与基因组上哪些位点结合调控哪些靶基因,以及lncRNAs在多大程度上决定肿瘤中的基因表达失调。结直肠癌(Colorectal Cancer,CRC)是人类常见的消化道肿瘤之一,为了分析lncRNA在结直肠癌中对基因表达调控的影响,我们对12例结肠直肠癌组织和3个正常结直肠组织进行了全基因组转录本测序(RNA-seq)和DNA甲基化测序(MeDIP-seq)。针对测序数据,根据对lncRNA和蛋白编码基因的注释,我们识别了结直肠癌中差异表达的蛋白质编码转录本和非编码转录本以及差异甲基化位点。分析预测了非编码转录本在蛋白质编码基因的DNA结合位点,识别了共差异表达的非编码转录本与编码转录本构成的模块(modules),分析识别了模块中的核心网络并对网络中的重点元件进行了功能分析。我们的分析结果显示,除了异常表达的蛋白编码基因,例如IGF2、WNT5A、WNT2、JUN、MYC、CA2等,在结直肠癌中还有大量异常表达的lncRNAs,例如 H19、CDKN2B-AS1、PRR7-AS1、SNHG15、PVT1、SATB2-AS1 等,以及大量表达的异常lncRNA基因转录本(未注释的转录本)。而且,许多差异表达的非编码转录本在蛋白编码基因启动子区存在DNA结合位点(例如H19在IGF2、WNT5A、MYC、JUN、CHEK1 等有 DNA 结合位点,SATB2-AS1 在 SATB2、CDKN2B-AS1在CA2、HOXD-AS1在GAS1等有DNA结合位点)。其中在一部分lncRNA的DNA结合位点处同时存在甲基化状态改变。此外,在不同分化程度的结直肠癌细胞里,非编码转录本与编码基因转录本形成特征性的共表达模块与网络,揭示lncRNA介导的表观遗传失调对肿瘤中的基因异常表达有重要影响,这些网络中的核心元件可以看做是表观遗传失调的标志(signature),我们认为这种标志对不同肿瘤的诊断、治疗干预、预后判断具有重要意义。