论文部分内容阅读
在全世界,癌症是患病人数众多的一种疾病,同时也是死亡率最高的几种疾病之一,对人类的健康产生了巨大威胁。癌症的的发生是由多种因素引起的,包括环境中的危险因素和遗传易感性等。目前,癌症遗传易感性常用研究方法之一就是GWAS(Genome-wide association study),即全基因组关联分析。多个GWAS研究显示:位于5p15.33区域中基因CLPTM1L(CLPTM1 like)的内含子中的SNP标记rs401681与肺癌、胰腺癌、膀胱癌、结直肠癌、黑色素细胞瘤和宫颈癌等六种癌症的遗传易感性密切相关。由于rs401681位于CLPTM1L的内含子区域中,CLPTM1L被认为涉及以上六种癌症的发生发展,并且认为rs401681通过调控CLPTM1L的表达与六种癌症相关。然而,该假说及其调控机制并没有实验证据的支持。此外,由于空间的限制,只有一小部分标签SNP被包含到GWAS研究中进行基因分型。因此,六种癌症的真实致病SNP可能不是rs401681或者不仅仅是rs401681,而是与rs401681连锁的SNP。然而,rs401681附近区域的连锁不平衡模式从来没有被研究。在本研究中,我们聚焦于多个人群,试图去揭示在5p15.33区域中的与六种癌症相关的真实的功能突变及其调控机制。通过对多个人群的千人基因组计划数据中该区域的基因型数据的分析,SNP位点rs402710被发现与rs401681连锁。因此,这两个SNP位点均有可能是以上六种癌症的遗传易感性位点。但是,这两个SNP位点在六种癌症的研究中呈现出两种不同的研究结果。在肺癌的研究中,我们首先分别构建了包含rs401681和rs402710位点的两种pGL3-promotor质粒以及相对应的SNP位点定点突变质粒。我们将以上质粒分别转染到肺上皮细胞Beas-2B中进行荧光双报告实验。结果显示,在肺细胞Beas-2B中,SNP位点rs401681和rs402710均为功能性位点,可调控基因的表达。染色质免疫共沉淀实验结果显示SNP位点rs401681及rs402710分别位于转录因子HNF-4A和MAF1的结合位点中,通过影响转录因子的结合效率来调控基因表达。染色质构象捕获实验结果则显示,包含rs401681和rs402710位点的DNA片段调控的靶基因不是CLPTM1L基因,而是TERT基因。而目前的研究显示TERT基因与癌症的发生发展密切相关,因此,我们的研究结果解释了这两个SNP与肺癌相关的分子机制。在胰腺癌、膀胱癌、结直肠癌、黑色素细胞瘤和宫颈癌等五种癌症的研究中,我们同样进行了荧光双报告实验。结果显示,在以上五种癌症的细胞中,SNP位点rs401681和rs402710均为功能性位点,可以调控基因表达。但是与肺癌细胞中结果不同的是,利用以上五种癌细胞进行的染色质构象捕获实验结果显示,包含rs401681和rs402710位点的DNA片段调控的靶基因不再是TERT基因,而是一段DNA非编码区。因此,我们怀疑该区段可能存在未知的编码基因。通过生物信息学分析以及数据库搜索,我们发现该区段的确存在一个未被研究过的lncRNA(long non-coding RNA)基因。