论文部分内容阅读
根据全球最新统计提示(GLOBOCAN 2012),乳腺癌仍居于所有女性恶性肿瘤新发病例及癌症相关死亡率首位,约有167万新发病例占所有女性恶性肿瘤新发病例的25.1%。尽管相关数据表明,东亚地区乳腺癌发病率约仅为欧美地区的三分之一,我国发病率比例仍相对较低,但正以每年3-5%的速度递增,且发病年龄呈年轻化趋势。由此可见,乳腺癌已成为危险我国女性健康的重大疾病之一乳腺癌发病因素复杂多样,目前研究认为遗传因素和环境因素共同作用影响其发生发展。然而相同暴露因素下乳腺癌易感性的差异可能由于个体遗传背景的差异导致。相关研究已确定经典的高共显性基因例如BRCA1、BRCA2基因与乳腺癌发病密切相关,但此类基因多与家族性乳腺癌相关,仅能解释15-25%家族相关乳腺癌,和不到5%全部乳腺癌病例。因此,更多未知的低外显性基因变异起到相当重要的作用。单核苷酸多态性(SNP)是人类基因组中最常见的遗传变异,属于胚系突变(germline mutation),不同于组织中的体细胞突变(somatic mutation),这些变异稳定存在个体基因组中并能够遗传给下一代。因此,识别与乳腺癌相关的单核苷酸多态性位点能够发现和用于筛查高危人群,降低乳腺癌的发病风险,为相关癌症机制研究提供线索。过去,以根据基因机制功能为证据,即候选基因为策略,在人群中进行病例对照关联研究成为疾病易感性位点的主要研究就方法,但由于样本量及分型技术的限制,发现位点与疾病关联效应较弱,结果在不同研究人群中存在差异,真正与疾病建立关联的遗传变异位点较少。近年来,随着人类基因组计划的完成及不断完善,以及基因分型技术的迅速发展,全基因组关联研究(Genome-wide association study, GWAS)作为一种强有力的用于筛选易感位点的研究方法,逐步应用于多种人类复杂性疾病遗传变异的研究,并且先后在基因组中发现多个与乳腺癌易感性相关的单核苷酸多态性位点。目前为止,GWAS已经在1p11.2、5p12、6q25、8q24、10q26等区域发现了众多与乳腺癌的易感性相关的基因多态性位点,从遗传学角度解释以及完善了乳腺癌的发病原因。在这些位点中,rs2046210位于染色体6q25.1区域的CCDC170基因与雌激素受体1 (ESR1)之间,在首个基于中国人群的GWAS研究中被报道与乳腺癌易感性相关。接着,在另外一项GWAS研究中,位于CCDC170基因内含子区域的rs3757318和位于ESR1基因的rs9383951也发现与乳腺癌易感性相关。至今,已有数个研究证实此区域的遗传多态性位点与乳腺癌发病相关,尤其是rs2046210位点作用已被众多研究反复证实。在一项前期的研究中,我们针对6q25.1区域41kb的区域进行进一步分析,发现四个位点rs1038304, rs6929137, rs2046210 and rs10484919与乳腺癌易感性相关。但是这些位点位于ESR1基因上游区域,仍不能很好的解释该区域与乳腺癌发病的生物学机制。因此,寻找该区域具有生物学功能的致病位点,对阐明乳腺癌遗传易感性机制具有重要意义。ESR1基因编码雌激素受体α,因其与乳腺癌发病、转归、预后多方面机制的密切关系,被认为是染色体6q25.1区域候选的致病基因。雌激素受体直接作用于DNA上的雌激素受体结合原件,或与相关转录基因结合共同作于与染色质。ESR1基因上的多态位点,也在多个基于候选基因策略的关联中报道与乳腺癌发病相关。多项研究试图阐述染色体6q25.1区域的生物学机制。Cai等人在将含有rs2046210的36kb区域分为四段,分别进行荧光素酶报告基因实验,发现rs6913578可能是潜在的功能位点与转录调控相关。此位点与rs2046210高度连锁(r2>0.8),同样位于基因间区域。在上述研究中发现的位于该区域的位点,多位于内含子或基因间,且经过连锁不平衡分析,大多位于ESR1基因上的多态性位点均与GWAS报道的位点连锁程度较低(均r2<0.1)。根据表达数量性状分析(expression quantitative trait loci, eQTL)研究结果,rs2046210基因型与基因CCDC170表达相关,有报道指出该基因与ESR1基因表达呈正相关,且与激素受体阳性乳腺癌细胞增殖相关。去年,一项发表在Nature Comunications研究结果表明,在Luminal B型雌激素受体阳性的乳腺癌组织中存在ESR1-CCDC170融合基因,体外证实该融合基因可导致疾病较强侵袭性。由此可见,CCDC170与乳腺癌密切相关。因此,为了寻找染色体6q25.1潜在功能性致病位点,本研究通过两个策略选取6q25.1区域基因多态性位点进行研究。第一,我们分析了与既往GWAS研究报道的位点rs2046210存在高度连锁不平衡的位点(r2>0.8)30个位点,结合生物信息学分析网站SNPinfo (http://snpinfo.niehs.nih.gov/)及已报道的表达数量性状分析研究(expression quantitative trait loci, eQTL, http://eqtl.uchicago.edu/cgi-bin/gbrowse/eqtl/)对多态性位点进行功能学注释。第二,我们同时纳入ESRl基因上位点,利用国际人类基因组单体型图计划(HapMap, http://www.hapmap.org)选取含有基因以及其上游2kb在内的区域,运用Haploview软件分析并选取在中国人群中最小等位基因频率(minor allele frequency,MAF)≥0.05,哈代-温伯格平衡(Hardy-Weinberg, HWE)≥0.05,基因分型率≥90%的SNP位点,然后利用生物信息学预测工具SNPinfo对筛选的所有符合以上条件的SNP位点进行功能预测,进一步通过连锁不平衡分析,以r2=0.8为界值在这些功能性位点中筛选标签多态性位点。因此,我们纳入该区域6个功能性位点,同时也纳入GWAS多次报道的位点rs2046210便于后续分析。在人群研究中,我们采用病例对照研究设计,在1064例经病理组织学确诊的乳腺癌病例和1073例年龄与之匹配的健康女性对照中,探讨该区域基因多态性与乳腺癌遗传易感性之间的关联,提取参与研究2138个体的外周血DNA,通过严格样本质检,应用Illumina分型平台进行基因分型检测。采用卡方检验或t检验比较人口学基本特征、乳腺癌发病相关因素、病理亚型及多态位点基因型频率在病例组和对照组间的分布。采用logistic回归模型,以年龄、初潮年龄以及绝经状态作为调整因素,计算优势比(odds ratio, OR)及其95%可信区间(confidence interval, CI),分析各位点与乳腺癌发病风险之间的关联强度,运用分层分析和多因素logistic回归控制混杂因素的影响。在发现的与乳腺癌发病风险显著相关位点之间,运用条件回归分析,以位点互为调整因素,估算位点对疾病的独立效应强弱。在功能机制的探讨中,我们对筛选出的具有较强独立效应,并且存在潜在功能位点进行了初步分子机制分析。应用PMIR-REPORTTM载体进行含有多态性位点的质粒构建,定点突变获得含有不同等位基因的重构质粒,瞬时转染,双荧光素酶报告基因实验,以验证多态性位点不同等位基因之间的功能学差别。应用实时定量荧光PCR在另外一个独立健康人群中,检测多态性位点不同基因型及基因mRNA水平表达之间的关系。研究结果表明,四个位点与乳腺癌发病风险相关,分别是位于CCDC170基因上的rs9383935, GWAS多次报道的位于基因间的位点rs2046210, ESR1基因上的rs3798758和rs2228480。首先,位于CCDC170基因上的rs9383935(G>A)与乳腺癌发病风险存在统计学关联(OR=1.38,95% CI:1.20-1.57, P=2.21×10-6),与野生突变GG基因型相比,每增加一个危险等位基因A,乳腺发病风险平均增加38%。我们根据年龄、初潮年龄、绝经年龄、绝经状态、乳腺癌雌激素受体状态、孕激素受体状态,对总体研究人群进行分层分析研究。分层分析显示,rs9383935在各亚组中均显示出显著效应。其次,与之前报道过的GWAS研究结果一致,我们也发现位于基因间区域rs2046210 (G>A)与乳腺癌发病风险相关(OR=1.32,95% CI:1.16-1.50,P= 2.04×10-5),与rs9383935相似分层分析亚组均显著。在ESR1基因上,两个位点多态性改变rs3798758 (G>A)和rs3798758 (G>A)存在显著效应(rs3798758, OR=1.19,95% CI:1.04-1.37,P= 0.013; rs2228480, OR=0.84,95% CI:0.72-0.98, P=0.025),与携带野生纯合型个体相比,每增加一个风险位点,前者使乳腺癌患病风险平均增加19%,后者平均降低16%。分层分析显示,rs3798758在低年龄组、初潮年龄较高组、绝经前女性中显著增加乳腺癌发病风险,同时该位点不同激素状态乳腺癌发病风险均相关;rs2228480分层中在高年龄组、首胎活产高年龄组、雌激素受体阳性乳腺癌中更为显著。接着,对四个位点进行异质性检验,提示各位点在各层间均不存在异质性(P<0.05)。进一步运用条件回归分析,以上述四个位点互为调整因素,来判断各位点独立效应。结果表明当将rs2046210加入logistic回归分析调整因素,rs9383935仍然与乳腺癌易感性显著相关(P=0.025);反之,以rs9383935作为调整因素,rs2046210的与疾病的关联性减弱(P=0.810)。其次,我们纳入所有四个位点进行分析,分别以除本身位点以外的三个位点作为调整因素,两个位于ESR1基因rs2228480和rs3798758,以及6q25.1区域基因间的rs2046210关联性明显减弱(分别为P=0.069,0.082和0.901)。然而,位于CCDC170基因上的rs9383935呈现了较强的独立作用,经调整后仍然与疾病的易感性显著相关(P=0.019)。提示rs9383935可能为此区域重要的致病位点。通过含有rs9383935位点的CCDC170 3’UTR区域质粒重构,进而以荧光素酶报告基因实验,在两个乳腺癌细胞系MCF-7、BT-474中,验证了该位点G>A的突变可以削弱miR-27a与CCDC 170基因3’UTR端的结合力,从而使得CCDC 170的转录水平升高。进一步,观察miR-27对细胞内源性基因表达水平的影响,在MCF-7细胞系中,转染miR-27提取细胞RNA逆转录后,通过RT-PCR检测,细胞内CCDC 170的表达水平显著下降。为进一步证实rs9383935在既往eQTL分析研究中的结果,其能够影响本体基因CCDC 170的表达,探讨染色体6q25.1区域上rs9383935在乳腺癌发生发展中的潜在功能学。同时鉴于该区域ESR1基因的重要性,及既往ESR1基因与CCDC 170表达的相关性。在一个独立122健康人群中,我们进行了rs9383935基因型与CCDC 170和ESR1基因表达关系的分析。结果表明,携带rs9383935 A危险等位基因的个体与不携带危险等位基因的个体相比CCC170基因的相对表达水平显著升高,而该位点的不同基因型与ESR1的相对表达水平没有观察到显著相关性。结合癌症基因数据库TCGA(The Cancer Genome Atlas)中的乳腺癌数据,分析了rs9383935基因型与乳腺癌患者总体生存(overall survival)之间的关系,发现在非裔人群中,该位点风险等位基因A能够显著提高的乳腺癌的死亡风险。同样,运用TCGA乳腺癌肿瘤组织表达数据,对比了匹配的肿瘤组织与癌旁组织中CCDC170基因的表达差异,尽管总体样本中肿瘤组织中平均表达水平稍高于癌旁组织,但未达到统计学差异。我们还比较了四种乳腺癌病理亚型中CCDC170基因的表达差异,四种亚型分别是:LuminalA型乳腺癌(ER+/PR+HER2-)550例,Lumina B型(ER+/PR+HER2+)101例,单纯HER2阳性乳腺癌(ER-PR-HER2+)27例和149例三阴乳腺癌中(ER-PR-HER2-),发现在四种亚型中该基因表达差异显著。本研究联合Hapmap、SNPinfo等多个基因组及生物信息学数据库,并且结合HaploView软件筛选了染色体6q25.1区域6个功能性单核苷酸多态性位点,采用病例对照研究设计,在1064例经组织病理学确诊的乳腺癌新发病例和1073例年龄与之匹配的健康女性对照中进行基因分型检测,对各位点在病例和对照之间的基因型分布进行比较,探讨多态性位点与乳腺癌易感性之间的关联,并进行了初步的生物机制研究,发现此区域的功能性致病位点,进一步阐明乳腺癌的遗传易感机制提供线索,为高危人群的筛检和乳腺癌的早期诊断提供科学依据。