论文部分内容阅读
乳腺癌(Breast Cancer,BC)仍是一个世界性的公共卫生难题。在女性中,乳腺癌是最常见的癌症,也是癌症死亡的最主要原因。研究发现乳腺癌是由个人生活方式、环境、遗传和生殖因素等多种因素相互作用发展的结果。长链非编码RNA(long non-coding RNA,lncRNA)在肿瘤的发生发展过程中发挥着重要的生物学功能。越来越多的证据表明易感基因在肿瘤发生发展中起着重要作用。由于lncRNAs结构的复杂性也决定了其功能的复杂性,虽有报道lncRNA LINC00520与乳腺癌相关。然而,目前LINC00520 SNPs与乳腺癌遗传易感性之间的关联及其作用机制尚不清楚。目的本课题联合数据库、文献检索以及生物信息学技术,全面的筛选与乳腺癌发生相关的lncRNA及其单核苷酸多态位点(Single Nucleotide Polymorphism,SNP),用分子流行病学的方法,同时结合病例-对照研究,进行长链非编码RNA遗传变异与乳腺癌易感性关联研究,并对其生物学功能进行初步研究。方法1.基于生物信息学,联合数据库和文献检索全面的筛选与乳腺癌发生相关的lncRNA及功能性SNPs,并对SNPs进行功能预测。2.采用分子流行病学的方法,同时结合病例-对照研究,借助PASS 8.0.14(http://www.ncss.com/pass.html)计算样本量。本次研究共纳入乳腺癌新发病例504例和按照年龄(±2岁)与之频数匹配的健康对照505例,并收集其血液样本。根据位点的不同情况,rs11622641、rs7157819、rs12880540和rs2152275位点采用SNPscan分型方法,rs4144657、rs2152278和rs7142488位点采用PCR-RFLP方法分型,rs8008130和rs8012083位点采用CRS-RFLP方法分型,检测筛选出的基因SNPs在乳腺癌患者与正常人群中的基因分型表达频率。应用Hardy-weinberg软件分析对照组人群基因型分布是否符合Hardy-Weinberg平衡。采用MDR 2.0软件分析lncRNA基因上的多态位点与生殖因素间的交互作用。采用SPSS 21.0(SPSS Inc.,Chicago,USA)软件进行统计分析,分析SNPs等位基因频率分布差异及其与乳腺癌易感性及激素水平之间的关联,找到功能性SNPs并对其进行进一步的功能研究。3.利用实时荧光定量PCR(quantitative reverse transcription-polymerase chain reaction,qRT-PCR)检测功能性SNP不同基因型组别中lncRNA的相对表达水平,从而分析功能性SNP与lncRNA表达水平之间的关联。同时利用荧光素酶(luciferase assays)试验验证SNP等位基因变异是否会影响lncRNA与预测的具有潜在结合位点的miRNA的结合。结果1.关联分析:rs11622641和rs2152278这两个位点等位基因的变异个数可影响乳腺癌的发病风险。rs11622641基因型CT相比于其野生基因型CC降低了乳腺癌33.4%的发病风险(OR:0.666,95%CI:0.453-0.979)。rs11622641位点在显性模型(OR:0.650,95%CI:0.445-0.949)和超显性模型(OR:0.670,95%CI:0.455-0.984)中均能降低乳腺癌的发病风险。rs12880540基因型GG相比于其野生基因型TT增加了乳腺癌55.1%的发病风险(OR:1.551,95%CI:1.034-2.328)。rs12880540在隐性模型(OR:1.566,95%CI:1.069-2.295)中能增加乳腺癌的发病风险。rs2152278基因型TT相比于其野生基因型GG可增加乳腺癌70.0%的发病风险(OR:1.700,95%CI:1.278-2.261)。rs2152278位点在显性模型(OR:1.619,95%CI:1.239-2.114)和超显性模型(OR:1.556,95%CI:1.194-2.026)中均能增加乳腺癌的发病风险。而rs7157819、rs2152275、rs8008130、rs4144657、rs8012083和rs7142488位点在共显性、显性、隐性和超显性模型中均与乳腺癌发病风险没有统计学关联(P>0.05)。2.分层分析:年龄≤50岁(OR:0.549,95%CI:0.327-0.923)、初潮年龄≤14(OR:0.549,95%CI:0.342-0.880)、怀孕次数>2(OR:0.596,95%CI:0.363-0.980)和流产次数≤2(OR:0.637,95%CI:0.434-0.935)的人群中,rs11622641基因型CT或TT的个体相较于基因型CC的个体有较低的乳腺癌发病风险(P<0.05)。rs7157819基因型CT或TT在流产次数>2的人群中能增加其乳腺癌发病风险(OR:4.192,95%CI:1.135-9.486)。rs12880540基因型TG或GG在绝经年龄≤50岁的人群中能增加其乳腺癌发病风险(OR:1.800,95%CI:1.055-3.070)。在绝经年龄≤50岁的人群中,rs4144657基因型CT或TT相对于基因型CC能够降低乳腺癌发病风险(OR:0.230,95%CI:0.061-0.871)。rs2152278位点在年龄≤50岁、初潮年龄≤14、初潮年龄>14、未绝经、怀孕次数≤2、怀孕次数>2、流产次数≤2、流产次数>2、有母乳喂养史、无母乳喂养史、无乳腺癌家族史人群中携带基因型GT或TT均可增加乳腺癌的发病风险。rs12880540基因型TG(OR:1.617,95%CI:1.037-2.522)、rs2152275基因型AA(OR:2.735,95%CI:1.008-7.418)以及rs8012083基因型GG(OR:0.305,95%CI:0.135-0.693)均与Her-2受体阳性状态有统计学关联。rs8012083基因型GG(OR:3.575,95%CI:1.318-9.698)能够明显增加三阴型乳腺癌的发病风险。3.单倍型分析:LINC00520基因Crs7157819 Trs12880540 Ars2152275 Trs11622641单倍型可以降低乳腺癌发病风险。4.交互作用分析:怀孕次数、流产次数和rs2152278在乳腺癌发生过程中具有基因-生殖因素交互作用,结果显示怀孕次数>2、流产次数>2且具有rs2152278等位基因T的人群患乳腺癌的风险增加5.239倍。5.qRT-PCR:rs12880540基因型TG和GG的LINC00520相对表达量均明显高于基因型TT(P<0.01),rs12880540基因型GG的LINC00520的相对表达量也明显高于基因型TG(P<0.01)。趋势检验结果显示LINC00520相对表达量随着rs12880540突变个数的增加呈线性变化趋势(Ptrend<0.001)。6.功能验证:生物信息学预测可知rs12880540等位基因G突变为T后,LINC00520的二级结构发生了改变,同时产生miR-92a-2-5p和miR-4648两个结合位点以及丢失miR-3122、miR-3913-5p、miR-4259和miR-4425四个结合位点。荧光素酶报告基因实验结果发现:rs12880540等位基因为T时LINC00520和miR-3122有相互作用关系,但是rs12880540 G/T变异对LINC00520和miR-3122的结合能力没有影响。结论1.本研究首次发现了LINC00520基因上rs11622641位点可降低乳腺癌的发病风险;rs12880540和rs2152278可增高乳腺癌的发病风险。rs12880540基因型TG、rs2152275基因型AA以及rs8012083基因型GG均与Her-2受体阳性状态相关。rs8012083基因型GG能够明显增加三阴型乳腺癌的发病风险。2.LINC00520基因Crs7157819 Trs12880540 Ars2152275 Trs11622641单倍型可以降低乳腺癌发病风险。怀孕次数、流产次数和rs2152278在乳腺癌发生过程中具有基因-生殖因素交互作用。3.LINC00520相对表达量随着rs12880540突变个数的增加呈线性趋势增长。LINC00520和miR-3122有相互作用关系,但是rs12880540 G/T变异对LINC00520和miR-3122的结合能力没有影响。4.本研究首次探索了LINC00520 SNPs与乳腺癌遗传易感性的关联研究和功能验证,为乳腺癌的筛查和早期诊断提供了潜在的生物标志物,也为乳腺癌的预防提供了依据。