论文部分内容阅读
背景:原发性肝癌是常见恶性肿瘤之一,在恶性肿瘤中其世界范围年发病率占第五位,死亡率占第三位。中国是乙型肝炎病毒慢性感染大国,也是肝癌的发病大国,每年新发肝癌病例的一半来自是中国。慢性乙型肝炎病毒感染是肝癌的最重要风险因子。但是,只有少部分慢性乙型肝炎感染者最终会发生肝癌,说明遗传背景起到重要作用。方法:本研究收集中国华东地区汉族男性乙型肝炎病毒慢性感染者(HBsAg阳性),采用病例对照研究设计,利用基因芯片进行两个阶段的全基因组单核苷酸多态性(SNP)关联研究(genome-wide association study, GWAS)。第一阶段用Affymetrix 500K基因芯片对50例肝癌和50例对照进行全基因组50万个单核苷酸多态性(SNP)扫描。第二阶段从第一阶段结果中选择1152个SNP,利用Illumina公司GoldenGate定制基因芯片,在282个肝癌与278个对照中进行SNP扫描和关联分析。使用假阳性报告率(false positive report probability, FPRP)对统计学结果进行评估。对可能的相关基因在肝癌和癌旁组织及正常肝组织中的基因和蛋白质表达用实时定量聚合酶链式反应(qRT-PCR)和免疫组化进行检测。结果:第一阶段SNP关联分析显示357个SNP的最小p值(从allel_P,genotype_P和Cochran-Armitage_P中确定)小于1×10-3。第二阶段研究显示26个SNP的等位基因分布差异的未校正p值小于0.05。第一阶段和第二阶段合并分析显示,8个SNP(rs2120243,rs1350171,rs7116140,rs1048338,rs4480667,rs4417097,rs9893681 and rs4561519)通过FPRP检验门槛(FPRP<0.20)。关联性最强的是rs2120243(合并ORallele=1.76,95%CI:1.39-2.22,p=2.00×10-6),此SNP位于VEPH1第四内含子中。关联性排在第二位的是位于基因FZD4下游的rs1350171(合并ORallele=1.66,95%CI:1.33-2.07,p=6.48×10-6)。关联性排在第三位的是位于基因PCDH9上游的rs4480667(合并ORallele=0.64,95%CI:0.51-0.81,p=1.42×10-4)。另外SNP涉及的基因是PRMT6, LHX1和KIF2B。实时定量聚合酶链式反应(qRT-PCR)和免疫组化染色显示VEPH1,FZD4基因的mRNA和蛋白质在肝癌组织中较癌旁组织及正常肝组织低表达,PCDH9蛋白在肝癌组织中较癌旁组织及正常肝组织显著低表达。结论:本两个阶段的全基因组关联试点研究(332例肝癌和328例对照)和初步的基因表达研究,发现了一些肝癌相关基因。基因功能分类和蛋白质网络分析提示可能与肝癌的发生相关相关基因涉及TGFB1, PI3K/insulin, Wnt, EGFR等多条信号通路。本研究得到的关联结果需要在具有不同遗传背景的、更大的样本人群中重复证实,相关基因在肝癌发生中的作用需要更加深入细致的研究。本研究利用全基因组高密度SNP芯片(Affymetrix 500K)在肝癌易感人群-汉族男性慢性乙型肝炎病毒感染者(HBsAg阳性)中进行全基因组SNP扫描,在病例-对照组中发现SNP频率的分布差异,进行关联研究,旨在发现与肝癌发生可能有关的SNP,从中挑选通过适当的统计学差异门槛的SNP,进行第二阶段的扩大样本的SNP验证。本研究样本50例肝癌和50例对照均为来自江苏启东地区的男性汉族人,血清HBsAg阳性。全基因组关联研究结果显示,357个SNP的分布差异最小P值(从等位基因P,基因型P和趋势P中确定)小于1×10-3,其中26个SNP的最小P值小于1×10-4。本研究利用Illumina GoldenGate客户定制芯片对1152个SNP进行扩大样本的基因关联研究,以期验证第一阶段的关联结果。我们依照P值大小、信号成簇性、涉及基因的对蛋白质功能有影响错义突变及可能存在拷贝数变异(copy number variation, CNV)的挑选方法,挑选出1152个SNP进行第二阶段的验证工作。研究样本包括282例肝癌和278例对照。病例来自华东地区,HBsAg阳性。对照来自江苏启东地区。所有研究样本均为汉族男性人。实验结果显示643个SNP通过质量检验标准(MAF>0.01 and HWE disequilibrium P>0.001, call frequency> 0.95)。其中26个SNP的等位基因频率分布差异P值小于0.05。合并第一、第二阶段基因型分布频率计算等位基因分布差异,并且用假阳性报告率(false positive report probability, FPRP)小于0.20为标准,结果显示8个SNP(rs2120243,rs1350171,rs7116140,rsl048338,rs4480667,rs4417097,rs9893681 and rs4561519)达到统计学意义。与8个SNP最近的6个基因是:VEPH1, FZD4, PCDH9, PRMT6, LHX1和KIF2B。本研究利用实时定量聚合酶链式反应(qRT-PCR)对11例肝癌组织和2例正常肝组织进行VEPHl和FZD4基因mRNA表达检测。利用免疫组化的方法对22例肝癌、癌旁组织和11例正常肝组织进行VEPH1,FZD4和PCDH9蛋白表达检测。实验结果表明,VEPHl和FZD4的mRNA和蛋白质水平在肝癌组织中较癌旁与正常肝组织低表达(PCDH9的基因mRNA检测尚在进行中)。VEPH1,FZD4和PCDH9蛋白质在肝癌组织中较癌旁与正常肝组织显著低表达。通过对6个相关基因及其SNP的生物信息学检索,发现多数基因与肿瘤的发生发展有关。相关SNP分别位于这些基因的内含子,基因上下游或是对蛋白质功能有损害的错义突变。这些SNP可能通过影响基因表达或者损害蛋白质功能而影响肝癌的发生,功能学影响尚需进一步的研究证实。本研究利用多因子降维法(multifactor dimensionality reduction, MDR)和多元Logit回归的方法,分析肝癌的基因互作与风险因素。6个SNP(rs2120243, rs4480667, rs1350171, rs4417097,rs9893681,rs4561519)在第二阶段560个样本中的基因型分布经过MDR分析,显示rs4480667,rs2120243与rs1350171有相互作用,其基因型组合可以较好地区别肝癌组与对照组,可能做为肝癌分子诊断标志物。对6个SNP (rs2120243, rs4480667, rs1350171, rs4417097,rs9893681,rs4561519)和年龄,家族史,吸烟,饮酒史进行多元logit回归,结果显示:肝癌家族史,rs4480667,rs2120243,rs1350171,rs4561519和rs9893681是肝癌的独立风险因子,与肝癌的发生相关。为了尽可能挖掘与肝癌相关的基因以及基因间的相互作用,我们扩大基因检索范围:纳入第一阶段与第二阶段合并分析或第二阶段显示等位基因频率分布差异P值小于0.05的SNP,再利用NCBI MAP工具,搜寻与SNP最近的基因。结果显示,共有涉及71个基因的SNP等位基因频率分布差异P值小于0.05。我们将71个基因输入MAS 3.0,DAVID和STRING报务器在线分析功能分类与蛋白网络。分析结果显示涉及前脑发育,细胞迁移,细胞增殖,基因可变剪接,细胞膜蛋白,信号转导和细胞黏附等基因富集明显(与全基因组基因分类比较)。STRING分析显示位于网络中心的关键节点有:FYN, EGFR, SRC, PTK2B, ERBB2, BDNF, IL2, PRKCQ和CCND1等蛋白,其中许多蛋白与肿瘤有关。全文结论本研究通过同质性较好的肝癌易感人群两个阶段的GWAS研究,发现了一些可能的肝癌相关基因。实验初步证实3个基因(VEPH1,FZD4和PCDH9)在肝癌组织与癌旁及正常组织中的表达存在差异。基因功能分类及蛋白质网络构建显示出可能与肝癌发生的一些相关基因及基因相互作用网络。关联结果和基因功能研究需要在更大的样本研究中重复证实。创新点本研究采用病例-对照研究设计,首次利用全基因组SNP检测进行肝癌相关基因的筛查,找到了一些可能与肝癌发生的相关基因。潜在应用价值肝癌相关基因的鉴定是肝癌发病机制研究的重要方面,经过证实的肝癌相关基因突变可以作为肝癌发生的风险预测和基因治疗靶点,具有重要的临床应用价值。