广东、重庆、山东、南昌散发性乳腺癌易感基因多态性筛选及验证的研究

被引量 : 9次 | 上传用户:kent10211021
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究背景和目的:乳腺癌是女性最常见的恶性肿瘤之一,其发病率在全球呈明显的上升趋势,严重危害着广大妇女的身体健康。尽管我国属于乳腺癌低发地区,但随着工业化的发展,人们生活方式的变化,乳腺癌总发病率在不断提高。2005年统计结果显示,乳腺癌在城市女性肿瘤发病率中位居第一,为49.25/100,000,预计到2021年,中国妇女乳腺癌的发病率将达到85.3/100,000。如何进行早期预防并降低乳腺癌发病率已经成为乳腺肿瘤研究中的重大现实课题。乳腺癌的发生发展是一个复杂的过程,不仅涉及生活习惯、环境等因素,还与个体的遗传背景有关。在相似的致癌因素作用下,只有部分人群发生肿瘤。不同的遗传背景使得只有部分人群对特定致癌因素敏感,即有不同的肿瘤易感性。随着人类基因组计划完成以及基因组学、功能基因组学、药物基因组学等相关学科的快速发展,人们对自身遗传信息和乳腺癌的关系有了更深刻的了解。乳腺癌发生发展是多基因多阶段协同作用的结果,从致癌物质发挥作用到肿瘤的形成过程中涉及多种外显性不同的易感基因的异常活动。高外显性的易感基因包括BRCA1, BRCA2, TP53和PTEN;中外显性的有ATM, CDH1, STK1, NBS1, BRIP等,低外显性的有FGFR2, TOX3(TNRC9), MAP3K1, LSP1, CASP8,TGFB1以及一些非基因区的易感位点。BRCA1/2, TP53和PTEN的突变只占据乳腺癌患者遗传风险的15-25%,并且在散发性乳腺癌很少检测到这些突变,中外显性易感基因CHEK2, ATM, CDH1, NBS1, RAD50, BRIP, PALB2, TGFBR1等基因中的突变对乳腺癌患者遗传风险的贡献为20-30%,表明还有其他的易感基因与乳腺癌的发生风险相关。前些年针对乳腺癌这类复杂性疾病,国外主要从群体遗传学入手(大、中、小人群关联分析研究和全基因扫描分析),又寻找了大量的易感基因和风险位点。如FGFR2, TNRC9, MAP3K1, LSP1, RAD51, ESR1, TOX等。单核苷酸多态性(Single nucleotide polymorphism, SNP)则是易感基因引起肿瘤易感性的表现方式之一。它是继限制性片段长度多态性(Restriction Fragment Length Polymorphism, RFLP)、DNA单链构象多态性(Single-Strand Conformation Polymorphism, SSCP)之后出现的第三代遗传标记,主要是指在基因组水平上由单个核苷酸变异(包括转换、颠倒、缺失、插入)所引起的DNA序列多态性,在基因组中的分布密度高,大约每隔300-1000个碱基就出现一次。大量研究发现SNP是疾病易感性、药物敏感性等生物性状(表型)差异的重要遗传学基础,因此SNP的相关研究将会为疾病的诊断、预防和治疗等个体化医疗发展提供重要数据基础和理论依据。在复杂疾病风险因素的研究中,全基因组关联分析(Genome-wide association study, GWAS)成为一个非常行之有效的方法。全基因组关联分析是指在人类全基因组范围内找出存在的序列变异,即单核苷酸多态性(SNP),从中筛选出与疾病相关的SNPs。GWAS为人们打开了一扇通往研究复杂疾病的大门,将在患者全基因组范围内检测出的SNP位点与对照组进行比较,找出所有的变异等位基因频率,从而避免了像候选基因策略一样需要预先假设致病基因。同时,GWAS研究让我们找到了许多从前未曾发现的基因以及染色体区域,为复杂疾病的发病机制提供了更多的线索。GWAS的设计基本原理同经典的病例对照研究相同,即假设某个SNP与疾病发生关联,则理论上病例中该SNP的等位基因频率应该高于对照组。然后通过假设检验来检验该假设。但GWAS研究所需样本量大,基因分型耗资巨大,因此遗传统计分析的任务不仅要从几十万个SNPs中发现与疾病表型的关联,同时需要严格控制由于人群混杂可能带来的假阳性,以及因多重比较而带来的I类错误概率扩大等问题,从大量的阳性结果中筛选出那些与疾病真正相关的基因组内序列变异。高质量的重复研究能够帮助我们做出正确的判断。重复研究的方法之一是直接将两个或者几个研究人群联合起来进行分析,通过大样本量来提高研究的检验效能,提高可能与与疾病关联的SNP的概率。重复研究已成为我们发现与疾病真关联的必要保证。鉴于此,本研究拟在现有国内外研究成果的基础上,挑选出GWAS研究得到的阳性位点,通过在中国汉族女性中进行验证来筛选出适合中国汉族人群的SNP位点,为乳腺癌风险评估模型的建立提供数据和理论基础。本研究首先在广东、南昌、重庆收集乳腺癌标本,选择全基因组关联分析研究获得的43个SNP位点,对乳腺癌病例和对照标本进行基因分型,并对基因分型数据进行统计分析,初步筛选出适合中国汉族女性的SNP位点。分析策略为:第一部分,将广东、南昌、重庆三个地区的汉族女性作为一个整体研究对象,按照病例-对照设计进行分析;第二部分,以广东汉族女性为研究对象,分析病例组与对照组之间基因型频率的分布是否有差异;第三部分,分析南昌地区与乳腺癌发病风险相关的SNP位点;第四部分,仅对重庆汉族病例组和对照组进行分析。此外,由于乳腺癌热点基因FGFR2上具有多个位点(rs1078806、rs2981579、rs7895676、 rs1219648、rs2420946、rs2981582、rs2981575)被选择,故对其符合HWE平衡的位点进行了进一步的连锁分析和单倍体型分析。我们挑选出本次研究中与乳腺癌发病密切相关的易感基因及阳性位点,在山东汉族女性中进一步验证。数据分析分为两部分:第一,单独对山东汉族女性进行分析;第二,将大样本量的两个人群联合起来分析,即将山东和广东地区数据合起来分析。方法:位点的初步筛选1.研究对象的收集根据病例对照研究设计,收集广东、南昌、重庆三个地区汉族女性乳腺癌病例及正常女性对照全血标本,并收集相应临床资料。使用DNA提取试剂盒(Tiangen)提取血样DNA,并保存于-70℃备用。2.待验证乳腺癌易感SNP位点的挑选挑选出乳腺癌全基因组关联分析得到的全部阳性SNP位点。3.引物设计及合成从NCBI由dbSNP数据库中将含有已挑选SNP位点的序列下载,用引物设计软件(Assay Designer3.1, Sequenom)进行引物设计,每个位点有相应的三条引物,包括PCR扩增的前、后引物(1st-PCRP,2nd-PCRP)以及单碱基延伸反应引物(UEP_SEQ),将设计好的引物送至英骏公司(上海)合成。4.基因分型检测经过PCR. SAP及Extention等步骤处理DNA后,利用Sequenom MassARRAY-iPLEX平台,对选出的位点进行基因分型。5.各个SNP位点的统计分析对检测结果进行整理,利用网站http://bioinfo.iconcologia.net/SNPstats进行相关统计分析,筛选出与中国汉族女性乳腺癌发病风险相关的易感SNP位点。6. LD and haplotype分析利用软件haploview,对FGFR2上的位点rs1078806、rs2981579、rs1219648、rs2420946、rs2981582,进行单倍体型分析和LD分析。易感位点的进一步验证1.对初步筛选出的与乳腺癌发病密切相关的易感基因及阳性位点进一步在山东汉族女性中验证。2.数据分析先对山东样本进行独立分析,再将广东和山东样本结合起来分析,排除小样本量的影响。结果:共挑选出待检测SNP位点43个。经过检测及相关统计分析发现rs999737在中国汉族女性中无多态性,基本基因型为CC。共发现11个位点有统计学意义并与乳腺癌发病风险相关,分别是:1)在广东、南昌和重庆为整体研究对象中有6个位点rs2981579(P=0.029)、rs4784227(P=0.0069)、rs4973768(P=0.038)、 rs2046210(P=0.0001)、rs8051542(P=0.039)、rs3734805(P=0.0006)的基因型在病例组与对照组分布中存在差异,具有统计学意义;2)以广东地区汉族女性为研究对象,统计分析得出8个阳性位点,分别是rs4784227(P=0.0003)、 rs16886165(P=0.024)、rs3757318(P<0.0001)、rs2046210(P=0.0008)、rs8051542(P=0.017)、rs13387042(P=0.04)、rs1978503(P=0.032)、rs3734805(P=0.0041);3)位点rs1562430(P=0.02)和rs3757318(P<0.0001)与南昌地区汉族女性乳腺癌发病风险相关,位点rs1562430的GG基因型为保护性基因型且其病例组不符合平衡;4)rs4973768(P=0.041)和rs2046210(P=0.023)在重庆地区人群中具有统计学意义,且均为危险位点。其中rs2046210是与中国汉族女性乳腺癌发病风险高度相关的一个SNP位点。连锁分析结果表明:1)位点rs2981579和rs1078806高度连锁(D’=0.997,r2=0.453,2); rs2420946和rs2981582高度连锁(D’=0.958,r2=0.701)。5个位点rs2981579、rs1078806、rs1219648、rs2420946、rs2981582单倍体型分析结果,单倍体型TTACC和TTGTC病例组和对照组中存在差异,且为危险单倍体型,P值分别为0.02和0.0066。进一步验证时发现:1)在山东地区人群中,位点rs2046210(P=0.05)、rs3734805(P=0.037)、rs3803662(P=0.033)、rs4784227(P=10-4)、rs12443621(P<0.0001)病例对照组基因型分布频率存在差异,且具有统计学意义;2)排除小样本量影响,对广东和山东地区联合分析,发现位点rs889312(P=0.018)、rs16886165(P=0.012)、rs3734805(P=6×104)、rs4784227(P<0.0001)、rs2046210(P=2×104)是潜在的乳腺癌易感位点。结论:本研究共挑选出的43个可能易感SNP位点,经过在中国汉族女性人群检测和统计分析,筛选出14个有统计学意义,可能与中国汉族女性乳腺癌发病风险相关易感SNP位点。位于基因ESR1的位点rs3734805和rs2046210和位于基因TOX3的位点rs4784227与中国汉族女性乳腺癌发病风险密切相关,rs2046210的关联性最明显。综合以上的研究结果表明,FGFR2, ESR1和TOX3与中国人群乳腺癌易感性密切相关。
其他文献
<正>一、亲近文本,探寻学法先“读”《白鹅》这篇课文是丰子恺先生《缘缘堂随笔》中少有的一篇写动物的优美散文。课文为节选内容,整篇课文语言幽默、诙谐,
祁东县是一个以水稻生产为主的农业大县,常年水稻病虫害发生面积均在770万亩次以上,近年来水稻病虫害特别是"两迁"害虫发生为害加重。本文通过组建水稻重大病虫害绿色防控技
目的:观察清胰汤(Qing Yi Decoction, QYD)对重症急性胰腺炎(severe acute pancreatitis, SAP)大鼠肠神经系统(enteric nervous system, ENS)血管活性肠肽(vasoactive intesti
在对基因芯片杂交环境采用开放式设计,建立开放式板式温控体系,并利用CCD成像体系对基因芯片杂交结果进行分析。结果表明开放式基因芯片杂交体系是可行的,降低基因芯片杂交对
近年来,国际农产品市场竞争日益激烈,中国作为国际上开放的农产品市场之一,农产品贸易面临着机遇与挑战。农业是中国经济发展的基础,需要政策、科技、资金三方面的投入,这体
人参作为名贵中药,其活性成分较多,具有多种药理作用。目前,人参的需求量越来越大,其加工品在医药、化工、保健、饮料、美容等领域得到了广泛应用。但人参产品缺乏完善的质量
牛初乳中含有免疫球蛋白、乳铁蛋白和生长因子等天然活性物质,其中的免疫球蛋白含量较高且具有提高人体免疫力和增强疾病抵抗力等功能,故牛初乳对乳产品的开发具有重要意义。
目的探讨结直肠癌切除联合射频消融治疗同时性结直肠癌肝转移对相关临床指标、患者的安全性及预后生存率的影响,为该疗法在临床的应用提供依据。方法回顾性分析2011年1月—20
对近年来引进的优质用材美国红橡纳塔栎(Quercus nuttallii)、水栎(Quercus nigra)和舒玛栎(Quercus shumardii)3个14年生树种的木材生长特性进行了研究,主要生长指标有单株平均材
轮胎是我国化学工业的重点产品之一,轮胎裁断是轮胎厂半成品生产中的关键环节,其裁断精度如何,将直接影响到轮胎成型半成品的质量,进而影响轮胎成品的内在质量。本课题就是开发一