基于二代测序靶向捕获技术准确检测地中海贫血珠蛋白基因变异

来源 :南方医科大学 | 被引量 : 5次 | 上传用户:yeah0818
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
背景与目的地中海贫血是严重威胁人类健康的致死致残的常染色体隐性遗传性血液病。全球约2%的人为地中海贫血基因的携带者,在我国南方高发病地区的人群携带率为3%-24%。地中海贫血是由于珠蛋白基因发生缺陷,导致肽链合成减少或缺失的遗传性溶血性血红蛋白病,根据编码珠蛋白基因肽链合成受到抑制的类型,地中海贫血可分为弘地中海贫血、p-地中海贫血、δ-地中海贫血、Y-地中海贫血、δp-地中海贫血和研6p-地中海贫血等。临床上地中海贫血又分为轻型(地中海贫血携带者),中间型和重型。临床表现出特殊的地中海贫血面容-头颅增大、颧骨突出、眼距增宽、鼻梁低平,根据病情的轻重表现为小细胞低色素,溶血性贫血伴黄疸,疲乏无力,肝脾肿大,不定期或定期输血,水肿胎或过多铁沉积导致心力衰竭致死。成人的血红蛋白主要是两个a类亚基和两个β类亚基珠蛋白形成的四聚体,在血红素的作用下运输氧气。因此地中海贫血可大致分为α地中海贫血和p-地中海贫血,α地中海贫血主要由弘珠蛋白基因缺失引起,中国人中最常见的是SEA、3.7kb和4.2kb这三种缺失类型,在广西地区突变携带率分别为7.84%,4.78%和1.61%。p-地中海贫血主要由p-珠蛋白基因突变引起,中国人中最常见是点突变CD41-42(广西地区占45.2%),CD17(广西地区占24.7%),-28、CD26、IVS-Ⅱ-654和CD71-72这6种突变共占了全部突变类型90%以上。α-珠蛋白基因簇定位于16号染色体16p13.3位点,成人α珠蛋白主要由仅1和眈两个基因编码,p珠蛋白基因簇定位于11号染色体1lp15.5位点,成人p-珠蛋白主要由p基因编码。目前世界上已发现至少300种伽珠蛋白基因变异和200多种p-珠蛋白基因变异,而在中国人群中至少30种(其中17种缺失型和13种非缺失型)α地中海贫血突变和58种(52种点突变和6种缺失型)p-地中海贫血突变。由于地中海贫血属于常染色体隐性遗传病,即夫妻双方都为地中海贫血基因携带者,下一代则有1/4的几率成为地中海贫血的患者。而目前地中海贫血缺乏理想的治疗方法,输血和骨髓移植是目前改善患者生活的方法,但该方法给家庭带来沉重的经济负担,对患者的心里带来严重的影响。想从根源上防止地中海贫血的发生,重要的在于预防有地中海贫血基因缺陷的患儿出生,做好产前大规模人群的筛查和宣传。临床上进行地中海贫血基因的筛查只针对q基因的3种缺失和3种点突变,β基因的17种点突变,远远不能满足对其他变异位点的检测,因此准确诊断地中海贫血的致病突变可以更有效的预防患儿的出生,丰富已有突变数据库的同时为地中海贫血病人的治疗提供新的靶点和研究思路。二代测序技术又称下一代测序技术或深度测序技术,可以一次性对几十万到几百万条DNA分子序列进行测定,其本质为边合成边测序,即通过不同颜色的荧光来标记四种不同的dNTP,通过碱基互补配对原理在DNA聚合酶的作用下,每次添加一种dNTP,结合的碱基就会释放出相应的荧光,最后根据荧光信号对碱基进行识别,一次上机可以产出几百兆到几个太的数据量。与传统的一代测序技术相比二代测序可以一次性对几百几千个样本同时进行测序分析,具有高通量,低成本,高分辨率等优点,靶向捕获测序是利用序列捕获技术将所感兴趣的区域通过芯片杂交的方式抓取下来,通过高度富集度的方式,更直接快捷地获得大批量样本的序列变异信息,相对于全基因组测序更高效更快捷,极大提高了人类基因组疾病相关区域的研究效率,显著降低了研究成本。因此该技术被广泛应用到遗传性疾病检测,肿瘤疾病,药物开发等分析和研究中,该技术还可完美地应用于地中海贫血疾病中未知变异的发掘和解决常规实验室无法检出的的变异。本研究主要采用二代测序结合芯片捕获技术对地中海贫血病人进行测序分析,测序原始数据通过BWA, Samtools, GATK, Annovar等一系列软件的处理,结合Python和Perl等程序对数据作出相应分析,最后可分别得到点突变(SNP),小插入缺失突变(Indel)和拷贝数变异(CNV)等信息,从而对地中海贫血病人变异作出准确的判断。本研究旨在搭建好二代测序数据分析的平台,初步构建地中海贫血疾病相关变异的信息学数据分析流程,建立相关基因的突变谱,为后期地中海贫血病人的变异检测提供基础,也为其他遗传性疾病的诊断和预防提供参考和研究方向。材料与方法1.研究对象收集来自我国南方192例无亲缘关系的地中海贫血样本进行回顾性分析,其中包含93例棚R蛋白基因型正常的p-地中海贫血患者,84例β-珠蛋白基因型正常的α地中海贫血患者和15例α-珠蛋白基因合并p-珠蛋白基因的地中海贫血患者。此项研究通过了我校南方医院医学伦理委员会的批准,所有患者均签订知情同意书。2.血液学参数与基因型检测所有的血液学参数结果均使用自动全细胞计数仪和血红蛋白分析仪高效液相色谱法进行测定,使用经典酚-氯仿法提取受试者外周静脉血(EDTA-K2抗凝)基因组DNA。通过跨越断裂点PCR (Gap-PCR)检测缺失和反向点杂交(Reverse Dot Blot, RDB)检测点突变进行样本基因型验证。3.基因组DNA文库构建将符合质检的基因组DNA每个样品取100ng进行文库构建,利用CovarisS2将DNA片段打断为200bp-500bp的小片段,进行末端修复,加“A”碱基延伸及接头(adapter)连接,捕获前进行非捕获的连接介导PCR,纯化后的文库与已设计好的Agilent液相杂交芯片进行杂交,富集珠蛋白基因簇相应捕获序列,杂交产物纯化后每个样本分别加入不同的barcode进行捕获连接介导PCR,再次纯化后使用Life的Qubit和安捷伦2100对文库的浓度和片段大小进行定量。通过质检的文库在cBOT上进行簇生成后直接放入Hiseq2000平台进行90个循环的测序。4.二代测序数据分析原始数据下机后根据不同样本barcode标记进行数据拆分,将初始数据进行低质量和adapter污染过滤后,以NCBI人类基因组参考序列(hg19,GRCh37)为模板进行比对,针对后期进行SNP, INDEL和CNV的检出在比对时分别采取BWA软件的BWA-backtrack和BWA-MEM两种算法,运用Samtools, GATK, Annovar等软件结合自身编写的程序进行突变检测和功能注释,构建缺失后的参考基因组,将第一次未必对上参考基因组的配对短序列提取出来与构建的缺失参考基因组重比对,利用跨越断点的特异性序列与比对深度数据相结合进行拷贝数变异的检测。结果通过靶向捕获珠蛋白基因簇进行二代测序数据分析,发现本次地中海贫血样本测序平均深度为250X,捕获区域的覆盖度达92%以上,其中深度为30X以上的序列占总序列的93%以上。在99例α地中海贫血样本中,检出98例样本含缺失变异,包括9例3.7kb缺失杂合突变,2例4.2kb缺失杂合突变,29例SEA和3.7kb复合杂合缺失突变,14例SEA和4.2kb复合杂合缺失突变,36例SEA缺失杂合CS点突变,2例SEA缺失杂合QS点突变和6例SEA杂合缺失突变,除此之外还检出1例含有WS杂合点突变;在108例β-地中海贫血样本中,检出108例样本含点突变,包括20例突变纯和子,15例突变杂合子和66例双重突变杂合子样本,还有7例缺失复合点突变样本也被检测出。基因型结果均与实验室常规鉴定结果一致,即缺失结果与Gap-PCR结果一致,点突变结果与反向点杂交结果一致,此外,测序结果新检出CD54-58和IVS-Ⅱ-5这两种突变,结果表明二代测序技术在同等条件大批量样本能够快速和准确检测出突变结果。除此之外,在理地中海贫血样本中普遍存在的SEA缺失型的缺失位置坐标与HbVar数据库中报道的有差别,即HbVar数据库中报道该缺失区域为chr16:215400-234700 (hg19, HbVar:1086)而通过大量测序数据分析结果得到该缺失区域为chr16:215396-234699 (hg19)。在β-地中海贫血中国型缺失样本中发现,中国型缺失区域为chr11:5191124-5237502(hg19)与chr11:5237540-5270051 (hg19)这两段组成,与HbVar数据库中报道的缺失位置chr11:5191124-5270051 (hg19, HbVar:1046)不同。使用Sanger测序对SEA和中国型缺失样本分别进行验证,将得到测序峰图比对回参考基因组序列,进一步证明深度测序数据结果的正确性。地中海贫血疾病的产生涉及到300种α珠蛋白基因变异和200多种p-珠蛋白基因变异,在此项分析中由于样本量和突变种类的限制,并未能包含到所有的突变种类,在已知有限样本和突变种类的情况下,初步建立地中海贫血样本深度测序数据的分析流程,可以准确识别各类型突变的同时,更新了变异的缺失断点,有利于新突变的检出。结论本项研究通过对192例地中海贫血样本进行珠蛋白基因簇靶向捕获二代测序,初步建立了一套稳定,高通量,自动化的分析流程,该流程可准确检测出编码血红蛋白一系列基因的突变,也可识别未知和罕见珠蛋白变异,结合大量已有的公共数据库,自动注释出临床医生可识别的变异名称,有利于更好地解释变异与疾病之间的关联和致病机理,该流程对东南亚型缺失和中国型缺失的断裂点做出了修正,为我国地中海贫血患者的诊断和治疗,产前诊断和遗传咨询提供了可靠的遗传数据和科学基础,有效降低地中海贫血的出生缺陷率。地中海贫血作为一种遗传性血红蛋白病,在我国南方有着较高的人群携带率,近年来,国家科技部专门针对出生缺陷防治进行"973"立项研究,地中海贫血就是其中研究重点之一,国家卫计委推出一系列地中海贫血出生缺陷防控项目及孕前优生检查等,可见社会和人民对地中海贫血的日益关注。因此对地中海贫血的人群筛查,基因检测,后期治疗方法的探究和疾病发病机制,致病基因突变准确快速地检测显得尤为重要。二代测序是近几年来用于疾病研究最火热的新兴科技,该方法依赖起始样本量低,无需对照基因组,可同一时间对大批量样本进行基因组数据测定,结果准确快速。基因测序技术不仅可以大大降低遗传相关疾病发生率,减少出生缺陷,还可以实现对疾病预测,预防,预警以及个体化诊疗。人类的疾病大多与基因相关,基因异常、基因受损都会引起对应的蛋白质或酶的功能变化,从而引起疾病。目前约有2500多种疾病已经有了对应的基因检测方法,并在美国临床合法应用,甚至基因检测已成为美国疾病预防的常规手段之一,在国内无创产前筛查胎儿患唐氏综合症风险,使基因测序在临床应用中开创一片新前景。二代测序在地中海贫血病人变异检测的成功运用,意味着该技术也同样适用于其他单基因遗传病,为罕见遗传性疾病的研究提供一种新的研究技术和分析方法。
其他文献
频率分析是设计洪水分析与计算的主要方法,也是工程水文学的重要组成部分,对各种工程的投资与安全都有着直接的影响。其中线型选择是水文频率计算中的重要课题之一,特别是曲
长期以来,随着我国经济的快速发展,水资源愈发短缺,华北地区尤为严重。为满足地区社会发展需求,华北地区持续多年超采地下水,已经造成严重的环境问题,地下水超采治理迫在眉睫
近年来我国小流域大洪水时有发生,给当地居民和社会经济带来极大的影响,针对此现状国家投巨资启动了全国山洪预警预报项目。  小流域山洪预报相对于大流域来说,具有汇流时间短
目前国内港口码头旅客上、下船主要有以下三种方式:人行踏步(梯步);钢引桥或多跨钢引桥;客运缆车,三种方式各有其优缺点,但均无法满足大水位差旅游码头发展需要。因此为了研究一种
利用深部盐岩洞穴进行能源地下储备是国际上广泛认可的能源储备方式,我国盐岩能源地下储库群大规模兴建已经开始。由于近30年,国外盐岩地下油气储库灾难性事故时有发生,因此
随着全球气候的显著变化以及水资源需求日益增长,我国农业系统面临的旱灾风险也不断增加。因此,有必要加强农业旱灾风险研究,为我国农业干旱灾害的科学管理以及防灾减灾策略
运用SMART(Switching Mechanism at5end of RNA Transcript)技术,构建了海南坡鹿、海南黄牛、五指山小型猪外周血白细胞cDNA文库。用RNAiso Reagent(TAKARA)处理新鲜血液,以总RNA抽
阳西县溪头渔港于广东省西南部沿海,位于东经111°4540",北纬21°3820"。目前,渔港港池和航道淤积比较严重,防波堤短矮残旧,不够坚固,防御台风、风暴潮能力差,存在着配套设施不足、