论文部分内容阅读
痛风是患有高尿酸血症后关节内尿酸结晶沉积而引起的一种常见的关节炎。在强大的基因参与调控的疾病中,痛风是一种发病率最高的炎症性关节疾病。格外值得注意的是,痛风在中国人群中已经成为第二大代谢性疾病。对痛风(Gout)病例组和健康对照组进行全外显子高通量测序(Whole Exome Sequencing,WES),在全外显子范围内探寻痛风疾病新的易感基因位点。本研究共纳入33名中国成年人,病例组包含了 11名被昆明医科大学第一附属医院风湿免疫科专家临床诊断为痛风的成人患者;健康对照组由来自体检中心的22名健康成年人组成。分别从患者和健康人的全血中提取基因组DNA。利用Agilent SureSelect Human All Exon Kit对研究对象进行了全基因组外显子捕获,然后用HiSeq 3000高通量测序仪进行全外显子组测序。对比分析各种测序数据分析软件的优缺点后,详细地论述SeqMule软件的特点及操作,利用SeqMule对研究对象的外显子测序数据进行自动化比对与SNP分析。对所有的变异体进行功能注释,筛选出可能对基因功能有显著影响的非同义突变(Nonsysnonymous,NS)。使用R软件对得到的基因数据进行生物信息学分析和统计学分析:过滤掉同义突变等不影响基因功能的突变,只保留影响基因功能的非同义突变;过滤掉公共遗传突变数据库(dbSNP)正常人携带的常见突变、已发表的正常对照个体的突变、以及该项目实验测序的正常对照个体的突变;然后在所有患病个体的突变集合中取交集;利用Fisher精确检验筛选具有统计学意义(P<0.05)的单核苷酸变异,减少候选致病突变的数量。经过全外显子测序、生物信息学分析、统计学分析、以及蛋白质功能预测后,我们找到23个罕见突变基因包含了 24个罕见的单核苷酸变异。通过在HGMD、Pubmed、snp138等公共数据库的筛查,发现两个可能与痛风疾病发展显著相关的SNPs(单核苷酸多态性)的遗传变异,分别是KLRC2和NCOR1基因在外显子区域的 rs3419537(c.56C>G,P = 0.00417)和 rs73281920(c.59T>G,P =0.00000143)位点。这两个位点都被蛋白质功能预测软件SIFT和PolyPhen-2预测为“有害”。KLRC2(c.56C>G)位于定位区域12p13.2上,6名患者中检测到突变,健康对照组均未突变。NCOR1(c.59T>G)位于定位区域17p12-p11.2上,9名患者中检测到突变,健康对照组均未突变。利用全外显子组测序技术,使用自编R程序,经过生物信息学分析和统计学分析后,从11名痛风患者中筛选出2个可能致病突变基因位点,为痛风的诊断提供了更加快速、准确的方法。与多个分析软件的对比,发现了一站式全基因组和外显子组测序数据自动分析软件(SeqMule)能够优化许多分析软件存在的一些缺点,能够对外显子组和全基因组测序数据完成全面、灵活、高效地自动化分析,可以更好地分析高通量测序数据,最终提升数据分析的一致性和准确性。