论文部分内容阅读
背景:特发性肺纤维化(idiopathic pulmonary fibrosis,IPF)是一种严重的慢性罕见疾病,主要表现为劳累性干咳、呼吸困难和疲劳等症状。肺组织纤维化会造成肺间质间隙瘢痕化及肺功能进行性恶化,最终造成各器官衰竭而死亡。目前,IPF认知率低,预后差,确诊后中位生存期短,且尚无治疗的有效手段,被称为“不是癌症的癌症”。IPF的危险因素包括内在因素(如遗传、衰老、性别和肺部微生物组)、外在因素(如吸烟、环境暴露和空气污染)和IPF共病(comorbidity)。甲状腺功能减退症(hypothyroidism,HypoT)是由于甲状腺激素合成及分泌减少,或其生理效应不足所致机体代谢降低的一种疾病,属于IPF非呼吸系统的共病。观察性研究证实IPF与HypoT具有一定程度的相关性,且HypoT能够预测IPF的死亡率,然而,由于IPF是罕见疾病且中位生存期短,建立大规模纵向队列有困难,故当前针对HypoT与IPF的关联性研究多停留在小样本、回顾性研究,这也致使二者间的因果关系尚不明确。孟德尔随机化(Mendelian randomization,MR)是一种使用遗传变异(如单核苷酸多态性,single nucleotide polymorphisms[SNPs])作为工具变量(instrumental variable,IV)来推断暴露和结局之间因果关系的方法。MR类似于“自然状态下的”随机对照试验,因等位基因是随机分配的,MR在很大程度上排除了未观测混杂因素的影响,且由于随机分配在出生前就完成,从而有效避免了逆因果问题。同时,遗传变异的测量具有较高的准确性,不容易出现测量误差。目前,大量全基因组关联研究(genomic wide association study,GWAS)汇总数据的公开发布,助推了两样本MR的蓬勃发展,使其成为在观察性研究中探索暴露和结局间因果关系的有效手段。目的:使用GWAS汇总数据,在MR框架下探索HypoT与IPF的因果关联,阐明两种疾病之间的因果关系、因果效应大小及其方向,为IPF的病因机制研究提供线索,为IPF患者的预防、诊断和治疗提供科学依据。方法:IPF汇总数据来源于目前最大的IPF GWAS研究,包括11,259个研究对象(2,668例病例和8,591例对照)。HypoT的数据来源于三个不同的GWAS平台:(1)英国生物银行(UK Biobank,UKBB),其病例为自我报告患HypoT或黏液性水肿疾病的GWAS(N=289,307,18,740例病例和270,567例对照);(2)与UKBB独立的外部HypoT GWAS数据集,包括53,423名研究对象,其中病例3,440例,对照49,983例;(3)UKBB,其病例为ICD-10诊断的GWAS,包括244,890名研究对象,其中病例13,043例,对照231,847例。IPF其它共病(慢性阻塞性肺疾病、阻塞性睡眠呼吸暂停、缺血性心脏病、动脉粥样硬化、2型糖尿病、胃食管反流病和肺癌)及吸烟的GWAS数据均来源于UKBB。单元MR分析中,首先使用连锁不平衡得分回归分析来检验HypoT GWAS与IPF GWAS间的样本重叠程度,然后按照严格条件对IV行筛选,使用F统计量排除弱工具变量偏倚,进一步采用MR-Egger、MR多效性残差和异质性检测(MR pleiotropy RESidual Sum and Outlier,MR-PRESSO)和留一法分析IV的有效性进行验证。MR逆方差加权法(inverse-variance weighted,MR-IVW)为主要分析方法,加权中位数法(the weighted median method)、基于稳健性回归的 MR-IVW 法(MR-IVW method using robust regression,MR-Robust)、基于套索算法的 MR 方法(MR-Lasso)和 MR 稳健调整的轮廓得分法(MR Robust Adjusted profile Score,MR-RAPS)作为敏感性分析来评估研究结果的可靠性。此外,应用独立外部数据集对探索性分析中的结果进行验证,应用UKBB不同病例来源的HypoT数据进行敏感性分析,最后,将IPF作为暴露,HypoT作为结局进行反向MR分析。在单元MR的基础上,进一步考虑IPF其它共病及吸烟,采用基于贝叶斯模型平均的多元MR方法(multivariate MR based on Bayesian model averaging,MR-BMA),进一步评估HypoT与IPF间的因果关联是否受其它因素的影响,用概率量化不同因素为IPF病因的不确定性。结果:1.探索性分析中,共筛选出84个IVs,排除样本重叠和弱工具变量偏倚,MR-Egger未检测到水平多效性,留一法和MR-PRESSO也未发现离群值,MR-IVW分析发现 HypoT 与 IPF 存在因果关联(OR=1.125;95%CI=1.028-1.231;P=0.011),加权中位数 MR法的结果为(OR=1.149;95%CI=1.010-1.308;P=0.034),MR-lasso 的结果为(OR=1.101;95%CI=1.012-1.198;P=0.025),MR-Robust 的结果为(OR=1.111;95%CI=0.997-1.237;P=0.057),MR-RAPS 的结果为(OR=1.104;95%CI=1.003-1.215;P=0.042)。2.验证性分析中,通过IVs的筛选和验证共获取6个SNPs可作为有效IVs进行分析,MR-IVW 的结果为(OR=1.229;95%CI=1.054-1.432;P=0.008),进一步证明HypoT与IPF存在因果关联,其余MR方法得到的因果效应估计值具有统计学意义。3.敏感性分析中共使用44个IVs,MR-IVW的结果为(OR=1.163;95%CI=1.040-1.300;P=0.008),其余MR方法得到得因果效应估计值也均具有统计学意义。4.反向MR分析中,共使用14个有效IVs,IVW的结果为(OR=1.010;95%CI=0.994-1.026;P=0.214),未检测到因果关系。5.MR-BMA多元MR分析显示,HypoT是IPF证据最强的致病因素(边际纳入概率=0.388,错误阳性率=0.025)。经模型诊断剔除强影响点后,重新进行MR-BMA分析,暴露因素的边际纳入概率排序并没有改变。结论:HypoT是IPF的病因,并且不存在反向因果关联,独立数据集验证、不同方法的敏感性分析及多元MR-BMA分析均得出一致结论,这为IPF发病机制及治疗方案提供重要科学依据。