论文部分内容阅读
背景与目的层次结构数据或多水平数据在医学研究中非常常见,如使用多阶段整群抽样设计的大规模流行病学研究,或采用群组随机试验设计的干预比较研究,其最重要的特点之一是“层内”数据间的相关性。多水平模型或分层模型常用来处理这类数据,目前关于连续型或离散型多水平数据分析方法(如广义线性多水平模型)的研究较多;而关于层次生存数据分析方法的研究相对较少。脆弱模型是最常见的一种层次生存模型,能够处理不同类型的层次生存数据,如集群数据(clustered data)和复发事件(recurrent events),其中最常用的是Cox共享脆弱模型,为半参数模型。与参数脆弱模型相比,半参数脆弱模型无需指定基准风险函数,可能会损失部分数据信息,是否会因此损耗效应估计和假设检验的能力尚不清楚。论文第一部分借助蒙特卡罗模拟技术开展比较研究,探索在不同情境下(样本量、群组样本量、删失比例、群组内相关性程度),Cox和参数共享脆弱模型的效应估计和假设检验能力,及不同因素对它们表现的影响。论文第二部分基于大规模前瞻性流行病学研究的随访数据,使用脆弱模型开展实例研究。人们平均每天花费约三分之一的时间睡觉,睡眠对人类健康至关重要,它越来越被认为是影响心血管疾病(Cardiovascular Diseases,CVDs)和死亡的一种重要的生活方式。既往关于睡眠与心血管疾病的人群流行病学研究局限在一些国家或地区,且结果存在争议,本实例研究基于来自21个高、中和低收入国家的人群队列探索睡眠(24小时睡眠时长、白天小睡)与死亡或主要心血管事件的关联性。方法对于模型的比较研究,借助蒙特卡罗模拟,生成满足不同情境设定的二水平生存数据,比较各情境下Cox共享脆弱模型和参数共享脆弱模型的效应估计和假设检验表现。情境设定因素包括总样本量N(200,500),群组样本量k(50,25,10),删失比例 c(10%,30%,50%)和群组内相关性 Kendall’s τ(0.2,0.5,0.6),每个情境均开展1000次模拟。模型比较评价指标包括:固定效应回归系数估计均数和标准误、平均相对百分偏差(bias%)和均方误差(Mean Squared Error,MSE)[效应估计准确性指标]、脆弱分布参数估计均数、经验覆盖率、统计检验效能或Ⅰ类错误[假设检验能力指标]。对于睡眠与主要心血管事件或死亡的关联性研究,数据来源于前瞻性城乡流行病学研究(Prospective Urban Rural Epidemiological study,PURE),该研究采用多阶段整群抽样方法,招募来自全球21个高、中和低收入国家的35-70岁成年人,基线招募及数据采集从2003年开始,基线数据采集及随访事件确认均采用标准的问卷或病例报告表。该研究一共纳入116,632名调查对象,截至2017年9月,该队列的中位随访时间是7.8年(四分位数间距:5.1-9.2年)。夜间睡眠时间以就寝时间和醒来时间之间的间隔来估计,白天小睡时间以调查对象自报的时间估算,24小时总睡眠时间以两者之和估算。结局指标均为时间-事件,主要结局事件为死亡和非致命性心肌梗死、卒中和心力衰竭的复合事件。使用Cox共享脆弱模型评估24小时估计睡眠时间、白天小睡与结局指标的关联性,并探索不同睡眠习惯地区关联性是否一致。此外,还进行了一系列敏感性分析进一步了解关联结果的稳定性。结果模拟研究结果显示,在风险比(Hazard Ratio,HR)≠1的场景中,Cox共享脆弱模型(以下简称“Cox模型”)和Weibull共享脆弱模型(以下简称“Weibull模型”)固定效应估计值的平均相对百分偏差均在5%以内,MSE均不超过0.05,与真值非常接近;两个模型bias%差异不超过1.5%,MSE差异低于0.01,准确性相当;N=200时,Weibull模型统计检验效能比Cox模型高2%左右,当N增大到500时,两个模型统计功效差值在0.5%以内;整体来看,Cox模型脆弱分布参数θ估计均值更接近真值。两个模型效应估计准确性和统计检验效能随群组规模增大、删失比例降低而提高,θ估计准确性随之降低,但幅度均较小;群组内相关性对参数估计影响较小,但可能削弱模型检验效能。在HR=1的场景中,Cox模型和Weibull模型固定效应估计值的MSE均低于0.05,两个模型MSE差异非常小,不超过0.001,准确性非常接近;大部分模拟情境中,Cox模型脆弱分布参数θ估计均值大于Weibull模型,更接近真值;两个模型Ⅰ类错误发生概率基本在可接受范围(~0.05),但在个别情境下低于0.045,相同设定下两个模型差异不超过0.005。群组规模增大、删失比例降低能够提高两个模型固定效应估计准确性,群组内相关性对模型参数估计的影响较小。实例研究结果显示,截至2017年9月,共有4381例死亡和4365例主要心血管事件发生。以每天睡6-8小时作为参照,调整人口学信息、生活方式和疾病史后,每天睡眠时间大于8小时与复合事件风险增加有关,且随着睡眠时间增加,事件发生风险也呈递增趋势(HR:8-9h:1.05[0.99-1.12];9-10h:1.17[1.09-1.25];>10h:1.41[1.30-1.53],趋势检验P值<0.0001);每天睡眠不超过6小时的人复合事件发生风险也增加,但没有达到统计学显著性(HR:1.09[0.99-1.20])。不同睡眠习惯地区(白天小睡是否常见)24小时估计睡眠时间与事件关联性均呈J型,24小时睡眠时长与两个次要终点结局(死亡、主要心血管事件)也呈J型关联,敏感性分析结果稳定。此外,当夜间得到充足或更长的睡眠时(每晚>6h),与白天不小睡的人比,白天小睡的人死亡或主要心血管事件的发生风险增加,且随着小睡时间延长,风险增加(HR:0-1h:1.13[1.07-1.20];>1h:1.31[1.21-1.43]);但当夜间睡眠缺乏时(每晚≤6h),没有观察到白天小睡的人事件发生风险增加。结论半参数Cox共享脆弱模型处理层次生存数据的表现不劣于参数共享脆弱模型,并不损失效应估计的准确性和假设检验能力;在大样本研究中,Cox共享脆弱模型是分析层次生存数据很好的选择。24小时估计睡眠时间与死亡或主要心血管事件间呈J型关联,每天睡约6-8小时的成年人发生死亡或主要心血管事件的风险最低;对于夜间睡眠超过6小时的成年人,与无白天小睡相比,白天小睡与死亡或主要心血管事件风险增加相关,而夜间睡眠≤6小时但白天小睡的成年人未观察到事件发生风险增高。