论文部分内容阅读
背景和目的心血管疾病是遗传与环境因素相互作用的结果,同一地区的居民由于遗传及生活习惯的相似性导致其患病率趋于一致。大规模人群心血管流行病学研究出于可行性考虑多采用多阶段整群抽样的方法,这种抽样方法所得数据的特点是具有多层次结构。层次结构数据中群体效应和个体效应之间是密不可分的,这对传统的logistic回归或一般线性回归提出挑战,而多水平模型是分析这类数据更为合适的方法。很多动物实验和人群流行病学研究发现睡眠与心血管事件相关,但是结果仍然存在较大争议。基于以上问题,本研究使用多水平模型探究我国中老年人群睡眠和心血管疾病(脑卒中和冠心病)之间的关系,建模前通过模拟数据探索“最佳”多水平模型的选取。方法用于探索睡眠和心血管事件关系的数据来源于中国前瞻性城乡流行病学研究(PURE-China)。此研究的基线数据于2005-2007年完成,采用多阶段整群抽样的方法,抽取了云南、青海、北京、南京、山东、山西、陕西、辽宁、南昌、内蒙、新疆以及四川12个研究中心(区县),270个社区。本调查共纳入46,285位35-70岁社区居民。使用标准问卷收集调查对象的社会人口学指标、睡眠及心血管事件发生情况。使用多水平logistic回归探索睡眠和心血管疾病之间的关系。建模之前基于PURE-China数据计算心血管及相关变量在区县和社区水平的组内相关系数(ICC),根据得到的ICC模拟具有“区县-社区-个体”三水平结构的数据集;然后使用Bootstrap的方法抽取不同结构、样本量的亚数据集;最后基于亚数据集拟合多水平模型,比较不同模型估计的固定效应p值的准确性和标准误的大小,探索“最佳”模型的选取,每次模拟1000次,计算平均值。结果PURE-China研究共纳入39,515名研究对象,其中女性23,345(59.1%)人,男性16,170(40.9%)人。研究人群24小时睡眠时长平均为8.7±1.1小时,夜间睡眠时长8.2±1.0小时,其中24小时睡眠时长7-8小时的居民占14.2%,≥9小时的居民占46.8%,<6小时的居民仅占0.7%;夜间睡眠时长7-8小时的占22.7%,≥9小时的占29.4%,<6小时的仅占1.1%。调整年龄、性别、体质指数、教育程度、吸烟、饮酒、运动、城乡、胆固醇、糖尿病、高血压及抑郁因素后(以每天睡眠时长7-8小时作为参照),每天睡眠时长≥9小时增加16%(OR=1.16,95%CI:1.03-1.29, P=0.0267)心血管病疾病的风险;午睡增加27%(OR=1.27,95%CI:1.18-1.36,P<0.0001)心血管病疾病的风险,另外午睡时间越长发生心血管疾病的风险越高,这种影响在男性中可能更大。分层分析发现每天睡眠时长≥9小时增加37%(OR=1.37,95%CI:1.12-1.62, P=0.0127)脑卒中的风险;午睡增加47%(OR=1.47,95%CI:1.30-1.64,P<0.0001)脑卒中的风险。每天睡眠时长<6小时增加58%(OR=1.58,95%CI:1.13-2.03, P=0.0478)冠心病风险;午睡增加23%(OR=1.23,95%CI:1.12-1.34,P=0.0.0001)冠心病的风险。将人群分为夜间睡眠时长7-8小时组,每天睡眠7-8小时组和其他组,以其他组作为参照,夜间睡眠时长7-8小时组心血管疾病风险降低24%(OR=0.76,95%CI:0.60-0.92, P=0.0008),脑卒中风险降低33%(OR=0.67,95%CI:0.36-0.98, P=0.0131),冠心病风险降低20%(OR=0.80,95%CI:0.63-0.97,P=0.0130)。对于白天没有午习惯的人群,夜间睡眠<6小时增加76%(OR=1.76,95%CI:1.25-2.27, P=0.0298)心血管疾病的风险。建模前的模拟研究发现随着样本量的增加,“区县-社区-个体”三水平logistic回归随着样本量的增加p估计的精度也随之增加,但是使用“区县-个体”及“社区-个体”两水平的logistic回归时,其对p估计的精度不仅和整体样本量有关,还和数据结构相关。相同的样本量下,适当增加水平三的群组数量可以得到更加精确的p估计。β值本身的大小也会影响其估计的效果。在p值较大时,小的样本量就可以满足对β值的准确估计。样本量太少,比如模拟结果提示样本量小于3000时,构建两水平logistic模型效果较好;而当样本量增加到18,000时,使用三水平logistic回归比两水平logistic回归得到更精确的β估计,同时参数估计趋于稳定。结论午睡、睡眠时间过长或过短都可能增加我国中老年人群心血管疾病的患病风险,每天仅夜间睡眠7-8小时的人群患病风险可能最低。模拟研究结果对今后此类研究中“最佳”多水平logistic回归模型的选取提供参考依据。