论文部分内容阅读
儿童白血病已成为危害儿童生命的主要疾病,它不仅对儿童的健康造成威胁,同时也给社会和家庭带来了经济负担和精神压力。但儿童白血病也是可防可治的,它在规范治疗后比成人白血病更容易缓解;故采用适当的筛查工具,对高危儿童进行筛查、预防监测,做到对白血病患儿的早发现、早诊断、早治疗,具有十分重要的公共卫生意义。国内外已建立了多个癌种的疾病风险预测模型,但尚没有关于儿童白血病的;指标体系的建立是构建儿童白血病预测模型的关键之一,而对于白血病儿童这个特殊的人群,疾病的发生不仅与患儿的有害环境暴露相关,还与其父母亲产前、哺乳期的有害环境暴露有关;另外,各个区域的致病因素也不尽相同,各有其特点。目的本研究旨在环境危险因素流行病学分析的基础上,筛选适当的预测因素建立预测模型的指标体系,而后建立河南省儿童白血病发病风险预测模型并进行验证,为该省儿童白血病高危人群的筛选、疾病的预测及一级预防策略的制定提供支持。方法1.根据病例-对照的研究设计,于2014-2016和2017-2018年分两阶段在河南省4家医院募集住院在治的、经骨髓组织病理学确诊的白血病患儿为病例;同时,按1:1比例于病例所在同家医院的呼吸病区、消化病区及中医康复病区,募集非白血病患儿作为对照。以面对面访谈患儿父母或其他监护人的形式完成统一的调查问卷,问卷内容包含研究对象及其父、母亲的一般人口学资料、潜在疾病影响因素暴露情况等。2.利用前阶段收集的病例-对照数据,用非条件Logistic回归等方法对各指标作危险因素分析,计算人群归因危险度百分比(Population Attributable Risk Percent)。根据OR值(Odds Ratio)及其95%置信区间、PARP等结果,结合文献学习及咨询专家意见建立本次模型的指标体系。3.合并前、后两阶段募集的样本数据,按照3:1的比例将样本随机分为建模人群和验证人群,分别运用人工神经网络(Artificial Neural Network,ANN)和Logistic回归两种方法建立预测模型;在验证人群中进行模型的验证,从区分度和校准度两方面评价模型的预测效果。4.统计学处理采用IBM SPSS Statistics 21.0和R 3.3.3软件。结果1.样本募集:第一阶段募集符合标准、问卷合格的病例407例,对照407例;第二阶段募集病例120例,对照120例,合并所得样本共得病例527例、对照527例,按3:1的比例将对象随机分为建模人群790例和验证人群264例。2.预测模型指标体系的建立:根据各指标OR值、PARP的结果,结合文献学习及专家意见,最终确定15个指标作为模型的输入变量,分别为:儿童相关因素(X1出生体质量、X2娩出方式、X3家庭月收入水平、X4住宅周围空气污染史、X5居住环境低频电磁场暴露史、X6感冒发烧史、X7肿瘤家族史、X8农药杀虫剂接触史、X9居室经常通风换气、X10经常食用不健康食品史),母亲相关因素(X11经常体育锻炼、X12常规服用叶酸、X13房屋装修史、X14农药杀虫剂接触史)及父亲相关因素(X15染发史)。3.预测模型的建立与验证:在建模过程中,ANN模型在逐渐纳入预测指标X1X15后,结果显示隐含层节点数为2时,交叉验证的均方根误差最小(0.4127),受试者工作特征曲线下面积(AUC)值最大(0.864),模型的最佳临界点为0.3365,灵敏度为89.9%,特异度为61.9%,拟合优度检验P=0.773(P>0.05认为模型拟合了数据,即模型的校准度较好);Logistic回归结果显示共有11个指标纳入方程,预测模型为:P=1/(1+exp[-(1.151+1.313X8+1.214X6+1.073X15+0.953X4+0.941X7+0.837X13+0.835X5+0.722X14+0.632X10-0.683X3-0.734X12)]),模型的AUC为0.842,最佳临界点为0.3252,灵敏度为89.6%,特异度为55.9%,拟合优度检验P=0.361。预测模型经验证,结果显示,ANN模型的AUC(0.878)、灵敏度(89.3%)、特异度(79.6%)及约登指数(0.648)均优于Logistic回归模型的AUC(0.847),灵敏度(85.2%),特异度(58.5%)及约登指数(0.478),且AUC的差异具有统计学意义(P=0.042),即ANN模型的区分度优于Logistic回归模型;经拟合优度检验,ANN模型的校准度(P=0.572)优于Logistic回归模型(P=0.359)。结论采用ANN和Logistic回归两种方法建立儿童白血病发病风险的预测模型,ANN模型的预测效能优于Logistic回归模型。