河南省儿童白血病发病风险预测模型的建立

来源 :郑州大学 | 被引量 : 0次 | 上传用户:tian96610
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
儿童白血病已成为危害儿童生命的主要疾病,它不仅对儿童的健康造成威胁,同时也给社会和家庭带来了经济负担和精神压力。但儿童白血病也是可防可治的,它在规范治疗后比成人白血病更容易缓解;故采用适当的筛查工具,对高危儿童进行筛查、预防监测,做到对白血病患儿的早发现、早诊断、早治疗,具有十分重要的公共卫生意义。国内外已建立了多个癌种的疾病风险预测模型,但尚没有关于儿童白血病的;指标体系的建立是构建儿童白血病预测模型的关键之一,而对于白血病儿童这个特殊的人群,疾病的发生不仅与患儿的有害环境暴露相关,还与其父母亲产前、哺乳期的有害环境暴露有关;另外,各个区域的致病因素也不尽相同,各有其特点。目的本研究旨在环境危险因素流行病学分析的基础上,筛选适当的预测因素建立预测模型的指标体系,而后建立河南省儿童白血病发病风险预测模型并进行验证,为该省儿童白血病高危人群的筛选、疾病的预测及一级预防策略的制定提供支持。方法1.根据病例-对照的研究设计,于2014-2016和2017-2018年分两阶段在河南省4家医院募集住院在治的、经骨髓组织病理学确诊的白血病患儿为病例;同时,按1:1比例于病例所在同家医院的呼吸病区、消化病区及中医康复病区,募集非白血病患儿作为对照。以面对面访谈患儿父母或其他监护人的形式完成统一的调查问卷,问卷内容包含研究对象及其父、母亲的一般人口学资料、潜在疾病影响因素暴露情况等。2.利用前阶段收集的病例-对照数据,用非条件Logistic回归等方法对各指标作危险因素分析,计算人群归因危险度百分比(Population Attributable Risk Percent)。根据OR值(Odds Ratio)及其95%置信区间、PARP等结果,结合文献学习及咨询专家意见建立本次模型的指标体系。3.合并前、后两阶段募集的样本数据,按照3:1的比例将样本随机分为建模人群和验证人群,分别运用人工神经网络(Artificial Neural Network,ANN)和Logistic回归两种方法建立预测模型;在验证人群中进行模型的验证,从区分度和校准度两方面评价模型的预测效果。4.统计学处理采用IBM SPSS Statistics 21.0和R 3.3.3软件。结果1.样本募集:第一阶段募集符合标准、问卷合格的病例407例,对照407例;第二阶段募集病例120例,对照120例,合并所得样本共得病例527例、对照527例,按3:1的比例将对象随机分为建模人群790例和验证人群264例。2.预测模型指标体系的建立:根据各指标OR值、PARP的结果,结合文献学习及专家意见,最终确定15个指标作为模型的输入变量,分别为:儿童相关因素(X1出生体质量、X2娩出方式、X3家庭月收入水平、X4住宅周围空气污染史、X5居住环境低频电磁场暴露史、X6感冒发烧史、X7肿瘤家族史、X8农药杀虫剂接触史、X9居室经常通风换气、X10经常食用不健康食品史),母亲相关因素(X11经常体育锻炼、X12常规服用叶酸、X13房屋装修史、X14农药杀虫剂接触史)及父亲相关因素(X15染发史)。3.预测模型的建立与验证:在建模过程中,ANN模型在逐渐纳入预测指标X1X15后,结果显示隐含层节点数为2时,交叉验证的均方根误差最小(0.4127),受试者工作特征曲线下面积(AUC)值最大(0.864),模型的最佳临界点为0.3365,灵敏度为89.9%,特异度为61.9%,拟合优度检验P=0.773(P>0.05认为模型拟合了数据,即模型的校准度较好);Logistic回归结果显示共有11个指标纳入方程,预测模型为:P=1/(1+exp[-(1.151+1.313X8+1.214X6+1.073X15+0.953X4+0.941X7+0.837X13+0.835X5+0.722X14+0.632X10-0.683X3-0.734X12)]),模型的AUC为0.842,最佳临界点为0.3252,灵敏度为89.6%,特异度为55.9%,拟合优度检验P=0.361。预测模型经验证,结果显示,ANN模型的AUC(0.878)、灵敏度(89.3%)、特异度(79.6%)及约登指数(0.648)均优于Logistic回归模型的AUC(0.847),灵敏度(85.2%),特异度(58.5%)及约登指数(0.478),且AUC的差异具有统计学意义(P=0.042),即ANN模型的区分度优于Logistic回归模型;经拟合优度检验,ANN模型的校准度(P=0.572)优于Logistic回归模型(P=0.359)。结论采用ANN和Logistic回归两种方法建立儿童白血病发病风险的预测模型,ANN模型的预测效能优于Logistic回归模型。
其他文献
襄汾县境内有6座中型灌区,实现灌区可持续利用,关系到经济社会可持续发展,通过对全县中型灌区概况介绍,指出灌区发展中存在的问题,提出灌区发展的四项对策。
海子湾水库位于朔州市右玉县,控制流域面积2022km2,总库容为980万m3,最大坝高10m,属小(1)型水利工程。枢纽防洪标准为30年一遇设计,300年一遇校核,正常蓄水位1263.8m,校核洪水位1264.66m
对当前河道堤防现状进行了分析,提出了河道的主要任务是防洪和水面工程,介绍了堤防建设、河道疏浚、水面景观工程的布置。
介绍了TBM管片衬砌后局部洞段顶部塌方处进行固结灌浆处理的有关过程和方法。
质量经营理论有三个来源:全面质量管理(TQM)理论、可持续发展理论、企业竞争和战略管理理论.质量经营理论主要源于TQM,以TQM的理念、精髓和技术方法为其基本内核;可持续发展
文中针对汾河三坝灌区春浇库水供应严重不足而灌溉淡季河道弃水较多的现状.经过3年的典型试验和10余年的推广应用,对蓄水灌溉技术与效果进行了较为系统的研究。指出蓄水灌溉是
为有效地解决出口欠退税问题,缓解出口企业的资金短缺,借鉴金融创新,采用资产证券化融资是行之有效的方法.在分析我国出口退税的现状和资产证券化融资特点的基础上,着重讨论
文中介绍了长治市水资源的特点和水资源开发利用现状,并总结了长治市水资源开发利用中存在的问题.针对性地提出了合理配置水资源、建设节水型社会、开发新水源、建立高效运行
根据高平市灌溉现状,分析了灌溉工程存在的问题、发展的潜力,提出了解决的措施和建议。
张峰水库大坝采用黏土斜心墙碾压堆石坝,土料场土样击实试验指标是工程设计的基本参数之一,它不仅会影响施工成本和工期,还会直接影响心墙的防渗效果,甚至影响大坝的稳定和沉